2023.10.18
한화비전-GIST, 국제 AI 음향 인식 대회서 심사위원상 수상
□ 샤오미, 삼성리서치 등 유수 기관 제치고 연구 독창성 및 우수성 인정받아
□ 실내 환경에서 발생 가능한 소리 탐지하는 인공지능 모델 설계
한화비전 AI연구소와 광주과학기술원(GIST) 전기전자컴퓨터공학부 오디오지능연구실 공동 연구팀이 지난 9월 ‘국제 AI 음향 인식 경진대회(DCASE 챌린지 2023)’ 워크숍에서 샤오미, 삼성리서치 중국-난징 등 유수 기관 15개 팀을 제치고 심사위원상을 수상했다.
DCASE 챌린지는 국제전기전자공학회(IEEE) 산하 신호처리소사이어티(AASP)가 2013년부터 개최하는 세계적인 대회로, 인공지능(AI)을 이용해 소리를 듣고 상황을 판단하는 음향 인식 기술을 겨룬다.
한화비전-GIST 공동 연구팀은 올해 3월부터 5월까지 열린 DCASE 챌린지2023에 참가해 ‘실내 음향 이벤트 탐지 부문(Task4A)’ 단일 모델 분야 1위와 앙상블 모델 분야 2위를 달성한 바 있다. 공동 연구팀이 워크숍에서 받은 심사위원상은 DCASE 챌린지 2023에 제출된 기술 리포트를 중심으로 연구 독창성과 우수성을 검토해 부문(Task)별 1팀에게만 주어진다.
‘실내 음향 이벤트 탐지 기술’은 실내 환경에서 발생할 수 있는 진공청소기 소리, 설거지하는 소리 등 10가지의 다양한 소리를 AI를 통해 탐지 및 구별하는 기술이다. 이 기술은 카메라를 통해 처리하는 데 제한이 있는 상황에서 소리만으로 음향 이벤트를 탐지할 수 있다는 강점을 통해 실내 상황 감시, AI스피커 등 다양한 애플리케이션에 활용될 수 있다.
이번 워크숍에서 공동 연구팀은 문제를 해결하기 위해 다양한 오디오 지능을 표현할 수 있는 AI 기술들을 접목해 고성능 실내 음향 이벤트 탐지 기술을 개발했다.
구체적으로 ▲AI가 추론한 의사 정답을 학습에 활용하는 준지도 학습 기술 ▲사전 학습 훈련 모델의 추론 결과를 기존 모델의 추론 결과와 융합하는 기술 ▲성능 향상을 위한 데이터를 정제하는 기술, 그리고 ▲AI의 능력 향상을 위해 다양한 기법을 병합하는 앙상블 기술 접목 AI 모델로 우수한 성과를 달성했다.
이번 대회를 통해 입증된 공동 연구팀의 기술은 한화비전 보안 카메라의 음향 이벤트 탐지에도 활용될 예정이다.