2023.10.18

한화비전-GIST, 국제 AI 음향 인식 대회서 심사위원상 수상

샤오미, 삼성리서치 등 유수 기관 제치고 연구 독창성 및 우수성 인정받아

실내 환경에서 발생 가능한 소리 탐지하는 인공지능 모델 설계

 
한화비전 AI연구소와 광주과학기술원(GIST) 전기전자컴퓨터공학부 오디오지능연구실 공동 연구팀이 지난 9월 ‘국제 AI 음향 인식 경진대회(DCASE 챌린지 2023)’ 워크숍에서 샤오미, 삼성리서치 중국-난징 등 유수 기관 15개 팀을 제치고 심사위원상을 수상했다.

DCASE 챌린지는 국제전기전자공학회(IEEE) 산하 신호처리소사이어티(AASP)가 2013년부터 개최하는 세계적인 대회로, 인공지능(AI)을 이용해 소리를 듣고 상황을 판단하는 음향 인식 기술을 겨룬다.

한화비전-GIST 공동 연구팀은 올해 3월부터 5월까지 열린 DCASE 챌린지2023에 참가해 ‘실내 음향 이벤트 탐지 부문(Task4A)’ 단일 모델 분야 1위와 앙상블 모델 분야 2위를 달성한 바 있다. 공동 연구팀이 워크숍에서 받은 심사위원상은 DCASE 챌린지 2023에 제출된 기술 리포트를 중심으로 연구 독창성과 우수성을 검토해 부문(Task)별 1팀에게만 주어진다.

‘실내 음향 이벤트 탐지 기술’은 실내 환경에서 발생할 수 있는 진공청소기 소리, 설거지하는 소리 등 10가지의 다양한 소리를 AI를 통해 탐지 및 구별하는 기술이다. 이 기술은 카메라를 통해 처리하는 데 제한이 있는 상황에서 소리만으로 음향 이벤트를 탐지할 수 있다는 강점을 통해 실내 상황 감시, AI스피커 등 다양한 애플리케이션에 활용될 수 있다.

이번 워크숍에서 공동 연구팀은 문제를 해결하기 위해 다양한 오디오 지능을 표현할 수 있는 AI 기술들을 접목해 고성능 실내 음향 이벤트 탐지 기술을 개발했다.

구체적으로 ▲AI가 추론한 의사 정답을 학습에 활용하는 준지도 학습 기술 ▲사전 학습 훈련 모델의 추론 결과를 기존 모델의 추론 결과와 융합하는 기술 ▲성능 향상을 위한 데이터를 정제하는 기술, 그리고 ▲AI의 능력 향상을 위해 다양한 기법을 병합하는 앙상블 기술 접목 AI 모델로 우수한 성과를 달성했다.

이번 대회를 통해 입증된 공동 연구팀의 기술은 한화비전 보안 카메라의 음향 이벤트 탐지에도 활용될 예정이다.

한화비전은 세계 최고 수준의 광학 설계, 제조 및 영상 처리 기술을 가진 글로벌 영상 보안 솔루션 기업입니다. 새로운 가치를 제시하고, 지속가능한 미래를 실현해 나갈 당신의 비전 파트너가 되겠습니다.