딥브레인AI, 국제 학술대회서 'AI 휴먼' 논문 2편 채택
2023.03
02
뉴스관리팀장
17시 52분
330
0
본문
인공지능(AI) 전문 기업 딥브레인AI는 자사 AI 연구소에서 제출한 논문이 세계 최고 권위의 국제 음향·음성·신호처리 학술대회(ICASSP)에 채택됐다고 2일 밝혔다.
올해로 48주년을 맞이하는 ICASSP은 국제전기전자협회 신호처리학회가 주최하는 음향·음성·신호처리 분야 세계 최대 규모의 국제 학회다. ICASSP의 올해 주제는 ‘인공지능 시대의 신호처리’로, 작년 대비 2배에 가까운 6000편 이상의 논문이 제출돼 역대 최대 경쟁률을 기록했다.
이번에 ICASSP에서 채택한 딥브레인AI의 논문은 각각 영상 합성과 음성 합성을 다룬 연구 2건이다. 딥브레인AI는 올해 6월 그리스 로도스 섬에서 개최되는 ICASSP 2023에 참여해 전 세계 유명 석학과 기업 연구자를 대상으로 해당 논문들을 소개하게 된다.
딥브레인AI의 영상 합성 논문은 기하 변환 병목을 통해 머리 움직임, 립싱크, 표정을 분리 제어하는 기술인 ‘디스코헤드(DisCoHead)’를 다룬 내용이다. 머리와 얼굴의 신체 부위를 세분화해 상반신 이미지가 원하는 음성과 영상을 자연스럽게 따라가도록 컨트롤하는 방법을 소개한다. 딥브레인AI에서 세계 최초로 성공한 이 기술은 상반신의 자세와 발화 동작 및 비발화 표정을 자유롭게 조절 가능해 기존 방식보다 자유도가 높은 고품질의 가상 인간을 제작할 수 있다.
음성 합성 논문에서는 중국어 문자소-음소 변환을 위한 콘텍스트 모델링 기법을 다뤘다. 이 연구는 중국어 병음 변환 시 인접한 문자들 사이의 관계를 강조해 다음자의 병음 변환 정확도를 향상시키는 ‘문맥 강화 기법’을 제안한다. 딥브레인AI는 연구를 통해 학습한 병음 변환 모델을 자사 중국어 음성합성 서비스에 적용해 음성합성의 품질을 한 단계 높일 예정이다.
이 밖에도 딥브레인AI는 AI 영상합성 분야에서 국내외 148건의 지적 재산권을 출원 또는 등록했으며, 국제 컴퓨터 비전 학회 2021과 인터스피치 2021에 딥페이크 탐지와 음성 합성 관련 논문을 등재하는 등 더 나은 AI 휴먼을 제공하기 위한 연구 수행 및 기술 개발에 지속적인 노력을 기울이고 있다.
장세영 딥브레인AI 대표는 "세계 최고 권위를 지닌 학회에서 당사의 AI 휴먼 기술력을 다시 한번 입증할 수 있게 돼 매우 기쁘다”며 “앞으로도 학술적인 연구와 함께 사용자들이 더욱 편리하게 사용할 수 있는 AI 휴먼 서비스 고도화를 통해 생성 AI 분야 글로벌 선도 기업으로 발돋움해 나갈 것”이라고 말했다.
한편, 딥브레인AI는 누구나 쉽게 사용 가능하고, 비즈니스에 편리함을 제공하는 대화형 인공지능 구현을 목표로 다양한 생성 AI 기술 및 서비스를 제공하고 있으며, 최근에는 글로벌 시장조사기관 CB 인사이트가 선정한 ‘글로벌 250대 제너레이티브 AI(생성형 인공지능) 스타트업’ 중 엔터프라이즈 AI 아바타 분야 유망 기업 명단에 이름을 올린 바 있다.
올해로 48주년을 맞이하는 ICASSP은 국제전기전자협회 신호처리학회가 주최하는 음향·음성·신호처리 분야 세계 최대 규모의 국제 학회다. ICASSP의 올해 주제는 ‘인공지능 시대의 신호처리’로, 작년 대비 2배에 가까운 6000편 이상의 논문이 제출돼 역대 최대 경쟁률을 기록했다.
이번에 ICASSP에서 채택한 딥브레인AI의 논문은 각각 영상 합성과 음성 합성을 다룬 연구 2건이다. 딥브레인AI는 올해 6월 그리스 로도스 섬에서 개최되는 ICASSP 2023에 참여해 전 세계 유명 석학과 기업 연구자를 대상으로 해당 논문들을 소개하게 된다.
딥브레인AI의 영상 합성 논문은 기하 변환 병목을 통해 머리 움직임, 립싱크, 표정을 분리 제어하는 기술인 ‘디스코헤드(DisCoHead)’를 다룬 내용이다. 머리와 얼굴의 신체 부위를 세분화해 상반신 이미지가 원하는 음성과 영상을 자연스럽게 따라가도록 컨트롤하는 방법을 소개한다. 딥브레인AI에서 세계 최초로 성공한 이 기술은 상반신의 자세와 발화 동작 및 비발화 표정을 자유롭게 조절 가능해 기존 방식보다 자유도가 높은 고품질의 가상 인간을 제작할 수 있다.
음성 합성 논문에서는 중국어 문자소-음소 변환을 위한 콘텍스트 모델링 기법을 다뤘다. 이 연구는 중국어 병음 변환 시 인접한 문자들 사이의 관계를 강조해 다음자의 병음 변환 정확도를 향상시키는 ‘문맥 강화 기법’을 제안한다. 딥브레인AI는 연구를 통해 학습한 병음 변환 모델을 자사 중국어 음성합성 서비스에 적용해 음성합성의 품질을 한 단계 높일 예정이다.
이 밖에도 딥브레인AI는 AI 영상합성 분야에서 국내외 148건의 지적 재산권을 출원 또는 등록했으며, 국제 컴퓨터 비전 학회 2021과 인터스피치 2021에 딥페이크 탐지와 음성 합성 관련 논문을 등재하는 등 더 나은 AI 휴먼을 제공하기 위한 연구 수행 및 기술 개발에 지속적인 노력을 기울이고 있다.
장세영 딥브레인AI 대표는 "세계 최고 권위를 지닌 학회에서 당사의 AI 휴먼 기술력을 다시 한번 입증할 수 있게 돼 매우 기쁘다”며 “앞으로도 학술적인 연구와 함께 사용자들이 더욱 편리하게 사용할 수 있는 AI 휴먼 서비스 고도화를 통해 생성 AI 분야 글로벌 선도 기업으로 발돋움해 나갈 것”이라고 말했다.
한편, 딥브레인AI는 누구나 쉽게 사용 가능하고, 비즈니스에 편리함을 제공하는 대화형 인공지능 구현을 목표로 다양한 생성 AI 기술 및 서비스를 제공하고 있으며, 최근에는 글로벌 시장조사기관 CB 인사이트가 선정한 ‘글로벌 250대 제너레이티브 AI(생성형 인공지능) 스타트업’ 중 엔터프라이즈 AI 아바타 분야 유망 기업 명단에 이름을 올린 바 있다.
댓글목록 0