Dernière minute
CN桂冠原味沙拉檢出苯駢芘超標 中聯油脂受波及啟動回收VNDự thảo Luật Phòng, chống tác hại của thuốc lá: Yêu cầu xuất trình CCCD/VNeID khi mua thuốcDEPaketbombenanschlag in Monaco: Verdächtige identifiziertKR신조어 '화이트하라' 등장… 부하 직원을 지나치게 배려하는 것도 괴롭힘VNMỹ kỷ lục với màn bắn pháo hoa 40 phút mừng 250 năm quốc khánhCN中國軍機30架次、軍艦7艘、公務船5艘擾台CN國軍「神弓、神鷹」飛彈操演 刺針家族4款飛彈全數登場AUSuspected Bird Flu Case Identified in NSW Wild BirdVNTaylor Swift và Travis Kelce chi 10 triệu USD cho đám cưới tại Madison Square GardenDEMieten in deutschen Großstädten steigen um 51 Prozent in zehn JahrenCN桂冠原味沙拉檢出苯駢芘超標 中聯油脂受波及啟動回收VNDự thảo Luật Phòng, chống tác hại của thuốc lá: Yêu cầu xuất trình CCCD/VNeID khi mua thuốcDEPaketbombenanschlag in Monaco: Verdächtige identifiziertKR신조어 '화이트하라' 등장… 부하 직원을 지나치게 배려하는 것도 괴롭힘VNMỹ kỷ lục với màn bắn pháo hoa 40 phút mừng 250 năm quốc khánhCN中國軍機30架次、軍艦7艘、公務船5艘擾台CN國軍「神弓、神鷹」飛彈操演 刺針家族4款飛彈全數登場AUSuspected Bird Flu Case Identified in NSW Wild BirdVNTaylor Swift và Travis Kelce chi 10 triệu USD cho đám cưới tại Madison Square GardenDEMieten in deutschen Großstädten steigen um 51 Prozent in zehn Jahren
Newsgather
BackKAIST 등, 영상 이해해 소리 자동 구현 AI 개발…음향 제작 자동화 기대
KAIST 등, 영상 이해해 소리 자동 구현 AI 개발…음향 제작 자동화 기대
Tech
연합뉴스26.05.2026Tech2 dk okumaSouth Korea

KAIST 등, 영상 이해해 소리 자동 구현 AI 개발…음향 제작 자동화 기대

L'essentiel

KAIST 연구팀이 영상 속 상황을 이해해 현실감 있는 소리를 생성하는 AI 기술 '파바스'(PAVAS)를 개발했다. 이 기술은 물체의 물리 정보를 추론해 음향 제작을 자동화하고 AR/VR, 메타버스 등 다양한 분야에 활용될 전망이다.

Résumé généré par IA

Pourquoi c'est important

KAIST 연구팀이 영상 속 상황을 이해해 현실감 있는 소리를 생성하는 AI 기술 '파바스'(PAVAS)를 개발했다. 이 기술은 영상 속 물체의 질량과 속도 등 눈에 보이지 않는 물리 정보를 AI가 스스로 추론하도록 설계되었으며, 단순히 '무엇이 보이는지'를 넘어 '왜 이런 소리가 발생해야 하는지'에 대한 물리적 원인까지 AI가 이해하도록 만들었다.

Taille de police

KAIST 등 소리 자동 구현 AI 개발…영화·게임 등 음향 제작 자동화

(대전=연합뉴스) 김준호 기자 = 한국과학기술원(KAIST)은 전산학부 오태현 교수 연구팀이 영상 속 상황을 이해해 보다 현실감 있는 소리를 생성하는 인공지능(AI) 기술 '파바스'(PAVAS)를 개발했다고 26일 밝혔다.

POSTECH·소니 AI가 참여한 공동 연구진은 영상 속 물체의 질량과 속도 등 눈에 보이지 않는 물리 정보를 AI가 스스로 추론하도록 설계했다.

일반적인 영상에는 물체의 정확한 무게나 속도가 숫자로 제시되지 않지만, 연구팀은 AI가 주변 환경과 움직임의 맥락을 분석해 이를 추정하고 그 결과를 소리 생성 과정에 반영하도록 했다.

단순히 '무엇이 보이는지'를 인식하는 수준을 넘어 '왜 이런 소리가 발생해야 하는지'에 대한 물리적 원인까지 AI가 이해하도록 만든 것이다.

기술 검증 결과, 연구팀의 AI는 물체 간 충돌이나 타격 등 물리적 상호작용이 발생하는 장면에서 실제 환경과 매우 유사한 소리를 생성했다. 물체 질량·속도가 달라질 때 소리 크기·음색도 자연스럽게 변화하는 등 보다 현실감 있는 음향을 구현했다고 연구팀은 설명했다.

파바스는 영상 속 객체의 움직임과 충돌 특성을 분석해 장면과 정밀하게 맞아떨어지는 현실적인 효과음을 생성했다고 연구팀은 덧붙였다.

향후 이 기술은 콘텐츠 음향 제작 자동화는 물론 증강현실(AR)·가상현실(VR) 콘텐츠, 메타버스, 로보틱스 시뮬레이션 등 다양한 분야에서 더욱 몰입감 있는 사용자 경험을 제공할 수 있을 것으로 기대된다.

오태현 교수는 "향후 텍스트·영상·음성 등 다양한 정보를 동시에 이해하고 처리하는 차세대 AI의 핵심 기반 기술로 확장될 수 있을 것"이라고 말했다.

À surveiller

Perspective IA — des possibilités, pas des certitudes

  • PAVAS 기술이 콘텐츠 음향 제작 자동화에 활용될 것이다.

    Très probable · Moyen terme

  • PAVAS 기술이 AR/VR, 메타버스, 로보틱스 시뮬레이션 등 다양한 분야에서 사용자 경험을 향상시킬 것이다.

    Très probable · Moyen terme

  • PAVAS 기술이 텍스트·영상·음성 등 다양한 정보를 동시에 이해하고 처리하는 차세대 AI의 핵심 기반 기술로 확장될 것이다.

    Probable · Long terme

Questions ouvertes

  • PAVAS 기술의 상용화 시점은 언제인가?
  • 구체적으로 어떤 종류의 물리적 상호작용 소리를 더 잘 생성하는가?
  • 기존 음향 제작 방식 대비 비용 및 시간 절감 효과는 어느 정도인가?
  • 다른 AI 모델과의 성능 비교 결과는 어떠한가?

Sujets liés

This article was originally published by 연합뉴스.

Articles liés

Plus sur ce sujet인공지능