연합뉴스4d agoTech1 min readSouth Korea

한국 특화 안전성 평가체계 마련…글로벌 AI 검증 경쟁 본격화

Quick Look

KT와 고려대가 한국형 멀티모달 대형언어모델(MLLM) 안전성 평가 벤치마크 'KSAFE-MM'을 공개했다. 이는 한국 문화 맥락과 사회 고유 이슈를 반영한 국내 최대 규모의 한국어 MLLM 안전성 평가 데이터셋으로, 12개 MLLM을 검증했다.

AI-generated summary

KT와 고려대는 한국형 멀티모달 대형언어모델(MLLM) 안전성 평가 벤치마크 'KSAFE-MM'을 공개했다. 이는 한국 문화 맥락과 사회 고유 이슈를 반영한 국내 최대 규모의 한국어 MLLM 안전성 평가 데이터셋이다.

Font size

한국 특화 안전성 평가체계 마련…글로벌 AI 검증 경쟁 본격화

(서울=연합뉴스) 박형빈 기자 = KT[030200]가 고려대와 공동으로 한국형 멀티모달 대형언어모델(MLLM) 안전성 평가 벤치마크 'KSAFE-MM'을 공개했다고 16일 밝혔다.

'KSAFE-MM'은 글로벌 공통 리스크를 한국 문화 맥락으로 변환한 'KSAFE-MM-G'와 전세 사기, 독도 분쟁과 같은 한국 사회 고유의 이슈를 반영한 'KSAFE-MM-C'로 구성된다.

총 1만4천135개의 평가 샘플로 구성된 국내 최대 규모 한국어 멀티모달 안전성 평가 데이터셋으로, 젬마와 하이퍼클로바 X 등 12개 MLLM을 검증했다.

특히 민감 주제 수집부터 질의 생성, 합성 이미지 제작, 탈옥 질의 생성까지 전 과정을 자동화한 4단계 파이프라인을 구현한 것이 특징이다.

KT와 고려대 연구진은 동일한 방식을 일본어에 적용한 실험을 통해 다른 문화권으로의 확장 가능성도 확인했다고 설명했다.

업계에서는 AI 서비스 확산과 함께 안전성 검증의 필요성도 커져 국가·문화별 특성을 반영한 AI 평가 체계 구축 경쟁을 중요한 지점으로 보고 있다.

이번 연구 결과와 벤치마크는 아카이브와 허깅페이스에 공개돼 AI 서비스 안전성 검증과 레드팀 테스트 등에 활용될 전망이다.