디노티시아, KV캐시 압축 기술 'STAR-KV' 공개…연산 속도 6.9배 향상

L'essentiel

AI 스타트업 디노티시아가 대규모언어모델(LLM)의 메모리 부담을 줄이는 KV캐시 압축 기술 'STAR-KV'를 공개했다. 이 기술은 KV캐시를 최대 20배 압축하고 연산 속도를 최대 6.9배 향상시켜 AI 추론 생태계에 기여할 것으로 기대된다.

Résumé généré par IA

Taille de police

Read the full article on 연합뉴스

Sujets liés

디노티시아

SujetsSTAR-KV KV캐시 AI 대규모언어모델 LLM 압축 기술

This article was originally published by 연합뉴스.

Articles liés

Plus sur ce sujet디노티시아

En développement·3 sa önce

비용 절감 돕는 모델 라우팅 스타트업 호황

기업들의 AI 사용료 부담이 커지면서, 무제한 사용 대신 작업 난이도에 따라 AI 모델을 선택하는 '모델맥싱'으로 전환하고 있다. 이에 따라 사용자 요청을 파악해 적합한 모델에 분배하는 '모델 라우팅' 스타트업이 호황을 누리고 있다.

연합뉴스

En développement·14 sa önce

세종시, 9~10일 AI·사이버보안 콘퍼런스 개최…국제 대학생 경진대회도 열려

세종시는 9~10일 정부세종컨벤션센터에서 '2026 핵테온 세종 AI·사이버보안 콘퍼런스'를 개최한다. 사이버보안 인재 발굴·양성과 정보보호 산업 육성을 목표로 하며, 국제 대학생 사이버보안 경진대회 본선도 열린다.

연합뉴스

En développement·15 sa önce

South Korea to Launch Fourth Earth Observation Satellite on SpaceX Rocket

South Korea plans to launch its fourth medium-sized Earth observation satellite on a SpaceX Falcon 9 rocket from California on Tuesday. The satellite will be used for applications including agriculture, disaster response, and public safety.

Yonhap News

En développement·15 sa önce

넥슨·스마일게이트, LA 애니메 엑스포서 신작 게임 체험존 운영

넥슨과 스마일게이트가 북미 최대 서브컬처 행사 'LA 애니메 엑스포'에 참가해 신작 게임 체험 부스를 운영하며 현지 팬들의 큰 호응을 얻고 있다. 넥슨은 '프로젝트 RX'의 인터랙티브 체험과 '블루 아카이브' DJ 공연을, 스마일게이트는 '카오스 제로 나이트메어'와 '미래시' 시연 공간을 선보였다.

연합뉴스

En développement·16 sa önce

일본, 내년까지 노선버스 무인 자율주행 실증 사업 추진

일본 정부가 내년까지 노선버스의 무인 자율주행 실증 사업을 추진한다. 경제산업성은 2027년까지 원격 감시 시스템을 도입해 운전 및 승객 응대까지 무인화하는 레벨4 자율주행 실증을 실시할 예정이다.

연합뉴스

En développement·17 sa önce

KAIST 연구팀, AI 에이전트 에너지 소비량 분석 결과 발표

KAIST 연구팀이 AI 에이전트가 기존 생성형 AI보다 질문당 최대 136.5배 많은 에너지를 소비하며, 응답 시간도 최대 153.7배 늘어난다는 분석 결과를 발표했다. 이는 AI 시대 경쟁력이 '더 효율적인 AI'로 옮겨가고 있음을 시사한다.

연합뉴스

Plus sur ce sujet디노티시아