Son Dakika
ESEspaña sufre su primera derrota ante Georgia camino al Mundial 2027ARعاصفة رعدية توقف مران مصر، أوساكا تقصي سابالينكا، وبالوغون يشارك أمام بلجيكاINTLSemi-truck spills 40,000 pounds of Frank's RedHot hot sauce in Ohio heatwaveARمحلل أمريكي يقترح على بولندا أن تحذو حذو روسيا تجاه أوكرانياARتفكيك خلية اغتيالات في محافظة حماة السوريةRUГлава МИД Финляндии: Сотрудничество Китая с Россией бросает вызов безопасности ЕвропыKR네타냐후, 美 폭스뉴스 인터뷰서 "이란 핵무기 포기 목표 같다"BRConcurso Guarda Municipal: 100 vagas com salário inicial de R$ 4.005,53INTLNaomi Osaka Stuns World No. 1 Aryna Sabalenka to Reach Wimbledon QuarterfinalsSEFem nyheter från 5 juliESEspaña sufre su primera derrota ante Georgia camino al Mundial 2027ARعاصفة رعدية توقف مران مصر، أوساكا تقصي سابالينكا، وبالوغون يشارك أمام بلجيكاINTLSemi-truck spills 40,000 pounds of Frank's RedHot hot sauce in Ohio heatwaveARمحلل أمريكي يقترح على بولندا أن تحذو حذو روسيا تجاه أوكرانياARتفكيك خلية اغتيالات في محافظة حماة السوريةRUГлава МИД Финляндии: Сотрудничество Китая с Россией бросает вызов безопасности ЕвропыKR네타냐후, 美 폭스뉴스 인터뷰서 "이란 핵무기 포기 목표 같다"BRConcurso Guarda Municipal: 100 vagas com salário inicial de R$ 4.005,53INTLNaomi Osaka Stuns World No. 1 Aryna Sabalenka to Reach Wimbledon QuarterfinalsSEFem nyheter från 5 juli
Newsgather
GeriMicrosoft Research warns against delegating tasks to AI without verification
Microsoft Research warns against delegating tasks to AI without verification
Gelişiyor
Le Figaro Actualités23.05.2026Teknoloji1 dk okumaFrance

Microsoft Research warns against delegating tasks to AI without verification

Hızlı Bakış

Microsoft Research warns that current large language models (LLMs) like ChatGPT are not reliable agents and can introduce rare but serious errors that silently corrupt documents over long interactions, urging against delegating tasks without verification.

Yapay zekâ özeti

Neden Önemli?

Researchers from Microsoft Research have published a study on a pre-publication server warning about the unreliability of current large language models (LLMs) like ChatGPT for delegating tasks on documents without verification.

Yazı boyutu

Peut-on déléguer à une intelligence artificielle une suite de tâches sur un même document, sans avoir à vérifier le résultat final ? Pas encore, expliquent des chercheurs de Microsoft Research dans une étude mise en ligne sur un serveur de prépublication.

Ils mettent en garde contre le fait que les grands modèles de langage (LLM) actuels, comme ChatGPT, « ne sont pas des agents fiables : ils introduisent des erreurs rares mais graves qui corrompent silencieusement les documents et se cumulent au fil de longues interactions ».

Un avertissement tranché, alors que dans de très nombreux secteurs de l’économie, la tentation est de plus en plus forte de remplacer des êtres humains par des IA.

Pour arriver à cette conclusion, les trois chercheurs de Microsoft ont employé les grands moyens : ils ont mis au point un test de performance sur des dizaines de tâches différentes, avec lequel ils ont évalué 19 modèles d’IA.

Plusieurs versions de ChatGPT, développée par OpenAI, qui a…

Açık Sorular

  • What specific types of errors do LLMs introduce?
  • What is the threshold for 'long interactions' where errors accumulate?
  • What are the proposed solutions or mitigation strategies for these AI errors?
  • How does the performance of the 19 tested AI models compare specifically?

İlgili Konular

Bu haber ilk olarak şurada yayınlandı: Le Figaro Actualités.