Dernière minute
INTLTony Modra Critical After Truck Accident on Cattle PropertyINIndia Rejects Pakistan's Kashmir Claims, Calls Indus Waters Treaty Outdated at UNHRCINAccenture Shares Plunge Nearly 20% Amidst Mixed Financial Results and AI OptimismINNTA Launches Verified WhatsApp Channel for NEET UG 2026 Re-examinationUKBritish Actress Charged in Australia Over $208 Million Meth Smuggling PlotKRSouth Korea Loses to Mexico 1-0 in 2026 FIFA World Cup QualifyingAUWestern Australia Police to Trial Real-Time Facial Recognition CamerasAUCoroner Finds No Failings in Police or Hospital Response to Suicidal Veteran Steven AngusCNMalaysian Police Arrest 58 in World Cup Gambling SweepEUUS Defense Secretary Hegseth Launches Pentagon Review of European Forces, Criticizes AlliesINTLTony Modra Critical After Truck Accident on Cattle PropertyINIndia Rejects Pakistan's Kashmir Claims, Calls Indus Waters Treaty Outdated at UNHRCINAccenture Shares Plunge Nearly 20% Amidst Mixed Financial Results and AI OptimismINNTA Launches Verified WhatsApp Channel for NEET UG 2026 Re-examinationUKBritish Actress Charged in Australia Over $208 Million Meth Smuggling PlotKRSouth Korea Loses to Mexico 1-0 in 2026 FIFA World Cup QualifyingAUWestern Australia Police to Trial Real-Time Facial Recognition CamerasAUCoroner Finds No Failings in Police or Hospital Response to Suicidal Veteran Steven AngusCNMalaysian Police Arrest 58 in World Cup Gambling SweepEUUS Defense Secretary Hegseth Launches Pentagon Review of European Forces, Criticizes Allies
Newsgather
Backعالم روسي: الذكاء الطبيعي أهم من الذكاء الاصطناعي
عالم روسي: الذكاء الطبيعي أهم من الذكاء الاصطناعي
En développement
RT عربي1 g önceTech2 dk okumaArgentina

عالم روسي: الذكاء الطبيعي أهم من الذكاء الاصطناعي

L'essentiel

اختبار جديد يجمع بين مسائل رياضية معقدة وأسئلة غير مألوفة لأنظمة الذكاء الاصطناعي، أظهر أن النماذج الحالية أقل كفاءة من كبار العلماء وتفتقر للحدس الرياضي.

Résumé généré par IA

Pourquoi c'est important

أظهر اختبار جديد يجمع بين مسائل رياضية عالية التعقيد وأسئلة غير مألوفة لأنظمة الذكاء الاصطناعي، أن النماذج الحالية لا تزال أقل كفاءة من كبار العلماء.

Taille de police

عالم روسي: الذكاء الطبيعي أهم من الذكاء الاصطناعي

ولم تكن هذه المسائل ضمن بيانات التدريب الخاصة بالنماذج المشاركة، فيما تولّى علماء رياضيات متخصصون مراجعة الإجابات وتقييمها. ويُعد هذا الاختبار الأول من نوعه، إذ يجمع بين مسائل عالية التعقيد، وأسئلة جديدة غير مألوفة لأنظمة الذكاء الاصطناعي، إلى جانب تقييم رسمي يجريه خبراء متخصصون.

وأظهرت النتائج أن نماذج الذكاء الاصطناعي الحالية لا تزال أقل كفاءة من كبار علماء الرياضيات في التعامل مع مسائل مماثلة، كما أنها تفتقر إلى الحدس الرياضي وتظل عرضة لارتكاب الأخطاء أو ما يُعرف بـ"الهلوسة".

واقترح عشرة باحثين هذه المسائل من أعمالهم العلمية غير المنشورة. واقتصرت المشاركة على النماذج المتاحة للجمهور، بما في ذلك نموذج ChatGPT 5.5 Pro من OpenAI، إلى جانب فرق أكاديمية من جامعة كاليفورنيا، وجامعة برينستون، والمعهد الفيدرالي السويسري للتكنولوجيا في زيورخ.

وطوّرت فرق من جامعة كاليفورنيا والمعهد الفيدرالي السويسري للتكنولوجيا ما يُعرف بـ"الأنظمة الوسيطة"، وهي أنظمة يتولى فيها أحد روبوتات الدردشة طرح الحلول، بينما يقوم آخر بمراجعتها والتحقق منها، مع تبادل المعلومات بينهما عدة مرات عند الحاجة.

وسجّل نموذج المعهد الفيدرالي السويسري للتكنولوجيا أفضل أداء، بعدما نجح في حل ست مسائل من أصل عشر. واعتمد النظام على تحسين استجابات ChatGPT من خلال "مجلس استشاري" مكوّن من ثلاثة روبوتات دردشة متقدمة. وجاء فريق جامعة كاليفورنيا في المركز الثاني بنظام مساعد قائم على ChatGPT، تلاه فريق OpenAI باستخدام ChatGPT دون أدوات مساعدة، ثم فريق جامعة برينستون الذي استخدم نظاما قائما على Gemini 3.1 Pro.

ورغم ذلك، لم يتمكن أي فريق من حل ثلاث مسائل من أصل عشر. ووفقا للمشاركين، افتقرت الأنظمة في بعض الحالات إلى الفكرة الجوهرية التي يتوصل إليها البشر بصورة بديهية، بينما نجحت في حالات أخرى في اختيار النهج الصحيح لكنها أخفقت في تنفيذ التفاصيل بدقة.

ومن أبرز التحديات التي رُصدت ظاهرة "الهلوسة"، حيث قدمت أنظمة الذكاء الاصطناعي نتائج غير صحيحة حتى عند مطالبتها بالتحقق من المراجع. كما لوحظ أن بعض النماذج قامت بنسخ أجزاء من مقالات ومصادر منشورة دون الإشارة إليها بشكل واضح.

وأشار الباحثون إلى أن نشر هذه المسائل سيتيح للشركات والمؤسسات الأخرى استخدامها مستقبلا لاختبار قدرات أنظمة الذكاء الاصطناعي وتقييم أدائها في مواجهة التحديات الرياضية المعقدة.

Questions ouvertes

  • متى ستتجاوز نماذج الذكاء الاصطناعي الحدس البشري؟
  • ما هي آليات تطوير الحدس الرياضي للذكاء الاصطناعي؟

Sujets liés

This article was originally published by RT عربي.

Articles liés

Google DeepMind's AI Preparedness Chief on Preparing the World for AI
En développement·14 sa önce

Google DeepMind's AI Preparedness Chief on Preparing the World for AI

ليلى إبراهيم، رئيسة قسم الاستعداد للذكاء الاصطناعي في جوجل ديب مايند، تركز على إعداد العالم للتطور السريع للذكاء الاصطناعي، وتساعد الحكومات على وضع السياسات، وتعزز فهم الجمهور، وتضمن استخدام جوجل للذكاء الاصطناعي بمسؤولية. أجرت فريقها تمارين ميدانية في سنغافورة لتقييم تأثير الذكاء الاصطناعي على الرعاية الصحية والوظائف.

الشرق الأوسط
الذكاء الاصطناعي في الطب والتعليم: رهانات وتحديات
En développement·16 sa önce

الذكاء الاصطناعي في الطب والتعليم: رهانات وتحديات

مقالات متعددة تناقش دور الذكاء الاصطناعي في الطب، مع التركيز على التحديات التي تواجه دمجه في الممارسة السريرية، بالإضافة إلى استعراض برامج الذكاء الاصطناعي الأكاديمية في الجامعات الأميركية ومشاريع مبتكرة في مجالات الطب والتصميم.

الشرق الأوسط
تطور الذاكرة الرقمية: من 8 ميغابايت إلى تيرابايت، ودورها في مستقبل الألعاب
En développement·17 sa önce

تطور الذاكرة الرقمية: من 8 ميغابايت إلى تيرابايت، ودورها في مستقبل الألعاب

تطورت وحدات التخزين الرقمية بشكل هائل خلال 25 عامًا، حيث انتقلت من سعة 8 ميغابايت إلى أكثر من تيرابايت، لتصبح ضرورية للألعاب المحمولة الحديثة والاشتراكات السحابية، مع ظهور تقنيات مثل SanDisk microSD Express.

الشرق الأوسط
Plus sur ce sujetذكاء اصطناعي