Новый тест для искусственного интеллекта не проходит ни одна модель ИИ
korrespondent.net
Tue, 25 Mar 2025 17:45:00 +0200

Фонд Arc Prize Foundation выпустил новый тест для проверки способностей ИИ по сравнению с человеком под названием ARCAGI2 и объявил приз в 700 тысяч создателям первых пяти моделей, которые получат в этом тесте рейтинг в 85 или выше.
Информация опубликована на сайте фонда.
В отличие от других тестов, которые проверяют ИИ на специализированные знания или сверхточные вопросы, невозможные для людей, ARCAGI2 использует задания, простые для людей, но сложные для ИИ.
В тестах каждое задание решали как минимум 2 человека за 2 попытки или меньше в контролируемом исследовании с участием четырех сотен людей, поэтому каждая модель ИИ также получила всего две попытки.
Исследователи фонда обнаружили, что системам искусственного интеллекта трудно интерпретировать значение символов, которое выходит за пределы их визуального вида.
Системы пытались проверять симметрию, зеркальное отражение, трансформации и даже распознавали соединительные элементы, но не смогли определить значение самих символов.
Также ИИ тяжело дается выполнение заданий, которые требуют одновременного применения правил или применения нескольких правил, которые взаимодействуют между собой.
Если правила заданий должны изменяться в зависимости от контекста, современный искусственный интеллект тоже не справится с задачей.
Заметим, что несмотря на то, что каждые 2 человека в группах тестирования всегда вместе проходили тест полностью, средний результат для одного человека 60.
Напомним, ранее сообщалось, что в Китае заявили о создании первого в мире автономного агента ИИ.
Cloudflare создала ИИ для обмана ботов, которые собирают информацию для ИИ Новости от Корреспондент.net в Telegram и WhatsApp.
Подписывайтесь на наши каналы https//t.me/korrespondentnet и WhatsApp
Последние новости
