Запись - OpenVK

Закрыть

Старый интерфейс

вход

регистрация

помощь

📟 Пейджер » Стена » Запись

Все записи

Записи сообщества

Чужие записи

Запись

📟 Пейджер опубликовали
3 апр. в 18:11

Любопытный бенчмарк для оценки человекоподобного мышления у ИИ от знаменитого Франсуа Шолле (автора Keras).
Там 135 мини-игр на сетке 64×64. Агент должен сам исследовать среду, понять ее механики и догадаться о цели: никаких инструкций ему не дают.

Сейчас лучшая модель (Gemini 3.1 Pro) набирает лишь 0.37%. А люди — 100%. Но это пока.

Можете сами попробовать поиграть. Нажимаете Start и вперёд!

[ссылка в источнике]

Источник: https://arcprize.org/tasks/ls20

Комментарии (0)

Будьте первым, кто оставит комментарий!

Действия

об инстанции правила блог помощь разработчикам приватность

all languages »

OpenVK Altair Preview (9d43dd30-nightly) | PHP: 8.2.30 | DB: 8.0.34-26

OpenVK является любительской разработкой и никак не связан с ВКонтакте и компанией ООО "ВК"

время подавать напитки и вершить судьбы

Mastodon | Telegram | GitHub | Discord | Email

Powered by Debian

Хостинг предоставлен провайдером Senko Digital