Система использовала модель Gemini от Google для размышлений о целях, объяснения своих планов и действий в незнакомых играх.
SIMA 2 научилась новым навыкам через самостоятельную игру и адаптировалась к мирам, созданным мгновение назад Джинни 3.
DeepMind запланировала ограниченный исследовательский предварительный просмотр для разработчиков и ученых.
Центр искусства, моды и развлечений Decrypt.
Откройте SCENE
Google DeepMind представила SIMA 2 в четверг — новый ИИ-агент, который, по утверждению компании, ведет себя как “спутник” в виртуальных мирах. С запуском SIMA 2 DeepMind стремится продвинуться дальше простых действий на экране и перейти к ИИ, который может планировать, объяснять свои действия и учиться на опыте.
“Это значительный шаг в направлении Искусственного Общего Интеллекта (AGI), с важными последствиями для будущего робототехники и воплощения ИИ в целом,” сообщила компания на своем сайте.
Первая версия SIMA (Масштабируемый Инструктируемый Мультиверсальный Агент), выпущенная в марте 2024 года, изучила сотни базовых навыков, наблюдая за экраном и используя виртуальные клавиатуру и мышь. Новая версия SIMA, по словам Google, делает шаг вперед, позволяя ИИ мыслить самостоятельно.
SIMA 2 - наш самый мощный ИИ-агент для виртуальных 3D-миров. 👾🌐
Запущенный компанией Gemini, он выходит за рамки выполнения базовых инструкций, чтобы думать, понимать и действовать в интерактивных средах — это означает, что вы можете общаться с ним через текст, голос или даже изображения. Вот как 🧵 pic.twitter.com/DuVWGJXW7W
— Google DeepMind (@GoogleDeepMind) ноября 13, 2025
<br>
“SIMA 2 - это наш самый мощный ИИ-агент для виртуальных 3D-миров,” написала Google DeepMind в X. “Работая на платформе Gemini, он выходит за рамки выполнения базовых инструкций, чтобы мыслить, понимать и предпринимать действия в интерактивных средах - это означает, что вы можете общаться с ним с помощью текста, голоса или даже изображений.”
Используя модель искусственного интеллекта Gemini, Google заявила, что SIMA может интерпретировать высокоуровневые цели, обсуждать шаги, которые она намерена предпринять, и сотрудничать внутри игр с уровнем рассуждений, которого оригинальная система не могла достичь.
DeepMind сообщила о более сильной генерализации в виртуальных средах и о том, что SIMA 2 завершила более длинные и сложные задачи, которые включали логические подсказки, эскизы, нарисованные на экране, и эмодзи.
“В результате этой способности производительность SIMA 2 значительно ближе к производительности человека в широком круге задач,” - написала Google, отметив, что у SIMA 2 уровень выполнения задач составил 65%, по сравнению с 31% у SIMA 1.
Система также интерпретировала инструкции и действовала внутри совершенно новых 3D-миров, созданных Genie 3, еще одним проектом DeepMind, выпущенным в прошлом году, который создает интерактивные среды из одного изображения или текстового запроса. SIMA 2 ориентировалась, понимала цели и принимала значимые действия в мирах, с которыми она никогда не сталкивалась до момента тестирования.
“SIMA 2 теперь гораздо лучше выполняет детальные инструкции, даже в мирах, которых она никогда не видела,” написала Google. “Она может переносить усвоенные концепции, такие как 'добыча' в одной игре и применять их к 'сбору' в другой—связывая точки между похожими задачами.”
После изучения человеческих демонстраций исследователи сообщили, что агент перешел к самонаправленной игре, используя метод проб и ошибок, а также обратную связь, созданную Gemini, для создания новых данных опыта, включая цикл обучения, в котором SIMA 2 генерировала задачи, пыталась их выполнить, а затем передавала свои собственные данные о траектории обратно в следующую версию модели.
Хотя Google назвал SIMA 2 шагом вперёд для искусственного интеллекта, исследование также выявило пробелы, которые всё ещё необходимо устранить, включая трудности с очень длинными многоэтапными задачами, работу в условиях ограниченного объёма памяти и проблемы визуальной интерпретации, характерные для 3D AI систем.
Тем не менее, DeepMind заявила, что платформа служила испытательным полигоном для навыков, которые в конечном итоге могут перейти в робототехнику и навигацию.
“Наше исследование SIMA 2 предлагает надежный путь к приложениям в робототехнике и еще один шаг к AGI в реальном мире,” говорится в сообщении.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Новый AI-агент Google DeepMind учится, адаптируется и играет в игры как человек
В кратце
Центр искусства, моды и развлечений Decrypt.
Откройте SCENE
Google DeepMind представила SIMA 2 в четверг — новый ИИ-агент, который, по утверждению компании, ведет себя как “спутник” в виртуальных мирах. С запуском SIMA 2 DeepMind стремится продвинуться дальше простых действий на экране и перейти к ИИ, который может планировать, объяснять свои действия и учиться на опыте.
“Это значительный шаг в направлении Искусственного Общего Интеллекта (AGI), с важными последствиями для будущего робототехники и воплощения ИИ в целом,” сообщила компания на своем сайте.
Первая версия SIMA (Масштабируемый Инструктируемый Мультиверсальный Агент), выпущенная в марте 2024 года, изучила сотни базовых навыков, наблюдая за экраном и используя виртуальные клавиатуру и мышь. Новая версия SIMA, по словам Google, делает шаг вперед, позволяя ИИ мыслить самостоятельно.
— Google DeepMind (@GoogleDeepMind) ноября 13, 2025
<br>
“SIMA 2 - это наш самый мощный ИИ-агент для виртуальных 3D-миров,” написала Google DeepMind в X. “Работая на платформе Gemini, он выходит за рамки выполнения базовых инструкций, чтобы мыслить, понимать и предпринимать действия в интерактивных средах - это означает, что вы можете общаться с ним с помощью текста, голоса или даже изображений.”
Используя модель искусственного интеллекта Gemini, Google заявила, что SIMA может интерпретировать высокоуровневые цели, обсуждать шаги, которые она намерена предпринять, и сотрудничать внутри игр с уровнем рассуждений, которого оригинальная система не могла достичь.
DeepMind сообщила о более сильной генерализации в виртуальных средах и о том, что SIMA 2 завершила более длинные и сложные задачи, которые включали логические подсказки, эскизы, нарисованные на экране, и эмодзи.
“В результате этой способности производительность SIMA 2 значительно ближе к производительности человека в широком круге задач,” - написала Google, отметив, что у SIMA 2 уровень выполнения задач составил 65%, по сравнению с 31% у SIMA 1.
Система также интерпретировала инструкции и действовала внутри совершенно новых 3D-миров, созданных Genie 3, еще одним проектом DeepMind, выпущенным в прошлом году, который создает интерактивные среды из одного изображения или текстового запроса. SIMA 2 ориентировалась, понимала цели и принимала значимые действия в мирах, с которыми она никогда не сталкивалась до момента тестирования.
“SIMA 2 теперь гораздо лучше выполняет детальные инструкции, даже в мирах, которых она никогда не видела,” написала Google. “Она может переносить усвоенные концепции, такие как 'добыча' в одной игре и применять их к 'сбору' в другой—связывая точки между похожими задачами.”
После изучения человеческих демонстраций исследователи сообщили, что агент перешел к самонаправленной игре, используя метод проб и ошибок, а также обратную связь, созданную Gemini, для создания новых данных опыта, включая цикл обучения, в котором SIMA 2 генерировала задачи, пыталась их выполнить, а затем передавала свои собственные данные о траектории обратно в следующую версию модели.
Хотя Google назвал SIMA 2 шагом вперёд для искусственного интеллекта, исследование также выявило пробелы, которые всё ещё необходимо устранить, включая трудности с очень длинными многоэтапными задачами, работу в условиях ограниченного объёма памяти и проблемы визуальной интерпретации, характерные для 3D AI систем.
Тем не менее, DeepMind заявила, что платформа служила испытательным полигоном для навыков, которые в конечном итоге могут перейти в робототехнику и навигацию.
“Наше исследование SIMA 2 предлагает надежный путь к приложениям в робототехнике и еще один шаг к AGI в реальном мире,” говорится в сообщении.