Rakuten запустил японскую большую языковую модель Rakuten AI 3.0, вызвав спор из-за предположения, что она основана на архитектуре DeepSeek

Gate News сообщает, 17 марта группа Rakuten объявила о запуске специализированной японской модели Rakuten AI 3.0. Компания заявила, что эта модель показывает лучшие результаты по нескольким японским стандартным тестам, таким как японская культура и история, соблюдение инструкций, по сравнению с моделями вроде GPT-4, и разработана на основе открытых моделей сообщества с использованием собственных двуязычных данных. Однако некоторые пользователи на платформе X обнаружили, что в файле config.json на странице проекта Hugging Face содержится строка "model_type: deepseek_v3" и другие подобные. Кроме того, при ответах на связанные вопросы эта модель явно склоняется в сторону Китая, а не Японии. Это открытие вызвало обсуждения среди пользователей о том, основана ли эта модель на DeepSeek и сколько японских технологий было разработано самостоятельно.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев