Телефон напханий великими моделями, і це тільки початок

Першоджерело: Photon Planet

Джерело зображення: Створено Unbounded AI

Виробники мобільних телефонів, яким терміново потрібно знайти новий маховик, придивляються до великих моделей.

На конференції розробників на початку серпня Huawei оголосила, що інтегрує у велику модель Xiaoyi, помічника зі штучним інтелектом у HarmonyOS 4, і запросила її протестувати наприкінці серпня. Xiaomi також відкрила тест запрошення свого ШІ-помічника Xiaoai, щоб отримати доступ до великої моделі приблизно в той же час. За ними пішли OPPO і vivo, які почали експериментувати з великими моделями мобільних телефонів у листопаді.

«Запихання великих моделей у мобільні телефони» не є чимось новим у галузі,Не кажучи вже про vivo, який інтенсивно розігрівається з середини жовтня,Rongmi O три розкрили відповідні новини на прес-конференції, що відбулася цього року。 Загальна думка в індустрії полягає в тому, що апаратна частина доріжки смартфона майже не розгортається, і більшість великих моделей, що працюють у хмарі, є лише змінною, яка вільна від апаратного забезпечення.

Слід зазначити, що розгортання на стороні пристрою також є галузевою тенденцією для великих моделей. Візьмемо для прикладу ChatGPT, як типового представника хмарної великої моделі, його навчання та висновки запускаються в Microsoft Azure, а користувачі отримують результати через браузери або програми. Між введенням-виведенням і туди-сюди існує не тільки затримка, яка впливає на взаємодію з користувачем, але й витрати на хмару, такі як споживання енергії та обчислювальна потужність.

З точки зору реальних сценаріїв і потреб, багато потреб можуть бути задоволені периферійними пристроями, особливо широко використовуваними терміналами, такими як мобільні телефони, ПК і транспортні засоби на нових джерелах енергії.

В результаті кінцеве розгортання великих моделей поступово перетворилося на консенсус, не тільки виробники мобільних телефонів прикували свої зусилля до навчання моделей, але й Lenovo на треку ПК та Qualcomm на доріжці чіпів деякий час тому випустили відповідні рішення для кінцевого ШІ. Зокрема, щойно випущені Qualcomm Snapdragon 8 Gen3 та MediaTek Dimensity 9300, покращення їх продуктивності ШІ, можна сказати, є основою великої моделі на мобільному телефоні.

Потреби галузі та умови апаратного забезпечення були задоволені, і велика модель нарешті може увійти в мобільний телефон. Що досить дивно, так це те, що першим виробником мобільних телефонів, який випустив «повноцінний продукт», є vivo.

**В якому стані модель vivo large? **

1 листопада компанія vivo провела конференцію розробників, на якій випустила власноруч розроблену велику модельну матрицю «BlueLM», що включає 1 мільярд, 10 мільярдів, 100 мільярдів та інші різні масштаби параметрів. У той же час вона також випустила OriginOS 4, самостійно розроблену операційну систему, адаптовану до її великої моделі.

Перед обличчям «землі обітованої» великих моделей завзяття vivo майже написано на його обличчі.

Згідно з останніми даними, опублікованими агентством маркетингових досліджень Canalys, 26 жовтня відвантаження та відвантаження vivo знизилися, а також рейтинг впав. vivo терміново потрібні великі моделі та OriginOS 4, щоб переломити ситуацію, і не дивно, що вона першою «відкриє книгу».

І в порівнянні з великою моделлю, розмах оновлень OriginOS 4, запущеної vivo цього разу, трохи слабкий. У суспільному надбанні не тільки ітерація його віртуальної відеокарти, гетерогенний обчислювальний простір і легка вага не така, як очікувалося, але і не були оновлені такі модулі, як атомарне сповіщення, яке досить гучне серед користувачів vivo. Іншими словами, велика модель є головним героєм цієї конференції.

З точки зору бізнес-моделі, маршрут vivo на цій прес-конференції схожий на маршрут інших гравців у галузі раніше, з асистентом штучного інтелекту як носієм, який використовує метод гібридного розгортання на стороні пристрою + хмари, в якому велика модель на стороні пристрою, яка є основною грою, представляє очевидні характеристики локалізації та легкості.

Мета цього очевидна, енергоспоживання та обчислювальна потужність, що надаються маленьким світом мобільних телефонів, не такі, як у комп'ютерному залі. Просто те, як поєднати можливості моделі з глибиною мобільного телефону, стало тим «ноу-хау», через яке виробникам мобільних телефонів терміново потрібно пробитися.

У зв'язку з цим, рішення vivo полягає в тому, щоб запустити багатопараметричну модель специфікації, з яких 1 мільярд специфікацій призначено в основному для текстових сценаріїв, а 7 мільярдів специфікацій для природного діалогу, а телефото запитань і відповідей є основними моментами розгортання на стороні пристрою. В офіційному вступі 1 мільярд специфікацій окремо орієнтований на сторону пристрою, а 7 мільярдів специфікацій мають бути подвійного призначення для пристрою та хмари, і всі вони розгорнуті в хмарі з 70 мільярдів, що також відображає матричну ідею vivo «нехай Бог повернеться до Бога, а Цезар до Цезаря» у співпраці між пристроями та хмарою.

Це те ж саме, що і конференція розробників I/O від Google у травні цього року, коли Google випустила велику модель PaLM2 з чотирма специфікаціями параметрів, з яких модель з малими параметрами може обробляти 20 токенів в секунду в автономному стані, що підходить для офлайн-використання терміналів.

Якщо ви думаєте, що vivo – це «колупання в зубах», то це занадто різко. Фактично, vivo поставила собі за мету створити внутрішню команду штучного інтелекту ще у 2017 році, і сьогодні Науково-дослідний інститут штучного інтелекту vivo налічує понад 1 000 дослідників.

Незважаючи на те, що його технічні опади в цілому поступаються першому ешелону, таким як Ali і Baidu, існування спільноти з відкритим вихідним кодом також дозволяє гравцям, які виходять на ринок трохи пізніше, швидко наздогнати велику армію. Науково-дослідний інститут «Граф знань», створений компанією vivo у 2018 році, також може певною мірою посилити нестачу навчальних даних, з якими він може зіткнутися як виробник мобільних телефонів.

Що стосується модельних здібностей, то vivo здала хороший бланк відповідей у період розминки. Повідомляється, що BlueLM зайняла перше місце в категорії «модель обмеженого доступу» в сторонньому оціночному наборі C-of китайської великої моделі. Згідно з офіційним оголошенням, BlueLM є першою в галузі великою моделлю 7B на стороні пристрою.

Однак є не кілька моделей, які набрали високі бали в оцінці, але мають незадовільну фактичну продуктивність, і деякі люди в галузі кажуть, що цей список був «відкинутий» за останній період часу, що може відображати лише здатність моделі «робити запитання» і не може відображати здатність міркувати, безпеку та адаптивність. З цієї точки зору зрозуміло, що бізнес-результати vivo потребують більш практичних перевірок.

Більш того, поточні можливості хмарної моделі vivo, такі як діаграма Веньшена і взаємодія, не вискочили з пастки великих моделей, і новинка обмежена. Крім того, його можливості моделі на стороні пристрою все ще знаходяться на стадії тестування, а відображення кінцевих можливостей неминуче обмежене апаратним забезпеченням мобільних телефонів.

Ми дізналися, що багато користувачів, яких запросили взяти участь у внутрішньому тестуванні Blue Heart, використовують флагманські телефони, представлені X90 Pro, і ці моделі також є найвищими в загальнодоступному графіку бета-адаптації для масштабних модельних додатків, випущених vivo.

Будь ласка, введіть схему, щоб сказати

Немає сумнівів, що великі моделі стають другим полем битви для виробників мобільних телефонів, які відкривають високий клас, а також вони є важливою змінною для пожвавлення користувачів та активації IoT. Незважаючи на це, все ще є багато змінних у намірі vivo підвищити цінність продуктів високого класу, покладаючись на великі моделі

Врешті-решт, запуск великої моделі є не лише новим наріжним каменем високого класу vivo, але й його спробою витягнути нові машини та продукти високого класу.

Бюджетним моделям, природно, важко впоратися з цією війною високого класу. Візьмемо для прикладу базову модель Y100, випущену vivo до цієї прес-конференції, це одна з останніх моделей у вищезгаданому плані адаптації, і за таким подібним «ударом у спину» стоїть надія vivo на повернення на трон з висококласними продуктами.

Незважаючи на це, випуск великих моделей все ще не є плюсом для продуктів високого класу vivo.

Ван Ян (псевдонім), підприємець спільноти з відкритим вихідним кодом великої моделі на стороні пристрою, розповів Photon Planet, що здатність великої моделі на стороні пристрою полягає в продуктивності штучного інтелекту, яку забезпечує його NPU (процесор, спеціально розроблений для глибоких нейромережевих обчислень). Однак у попередніх моделях vivo він не звертав уваги на можливості NPU, тому цілком ймовірно, що старим моделям буде складно плавно працювати з великими моделями.

Що стосується майбутнього релізу, то нова модель серії vivo X100, оснащена флагманським чіпом MediaTek Dimensity 9300 і процесором штучного інтелекту нового покоління, можливо, зможе плавно використовувати можливості моделі, але в разі, якщо на ринку вже є великі модельні програми, такі як Wenxin Yiyan і iFLYTEK Xinghuo, місце, що залишилося для мобільного телефону, не таке велике, як уявлялося. У порівнянні зі здібностями, можливо, геймплей, показаний vivo цього разу, більше заслуговує на глибоке вивчення.

**Зробити свій телефон розумнішим? **

Кевін Скотт, технічний директор Microsoft, який підштовхнув Microsoft стати ангельським інвестором в OpenAI, публічно заявив, що сама модель є не продуктом, а інфраструктурою. Мається на увазі, що після того, як тренінг відточує модельну базу, дослідження продукту є ядром «другого підприємництва» багатьох гравців.

«Перевиробництво» великих моделей на мобільних телефонах є само собою зрозумілим, але великі моделі, розгорнуті на мобільних телефонах, все ще потребують подальшого виробництва. Судячи з інформації, представленої на даний момент, vivo реалізує можливості великої моделі за допомогою програми під назвою Xiao V assistant, і поточний основний шлях у галузі полягає в тому, щоб вбудувати можливості великої моделі в існуючий помічник штучного інтелекту.

Користувачі смартфонів мають реальну потребу в умінні розбиратися у великих моделях, будь то розумний помічник, який жартома називають «штучною інтелектуальною інвалідністю», або все більш роздутий додаток і дані в умовах вибуху ємності, мобільні телефони повинні вміти краще розуміти взаємодію і допомагати користувачам сортувати інформацію. Додавання великих моделей, по суті, має на меті надати мобільним телефонам можливості розуміння природної мови.

У разі нереалізованої реалізації проблеми користувацького досвіду, такі як енергоспоживання, розсіювання тепла та затримка, які можуть виникнути в моделі на стороні пристрою, можуть бути поки що проігноровані. На думку Ван Яна, основна проблема, з якою стикається модель vivo, полягає в тому, як розрізняти межі можливостей різних моделей і як їх називати, коли кілька моделей використовуються разом, «що пов'язано з кінцевою формою продукту і презентацією».

Перед обличчям С-сторони з узагальненими сценаріями та складними вимогами моделі, що викликаються різними вимогами, відрізняються. Наприклад, модель специфікації на 1 мільярд і модель специфікації на 7 мільярдів на стороні пристрою повинні вчитися на локальних даних користувача, намагаючись «краще зрозуміти користувача». Тому важливим показником є те, чи можна використовувати можливості моделі та адаптовану до неї ОС для реалізації складних інструкцій на мобільному телефоні.

Поки що складна командна функція, яку демонструє BlueLM, є досить яскравою. У нещодавно випущеній OriginOS 4 V-assistant знаходиться в нижньому правому куті бічної панелі, і його можна відкрити, натиснувши на нього. Мало того, що логіка роботи коротша, ніж у хмарної моделі, яка більше підходить для використання на мобільних телефонах, так ще й деякі складні інструкції в ОС, такі як інтелектуальний пошук альбомів, попереднє виконання команд сторонніх додатків і налаштування в ОС.

Варто згадати, що маленький V-асистент ізольований від існуючого голосу Jovi vivo з точки зору функцій і шляху, і вони незалежні один від одного, що, очевидно, відрізняється від великого модельного шляху на стороні пристрою, запропонованого іншими виробниками раніше.

З функціональної точки зору, маленький V-подібний асистент в основному може досягти повного охоплення голосу Джові, тому мета їх розрізнення, швидше за все, полягатиме в тому, щоб полегшити користувачам відчути різницю між ними. Крім того, логіка продукту маленького помічника V схожа на логіку Copilot, що зберігається в сімейному сегменті Microsoft, і два різні шляхи, ймовірно, будуть інтегровані в майбутньому.

Це також відображає те, що поточний BlueLM все ще знаходиться на стадії тестування, і форму продукту важко сказати зрілою.

Згідно з відгуками тих, хто брав участь у внутрішньому тесті BlueLM, з можливостями моделі флагманської моделі vivo все ще існує затримка на 2s~5s у вимогі до генерації простого тексту в межах 20 токенів, що не є гарною новиною для подальшої реалізації – затримка хмарної моделі не була добре вирішена. Це може бути покращено в моделях, оснащених новітніми чіпами штучного інтелекту від виробників чіпів, але для споживачів це не є причиною змінювати свої телефони.

Крім того, будучи першою в галузі моделлю мобільного телефону, хмарна модель vivo також стикається з «оточенням» великих моделей багатьох постачальників хмарних послуг.

Наприклад, компанія vivo оголосила, що запустить розмовного робота Lanxin Qianxun в магазині додатків, і специфікації в 175 мільярдів параметрів не кидаються в очі в порівнянні з великими моделями в поточних магазинах додатків. Серед постачальників хмарних послуг Baidu вже стягнув плату за нещодавно випущену професійну версію Wenxin 4.0 для тестування ґрунту, тоді як Lanxin Qianxun, здається, є скоріше не дуже привабливим членом екосистеми великих моделей vivo, і його шлях, очевидно, є обструктивним і довгим.

Слід зазначити, що vivo запізнилася, і розрив у технологіях також обмежить подальший розвиток її великомасштабного модельного бізнесу.

З точки зору програмного забезпечення, велика модель vivo стала рекламним матеріалом платформи машинного навчання Pai від Alibaba Cloud, і ми навіть можемо знайти тінь «Tongyi Qianwen» від назви «Blue Heart Qianwen». Робота в хмарі означає довгострокові витрати, і це найяскравіше відображено в OpenAI. З точки зору витрат, якщо vivo хоче перетворити BlueLM на довгострокову екосистему, IDC, створена самостійно, очевидно, більш сприятлива для довгострокової розробки, ніж міграція в хмару.

Що стосується апаратного забезпечення, Huawei і Apple, два провідні виробники, вже інтегрували самостійно розроблені можливості NPU у свої існуючі лінійки продуктів, тоді як vivo все ще потрібно покладатися на виробників мікросхем. Незважаючи на те, що в навчанні та налаштуванні моделей можуть бути побудовані певні бар'єри, розрив в апаратному забезпеченні як ядрі все одно призводить до кількох позицій у провідних виробників.

Битва терміналів великої моделі

Додавання великої моделі змушує нас заново усвідомити, що суть смартфона – це смарт-термінал, який об'єднує кілька можливостей, і він має як апаратні, так і ОС входи. Унікальні умови роблять природним поєднання мобільних телефонів з великими моделями.

Отже, чи можуть інші термінали також бути підключені до великої моделі та перевизначити межі можливостей терміналу так само, як переробляти програму?

Дослідження цієї проблеми можна простежити до появи мереж глибокого навчання, а обговорення можливості кінцевих моделей також випливає з «кліше» проблем затримки, енергоспоживання, конфіденційності та інших питань у галузі.

Насправді, задовго до офіційного початку цього захоплення запиханням великих моделей в мобільні телефони, нові енергетичні транспортні засоби з автономним водінням вже стали терміналом великих моделей. В індустрії не бракує уяви, що розумні носимі пристрої оснащуються великими моделями, але мобільні телефони, схоже, ось-ось вийдуть на перше місце завдяки різноманітності сцен і зручності мережі.

Крім того, коли виробники мобільних телефонів інтенсивно випускають великі моделі та вводять їх у використання, це стане чудовим тренувальним майданчиком для кінцевих моделей. Також можна обговорити методику створення різноманітних терміналів, оснащених великими моделями, починаючи з посадки мобільних телефонів великих моделей.

Адже якою б гарною не була модель на телефоні, найкраща продуктивність, якої можна досягти за короткий проміжок часу – це не що інше, як «секретар» у сфері життя користувача. Уява, принесена великою моделлю інших смарт-терміналів, безсумнівно, більша.

Наприклад, банкомати, які поступово знімають кошти з історичної стадії завдяки мобільним платежам, можуть покладатися на великі моделі, що дозволяють користувачам оминати банк, щоб стати в чергу для поглибленого бізнесу; Це також розумна камера, яка належить до сценарію B-end, яка визначає основні ознаки пацієнтів у медичній сфері, швидка перевірка якості в промисловій сфері та інтелектуальне зрошення в сільськогосподарській сфері. Тепер ринок B-end, який не був широко відкритий, покладаючись на хмарну модель, також може започаткувати змінну кінцевої сторони.

Саме тому vivo покаже на цій прес-конференції операційну систему Blue River (BlueOS), оснащену новими vivo Watch, коли її екологія не така ідеальна, як у Huawei і Xiaomi. Як крос-термінальна система, розроблена vivo для ери загального штучного інтелекту, її запуск має на меті керувати серією продуктів IoT через мобільні телефони, які, безсумнівно, мають хорошу уяву.

vivo також оголосила про відкритий вихідний код своєї моделі специфікації 7B і запустила набір для розробки BlueKit, який є явною амбіцією для екологічного будівництва. Можливо, в даний час vivo тільки досягла того рівня, коли IoT розуміє інструкції, але це дуже важливо для майбутніх висококласних, екологічних та інших стратегій vivo.

Можливості моделі мобільного телефону невідомі, і є багато викликів, і після офіційного релізу та посадки вона обов'язково принесе в індустрію більше «відкритих» напрямків. Більш химерні пози для посадки чекають, щоб їх розблокувала індустрія.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити