Популярний AI Pin — це плагін для ChatGPT, закріплений на грудях

Першоджерело: Положення на основі кремнію

Джерело зображення: Створено Unbounded AI

Інвестиції генерального директора OpenAI Сема Альтмана в перше в історії людства справжнє апаратне забезпечення штучного інтелекту, AI Pin, є найпопулярнішим апаратним продуктом у світі за останні два дні. Якщо ви все ще не знаєте про цей продукт, ви можете переглянути це відео, щоб дізнатися.

Компанія, що стоїть за цим, Humane, була заснована Імраном Чаудрі, колишнім заслуженим дизайнером Apple, і Бетані Бонджорно, колишнім керівником системи Apple, яка брала участь у розробці оригінального iPhone і навіть прототипу з колесами прокрутки, над якими Стів Джобс знущався, коли iPhone був вперше випущений. Він був настільки незадоволений, коли покинув Apple, що перед тим, як прийняти рішення піти, відправив електронного листа всім співробітникам і написав вірш: «На жаль, річка пересихає, і тоді ви шукаєте нову». Потім Apple звільнила його.

Найбільшим акціонером Humane є Сем Альтман, а його «програмним забезпеченням» є GPT-4. Його оголошення збіглося з конференцією розробників OpenAI, яка знищила купу стартапів зі штучним інтелектом, а Сем Альтман був її великим татом, і дискусія відразу ж закрутилася навколо того, «чи це новий iPhone».

Однак, якщо ви уважніше придивитеся до AI Pin, то побачите, що його значення не чорно-біле — це або вбивця iPhone, або це просто хайп, і це не так. Фактично, це перший експериментальний продукт ідеї «нового заліза» в епоху штучного інтелекту. За словами мого колеги Ло Іхана, це «жорсткий плагін для ChatGPT».

Протеже Джобса знали пароль Джобса: метод взаємодії був вкрай радикальним, а користувацький досвід – вкрай консервативним і стриманим, як і iPhone того часу.

Найбільша фішка AI Pin полягає в тому, що він не має екрана, що змінює спосіб його взаємодії одним махом. Ви можете використовувати його лише більшу частину часу за допомогою природної мови, а трохи більше за допомогою жестів. Це повністю налаштовано на основі можливостей ChatGPT, тому що одна з найбільших революцій у LLM (великих мовних моделях) полягає в тому, щоб підвищити популярність LUI (мовного інтерфейсу користувача), і цей шпилька штучного інтелекту є майже грою, щоб використовувати LUI до крайності.

Це також визначає, що він є експериментальним об'єктом. Нещодавно людина, відповідальна за прикладний продукт національного рівня з сотнями мільйонів користувачів у Китаї, сказала мені, що вони використовували LUI для дуже ретельної трансформації продукту, і багато базового коду було переписано, але він вважає, що LUI — це не просте оновлення заміни, а паралельний вибір, який відкриває нові можливості. Зрештою, LUI об'єднає GUI (Gesture User Interface) для створення апаратних продуктів, які належать до епохи штучного інтелекту.

Це те, що робить AI Pin. Деякі функції викликаються природною мовою, а деякі викликаються простими жестами, що також є крутим моментом для зовнішнього світу, щоб вигукнути, прочитавши його Demo, я думаю, що це насправді «залізо» AI Agent. Велика модель має шпильку, прикріпіть її до грудей і засліпте або просто перетворіть на кулон, як інший стартап штучного інтелекту Rewind. Це може перетворитися на тренд.

Але AI Pin, з точки зору зовнішнього вигляду та функцій, трохи не схожий на Misfit, який 10 років тому робив «розумні брошки»? У той час таких «носяться девайсів» у курячі ребристі рубчики було чимало, і Google Glass, який користувався популярністю і швидше зникав. Чи буде ендшпіль AI Pin таким самим, як у них?

Відповідь на це питання зводиться до розуміння поняття «інтелект». 10 років тому, будь то Google Glass, Misfit або різноманітні розумні браслети і смарт-годинники, хіба всі вони не були по суті «розумово відсталим залізом»? Принаймні одна річ, у яку ви повинні вірити, це те, що з GPT-4 як «програмним забезпеченням» AI Pin справді відкрив новий етап «розумного» обладнання. Його основна здатність полягає у використанні мовної взаємодії та взаємодії дій для виклику агентів штучного інтелекту. Або просто ви думаєте про шпильку зі штучним інтелектом як про агента штучного інтелекту, який висить у вас на грудях і засліплює інших.

Суть AI Agent полягає в поєднанні додатків і функцій штучного інтелекту з великими мовними моделями як основними можливостями, заснованими на індивідуальних потребах окремих осіб або організацій, і він має високий ступінь персоналізації та орієнтований на сценарій: постукайте по шпильці на грудях, прошепотіте їй кілька слів, відкрийте долоню, побачите рядок яскравих символів, розкажіть вам запропонований спосіб вирішення проблеми, повідомте дані іншої сторони ключовим або безпосередньо замовте меню ресторану в іншій руці для вас. Це набагато розумніше, ніж ці браслети для годинника. Звичайно, це також свідчить про те, що на відміну від апаратного забезпечення в традиційному розумінні, сам штифт ШІ буде не апаратним забезпеченням загального призначення, а «жорстким плагіном» для реалізації індивідуального ШІ.

Оскільки це «жорсткий плагін», природно, що за ним стоїть абсолютно нова система. Ця нова система базується вже не на апаратному забезпеченні, а на великій мовній моделі. Озираючись назад на iPhone – це був iPhone, а потім App Store, настільки, що Apple все ще є компанією-виробником апаратного забезпечення з точки зору доходів сьогодні. Так що ж робити, якщо спочатку є потужний «App Store»? OpenAI та AI Pin використовують такий зворотний сценарій.

Всім відомо, що люди звертають увагу на AI Pin через те, що за ним стоять OpenAI та ChatGPT, а засновники AI Pin знають це самі. Подібно до того, як розробники програмного забезпечення готові оподатковуватися Apple, оскільки вони залежать від апаратного забезпечення Apple у своєму доході, AI Pin поступився місцем доходу від підписки в перший день — метод ціноутворення Humane: це фіксована ціна апаратного забезпечення та щомісячна «абонентська плата» — «податок», який сплачується OpenAI за викликом можливостей GPT-4. Чи відрізняється це від логіки плагінів ChatGPT?

В OpenAI вважають, що суть великих мовних моделей – це найкращий компресор світових знань. Однак компресор не може безпосередньо вирішити кожну конкретну проблему для кожної людини, тому потрібні плагіни, так і з'явилася ідея AI Agent. Сьогодні нове покоління апаратного забезпечення також формується цією ідеєю в гонитві за «нативним штучним інтелектом»: заснована на базовій великій мовній моделі, зосереджена на «мозку», який може стискати базову модель і навчати її персональними даними, доповнена різними жорсткими плагінами — нарешті у кожного є персоналізований агент штучного інтелекту.

AI Pin хоче зробити це агресивно за один крок. Просто чим більше хочеться зробити це за один крок на ранніх експериментах, тим простіше стати гарматним м'ясом. Він підключає плагін безпосередньо до бази, що приносить масу проблем. Однією з найбільш критикованих є конфіденційність. Якщо є локальний проміжний «сейф» з більшою обчислювальною потужністю, плагін може більше зосередитися на власних завданнях, а базова модель може бути більш загальною, тоді він може вирішити більше проблем.

Не так давно я познайомився з Деном Сірокером, генеральним директором Rewind, популярного в Кремнієвій долині стартапу, схожого на Humane, який продемонстрував можливість зробити Rewind доступним офлайн на комп'ютерах, що було б більш безпечним і персональним (Rewind також більш радикальний, ніж Humane, його продукт цілодобово фіксує кожен рух користувача і більш чутливий до питань конфіденційності), і, на його думку, «мозок» між базовою моделлю і плагіном Його все ще потрібно нести мобільні телефони та комп'ютери, але потрібен новий мобільний телефон і новий комп'ютер, який визначається здатністю великих мов. У цьому сенсі ми все ще цілком очікуємо, що Nvidia і Lenovo перетворять комп'ютери в «AIPC», а Qualcomm допоможе vivo і Xiaomi запхати великі моделі в мобільні телефони.

Висновок в основному такий: AI Pin — це «жорсткий плагін», який прикріплює ChatGPT до ваших грудей, усуває сенсорний екран і дозволяє поєднувати інтерфейс мовної взаємодії та інтерфейс взаємодії з жестами. Це портативний AI Agent з апаратною базою, яка підключається безпосередньо до хмари, що є досить агресивним, радикальнішим, ніж Google Glass на той час, а це означає, що це скоріше експеримент, але людям це потрібно.

Тільки радикальні спроби можуть розпалити уяву. Це причина, чому люди так захоплюються AI Pin. Люди сприймають його як "плагін Ultraman", тобто продовження ChatGPT у світі апаратного забезпечення, відкриття можливої нової апаратної ери. Це нагадує мені часи 15-річної давнини.

У червні 2008 року в Сан-Франциско, на WWDC від Apple, був офіційно випущений App Store. Виступаючи зі сцени, Стів Джобс сказав: «Ви можете розробляти та публікувати додатки, як сама Apple». Потім на сцену вийшли одні з перших розробників Apple. Один з хлопчиків у рожевому привернув увагу Джобса. Містер Джобс покликав хлопчика в рожевому до своєї затемненої кімнати, і 24-річний хлопець, який покинув навчання в Стенфорді, нервував і хвилювався, пізніше згадував, що «все, що він міг бачити, це його [Джобса] дві круглі лінзи, що відбивають світло». Тоді він показав свій додаток на сцені, висловивши подяку Apple: «Це початок нової мобільної ери».

Хлопчиком у рожевому був Сем Альтман.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити