Дорожня карта застосування штучного інтелекту: керованість – найсильніша дорожня карта

Джерело: Semi-Light

Автор: Ван Юнган

  • Ван Юнган: засновник і генеральний директор SeedV Lab, виконавчий декан Innovation Works AI Engineering Institute
  • Тонг Чао: співзасновник і головний продукт SeedV Lab

Де сценарії застосування генеративного ШІ

Генеративні технології штучного інтелекту, такі як Stable Diffusion і ChatGPT, привернули найбільшу увагу серед венчурних ІТ-індустрій у першій половині 2023 року. Коли ми оговтаємося від чудової хвилі нових технологій і почнемо серйозно думати про те, які сценарії застосування є найкращими напрямками впровадження генеративного штучного інтелекту, багато людей все одно виявитимуть, що зв’язок між технологіями та ринком заплутаний, важко відібрати найкращий шлях для реалізації генеративного ШІ:

  • Інвестор: за останні кілька місяців усі передові установи венчурного капіталу були мобілізовані та дуже зайняті. Виявилося, що за винятком чотирьох-п’яти провідних масштабних модельних підприємницьких проектів, які шукають усі, інші AIGC проекти незрозумілі і не наважуються інвестувати. , я не знаю, де розвиватимуться додатки ШІ в майбутньому.
  • Аналітик: Кілька провідних великомасштабних модельних проектів інвестували значні кошти та мають високі ризики; усі додатки на стороні B і уряді обмежені приватним розгортанням і приватними даними, мають тривалий цикл і їх важко реалізувати; більшість C -бічні додатки надто занадто дрібні, а однорідність проектів створення тексту та зображень є серйозною; зазвичай починають бізнес після однієї чи двох хороших статей, але сама команда не може визначити конкретний напрямок застосування. ..

Найбільша суть думки тут:

  • Більшість людей все ще підсвідомо думають про генеративний ШІ як про набір інструментів для створення діалогів, статей і зображень. Відповідно до стереотипу: ця штука може лише допомогти копірайтерам і дизайнерам підвищити ефективність, як це можна назвати підривною зміною?
  • Хоча є багато ознак того, що генеративний ШІ демонструє світанок штучного загального інтелекту (AGI), люди, які обмежені короткостроковими оціночними судженнями, завжди скажуть: ну і що? бачити - означає вірити. Хіба сучасний штучний інтелект все ще спілкується, пише статті та малює картини?

Очевидно, що недоцільно аналізувати перспективи застосування генеративного штучного інтелекту лише з однієї перспективи або одного часового вузла. Чи існує проста та зручна у використанні модель мислення, яка пов’язує розвиток генеративного ШІ?

Побудуйте модель мислення на основі керованості

Ми вважаємо, що генеративний штучний інтелект є революцією в інформаційній індустрії, яку можна порівняти з настільними комп’ютерами та мобільними комп’ютерами та навіть має більш підривний ефект. Руйнівні зміни ніколи не досягаються миттєво, вони поступово реалізуються з постійним розвитком і прогресом генеративного ШІ. Якщо ви хочете чітко бачити, які нові продукти, нові платформи, нові ринки та нові можливості принесе генеративний штучний інтелект, ми вважаємо, що є простий і зрозумілий шлях мислення, який легко керувати вибором продукту та проекту:

**Чим більш керованим буде генеративний ШІ, тим руйнівнішим він буде для ринку та галузі! **

Цей шлях можна просто представити графіком:

Оскільки керованість генеративного штучного інтелекту над створеним вмістом продовжує вдосконалюватися, застосовні сценарії застосування для генеративного штучного інтелекту продовжуватимуть розширюватися та поглиблюватися. Кількісні зміни ведуть до якісних. Після того, як порог домену пройдено, генеративний штучний інтелект може повністю змінити існуючу екологію продукту та надати продуктам справді інтелектуальні елементи.

У процесі еволюції керованість генеративного ШІ проходитиме приблизно шість етапів. Візьмемо як приклад найпростішу генерацію тексту:

Фаза 1: неконтрольоване

Понад 20 років тому модель статистичної мови, заснована на алгоритмі N-грамів, також могла генерувати безперервний текстовий вміст. Однак отримані результати значною мірою не піддаються контролю. Така рання форма «генеративного ШІ» майже не має можливості трансформуватися в продукти, не кажучи вже про підрив існуючого ринку.

Фаза 2: загальний напрямок можна контролювати

Від генерації тексту на основі LSTM або RNN до раннього генерування тексту GPT (наприклад, GPT-2), генеративний ШІ поступово набув здатності описувати фрагмент людської мови. Здатність описувати на цьому етапі може в основному досягати плавних речень, а зміст приблизно відповідає підказкам, які дають люди. Однак, оскільки деталі, структура чи логіка неконтрольовані, це все ще важко перетворити на справді корисний продукт.

Фаза 3: Керована структура або локальна логіка

Від GPT-3 до ChatGPT (GPT-3.5), вперше генеративний ШІ контролює структуру та локальну логіку створеного контенту. Створення тексту та багатораундові розмови є двома типовими прикладними екологіями в цей період. Перший може підтримувати такі практичні сценарії, як автоматичне підсумовування статей, створення юридичних документів і маркетингових копій, а другий може задовольнити деякі потреби розмовного пошуку, вивчення мови, інтелектуального обслуговування клієнтів, віртуальних людей і інтелектуальних ігрових персонажів.

Фаза 4: Попередній ланцюг думок можна контролювати

З GPT-3.5 до GPT-4 здатність логічного мислення генеративного ШІ значно покращилася. Вперше генеративний штучний інтелект має потужні аналітичні можливості (такі як вилучення даних із новин і узагальнення тенденцій), можливості керування (такі як перетворення людської мови на складні інструкції керування системою) і можливості попереднього логічного міркування (такі як відповіді на прості запитання математики , логічні задачі). Текстовий вміст, який можна створити, також поширюється на структурований і напівструктурований текст, такий як дані, таблиці, коди, послідовності інструкцій, робочі процеси або ланцюжки інструментів. Це безпосередньо призвело до появи великої кількості нових інструментів і систем, які сьогодні характеризуються Copilot (буквально перекладається як «другий пілот»).

Фаза 5: складні логічні міркування можна контролювати

Звичайно, коли сучасний GPT-4 створює текст, ланцюжок логічного мислення, яким можна керувати, ще знаходиться в зародковому стані. Якщо все піде добре, люди, як очікується, розроблять генеративний штучний інтелект наступного покоління, який зможе точно контролювати складні логічні міркування в недалекому майбутньому. Такий штучний інтелект має розширені можливості логічного мислення, такі як пам’ять, навчання, планування та прийняття рішень. Цих можливостей достатньо, щоб повністю підірвати форму взаємодії людини та комп’ютера в останні десятиліття та переглянути відносини між людьми та комп’ютерами в таких сценаріях, як засоби підвищення ефективності, платформи контенту, автоматизація бізнес-процесів, роботи, операційні системи та розумні пристрої.

Фаза 6: контрольовані правила або принципи

З більш перспективної точки зору проявами людського мислення найвищого рівня є: 1. Відкриття принципів і формулювання правил на основі індуктивного мислення 2. Застосування принципів або правил до конкретних сценаріїв на основі дедуктивного мислення. Ідеальна еволюційна форма генеративного штучного інтелекту полягає в наближенні до способу людського мислення, створенні правил або принципів, які можна порівняти з людським мисленням, і застосувати їх. Коли генеративний штучний інтелект досягне «Королівства свободи», де можна контролювати правила або принципи, він матиме сильну здатність ітерувати та вдосконалювати себе, він зможе розробляти правила системи та світові правила, як люди, і навіть проводити наукові дослідження разом із вченими-людьми. .

Керованість і типовий напрямок застосування

Поліпшення керованості генеративного ШІ призвело до значного розширення сфери застосування. Ми використовуємо наступний малюнок, щоб узагальнити зв’язок між керованістю та найкращим напрямком застосування генеративного ШІ на різних етапах розробки:

Базуючись на керованості, на кожному етапі розробки напрямки додатків, які підтримуються генеративним ШІ, продовжують розширюватися та поглиблюватись, від задоволення простих і локальних потреб до поступового розвитку для задоволення потреб домену та платформи, і, нарешті, накопичення до продукту та бізнес-моделі. руйнівні зміни. Чи можна керувати ланцюгом мислення та логічних міркувань і якою мірою їх можна точно контролювати, є найважливішими факторами в процесі переходу від кількісних змін до якісних.

Керованість і конкретні випадки застосування

Виходячи з керованості генеративного ШІ, ми поділяємо найбільш прийнятні напрямки застосування генеративного ШІ сьогодні та в найближчому майбутньому на чотири категорії та використовуємо наступний малюнок, щоб порівняти типові випадки застосування в кожній категорії із застосуванням генеративного ШІ. різні етапи розвитку пов'язані між собою:

Інструмент створення контенту/платформа контенту

Інструменти створення контенту є найпрямішим і найшвидшим сценарієм впровадження генеративного ШІ. З удосконаленням керованості генеративного штучного інтелекту завдання зі створення контенту будуть переходити від створення простого тексту та зображень до складного автоматичного створення відео, 3D, анімації, ігор, фільмів і віртуальних світів. За допомогою ШІ кожна звичайна людина матиме здібності, які спочатку належали лише професійним командам та професійним інструментам. Як тільки творче бажання звичайних людей значно вивільниться, потреби вищого рівня щодо обміну, перегляду, купівлі та спілкування в нових формах вмісту, безумовно, стимулюватимуть народження, розвиток і зростання нового покоління платформ вмісту.

Автоматизація бізнесу/Послуги для підприємств

Через такі причини, як безпека даних, приватне розгортання, точність вмісту та відповідність, бізнес-процеси мають дуже високі вимоги до керованості генеративного ШІ. Сфери бізнесу, де генеративний штучний інтелект є найбільш прийнятним сьогодні, можуть включати створення контенту в маркетингу та користувацькі інтерфейси в електронній комерції. Крім того, генеративний штучний інтелект також може значно підвищити ефективність бізнесу шляхом автоматичного генерування проміжних кодів, таких як SQL, автоматичного збору й аналізу даних, автоматичного створення звітів і автоматичного підключення бізнес-процесів. У майбутньому, з покращенням керованості генеративного ШІ, більш передові технології ШІ будуть поглинені в такі ключові процеси, як планування, прийняття рішень та оптимізація бізнес-процесів.

Особистий помічник/професійний помічник

У сценаріях особистого життя та офісу генеративний ШІ поступово слугуватиме різними формами «помічників» і створить нову екосистему співпраці людини та ШІ протягом кількох років. Те, наскільки керованим є генеративний ШІ, фундаментально визначає, наскільки розумні помічники ШІ в нашому житті чи роботі та які проблеми вони можуть допомогти нам вирішити. Щойно генеративний штучний інтелект досягне рівня секретарів, водіїв, перекладачів, юристів тощо на деяких посадах, асистенти ШІ стануть новим поколінням популярних електронних продуктів, які замінять комп’ютери та мобільні телефони.

Інфраструктура/Засоби розробки/ОС/Пошукові системи

Можливості програмування, можливості обробки даних, можливості проектування системи та можливості обробки знань генеративного штучного інтелекту забезпечать нові концепції дизайну та нові функції для інструментів розробки, баз даних, пошукових систем та операційних систем. Чи може в майбутньому народитися операційна система зі штучним інтелектом як ядром і інтелектуальна обчислювальна платформа з штучним інтелектом як ядром, цілком залежить від того, наскільки високої здатності генеративного штучного інтелекту може досягти складного логічного мислення.

Розвиток можливостей застосування мультимодального ШІ

У порівнянні з простим генеруванням тексту та зображення мультимодальні системи, включаючи звук, відео, 3D-сцени, анімацію та складні сюжетні лінії, більше відповідають людському здоровому глузду та оригінальним потребам і, очевидно, мають ширші та далекосяжні перспективи застосування. Щоб дізнатися про технічний стан і перспективи мультимодального ШІ, зверніться до іншої статті автора цієї статті:

В епоху після GPT мультимодальність є найбільшою можливістю У сфері мультимодальності ми вважаємо, що сьогоднішній і майбутній генеративний ШІ розвиватиметься й накопичуватиметься приблизно відповідно до контексту, показаного на малюнку нижче, і продовжуватиме народжувати нові революційні програми, нові платформи та навіть нові руйнівні бізнес-моделі:

Дозвіл на використання

Зображення та текстовий вміст усіх наведених вище планів додатків випущено SeedV Lab за ліцензією CC BY 4.0. На підставі вказівки першоджерела (лабораторії SeedV) кожен може вільно використовувати, змінювати та перевидавати.

Зображення наведеної вище дорожньої карти програми також є відкритим кодом у таких місцях, ласкаво просимо відвідати (ви можете безпосередньо натиснути [прочитати оригінальний текст] у кінці статті, щоб відвідати):

github.com/SeedV/generative-ai-roadmap

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити