Журнал Time публікує список «Найкращі винаходи 2023 року» з 14 проєктами штучного інтелекту

24 жовтня журнал Time опублікував список «Найкращих винаходів 2023 року», що охоплює такі ключові сфери, як штучний інтелект, зелена енергетика та сталий розвиток. Загалом 200 новаторських винаходів (і 50 винаходів Спеціальної премії) були відібрані для відбору на основі винахідливості, ефективності, впливу тощо, які змінюють те, як ми живемо, працюємо, граємо та думаємо про те, що можливо.

Ось коротке резюме 14 обраних винаходів у галузі штучного інтелекту:

1. Готове безкоштовне редагування: генеративне розгортання та генеративна заливка Adobe Photoshop

Adobe передає потужний штучний інтелект у руки мільйонів людей, вбудовуючи штучний інтелект у Photoshop, найпопулярніший у світі редактор зображень. Photoshop на базі генератора зображень зі штучним інтелектом Adobe Firefly тепер включає генеративне розгортання та генеративну заливку. Перший дозволяє користувачам безперешкодно заповнювати уявний контент за межами фотографії. Останній просто вводить кілька простих слів, щоб додати або видалити вміст з існуючого зображення. Жодна з функцій не потребує технічних знань. Ешлі Стілл (Ashley Still), старший віце-президент з цифрових медіа в Adobe, каже, що ці опції дозволяють «клієнтам втілювати своє бачення в життя швидше, ніж вони можуть собі уявити».

2. Чат-бот, що змінює правила гри: OpenAI GPT-4

GPT-4 від OpenAI минуло 8 місяців з моменту його випуску в березні, і він все ще залишається найпотужнішим чат-ботом, доступним для громадськості. Його попередник, ChatGPT, показав кращі результати, ніж 10% студентів, які складали адвокатський іспит, тоді як GPT-4 показав понад 90%. Він чудово вміє вербально міркувати, розбиваючи складні поняття на просту мову і навіть пояснюючи, чому жарт смішний. У вересні OpenAI почала розгортати можливість взаємодіяти з моделями за допомогою голосу та використовувати зображення як вхідні дані. Оновлений GPT-4 V був протестований в організації Be My Eyes, яка надає інструменти для людей з вадами зору для вербального опису змісту зображення природною мовою.

3. Винахідливий монтаж фільмів: злітно-посадкова смуга Gen-2

Runway – це стартап, який підтримується Google, чиї інструменти візуальних ефектів були використані для створення моторошних образів оскароносного фільму «Все скрізь і одразу». У червні компанія Runway представила модель Gen-2. Нова версія дозволяє будь-кому генерувати повне відео з текстових підказок, зображень або інших відео. Співзасновник і генеральний директор Runway Крістобаль Валенсуела порівнює нову технологію з винаходом камери 200 років тому. «Штучний інтелект — це новий тип камери, який назавжди переосмислить спосіб розповіді історій і призведе до створення повністю створених, повнометражних художніх фільмів», — сказав він. "

4. Автентичність штучного інтелекту: Alitheon FeaturePrint

Рішення багатотрильйонної проблеми підроблених товарів може бути таким же простим, як навести камеру телефону на годинник або сумочку і дозволити розумному програмному забезпеченню визначити його справжність. FeaturePrint — це оптична технологія штучного інтелекту, яка спочатку «бачить» крихітні деталі поверхні фізичного об'єкта та «відбитки» їх у унікальні математичні ідентифікатори. Потім одним натисканням кнопки він повідомляє вам про справжність товару. Роей Ганзарскі, генеральний директор Alitheon, сказав: «Немає необхідності в наклейках, етикетках або маркуванні. Одним із замовників є компанія Argor-Heraeus, яка виробляє золоті злитки для банків по всьому світу. "

5. Очі в небі: виявлення дронів по всьому місту

Дрони можуть принести як руйнування, так і користь. Загальноміські продукти виявлення дронів Dedrone можуть розкидати віртуальні щити по географічній зоні та попереджати правоохоронні органи за лічені секунди, якщо дрон увійде у визначений повітряний простір. Dedrone відстежує власні змішані сигнали, що випромінюються дронами, включаючи радіочастоти, дані ADS-B (також використовуються в літаках) і маяки RemoteID для визначення місця вторгнення. Мері-Лу Смолдерс, директор з маркетингу компанії, порівняла її з системою управління повітряним рухом для дронів, якої раніше не існувало. Серед клієнтів – Con Edison, який використовує його для захисту своєї інфраструктури; поліція в Барселоні; і невідома кількість аеропортів.

6. Майстер-перекладач: Meta SeamlessM4T

Meta порівнює свою модель штучного інтелекту SeamlessM4 T з Babel Fish, універсальним мовним перекладачем у The Hitchhiker's Guide to the Galaxy. Програмне забезпечення компанії здатне розуміти майже 100 мов з мови або тексту та перекладає їх у режимі реального часу в різних форматах, включаючи speech-to-speech, text-to-text, speech-to-text або text-to-speech. За даними Meta, окрім обробки набагато більшої кількості мов, ніж її попередник, система є більш ефективною, має нижчий рівень помилок і навіть може розшифровувати кілька мов, змішаних разом в одному реченні. Meta відкрила вихідний код моделі, а це означає, що її код доступний дослідникам у всьому світі.

7. Приголомшлива пародія: So-VITS-SVC

На початку цього року пісня під назвою "Heart on My Sleeve" анонімного автора на ім'я Ghostwriter викликала ажіотаж. (Пісня була швидко видалена легальним стрімінговим сервісом, але до цього вона стала вірусною.) Ці звуки генеруються за допомогою програмного забезпечення з відкритим вихідним кодом під назвою So-VITS-SVC, яке дозволяє технікам нейронної мережі тренувати голос співака, а потім створювати будь-яку пісню за допомогою голосу, згенерованого штучним інтелектом. Ентузіасти обмінюються голосовими моделями в спільноті Discord, від Bad Bunny до Тейлор Свіфт і Джеймса Хетфілда. У той же час з'явилися зручні веб-сайти, які використовують програмне забезпечення.

8. Пожежники зі штучним інтелектом: детектори лісових пожеж зі штучним інтелектом у Каліфорнії та Каліфорнії

Виявлення лісових пожеж до того, як вони поширяться, є проблемою, яка в даний час переслідує багато частин світу. Каліфорнія, програма громадської безпеки Каліфорнійського університету в Сан-Дієго, використовує штучний інтелект для допомоги. Проєкт у партнерстві з Cal Fire навчив штучний інтелект виявляти дим та інші ранні ознаки пожежі за допомогою мережі з понад 1050 камер, розкиданих по лісах по всьому штату. Як тільки система виявить відхилення від норми, вона сповістить місцеву пожежну службу за допомогою SMS. За перші два місяці система правильно визначила 77 пожеж до того, як надійшли тривожні виклики. Фалько Кюстер, один з головних дослідників у Каліфорнії, сказав: «Найбільші історії успіху [цієї [системи] – це пожежі, про які ви ніколи не чули. "

9. Створюйте музику з легкістю: стабільний звук

Стабільне аудіо, створене за допомогою стабільного штучного інтелекту, використовує можливості штучного інтелекту для створення майже будь-якого звуку чи пісні, які ви хочете, за допомогою лише кількох простих текстових підказок. (Наприклад, введення «ембієнт-техно, драм-машина, мирний, інструментальний» генерує розслаблюючу музику нью-ейдж, яка не виділяється в фанк-лаунжі.) Модель була навчена на наборі даних (так що це все законно) на аудіосайті інвентарю, який містить понад 800 000 аудіофайлів загальною тривалістю 20 000 годин і може бути використаний як для професійних, так і для аматорських проектів.

10. Захисники тварин: штучний інтелект TrailGuard

В Індії та деяких частинах Африка браконьєрство залишається найбільшою загрозою зникнення слонів і великих кішок навіть у природоохоронних територіях. TrailGuard AI, створений американською екологічною групою Resolve, використовує крихітні камери, що працюють на технології Intel, для моніторингу зникаючих видів і виявлення браконьєрів. Система використовує мобільні телефони або радіосигнали великої дальності, щоб передавати зображення на телефони органів влади всього за 30 секунд. Спеціально створені моделі штучного інтелекту TrailGuard навчені виявляти не лише людей, а й будь-які види, що становлять інтерес, від тигрів до гієн. Технологія, яка заарештувала понад 30 браконьєрів під час етапу випробувань у Східній Африка, зараз проходить масштабні випробування в центральній Індії, де багато тигрів.

11. Намалюйте свою уяву: OpenAI Dall-E 3

Коли OpenAI випустила ChatGPT у світ у листопаді минулого року, це зробило революцію в ландшафті штучного інтелекту. Компанія сподівається, що DALL-E 3, нова вдосконалена версія її генератора зображень на основі штучного інтелекту, матиме такий самий вплив. Адітья Рамеш з OpenAI, винахідник DALL-E 3, каже, що попередні генератори зображень повинні були вивчити нову технічну мову, включаючи додавання знаків мінус і цифр до рядків, щоб отримати найкращі результати. З іншого боку, DALL-E 3 згортається в ChatGPT, щоб користувач міг вводити команди сесії та отримувати зображення, яке відповідає його опису.

12. Слухайте: Відкрита колекція аудіокниг Project Gutenberg

Project Gutenberg – це найстаріша цифрова бібліотека, заснована в 1971 році, щоб зробити електронні книги більш доступними. Але генеральний директор Грег Ньюбі каже, що він «не вміє ні створювати, ні поширювати». У результаті Microsoft і Массачусетський технологічний інститут об'єдналися, щоб створити Open Audiobook Collection, яка використовує технологію перетворення тексту в мову, щоб перетворити 5,000 книг на безкоштовні синтезовані аудіокниги, які тепер доступні для завантаження на Spotify. Програмне забезпечення, яке підживлювало проект, також було випущено безкоштовно.

13. Ритм: AudioShake

Його учасники були в захваті, коли один з найбільших рок-гуртів нещодавно уклав угоду про використання їхніх хітів 1970-х років у рекламних роликах. Але є одна заковика: продюсерам реклами потрібні лише інструменти, а все, що є у гурту, — це фінальний мікс. Тож команда рок-гурту зв'язалася з AudioShake, компанією, чия програма штучного інтелекту ізолює попередньо записані аудіоелементи, розбиваючи їх на окремі компоненти. «Ми робимо аудіо інтерактивним і редагованим, і можемо використовувати ці дійсно практичні способи використання, які допомагають артистам заробляти гроші», — сказала Джессіка Пауелл, співзасновниця та генеральна директорка.

14. Переосмислення смартфона: Humane Ai Pin

Двоє колишніх керівників Apple, які заснували Humane, передбачали майбутнє без екранів, і Ай Пін був їхнім першим кроком. Після того, як легкий шпилька Humane Ai Pin магнітно закріплюється на вашому одязі, він стає вашим особистим помічником зі штучним інтелектом. Використовуючи комбінацію фірмового програмного забезпечення та GPT від OpenAI, пристрій дозволяє робити все, від постановки складних запитань до здійснення дзвінків і текстових повідомлень, і все це одним замовленням. У той же час вбудовані камери можуть ідентифікувати речі та надавати контекстну інформацію, наприклад, оцінки калорій для продуктів. Щоразу, коли камера, мікрофон або датчик вхідного сигналу PIN-коду активні, загоряється помітний індикатор конфіденційності, який називається індикатором довіри, щоб усі навколо знали, що він слухає або записує. Якщо вам потрібні візуальні ефекти, пікопроектор спроектує їх прямо на долоню витягнутої руки. Запуск продукту заплановано на 9 листопада.

Примітка: Гуманними інвесторами є Марк Беніофф і Лінн Беніофф, співголови та власники журналу Time

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити