Руководство по искусственному интеллекту: обзор ключевых концепций и ведущих игроков в области искусственного интеллекта

Источник: Techcrunch

Сборник: Бэббит

Источник изображения: сгенерировано инструментом Unbounded AI

Искусственный интеллект (ИИ), кажется, присутствует во всех уголках современной жизни, от музыки и медиа до бизнеса и продуктивности и даже знакомств. Есть так много вещей, за которыми трудно уследить. В этой статье будет рассказано обо всем, от последних крупных разработок в области ИИ до терминов и компаний, которые вам необходимо знать, чтобы быть в курсе последних событий в этой быстро развивающейся области.

Во-первых, что такое искусственный интеллект?

Искусственный интеллект, также известный как машинное обучение, представляет собой программную систему, основанную на нейронных сетях, методе, впервые появившемся несколько десятилетий назад, но в последнее время получившем широкое распространение благодаря новым мощным вычислительным ресурсам. В настоящее время ИИ добился эффективного распознавания речи и изображений, а также способности генерировать синтетические изображения и речь. Исследователи работают над тем, чтобы сделать искусственный интеллект способным просматривать веб-страницы, заказывать билеты, настраивать рецепты и многое другое.

Но если вы беспокоитесь о подъеме машин в стиле «Матрицы» — не беспокойтесь. Мы поговорим об этом позже!

Это руководство по ИИ состоит из двух основных частей:

  • Во-первых, самые основные понятия, которые вам нужно понять, и самые последние важные понятия.
  • Затем опишите основных участников ИИ и почему они важны.

АИ 101

Изображение предоставлено: Андрей Шип/Getty Images

Одна из сумасшедших вещей в ИИ заключается в том, что, хотя его основные концепции насчитывают более 50 лет, до недавнего времени даже технически подкованные люди были знакомы с его концепциями. Так что не волнуйтесь, если вы чувствуете себя потерянным — все такие.

Давайте сразу проясним одну вещь: хотя это и называется «искусственный интеллект», этот термин немного вводит в заблуждение. В настоящее время нет единого определения интеллекта, но то, что делают эти системы, определенно ближе к калькулятору, чем к мозгу, за исключением того, что ввод и вывод этого калькулятора более гибкие. ИИ может быть чем-то вроде «Искусственного кокоса» — это имитация интеллекта.

Ниже приведены основные термины, которые вы найдете в любом обсуждении ИИ.

Нейронные сети

Наш мозг в основном состоит из взаимосвязанных клеток, называемых нейронами, которые объединяются в сложные сети, выполняющие задачи и хранящие информацию. Люди пытались воссоздать эту удивительную систему в программном обеспечении с 1960-х годов, но требуемая вычислительная мощность не была широко доступна до 15-20 лет назад, когда графические процессоры позволили процветать численно определяемым нейронным сетям.

По сути, это просто множество точек и линий: точки — это данные, а линии — статистические отношения между этими значениями. Как и в мозге, это может создать многофункциональную систему, которая быстро получает входные данные, передает их по сети и производит выходные данные. Эта система называется моделью.

Модель

Модель — это фактический набор кода, который принимает входные данные и возвращает выходные данные. Сходство терминологии со статистическими моделями или системами моделирования, имитирующими сложные природные процессы, не случайно. В ИИ модель может относиться к полной системе, такой как ChatGPT, или почти к любой конструкции ИИ или машинного обучения, независимо от того, что она делает или производит. Модели бывают разных размеров, что означает, сколько места они занимают и сколько вычислительной мощности им требуется для работы. И все зависит от того, как обучалась модель.

тренироваться

Для создания модели ИИ нейронные сети, составляющие основу системы, подвергаются воздействию набора информации, называемого набором данных или корпусом. При этом эти обширные сети создают статистическое представление этих данных. Этот процесс обучения требует больших вычислительных ресурсов, а это означает, что он занимает недели или месяцы на огромных, мощных компьютерах. Причина этого не только в том, что сети сложны, но и в том, что наборы данных могут быть очень большими: миллиарды слов или изображений должны быть проанализированы и представлены в огромных статистических моделях. С другой стороны, когда модель обучена, ее можно использовать в гораздо меньших размерах и с меньшими требованиями — этот процесс называется логическим выводом.

Изображение предоставлено Google

Вывод

Когда модель действительно работает, мы называем это выводом, и традиционное значение этого слова очень многозначно: формулировать вывод, рассуждая об имеющихся доказательствах. Конечно, это не совсем «вывод», но статистически связывает точки в данных, которые он принимает, фактически предсказывая следующую точку. Например, скажите «заполните следующую последовательность: красный, оранжевый, желтый…» он обнаружит, что эти слова соответствуют началу списка, который он проглотил, т. е. цветам радуги, и экстраполирует следующий элемент, пока не найдет произвел остальную часть списка.

Вывод обычно гораздо менее затратен в вычислительном отношении, чем обучение: думайте об этом как о просмотре карточного каталога, а не о его сборке. Большие модели по-прежнему должны работать на суперкомпьютерах и графических процессорах, а модели меньшего размера могут работать на смартфонах или более простых устройствах.

Генеративный искусственный интеллект

Все говорят о генеративном ИИ — широком термине, который просто относится к моделям ИИ, которые генерируют необработанные выходные данные, такие как изображения или текст. Некоторые ИИ обобщают, некоторые реорганизуют, некоторые распознают и так далее, но ИИ, которые действительно что-то генерируют (спорно, «создает» он или нет), сейчас особенно популярны. Помните, только потому, что ИИ что-то сгенерировал, не означает, что это правильно или даже то, что это отражает реальность! Просто этого не существует, пока вы не попросите об этом, как история или картина.

Горячие слова прямо сейчас

Помимо основ, вот наиболее актуальные термины ИИ на середину 2023 года.

Большая языковая модель (LLM)

Крупномасштабные языковые модели сегодня являются наиболее влиятельной и широко используемой формой искусственного интеллекта.Масштабные языковые модели обучаются практически на всех текстах, составляющих Интернет, и большей части литературы на английском языке. Проглатывание всего этого приводит к огромной базовой модели (читайте дальше). LLM могут общаться и отвечать на вопросы на естественном языке и имитировать письменные документы различных стилей и типов, о чем свидетельствуют такие инструменты, как ChatGPT, Claude и LLaMa.

Хотя эти модели, несомненно, впечатляют, следует помнить, что они по-прежнему являются механизмами распознавания образов, и когда они отвечают на вопрос, они пытаются завершить идентифицированный образец, независимо от того, отражает ли этот образец реальность. LLM часто галлюцинируют в своих ответах, к чему мы скоро вернемся.

Если вы хотите узнать больше о LLM и ChatGPT, нажмите здесь.

Базовая модель

Обучение огромной модели с нуля на огромном наборе данных дорого и сложно, поэтому вам не нужно делать больше, чем нужно. Базовые модели — это большие модели с нуля, для работы которых требуются суперкомпьютеры, но часто за счет уменьшения количества параметров их можно уменьшить до контейнеров меньшего размера. Вы можете думать об этом как об общем количестве точек, которые должна обрабатывать модель, которое в наши дни может исчисляться миллионами, миллиардами или даже триллионами.

тонкая настройка

Базовая модель, такая как GPT-4, умна, но она также универсальна по замыслу — она вбирает в себя все, от Диккенса до Витгенштейна и правил Dungeons and Dragons, но если вы хотите, чтобы она основывалась на вашем резюме, напишите сопроводительное письмо, эти бесполезны. К счастью, можно точно настроить модель, выполнив дополнительное обучение модели с использованием специализированного набора данных. Например, бывает несколько тысяч заявлений о приеме на работу. Это дает модели лучшее понимание того, как помочь пользователю в этой области, не отказываясь от общих знаний, которые она почерпнула из остальных обучающих данных.

Обучение с подкреплением на основе обратной связи с людьми (RLHF) — это особый вид тонкой настройки, о котором вы много слышали: он использует данные от людей, взаимодействующих с LLM, для улучшения их коммуникативных навыков.

Распространение

* Из статьи о передовых методах постдиффузии вы можете увидеть, как воспроизводить изображения из очень зашумленных данных. *

Генерация изображений может выполняться несколькими способами, но, безусловно, наиболее успешным является диффузия, метод, лежащий в основе Stable Diffusion, Midjourney и других популярных генеративных ИИ. Модель диффузии обучается путем демонстрации изображений, которые постепенно ухудшаются путем добавления цифрового шума до тех пор, пока от исходного изображения ничего не останется. Наблюдая за этим, модель диффузии также учится выполнять процесс в обратном порядке, постепенно добавляя детали к чистому шуму, чтобы сформировать произвольно определенное изображение. Мы начали выходить за рамки этого в графике, но технология надежна и относительно проста для понимания, так что она довольно быстро вымрет.

Галлюцинация

Первоначально это была проблема, связанная с тем, что некоторые изображения при обучении соскальзывали в нерелевантные выходные данные, например, здания, кажущиеся сделанными из собак, из-за чрезмерного преобладания изображений собак в обучающей выборке. Теперь говорят, что ИИ галлюцинирует, потому что у него недостаточно или противоречивых данных в его тренировочном наборе, он просто выдумывает.

ИИ, которого попросили создать оригинальное или даже производное искусство, — это галлюцинация. Например, LLM можно попросить написать любовное стихотворение в стиле Йоги Берра, и он с радостью это сделает, даже если в его наборе данных ничего подобного нет. Но это может быть проблемой, когда требуется фактический ответ; модель уверенно представит полуреальный, полуиллюзорный ответ. В настоящее время нет простого способа сказать, что есть что, кроме как проверить это самостоятельно, поскольку сама модель на самом деле не знает, что является «истиной» или «ложью», она просто пытается завершить шаблон как можно лучше.

AGI или сильный искусственный интеллект

Искусственный общий интеллект (AGI), или сильный искусственный интеллект, на самом деле не является четко определенной концепцией, но самое простое объяснение состоит в том, что это достаточно мощный интеллект, чтобы не только делать то, что делают люди, но и быть похожим на нас. Учиться и совершенствоваться. сам. Некоторые опасаются, что этот цикл обучения, интеграции этих идей, а затем обучения и более быстрого роста будет самовоспроизводящимся циклом, который приведет к сверхразумной системе, которую невозможно ограничить или контролировать. Некоторые даже предлагали отложить или ограничить исследования, чтобы предотвратить такую возможность.

Это ужасная мысль. А в таких фильмах, как «Матрица» и «Терминатор», исследуется, что может произойти, если искусственный интеллект выйдет из-под контроля и попытается истребить или поработить человечество. Но эти истории не основаны на реальности. Внешний вид интеллекта, который мы видим в таких вещах, как ChatGPT, впечатляет, но он имеет мало общего с абстрактным мышлением и динамической многодоменной деятельностью, которую мы связываем с «настоящим» интеллектом.

Хотя предсказать будущее развитие практически невозможно, может быть полезно представить себе ОИИ как межзвездное космическое путешествие: мы все понимаем эту концепцию и, кажется, работаем над ее достижением, но в то же время нам еще предстоит пройти долгий путь, чтобы достичь это. Как и в случае с AGI, никто не сделает это случайно из-за огромных ресурсов и необходимого фундаментального научного прогресса!

Забавно думать об ОИИ, но не стоит лезть на рожон, потому что, как отмечают комментаторы, несмотря на свои ограничения, ИИ уже сегодня представляет реальную и значительную угрозу. Скайнет никому не нужен, но чтобы нанести реальный ущерб, не нужен сверхразум с ядерным оружием: сегодня люди теряют работу и становятся жертвами мошенничества. Если мы не сможем решить эти проблемы, какие у нас шансы против Т-1000?

Лучшие игроки в области искусственного интеллекта

OpenAI

Изображение предоставлено Леоном Нилом/Getty Images

Если в ИИ и есть известное имя, то это OpenAI. OpenAI, как следует из названия, — это организация, которая намерена проводить исследования и делать результаты более или менее общедоступными. С тех пор она была преобразована в более традиционную коммерческую компанию, которая предоставляет доступ к расширенным языковым моделям, таким как ChatGPT, через API и приложения. Его возглавляет Сэм Альтман, техномиллиардер, который, тем не менее, забил тревогу о возможных рисках искусственного интеллекта. OpenAI является признанным лидером в области LLM, но проводит исследования и в других областях.

Майкрософт

Как и следовало ожидать, Microsoft провела немало исследований в области ИИ, но, как и другие компании, более или менее не смогла воплотить свои эксперименты в основные продукты. Его самым умным шагом были ранние инвестиции в OpenAI, которые привели к эксклюзивному долгосрочному партнерству с компанией, которая теперь поддерживает своих диалоговых агентов Bing. Хотя ее собственные вклады меньше и менее применимы напрямую, у компании есть значительный исследовательский потенциал.

Google

Известная своими прорывами, Google каким-то образом упустила возможность для ИИ, хотя ее исследователи действительно изобрели технологию, которая непосредственно привела к сегодняшнему взрыву ИИ: Трансформеры. Теперь он пытается разработать своих собственных LLM и других агентов, но явно играет в догонялки, потратив большую часть последнего десятилетия на продвижение устаревшей концепции «виртуальных помощников» ИИ. Генеральный директор Сундар Пичаи неоднократно заявлял, что компания решительно поддерживает ИИ в поиске и повышении производительности.

Антропный

После отказа OpenAI от открытости Дарио и Даниэла Амодеи покинули ее, чтобы основать Anthropic, намереваясь исполнить роль открытой и этически внимательной исследовательской организации в области ИИ. С суммой наличных денег, которую они имеют на руках, они являются серьезными конкурентами OpenAI, даже если их модели (например, Клод) еще не так популярны или известны.

Изображение предоставлено: Брайс Дурбин/TechCrunch

Стабильность

Спорный, но неизбежный, Stability представляет собой жанр реализаций ИИ с открытым исходным кодом «все, что вы хотите», которые собирают все в Интернете и делают генеративные модели ИИ, которые он обучает, доступными бесплатно, при условии, что у вас есть оборудование для его запуска. Это очень хорошо согласуется с философией «информация хочет быть свободной», но также ускоряет этически сомнительные проекты, такие как создание порнографических изображений и использование интеллектуальной собственности без согласия (иногда одновременно).

Илон Маск

Маск не был исключением, откровенно говоря о своих опасениях по поводу безудержного ИИ, и о некоторых недовольствах после того, как его ранний вклад в OpenAI пошел в направлении, которое ему не нравилось. Хотя Маск, как обычно, не является экспертом в этом вопросе, его выходки и комментарии вызывают много шума (он подписал вышеупомянутое письмо об «паузе ИИ»), и он пытается создать собственное исследовательское присутствие.

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить