Используйте маленькие модели и сделайте большую разницу.
Первоисточник: Machine Energy
Источник изображения: Generated by Unbounded AI
Использование ИИ становится все более распространенным и не ограничивается его использованием отдельными лицами. Кроме того, на предприятиях становится все более популярным использование ИИ для улучшения рабочих процессов и повышения производительности. Но следует отметить, что более мощными часто являются более крупные модели, что вызывает трудности при развертывании на предприятии. Сильвио Саезе (Silvio Saese) написал о своих мыслях по этому поводу: ** модели не больше, а лучше, маленькие модели лучше справляются с содержанием работы. **
Далее следует перевод и аранжировка оригинального текста машинным сердцем без изменения первоначального смысла.
Первоначальный адрес:
В последние месяцы я много писал о том, что я называю LAM (Large Action Model), более активном, автономном варианте LLM. Он не только генерирует контент, такой как текст или изображения, но и может выполнять целые задачи и даже участвовать в рабочих процессах, как с людьми, так и в одиночку. В этом году, на Dreamforce 2023, с запуском Einstein Copilot, это видение сделало большой шаг к реальности. Einstein Copilot, разговорный помощник Salesforce с искусственным интеллектом, будет развернут на платформе Salesforce и готов к интеграции практически во все, что делают клиенты.
Второй пилот Эйнштейна: взгляд в будущее генеративного ИИ
Трудно не впечатлить Einstein Copilot из коробки. Он был разработан с нуля, чтобы быть продуктивным и безопасным способом, помогая пользователям практически во всех типах рабочих процессов. Он может обрабатывать вопросы, опубликованные на естественном языке, и предоставлять соответствующие достоверные ответы, извлеченные из конфиденциальных данных, которые защищены компанией. Это четкая картина того, в каком направлении, по моему мнению, движется ИИ на предприятии: единый, надежный интерфейс, разработанный для повседневного взаимодействия человека и компьютера и способный помочь в решении различных задач. Он демонстрирует силу искусственного интеллекта для обеспечения того, чтобы технология отвечала потребностям бизнеса, и я не сомневаюсь, что он также изменит то, как работают клиенты. И LAM, по мере того, как он будет развиваться в гибкости и функциональности, выведет эту и без того очень мощную силу на новый уровень.
Сделать генеративные модели ИИ «маленькими и большими»
В последнее время многие темы генеративного ИИ вращаются вокруг масштаба модели и архитектуры модели, которые лежат в основе LLM и LAM. Поскольку такие компании, как OpenAI, продолжают раздвигать границы масштаба, а количество параметров значительно превышает 100 миллиардов, нетрудно сделать вывод, что чем больше, тем лучше. На самом деле, большие модели часто хвастаются тем, что их производительности сложно или невозможно достичь иначе. И по мере увеличения размера модели возникает невероятно сложное поведение, предполагающее, что более масштабные стратегии могут принести значительные выгоды.
Как стратегическое уменьшение размеров моделей может принести огромные выгоды
В то время как более крупные модели продолжают доминировать в заголовках, погоня за более крупными моделями — не лучшая стратегия. Наиболее очевидно, что самые большие модели в настоящее время требуют больших вычислительных ресурсов, и многие компании находятся вне досягаемости. И даже те предприятия, которые могут позволить себе их развернуть, должны признать, что обещанная ими высококачественная продукция может быть чрезвычайно медленной. Кроме того, мы по-прежнему сталкиваемся с проблемами доверия, безопасности, вредоносности и претензий на право собственности, таких как авторское право, которые возникают из-за огромных наборов данных, полученных из глобального источника, на которые опираются гипермасштабируемые модели.
Эти недостатки делают малогабаритные модели все более привлекательными во многих сферах. Они относительно экономичны и могут быть настроены на невероятные скорости. Сегодня специально разработанная система LLM в некоторых случаях может работать даже полностью на периферии, включая мобильные устройства конечных пользователей. А поскольку они требуют меньшего обучения, клиенты могут взять на себя более активную роль в управлении при подготовке своих наборов данных. На этом этапе можно добиться огромных улучшений с точки зрения качества, безопасности и даже правового статуса контента, содержащегося в наборе данных.
Концентрируясь на более узких областях, качество выпуска небольших моделей также может быть на одном уровне с их «старшими братьями». Такие модели, как ChatGPT, по сути, предназначены для всех, помогая с домашними заданиями, рецептами ужина, отвечая на вопросы о науке, технике, истории и поп-культуре. В отличие от этого, генеративный ИИ для предприятий может и должен сосредоточиться на более мелких, но более актуальных проблемных областях. Это, безусловно, беспроигрышный вариант: это означает снижение барьеров для входа на рынок без ущерба для качества продукции. **
Как оркестровка малых моделей открывает большой потенциал
Даже небольшие модели могут предоставить большие решения, нам просто нужно по-другому думать о масштабе. Вместо того, чтобы увеличивать саму модель, переплетите несколько моделей для достижения цели более высокого уровня. ** Каждая модель разрабатывается с учетом конкретной цели и обучается на тщательно отобранном, тщательно проверенном и запатентованном наборе данных. Что, если бы агентов ИИ, таких как Einstein Copilot, можно было объединять или координировать, точно так же, как несколько человек могли бы выполнять больше работы в команде, чем по отдельности? Например, в ресторане, который представляет собой организацию, которая может быть достигнута только командной работой, у каждого участника есть свои навыки и направления деятельности: официанты отвечают за заказ, повара отвечают за приготовление еды, администраторы отвечают за обработку бронирований и заказов, а водители отвечают за доставку еды. Итак, как бы выглядел LAM при подобной организации?
В последнее время я думаю об оркестровке, и я думаю, что это одна из самых захватывающих технологий, но также и самая практичная, позволяющая безопасно и эффективно привлекать полезных, автономных агентов. Самое главное, что оркестровка означает, что даже самые амбициозные решения прозрачны и известны создателям и людям, которые работают с ними. Имейте в виду, что в этом случае масштаб исходит не от все более и более крупных нейронных сетей, а от независимых, четко определенных компонентов, которые организованы таким образом, чтобы иметь смысл для людей. Например, вместо того, чтобы обучать гигантскую модель записывать заметки о встречах с клиентами, делать выводы из результатов, обновлять соответствующие записи CRM, а затем отправлять последующую информацию, назначьте каждую из этих задач отдельно обученной модели.
На самом деле, я провел большую часть своей исследовательской карьеры в робототехнике, и я не могу не смотреть дальше, представляя, что такая хореография может быть сделана в реальном пространстве. На заводах, в офисах, больницах и даже в ресторанах макеты работают бок о бок с людьми для выполнения различных задач. Звучит высокопарно и далеко, но сейчас потенциал оркестровки огромен.
Поговорим о его преимуществах. Во-первых, оркестровка избавляет нас от сложности собрать достаточно большой набор данных и сделать единую модель настолько гибкой для решения сложностей междоменных агентов, а также избавляет от риска помещения большого количества очень разных данных в один обучающий набор. ** Кроме того, каждая модель может быть дополнительно настроена с помощью RLHF. Таким образом, в этой системе каждый компонент очень специализирован и используется для выполнения критически важных, но управляемых шагов в более крупной задаче.
При возникновении проблем, будь то во время ввода в эксплуатацию или производства, проблемы могут быть легко выявлены с помощью единой специализированной модели, позволяющей лучше понять и решить их. Даже серьезные неисправности могут быть устранены с помощью более надежного модульного способа. Кроме того, несколько моделей работают вместе, сбои легче контролировать и изолировать, а при выходе из строя одного компонента появляется больше возможностей для обеспечения непрерывности.
Модерн для генеративного ИИ: проектирование в нескольких моделях
Что еще более важно, он превращает создание корпоративных моделей ИИ из чисто технической задачи в задачу моделирования бизнес-процессов в терминах, понятных заинтересованным сторонам. Точно так же, как хороший менеджер разбивает проблему на команду, которую нужно решить, оркестратор ИИ будет иметь возможность разбить проблему на ряд специально разработанных моделей.
Что особенно интересно в этом видении, так это то, что оно указывает на новый навык, можно даже назвать его развивающимся искусством, и я с нетерпением жду, когда он будет развиваться на предприятии. Эксперты по оркестрации LAM будут мыслить на высоком уровне, рассматривая потребности предприятия как бизнеса, а не только технологической платформы, и использовать это понимание для разбивки больших, значимых задач на ряд более мелких задач, которые будут решаться «командами» LAM.
В их работе переплетаются инфраструктура, наука о данных и проектирование человеко-машинного интерфейса. Первый гарантирует, что эти команды моделей могут безопасно и эффективно развертываться, в то время как второй стремится собирать уникальные наборы данных для решения более мелких и менее неоднозначных задач. Другими словами, эксперты по оркестровке могут стать новыми лицами корпоративного ИИ, сосредоточившись не столько на специфике нейронных сетей, сколько на том, как создавать надежные системы.
На самом деле, я надеюсь, что этот навык не является ни редким, ни исключительным, а скорее широко распространенным, превращая оркестровку LAM в мощное, персонализированное решение, которое будет играть все более важную роль в нашей профессиональной жизни. По мере появления на рынке входной барьер может быть снижен еще больше, что приведет к появлению в мире решения для оркестровки LAM, похожего на второй пилот, которое просто обеспечивает генеративный ИИ в невероятных масштабах.
Некоторые будут использовать это рыночное решение напрямую, что сделает оркестровку LAM реальностью. Другие будут рассматривать их как модули и комбинировать их с другими модулями для формирования решений различных размеров в соответствии со своими потребностями. Но в любом случае, что меня больше всего волнует, так это то, что генеративный ИИ формируется не столько элитной небольшой группой технологов, сколько креативностью и видением профессионалов в различных областях.
На самом деле, мое видение будущего работы — это мир, в котором ИИ поддерживает человеческие навыки и позволяет нам мыслить на более высоком уровне, упрощая все, что мы делаем, сохраняя при этом креативность, стиль и перспективу, которые отличают нас от других.
Резюме
Реализация любого нового видения происходит постепенно, и LAM не является исключением. Однако последние годы показали, что каждый шаг на этом пути будет трансформационным. С самого начала своего существования LLM продемонстрировала редкий потенциал для прорывов и инноваций. Вспомогательные агенты, такие как Einstein Copilot, поднимают эту планку на новый уровень благодаря интуитивно понятному интерфейсу, надежным функциям доверия и безопасности, а также бесшовной интеграции с традиционными системами Copilot.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Оркестровка небольших моделей, чтобы 1+1_2 работы предприятия были более гибкими и эффективными
Первоисточник: Machine Energy
Использование ИИ становится все более распространенным и не ограничивается его использованием отдельными лицами. Кроме того, на предприятиях становится все более популярным использование ИИ для улучшения рабочих процессов и повышения производительности. Но следует отметить, что более мощными часто являются более крупные модели, что вызывает трудности при развертывании на предприятии. Сильвио Саезе (Silvio Saese) написал о своих мыслях по этому поводу: ** модели не больше, а лучше, маленькие модели лучше справляются с содержанием работы. **
Далее следует перевод и аранжировка оригинального текста машинным сердцем без изменения первоначального смысла.
В последние месяцы я много писал о том, что я называю LAM (Large Action Model), более активном, автономном варианте LLM. Он не только генерирует контент, такой как текст или изображения, но и может выполнять целые задачи и даже участвовать в рабочих процессах, как с людьми, так и в одиночку. В этом году, на Dreamforce 2023, с запуском Einstein Copilot, это видение сделало большой шаг к реальности. Einstein Copilot, разговорный помощник Salesforce с искусственным интеллектом, будет развернут на платформе Salesforce и готов к интеграции практически во все, что делают клиенты.
Второй пилот Эйнштейна: взгляд в будущее генеративного ИИ
Трудно не впечатлить Einstein Copilot из коробки. Он был разработан с нуля, чтобы быть продуктивным и безопасным способом, помогая пользователям практически во всех типах рабочих процессов. Он может обрабатывать вопросы, опубликованные на естественном языке, и предоставлять соответствующие достоверные ответы, извлеченные из конфиденциальных данных, которые защищены компанией. Это четкая картина того, в каком направлении, по моему мнению, движется ИИ на предприятии: единый, надежный интерфейс, разработанный для повседневного взаимодействия человека и компьютера и способный помочь в решении различных задач. Он демонстрирует силу искусственного интеллекта для обеспечения того, чтобы технология отвечала потребностям бизнеса, и я не сомневаюсь, что он также изменит то, как работают клиенты. И LAM, по мере того, как он будет развиваться в гибкости и функциональности, выведет эту и без того очень мощную силу на новый уровень.
Сделать генеративные модели ИИ «маленькими и большими»
В последнее время многие темы генеративного ИИ вращаются вокруг масштаба модели и архитектуры модели, которые лежат в основе LLM и LAM. Поскольку такие компании, как OpenAI, продолжают раздвигать границы масштаба, а количество параметров значительно превышает 100 миллиардов, нетрудно сделать вывод, что чем больше, тем лучше. На самом деле, большие модели часто хвастаются тем, что их производительности сложно или невозможно достичь иначе. И по мере увеличения размера модели возникает невероятно сложное поведение, предполагающее, что более масштабные стратегии могут принести значительные выгоды.
Как стратегическое уменьшение размеров моделей может принести огромные выгоды
В то время как более крупные модели продолжают доминировать в заголовках, погоня за более крупными моделями — не лучшая стратегия. Наиболее очевидно, что самые большие модели в настоящее время требуют больших вычислительных ресурсов, и многие компании находятся вне досягаемости. И даже те предприятия, которые могут позволить себе их развернуть, должны признать, что обещанная ими высококачественная продукция может быть чрезвычайно медленной. Кроме того, мы по-прежнему сталкиваемся с проблемами доверия, безопасности, вредоносности и претензий на право собственности, таких как авторское право, которые возникают из-за огромных наборов данных, полученных из глобального источника, на которые опираются гипермасштабируемые модели.
Эти недостатки делают малогабаритные модели все более привлекательными во многих сферах. Они относительно экономичны и могут быть настроены на невероятные скорости. Сегодня специально разработанная система LLM в некоторых случаях может работать даже полностью на периферии, включая мобильные устройства конечных пользователей. А поскольку они требуют меньшего обучения, клиенты могут взять на себя более активную роль в управлении при подготовке своих наборов данных. На этом этапе можно добиться огромных улучшений с точки зрения качества, безопасности и даже правового статуса контента, содержащегося в наборе данных.
Концентрируясь на более узких областях, качество выпуска небольших моделей также может быть на одном уровне с их «старшими братьями». Такие модели, как ChatGPT, по сути, предназначены для всех, помогая с домашними заданиями, рецептами ужина, отвечая на вопросы о науке, технике, истории и поп-культуре. В отличие от этого, генеративный ИИ для предприятий может и должен сосредоточиться на более мелких, но более актуальных проблемных областях. Это, безусловно, беспроигрышный вариант: это означает снижение барьеров для входа на рынок без ущерба для качества продукции. **
Как оркестровка малых моделей открывает большой потенциал
Даже небольшие модели могут предоставить большие решения, нам просто нужно по-другому думать о масштабе. Вместо того, чтобы увеличивать саму модель, переплетите несколько моделей для достижения цели более высокого уровня. ** Каждая модель разрабатывается с учетом конкретной цели и обучается на тщательно отобранном, тщательно проверенном и запатентованном наборе данных. Что, если бы агентов ИИ, таких как Einstein Copilot, можно было объединять или координировать, точно так же, как несколько человек могли бы выполнять больше работы в команде, чем по отдельности? Например, в ресторане, который представляет собой организацию, которая может быть достигнута только командной работой, у каждого участника есть свои навыки и направления деятельности: официанты отвечают за заказ, повара отвечают за приготовление еды, администраторы отвечают за обработку бронирований и заказов, а водители отвечают за доставку еды. Итак, как бы выглядел LAM при подобной организации?
В последнее время я думаю об оркестровке, и я думаю, что это одна из самых захватывающих технологий, но также и самая практичная, позволяющая безопасно и эффективно привлекать полезных, автономных агентов. Самое главное, что оркестровка означает, что даже самые амбициозные решения прозрачны и известны создателям и людям, которые работают с ними. Имейте в виду, что в этом случае масштаб исходит не от все более и более крупных нейронных сетей, а от независимых, четко определенных компонентов, которые организованы таким образом, чтобы иметь смысл для людей. Например, вместо того, чтобы обучать гигантскую модель записывать заметки о встречах с клиентами, делать выводы из результатов, обновлять соответствующие записи CRM, а затем отправлять последующую информацию, назначьте каждую из этих задач отдельно обученной модели.
На самом деле, я провел большую часть своей исследовательской карьеры в робототехнике, и я не могу не смотреть дальше, представляя, что такая хореография может быть сделана в реальном пространстве. На заводах, в офисах, больницах и даже в ресторанах макеты работают бок о бок с людьми для выполнения различных задач. Звучит высокопарно и далеко, но сейчас потенциал оркестровки огромен.
Поговорим о его преимуществах. Во-первых, оркестровка избавляет нас от сложности собрать достаточно большой набор данных и сделать единую модель настолько гибкой для решения сложностей междоменных агентов, а также избавляет от риска помещения большого количества очень разных данных в один обучающий набор. ** Кроме того, каждая модель может быть дополнительно настроена с помощью RLHF. Таким образом, в этой системе каждый компонент очень специализирован и используется для выполнения критически важных, но управляемых шагов в более крупной задаче.
При возникновении проблем, будь то во время ввода в эксплуатацию или производства, проблемы могут быть легко выявлены с помощью единой специализированной модели, позволяющей лучше понять и решить их. Даже серьезные неисправности могут быть устранены с помощью более надежного модульного способа. Кроме того, несколько моделей работают вместе, сбои легче контролировать и изолировать, а при выходе из строя одного компонента появляется больше возможностей для обеспечения непрерывности.
Модерн для генеративного ИИ: проектирование в нескольких моделях
Что еще более важно, он превращает создание корпоративных моделей ИИ из чисто технической задачи в задачу моделирования бизнес-процессов в терминах, понятных заинтересованным сторонам. Точно так же, как хороший менеджер разбивает проблему на команду, которую нужно решить, оркестратор ИИ будет иметь возможность разбить проблему на ряд специально разработанных моделей.
Что особенно интересно в этом видении, так это то, что оно указывает на новый навык, можно даже назвать его развивающимся искусством, и я с нетерпением жду, когда он будет развиваться на предприятии. Эксперты по оркестрации LAM будут мыслить на высоком уровне, рассматривая потребности предприятия как бизнеса, а не только технологической платформы, и использовать это понимание для разбивки больших, значимых задач на ряд более мелких задач, которые будут решаться «командами» LAM.
В их работе переплетаются инфраструктура, наука о данных и проектирование человеко-машинного интерфейса. Первый гарантирует, что эти команды моделей могут безопасно и эффективно развертываться, в то время как второй стремится собирать уникальные наборы данных для решения более мелких и менее неоднозначных задач. Другими словами, эксперты по оркестровке могут стать новыми лицами корпоративного ИИ, сосредоточившись не столько на специфике нейронных сетей, сколько на том, как создавать надежные системы.
На самом деле, я надеюсь, что этот навык не является ни редким, ни исключительным, а скорее широко распространенным, превращая оркестровку LAM в мощное, персонализированное решение, которое будет играть все более важную роль в нашей профессиональной жизни. По мере появления на рынке входной барьер может быть снижен еще больше, что приведет к появлению в мире решения для оркестровки LAM, похожего на второй пилот, которое просто обеспечивает генеративный ИИ в невероятных масштабах.
Некоторые будут использовать это рыночное решение напрямую, что сделает оркестровку LAM реальностью. Другие будут рассматривать их как модули и комбинировать их с другими модулями для формирования решений различных размеров в соответствии со своими потребностями. Но в любом случае, что меня больше всего волнует, так это то, что генеративный ИИ формируется не столько элитной небольшой группой технологов, сколько креативностью и видением профессионалов в различных областях.
На самом деле, мое видение будущего работы — это мир, в котором ИИ поддерживает человеческие навыки и позволяет нам мыслить на более высоком уровне, упрощая все, что мы делаем, сохраняя при этом креативность, стиль и перспективу, которые отличают нас от других.
Резюме
Реализация любого нового видения происходит постепенно, и LAM не является исключением. Однако последние годы показали, что каждый шаг на этом пути будет трансформационным. С самого начала своего существования LLM продемонстрировала редкий потенциал для прорывов и инноваций. Вспомогательные агенты, такие как Einstein Copilot, поднимают эту планку на новый уровень благодаря интуитивно понятному интерфейсу, надежным функциям доверия и безопасности, а также бесшовной интеграции с традиционными системами Copilot.