Источник изображения: сгенерировано инструментом Unbounded AI
В последние несколько дней отечественные «непопулярные певцы» снова стали популярны благодаря кавер-версиям AI.
Пользователи сети на станции B использовали модель ИИ для создания ИИ-клона певицы Стефани Сан, который на самом деле похож на «Лин Чилин» и «Го Деган» в автомобильной навигации. Возьмите собственный звук певца для тренировки и создайте «Sun Yanzi» с точно таким же тембром.
Затем таким странным образом осуществилось желание позволить айдолам петь свои любимые песни.
Источник: Станция Б
Зарубежный геймплей еще более возмутителен.
23-летняя интернет-знаменитость из США с 1,8 миллионами поклонников воспроизвела свой ИИ-клон с помощью GPT-4, а затем влюбила в себя более 1000 пользователей сети одновременно, взимая 1 доллар в минуту.
Всего за одну неделю она заработала 71 600 долларов.
** И это гораздо больше, теперь ее «парни» по-прежнему быстро растут, и их число увеличилось почти до 10 000 человек, и они стоят в очереди, чтобы «влюбиться» в нее целых 96 часов. . **
Некоторые аналитики считают, что по тренду ей не составляет труда зарабатывать 5 млн долларов США в месяц, и если бы не технические ограничения, то заработанные ею деньги могут быть астрономической цифрой.
Эти явления уже могут в полной мере продемонстрировать, что быстро приближается эра новых технологических дивидендов, принесенных AI+.
01Цифровая человеческая армия врывается в комнату прямого эфира
Живая доставка с товарами — наиболее потенциальный сценарий реализации виртуальной ИС.
Поколение Z использует такие инструменты, как социальные сети, видео и онлайн-покупки, намного опережая средний уровень всей сети. Новый игровой процесс, сочетающий цифровых людей и виртуальные пространства, принес им ощущение опыта и интерактивности. поклонники виртуального IP - молодые группы 18-24 лет.
Эта тенденция позволяет брендам увидеть возможность сделать так, чтобы продукты прорвались через круги.
В 2020 году виртуальные певцы Луо Тяньи и Ле Чжэнлин придут в комнату прямых трансляций Taobao, чтобы принести товары для Bausch & Lomb, Midea, L'Occitane и других брендов. Количество зрителей этой прямой трансляции достигло 2,7 миллиона человек, и почти 2 миллиона человек дали вознаграждение и взаимодействие.
В то время это вызвало бурную дискуссию, и наступила эра прямых трансляций **виртуальными цифровыми людьми. **
А с появлением крупномасштабных моделей искусственного интеллекта, запущенных chatGPT в этом году, область виртуальных цифровых людей открыла еще один раунд более величественных взрывов.
Большое количество виртуальных цифровых людей начало толпиться в комнате прямого эфира.
В апреле этого года виртуальный цифровой человек "朏朏" от Tianyu Digital завершил доступ к модели ChatGPT и завершил дебют в прямом эфире. Он может не только отвечать на вопросы клиентов в режиме реального времени, но и самостоятельно отвечать на разные вопросы.
Источник: Доуин
В коротком ролике было много таких сцен: Весь офис компании пуст, только ряды столов с десятками ИИ-красавиц на экранах компьютеров ведут прямую трансляцию.... ..
Источник: короткое видео
Эта компания может транслировать в прямом эфире в течение дня только опираясь на 2D сверхреалистичные аватары, сценарии и заранее подготовленные фоны.** Хотя отдельные эффекты не так хороши, как прямые трансляции, стоимость до смешного низкая, и это также может быть копируется по сверхнизкой цене, победа заключается в выигрыше по количеству, и нет ничего невозможного в том, чтобы действительно лечь и позволить ИИ зарабатывать деньги. **
Все это показывает, что революция в эффективности контента на основе «ИИ+» происходит в сфере цифровых людей.
Виртуальные цифровые люди делятся на множество типов в зависимости от технологии производства, сценариев применения и характеристик изображения.
В отличие от популярных 3D-идолов, большинство реалистичных 2D-цифровых людей, которые говорят в комнате прямой трансляции, основаны на реальных прототипах, а их голоса и выражения воспроизведены.
Виртуальный ведущий может работать в прямом эфире 7*24 по вызову, не беспокоясь о проблеме изменения настроек человека, что снижает трудозатраты при проведении прямых трансляций.
За этим AIGC меняет процесс производства цифровых людей.
Создание 2D-цифровых людей использует глубокое обучение. Требуется только определить дизайн изображения. После того, как графические и звуковые данные собраны и предварительно обработаны, они загружаются в модель для обучения. По сравнению с 3D, метод производства проще и подробнее стандартизированы, а эффективность производства постоянно улучшается.
Этот метод заводской сборочной линии значительно сократил производственный порог, стоимость и цикл цифровых людей.
** В то же время, с технологической итерацией и снижением затрат на производственной стороне отрасли, также начали появляться цифровые решения для человека для мелких клиентов. **
В апреле Tencent Cloud выпустила цифровую платформу для производства людей. Цифровые аватары, которым необходимо генерировать реальные изображения, могут приобретать услуги на платформе. Просто загружайте изображения, аудио и видео для реализации настройки и взимайте плату в соответствии с различными тембрами и продолжительностью видео.
В дополнение к созданию цифровых людей, он также может предоставить полный набор решений для цифровых прямых трансляций.Функции включают в себя звук реального человека, занимающий комнату для прямой трансляции, и получение интеллектуальных ответов на комментарии пользователей.Цена составляет всего тысячу юаней. .
** А некоторые операторы каналов даже продают якоря ИИ в пакетах менее чем за 200 юаней. **
Большинство этих якорных изображений происходят с разрешения модельных агентств.Хотя качество трансляции грубое, есть явные следы вырезок, а голос не имеет характеристик.
Но для обычных малых и средних предприятий нет большого V для доставки товаров, и они не могут позволить себе тратить миллионы на настройку высококлассного IP.Если они хотят сократить эксплуатационные расходы и быстро начать объем, несколько тысяч юаней цифрового человека достаточно.
Цифровая человеческая студия, Сиджи
Если предприятие хочет самостоятельно модифицировать код и создавать других цифровых людей, оно также может приобрести исходный код у поставщика технологий.Цифровые люди транслируются в прямом эфире и зарабатывают деньги.
Но история цифрового человека с искусственным интеллектом еще не закончена.
02 Наполненная ИИ душа
В отчете "Состояние и анализ возможностей цифрового человеческого рынка Китая" IDC разделила цифровых людей на пять уровней. В настоящее время развитие цифровых людей прошло этапы от ручного производства до моделирования ИИ. Изначально они имеют человеческий облик, но они могут только принимать простые интерактивные решения.
Когда уровень интеллекта достигает L4 и L5, цифровые люди, управляемые ИИ, могут принимать большинство решений сцены и поддерживать более модальные взаимодействия в реальном времени, подобно личному дворецкому ИИ Железного человека «Джарвису».
** Развитие виртуальных цифровых людей за последние 30 лет, технологическое развитие и рыночный спрос в основном развивались вокруг двух аспектов: визуальные эффекты и интерактивный опыт. **
Виртуальные цифровые люди впервые появились в играх, мультфильмах и фильмах, отражая эмоциональную связь с модными вещами и расширение ценности ИС.
Ранние IP-адреса персонажей рисовались вручную, и действия приходилось рисовать одно за другим. В 1982 году Хаяси Минми, героиня японского мультфильма «Макросы», стала первой виртуальной певицей, выпустившей музыкальный альбом.
Певица первого поколения Линь Минмэй
В фильмах изображение может быть смоделировано компьютером, но действие должно быть сделано людьми.Постепенно становятся популярными компьютерная графика, захват движения и другие технологии.Опираясь на зеленые экраны и оборудование для захвата, актеры могут стать любой ролью.
После тысячелетия, от «Властелина колец» в 2002 году до прошлогоднего «Аватара 2», эффект рендеринга персонажей был тщательным, что принесло большое удобство художественному творчеству.
Изображение «Голлума» из «Властелина колец», снятое реальными людьми
До сих пор развитие цифровых технологий человека приближалось к пределу того, чтобы быть более похожим на «человека», шаг за шагом, Это не только требует, чтобы внешний вид и визуальные эффекты на одежде были приближены к реальности, но также включало вождение (представление реальных и тонкие выражения и движения) и рендеринг (делающий картинку более детальной и в реальном времени).
Тем не менее, я все еще чувствую, что чего-то не хватает.
В 1970 году Масахиро Мори, японский специалист по робототехнике, выдвинул теорию «зловещей долины»: поскольку роботы внешне и поступками похожи на людей, люди будут испытывать к роботам положительные эмоции.
Когда роботы и люди достигнут определенного уровня сходства, даже малейшее различие будет преувеличено и вызовет негатив и негодование. И когда сходство между роботами и людьми продолжит расти, люди вернутся к ним с положительными чувствами.
В отличие от фильмов, сценарии приложений с более сильными социальными атрибутами предъявляют более высокие требования к взаимодействию цифровых людей в реальном времени и не удовлетворяются только созданием красивой «вазы».
** С точки зрения взаимодействия модели естественного языка заполняют пробел. **
GPT, чья способность генерировать текст поразила всех, добавила две полоски к «IQ» цифровых людей.
Большая модель НЛП является техническим краеугольным камнем виртуальных людей, управляемых ИИ.Проще говоря, она позволяет виртуальным цифровым людям красноречиво говорить, снижать стоимость производства стандартизированного контента и обучаться таким ролям, как интеллектуальное обслуживание клиентов, модератор и администратор. туристический гид. В долгосрочной перспективе, с улучшением персонализации и эмоционального понимания, также будет реализовано обеспечение общения и заботы о пожилых людях и становление «личным учителем» для детей.
Кроме того, ИИ также может управлять движениями рта, чтобы установить сопоставление с текстом. С улучшением реализма микровыражения станут более обильными. При разговоре выражения и форма рта могут совпадать. по форме» и «человекоподобны по духу».
Агентство Синьхуа: Первый в мире цифровой астронавт: Сяо Чжэн
Midjourney — это взрывной продукт, основанный на диффузионной модели, выпущенный в июле прошлого года и обучающий ИИ рисованию с помощью инструкций по вводу текста.
Пара, иллюстрация Midjourney
** Некоторые организации подсчитали, что их текущий годовой доход достиг 100 миллионов долларов США. **
Есть мастер станции B, который использовал Midjourney, чтобы восстановить реалистичный образ бабушки.Начиная с внешнего вида, морщины стареющей кожи и седые волосы полны деталей, плюс прошлый звук для воспроизведения голоса бабушки, и, наконец, сгенерированный образ бабушки через D-ID Цифровой двойной.
Чтобы компенсировать небольшое сожаление о том, что он не попрощался с бабушкой, внук начал диалог с цифровой «бабушкой» перед ним, и «бабушка» сердечно ответила, что на самом деле было ответным материалом, предоставленным ChatGPT.
Источник: Станция Б
Именно благодаря этим все большим и большим попыткам со стороны клиента, в свою очередь, большое количество обучающих материалов постоянно добавляется к «персонификации» ИИ, что ускоряет обогащение данных модели ИИ и, наконец, позволяет ИИ вкладывать душу в цифровые люди и открывают большие возможности.
##03 Эпилог
Исследование виртуальных аватаров продолжается уже более 30 лет.От нарисованных вручную до управляемых человеком, а затем и искусственного интеллекта продвижение реалистичного и интерактивного опыта открыло широкий спектр сценариев применения, просачивающихся в океан. .
AIGC помогает полностью оцифровать внешность, голос и другие характеристики обычных людей, а более низкий производственный порог открывает простор воображению рынка.
IDC прогнозирует, что к 2026 году объем рынка цифрового человека с искусственным интеллектом в Китае достигнет 10,24 млрд юаней, но то, насколько хороший опыт он может нам принести, определяет окончательную судьбу цифрового человека.
В то же время цифровой человек с искусственным интеллектом обладает потенциалом портала взаимодействия человека и компьютера следующего поколения.В будущем мы можем больше не сталкиваться с холодными экранами, а с живыми цифровыми людьми.участниками.
Возможно, как сказал крестный отец ИИ, люди — это всего лишь переходный этап в эволюции интеллекта для создания цифрового интеллекта.Теперь у нас наконец есть цифровой клон, который выглядит как человек, говорит, как мы, и может думать, как мы. в будущем. (полный текст)
Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
ИИ начинает вливать душу в цифровых людей
Автор: Фредди
Поддержка данных: пифагорейские большие данные (
Источник: Гелонгхуэй
В последние несколько дней отечественные «непопулярные певцы» снова стали популярны благодаря кавер-версиям AI.
Пользователи сети на станции B использовали модель ИИ для создания ИИ-клона певицы Стефани Сан, который на самом деле похож на «Лин Чилин» и «Го Деган» в автомобильной навигации. Возьмите собственный звук певца для тренировки и создайте «Sun Yanzi» с точно таким же тембром.
Затем таким странным образом осуществилось желание позволить айдолам петь свои любимые песни.
Зарубежный геймплей еще более возмутителен.
23-летняя интернет-знаменитость из США с 1,8 миллионами поклонников воспроизвела свой ИИ-клон с помощью GPT-4, а затем влюбила в себя более 1000 пользователей сети одновременно, взимая 1 доллар в минуту.
Всего за одну неделю она заработала 71 600 долларов.
Некоторые аналитики считают, что по тренду ей не составляет труда зарабатывать 5 млн долларов США в месяц, и если бы не технические ограничения, то заработанные ею деньги могут быть астрономической цифрой.
Эти явления уже могут в полной мере продемонстрировать, что быстро приближается эра новых технологических дивидендов, принесенных AI+.
01Цифровая человеческая армия врывается в комнату прямого эфира
Живая доставка с товарами — наиболее потенциальный сценарий реализации виртуальной ИС.
Поколение Z использует такие инструменты, как социальные сети, видео и онлайн-покупки, намного опережая средний уровень всей сети. Новый игровой процесс, сочетающий цифровых людей и виртуальные пространства, принес им ощущение опыта и интерактивности. поклонники виртуального IP - молодые группы 18-24 лет.
Эта тенденция позволяет брендам увидеть возможность сделать так, чтобы продукты прорвались через круги.
В 2020 году виртуальные певцы Луо Тяньи и Ле Чжэнлин придут в комнату прямых трансляций Taobao, чтобы принести товары для Bausch & Lomb, Midea, L'Occitane и других брендов. Количество зрителей этой прямой трансляции достигло 2,7 миллиона человек, и почти 2 миллиона человек дали вознаграждение и взаимодействие.
В то время это вызвало бурную дискуссию, и наступила эра прямых трансляций **виртуальными цифровыми людьми. **
А с появлением крупномасштабных моделей искусственного интеллекта, запущенных chatGPT в этом году, область виртуальных цифровых людей открыла еще один раунд более величественных взрывов.
Большое количество виртуальных цифровых людей начало толпиться в комнате прямого эфира.
В апреле этого года виртуальный цифровой человек "朏朏" от Tianyu Digital завершил доступ к модели ChatGPT и завершил дебют в прямом эфире. Он может не только отвечать на вопросы клиентов в режиме реального времени, но и самостоятельно отвечать на разные вопросы.
В коротком ролике было много таких сцен: Весь офис компании пуст, только ряды столов с десятками ИИ-красавиц на экранах компьютеров ведут прямую трансляцию.... ..
Эта компания может транслировать в прямом эфире в течение дня только опираясь на 2D сверхреалистичные аватары, сценарии и заранее подготовленные фоны.** Хотя отдельные эффекты не так хороши, как прямые трансляции, стоимость до смешного низкая, и это также может быть копируется по сверхнизкой цене, победа заключается в выигрыше по количеству, и нет ничего невозможного в том, чтобы действительно лечь и позволить ИИ зарабатывать деньги. **
Все это показывает, что революция в эффективности контента на основе «ИИ+» происходит в сфере цифровых людей.
Виртуальные цифровые люди делятся на множество типов в зависимости от технологии производства, сценариев применения и характеристик изображения.
В отличие от популярных 3D-идолов, большинство реалистичных 2D-цифровых людей, которые говорят в комнате прямой трансляции, основаны на реальных прототипах, а их голоса и выражения воспроизведены.
Виртуальный ведущий может работать в прямом эфире 7*24 по вызову, не беспокоясь о проблеме изменения настроек человека, что снижает трудозатраты при проведении прямых трансляций.
За этим AIGC меняет процесс производства цифровых людей.
Создание 2D-цифровых людей использует глубокое обучение. Требуется только определить дизайн изображения. После того, как графические и звуковые данные собраны и предварительно обработаны, они загружаются в модель для обучения. По сравнению с 3D, метод производства проще и подробнее стандартизированы, а эффективность производства постоянно улучшается.
Этот метод заводской сборочной линии значительно сократил производственный порог, стоимость и цикл цифровых людей.
** В то же время, с технологической итерацией и снижением затрат на производственной стороне отрасли, также начали появляться цифровые решения для человека для мелких клиентов. **
В апреле Tencent Cloud выпустила цифровую платформу для производства людей. Цифровые аватары, которым необходимо генерировать реальные изображения, могут приобретать услуги на платформе. Просто загружайте изображения, аудио и видео для реализации настройки и взимайте плату в соответствии с различными тембрами и продолжительностью видео.
В дополнение к созданию цифровых людей, он также может предоставить полный набор решений для цифровых прямых трансляций.Функции включают в себя звук реального человека, занимающий комнату для прямой трансляции, и получение интеллектуальных ответов на комментарии пользователей.Цена составляет всего тысячу юаней. .
** А некоторые операторы каналов даже продают якоря ИИ в пакетах менее чем за 200 юаней. **
Большинство этих якорных изображений происходят с разрешения модельных агентств.Хотя качество трансляции грубое, есть явные следы вырезок, а голос не имеет характеристик.
Но для обычных малых и средних предприятий нет большого V для доставки товаров, и они не могут позволить себе тратить миллионы на настройку высококлассного IP.Если они хотят сократить эксплуатационные расходы и быстро начать объем, несколько тысяч юаней цифрового человека достаточно.
Если предприятие хочет самостоятельно модифицировать код и создавать других цифровых людей, оно также может приобрести исходный код у поставщика технологий.Цифровые люди транслируются в прямом эфире и зарабатывают деньги.
Но история цифрового человека с искусственным интеллектом еще не закончена.
02 Наполненная ИИ душа
В отчете "Состояние и анализ возможностей цифрового человеческого рынка Китая" IDC разделила цифровых людей на пять уровней. В настоящее время развитие цифровых людей прошло этапы от ручного производства до моделирования ИИ. Изначально они имеют человеческий облик, но они могут только принимать простые интерактивные решения.
Когда уровень интеллекта достигает L4 и L5, цифровые люди, управляемые ИИ, могут принимать большинство решений сцены и поддерживать более модальные взаимодействия в реальном времени, подобно личному дворецкому ИИ Железного человека «Джарвису».
Виртуальные цифровые люди впервые появились в играх, мультфильмах и фильмах, отражая эмоциональную связь с модными вещами и расширение ценности ИС.
Ранние IP-адреса персонажей рисовались вручную, и действия приходилось рисовать одно за другим. В 1982 году Хаяси Минми, героиня японского мультфильма «Макросы», стала первой виртуальной певицей, выпустившей музыкальный альбом.
В фильмах изображение может быть смоделировано компьютером, но действие должно быть сделано людьми.Постепенно становятся популярными компьютерная графика, захват движения и другие технологии.Опираясь на зеленые экраны и оборудование для захвата, актеры могут стать любой ролью.
После тысячелетия, от «Властелина колец» в 2002 году до прошлогоднего «Аватара 2», эффект рендеринга персонажей был тщательным, что принесло большое удобство художественному творчеству.
До сих пор развитие цифровых технологий человека приближалось к пределу того, чтобы быть более похожим на «человека», шаг за шагом, Это не только требует, чтобы внешний вид и визуальные эффекты на одежде были приближены к реальности, но также включало вождение (представление реальных и тонкие выражения и движения) и рендеринг (делающий картинку более детальной и в реальном времени).
Тем не менее, я все еще чувствую, что чего-то не хватает.
В 1970 году Масахиро Мори, японский специалист по робототехнике, выдвинул теорию «зловещей долины»: поскольку роботы внешне и поступками похожи на людей, люди будут испытывать к роботам положительные эмоции.
Когда роботы и люди достигнут определенного уровня сходства, даже малейшее различие будет преувеличено и вызовет негатив и негодование. И когда сходство между роботами и людьми продолжит расти, люди вернутся к ним с положительными чувствами.
** С точки зрения взаимодействия модели естественного языка заполняют пробел. **
GPT, чья способность генерировать текст поразила всех, добавила две полоски к «IQ» цифровых людей.
Большая модель НЛП является техническим краеугольным камнем виртуальных людей, управляемых ИИ.Проще говоря, она позволяет виртуальным цифровым людям красноречиво говорить, снижать стоимость производства стандартизированного контента и обучаться таким ролям, как интеллектуальное обслуживание клиентов, модератор и администратор. туристический гид. В долгосрочной перспективе, с улучшением персонализации и эмоционального понимания, также будет реализовано обеспечение общения и заботы о пожилых людях и становление «личным учителем» для детей.
Кроме того, ИИ также может управлять движениями рта, чтобы установить сопоставление с текстом. С улучшением реализма микровыражения станут более обильными. При разговоре выражения и форма рта могут совпадать. по форме» и «человекоподобны по духу».
Midjourney — это взрывной продукт, основанный на диффузионной модели, выпущенный в июле прошлого года и обучающий ИИ рисованию с помощью инструкций по вводу текста.
** Некоторые организации подсчитали, что их текущий годовой доход достиг 100 миллионов долларов США. **
Есть мастер станции B, который использовал Midjourney, чтобы восстановить реалистичный образ бабушки.Начиная с внешнего вида, морщины стареющей кожи и седые волосы полны деталей, плюс прошлый звук для воспроизведения голоса бабушки, и, наконец, сгенерированный образ бабушки через D-ID Цифровой двойной.
Чтобы компенсировать небольшое сожаление о том, что он не попрощался с бабушкой, внук начал диалог с цифровой «бабушкой» перед ним, и «бабушка» сердечно ответила, что на самом деле было ответным материалом, предоставленным ChatGPT.
Именно благодаря этим все большим и большим попыткам со стороны клиента, в свою очередь, большое количество обучающих материалов постоянно добавляется к «персонификации» ИИ, что ускоряет обогащение данных модели ИИ и, наконец, позволяет ИИ вкладывать душу в цифровые люди и открывают большие возможности.
##03 Эпилог
Исследование виртуальных аватаров продолжается уже более 30 лет.От нарисованных вручную до управляемых человеком, а затем и искусственного интеллекта продвижение реалистичного и интерактивного опыта открыло широкий спектр сценариев применения, просачивающихся в океан. .
AIGC помогает полностью оцифровать внешность, голос и другие характеристики обычных людей, а более низкий производственный порог открывает простор воображению рынка.
IDC прогнозирует, что к 2026 году объем рынка цифрового человека с искусственным интеллектом в Китае достигнет 10,24 млрд юаней, но то, насколько хороший опыт он может нам принести, определяет окончательную судьбу цифрового человека.
В то же время цифровой человек с искусственным интеллектом обладает потенциалом портала взаимодействия человека и компьютера следующего поколения.В будущем мы можем больше не сталкиваться с холодными экранами, а с живыми цифровыми людьми.участниками.
Возможно, как сказал крестный отец ИИ, люди — это всего лишь переходный этап в эволюции интеллекта для создания цифрового интеллекта.Теперь у нас наконец есть цифровой клон, который выглядит как человек, говорит, как мы, и может думать, как мы. в будущем. (полный текст)