Современные крупные языковые модели, обеспечивающие голосовые интерфейсы, основаны на относительно простых архитектурах, и их часто программируют с искусственными особенностями — такими как стратегические паузы и заполнительные слова ("эм") — предназначенными для имитации естественного человеческого разговора. Такой подход недоиспользует потенциал голосовых технологий для агентских рабочих процессов.
Когда речь идет о серьезных профессиональных приложениях, более рациональный голосовой режим имеет смысл. Такой, который ориентирован на эффективность, а не на болтовню. Что-то, что прорезает мимикрию и сосредотачивается на точной коммуникации с AI-агентами, откроет реальные возможности для повышения производительности в автоматизированном управлении задачами и координации систем.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
10 Лайков
Награда
10
6
Репост
Поделиться
комментарий
0/400
LayerZeroEnjoyer
· 15ч назад
ngl эти "um" и паузы в голосовых помощниках на базе ИИ действительно бесят. Уже давно пора избавиться от этих вычурных вещей.
Посмотреть ОригиналОтветить0
StablecoinArbitrageur
· 01-18 18:53
честно говоря, искусственные «эм» и паузы — это такой ленивый дизайн. вы по сути платите налог за задержку ради театра. исходя из моего бэктестинга рабочих процессов выполнения ордеров, удаление этого бреда сокращает время отклика на 200-300мс — это базовые пункты в сценариях высокой частоты. но да, большинство разработчиков даже не будут правильно измерять это lol
Посмотреть ОригиналОтветить0
CexIsBad
· 01-18 18:47
Эти "эм" и паузы действительно бесят, это чистая трата времени.
Посмотреть ОригиналОтветить0
AltcoinMarathoner
· 01-18 18:42
Агенты голосового ассистента NGL, имитирующие человеческую неловкость, — вершина неэффективности. Просто пусть они будут прямыми, честно. Почему мы все еще тренируем большие языковые модели говорить "эм", когда вместо этого можем накапливать приросты производительности... 20-я миля кривой внедрения, а мы все еще болтаем с машинами лол
Посмотреть ОригиналОтветить0
ContractCollector
· 01-18 18:32
Я давно устал от этих "эм" и пауз, это действительно раздражает. Когда работаю, хочу просто передавать информацию напрямую, без всякой ерунды.
Посмотреть ОригиналОтветить0
GmGmNoGn
· 01-18 18:31
Давно хотел это сказать, эти "эм" и паузы действительно бесят, они просто тратят время. В рабочей ситуации вообще не нужны эти вещи, разве не проще просто работать?
Современные крупные языковые модели, обеспечивающие голосовые интерфейсы, основаны на относительно простых архитектурах, и их часто программируют с искусственными особенностями — такими как стратегические паузы и заполнительные слова ("эм") — предназначенными для имитации естественного человеческого разговора. Такой подход недоиспользует потенциал голосовых технологий для агентских рабочих процессов.
Когда речь идет о серьезных профессиональных приложениях, более рациональный голосовой режим имеет смысл. Такой, который ориентирован на эффективность, а не на болтовню. Что-то, что прорезает мимикрию и сосредотачивается на точной коммуникации с AI-агентами, откроет реальные возможности для повышения производительности в автоматизированном управлении задачами и координации систем.