Поточні великі мовні моделі, що забезпечують голосові інтерфейси, базуються на відносно простих архітектурах, і їх часто програмують з штучними особливостями — наприклад, стратегічними паузами та заповнювальними словами ("е") — щоб імітувати природну людську розмову. Такий підхід недоцільно використовує потенціал голосових технологій для агентських робочих процесів.
Що стосується серйозних професійних застосувань, то оптимізований голосовий режим має сенс. Такий, що орієнтований на ефективність, а не на дрібні розмови. Щось, що проривається крізь імітацію і зосереджено на точній комунікації з AI-агентами, відкриє реальні можливості для підвищення продуктивності у автоматизованому управлінні завданнями та системною координацією.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
10 лайків
Нагородити
10
6
Репост
Поділіться
Прокоментувати
0/400
LayerZeroEnjoyer
· 19год тому
ngl ці AI-голосові помічники з "ум" і паузами дійсно дратують. Уже давно потрібно було позбавитися цих надмірних речей.
Переглянути оригіналвідповісти на0
StablecoinArbitrageur
· 01-18 18:53
чесно кажучи, штучні "е-мі-мі" та паузи — це така лінива розробка. ви фактично платите податок за затримку заради театру. з моїх тестів на історичних даних щодо робочих процесів виконання замовлень, видалення цього нісенітниці зменшує час відповіді на 200-300мс — це базові пункти у сценаріях високочастотної торгівлі. але так, більшість розробників навіть не вимірюють це правильно, лол
Переглянути оригіналвідповісти на0
CexIsBad
· 01-18 18:47
Ці "ум" і паузи справді дратують, це просто марна трата часу
Переглянути оригіналвідповісти на0
AltcoinMarathoner
· 01-18 18:42
Агенти голосу ngl, що імітують людську ніяковість, — це вершина неефективності. Просто дозвольте їм бути прямими. наприклад, чому ми досі тренуємо LLM казати "е" або "ну", коли можемо накопичувати вигоди від продуктивності замість цього... 20-й кілометр кривої впровадження, і ми все ще ведемо невимушені розмови з машинами лол
Переглянути оригіналвідповісти на0
ContractCollector
· 01-18 18:32
Я давно вже не міг терпіти ці "um" і паузи, це дійсно дратує. Під час роботи хочу просто передавати інформацію, без цих порожніх речей.
Переглянути оригіналвідповісти на0
GmGmNoGn
· 01-18 18:31
Я давно хотів це сказати: ці "ум" і паузи дійсно дратують, вони просто марнують час. У робочих ситуаціях це зовсім не потрібно, чи не краще просто працювати?
Поточні великі мовні моделі, що забезпечують голосові інтерфейси, базуються на відносно простих архітектурах, і їх часто програмують з штучними особливостями — наприклад, стратегічними паузами та заповнювальними словами ("е") — щоб імітувати природну людську розмову. Такий підхід недоцільно використовує потенціал голосових технологій для агентських робочих процесів.
Що стосується серйозних професійних застосувань, то оптимізований голосовий режим має сенс. Такий, що орієнтований на ефективність, а не на дрібні розмови. Щось, що проривається крізь імітацію і зосереджено на точній комунікації з AI-агентами, відкриє реальні можливості для підвищення продуктивності у автоматизованому управлінні завданнями та системною координацією.