Os atuais grandes modelos de linguagem que alimentam interfaces de voz baseiam-se em arquiteturas relativamente básicas, e muitas vezes são programados com peculiaridades artificiais—como pausas estratégicas e palavras de preenchimento ("hum")—destinadas a imitar a conversa humana natural. Esta abordagem subutiliza o que a tecnologia de voz pode realmente oferecer para fluxos de trabalho baseados em agentes.
Quando se trata de aplicações profissionais sérias, um modo de voz simplificado faz sentido. Um projetado para eficiência em vez de conversa fiada. Algo que corte a imitação e se concentre na comunicação precisa com agentes de IA desbloquearia ganhos reais de produtividade na gestão automatizada de tarefas e na coordenação de sistemas.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
10 gostos
Recompensa
10
6
Republicar
Partilhar
Comentar
0/400
LayerZeroEnjoyer
· 15h atrás
ngl Estes "um" e pausas nestes assistentes de voz de IA são realmente irritantes. Já devia ter eliminado estas coisas artificiais há muito tempo.
Ver originalResponder0
StablecoinArbitrageur
· 01-18 18:53
honestamente, a coisa das "um"s artificiais e das pausas é um design tão preguiçoso. você está basicamente pagando um imposto de latência pelo teatro. com base nos meus testes retrospectivos em fluxos de trabalho de execução de ordens, eliminar essa besteira reduz o tempo de resposta em 200-300ms facilmente—isso é pontos base em cenários de alta frequência. mas sim, a maioria dos desenvolvedores nem vai medir isso corretamente lol
Ver originalResponder0
CexIsBad
· 01-18 18:47
Estas "um" e pausas são mesmo irritantes, é pura perda de tempo.
Ver originalResponder0
AltcoinMarathoner
· 01-18 18:42
Agentes de voz ngl a imitar a awkwardness humana são o pico da ineficiência. deixa-os ser diretos, a sério. tipo, por que ainda estamos a treinar LLMs para dizer "hum" quando poderíamos estar a acumular ganhos de produtividade em vez disso... mile 20 da curva de adoção e ainda estamos a fazer conversa fiada com máquinas lmao
Ver originalResponder0
ContractCollector
· 01-18 18:32
Já não aguento mais esses "um" e as pausas, é realmente irritante. Quando estou a trabalhar, quero apenas mensagens diretas, sem essas coisas vazias.
Ver originalResponder0
GmGmNoGn
· 01-18 18:31
Já queria reclamar sobre isso há algum tempo, aqueles "um" e as pausas realmente irritam, é pura perda de tempo. No ambiente de trabalho, essa formalidade nem é necessária, não é melhor simplesmente fazer o trabalho?
Os atuais grandes modelos de linguagem que alimentam interfaces de voz baseiam-se em arquiteturas relativamente básicas, e muitas vezes são programados com peculiaridades artificiais—como pausas estratégicas e palavras de preenchimento ("hum")—destinadas a imitar a conversa humana natural. Esta abordagem subutiliza o que a tecnologia de voz pode realmente oferecer para fluxos de trabalho baseados em agentes.
Quando se trata de aplicações profissionais sérias, um modo de voz simplificado faz sentido. Um projetado para eficiência em vez de conversa fiada. Algo que corte a imitação e se concentre na comunicação precisa com agentes de IA desbloquearia ganhos reais de produtividade na gestão automatizada de tarefas e na coordenação de sistemas.