Os fabricantes de telemóveis, que precisam urgentemente de encontrar um novo volante, estão de olho em modelos grandes.
Na conferência de desenvolvedores no início de agosto, a Huawei anunciou que integraria Xiaoyi, um assistente de IA no HarmonyOS 4, no modelo grande, e convidou-a para testá-lo no final de agosto. A Xiaomi também abriu o teste de convite de sua assistente de IA Xiaoai para acessar o modelo grande mais ou menos ao mesmo tempo. Seguiram-se a OPPO e a Vivo, que começaram a experimentar grandes modelos de telemóveis em novembro.
"Enfiar grandes modelos em telemóveis" não é uma novidade na indústria,Para não falar da vivo, que tem estado intensamente aquecida desde meados de outubro,Rongmi O três revelaram novidades relevantes na conferência de imprensa realizada este ano。 A visão geral na indústria é que a parte de hardware da pista do smartphone é quase inenrolável, e a maioria dos grandes modelos rodando na nuvem são apenas uma variável que está livre do hardware.
Deve-se notar que a implantação do lado do dispositivo também é uma tendência do setor para grandes faixas de modelos. Tomando o ChatGPT como exemplo, como um representante típico do modelo grande do lado da nuvem, seu treinamento e inferência são executados no Azure da Microsoft, e os usuários obtêm resultados por meio de navegadores ou aplicativos. Entre entradas-saídas e idas e vindas, não há apenas um atraso que afeta a experiência do usuário, mas também custos de nuvem, como consumo de energia e poder de computação.
Do ponto de vista dos cenários e necessidades reais, muitas necessidades podem ser satisfeitas por dispositivos de borda, especialmente terminais que são amplamente utilizados, como telefones celulares, PCs e novos veículos de energia.
Como resultado, a implantação final de grandes modelos tornou-se gradualmente um consenso, não apenas os fabricantes de telefones celulares aumentaram seus esforços para treinar modelos, mas também a Lenovo na pista de PC e a Qualcomm na trilha de chips lançaram soluções relevantes para IA de lado final há algum tempo. Em particular, os recém-lançados Qualcomm Snapdragon 8 Gen3 e MediaTek Dimensity 9300, a melhoria de seu desempenho de IA pode ser dito ser a base do modelo grande no telefone celular.
As necessidades da indústria e as condições de hardware foram atendidas, e o modelo grande pode finalmente entrar no telefone celular. O que é bastante surpreendente é que a primeira fabricante de telemóveis a contratar um "produto completo" é a Vivo.
**Qual é a condição do modelo vivo grande? **
Em 1º de novembro, a vivo realizou uma conferência de desenvolvedores, na qual lançou a matriz de grandes modelos auto-desenvolvida "BlueLM", incluindo 1 bilhão, 10 bilhões, 100 bilhões e outras escalas de parâmetros diferentes. Ao mesmo tempo, também lançou o OriginOS 4, um sistema operacional auto-desenvolvido adaptado ao seu modelo grande.
Diante da "terra prometida" dos grandes modelos, a ânsia da Vivo está quase estampada no rosto.
De acordo com os últimos dados divulgados pela Canalys, uma agência de pesquisa de mercado, em 26 de outubro, os embarques e embarques da Vivo diminuíram, e o ranking também caiu. A vivo precisa urgentemente de modelos grandes e do OriginOS 4 para virar a maré, e não é de estranhar que seja a primeira a "abrir o livro".
E em comparação com o modelo grande, o tempo de atualização do OriginOS 4 lançado pela vivo desta vez é ligeiramente fraco. Na discussão de domínio público, não só a iteração de sua placa gráfica virtual, espaço de computação heterogêneo e leve não é como esperado, mas também os módulos como a notificação atômica, que é bastante barulhenta entre os usuários da vivo, não foram atualizados. Ou seja, o grande modelo é o protagonista desta conferência.
Do ponto de vista do modelo de negócio, o percurso da Vivo nesta conferência de imprensa é semelhante ao de outros players da indústria antes, com assistente de inteligência artificial como operadora, adotando um método de implementação híbrida do lado do dispositivo + do lado da nuvem, em que o modelo grande do lado do dispositivo, que é o principal jogo, apresenta as características óbvias de localização e leveza.
O objetivo disso é óbvio, o consumo de energia e o poder de computação fornecidos pelo pequeno mundo dos telefones celulares não são os mesmos que os da sala de computadores. É apenas como combinar a capacidade do modelo com a profundidade do telefone móvel tornou-se o "know how" que os fabricantes de telefones celulares precisam urgentemente para romper.
Nesse sentido, a solução da Vivo é lançar um modelo de especificação multiparâmetro, dos quais 1 bilhão de especificações são principalmente para cenários de texto e 7 bilhões de especificações para diálogo natural e telefoto de perguntas e respostas de conhecimento são os destaques da implantação do lado do dispositivo. Na introdução oficial, as especificações de 1 bilhão são orientadas separadamente para o lado do dispositivo, e as especificações de 7 bilhões devem ser de dupla finalidade para o dispositivo e a nuvem, e todas elas foram implantadas na nuvem desde 70 bilhões, o que também reflete a ideia matricial da Vivo de "deixe Deus voltar a Deus, e César a César" na colaboração dispositivo-nuvem.
Isso é o mesmo que a conferência de desenvolvedores de E/S do Google em maio deste ano, quando o Google lançou um grande modelo PaLM2 com quatro especificações de parâmetros, dos quais o modelo de parâmetros pequenos pode processar 20 tokens por segundo no estado offline, o que é adequado para uso offline de terminais.
Se você acha que a vivo está "colhendo os dentes das pessoas", é muito duro. Na verdade, a vivo se propôs a criar uma equipe interna de IA já em 2017 e, hoje, o vivo AI Research Institute tem mais de 1.000 pesquisadores.
Embora sua precipitação técnica seja geralmente inferior ao primeiro escalão, como Ali e Baidu, a existência da comunidade de código aberto também permite que os jogadores que entram no mercado um pouco mais tarde alcancem rapidamente o grande exército. O Knowledge Graph Research Institute, criado pela vivo em 2018, também pode reforçar a falta de dados de treinamento que pode encontrar como fabricante de celulares até certo ponto.
Quanto à capacidade do modelo, a vivo entregou uma boa folha de respostas durante o período de aquecimento. É relatado que BlueLM ganhou o primeiro lugar na categoria de "modelo de acesso restrito" no conjunto de avaliação de terceiros C-do modelo chinês grande. De acordo com seu anúncio oficial, o BlueLM é o primeiro modelo grande do lado do dispositivo 7B da indústria.
No entanto, não são poucos os modelos que obtiveram pontuações altas na avaliação, mas têm desempenho real insatisfatório, e algumas pessoas na indústria dizem que essa lista foi "eliminada" no período de tempo passado, o que só pode representar a capacidade do modelo de "fazer perguntas" e não pode refletir a capacidade de raciocínio, segurança e adaptabilidade. Desse ponto de vista, fica claro que os resultados de negócios da Vivo precisam de testes mais práticos.
Além disso, os recursos atuais do modelo de nuvem da Vivo, como diagrama de Wensheng e interação, não saíram da armadilha dos modelos grandes, e a novidade é limitada. Além disso, sua capacidade de modelo do lado do dispositivo como uma grande jogada ainda está em fase de testes, e a exibição de recursos finais é inevitavelmente limitada pelo hardware do telefone celular.
Soubemos que muitos usuários que foram convidados a participar dos testes internos do Blue Heart estão usando telefones flagship representados pelo X90 Pro, e esses modelos também são os mais altos no cronograma público de adaptação beta para aplicativos de modelos em larga escala lançados pela Vivo.
Por favor, insira o diagrama para dizer
Não há dúvida de que os modelos grandes estão se tornando o segundo campo de batalha para os fabricantes de celulares abrirem high-end, e eles também são uma variável importante para revitalizar os usuários e ativar a IoT. Apesar disso, ainda há muitas variáveis na intenção da Vivo de aumentar o valor dos produtos high-end confiando em modelos grandes
Em última análise, o lançamento do modelo de grande porte não é apenas a nova pedra angular do high-end da Vivo, mas também sua tentativa de puxar novas máquinas e produtos high-end.
Os modelos low-end são naturalmente difíceis de lidar com esta guerra high-end. Tomemos como exemplo o modelo básico Y100 lançado pela vivo antes desta conferência de imprensa, este é um dos modelos mais recentes do plano de adaptação acima mencionado, e por trás de um movimento de "backstab" semelhante está a esperança de "pequeno ábaco" da Vivo de voltar ao trono com produtos topo de gama.
Mesmo assim, o lançamento de modelos grandes ainda não é uma vantagem para os produtos high-end da Vivo.
Wang Yang (pseudônimo), um empreendedor da comunidade de código aberto do modelo grande do lado do dispositivo, disse ao Photon Planet que a capacidade do modelo grande do lado do dispositivo está no desempenho de IA trazido por seu NPU (processador especialmente projetado para computação de rede neural profunda). No entanto, nos modelos anteriores da Vivo, ele não prestava atenção às capacidades NPU, então é provável que seja difícil para os modelos mais antigos rodarem modelos grandes sem problemas.
Quanto ao próximo lançamento, o novo modelo vivo X100 da série equipado com chip principal MediaTek Dimensity 9300 e uma nova geração de processador AI pode ser capaz de usar as capacidades do modelo sem problemas, mas no caso de já existirem grandes aplicações de modelos como Wenxin Yiyan e iFLYTEK Xinghuo no mercado, o espaço deixado para o telefone celular não é tão grande quanto se imaginava. Em comparação com a habilidade, talvez a jogabilidade mostrada pela vivo desta vez seja mais digna de um estudo aprofundado.
**Torne o seu telemóvel mais inteligente? **
Kevin Scott, CTO da Microsoft, que pressionou a Microsoft a se tornar um investidor-anjo na OpenAI, declarou publicamente que o modelo em si não é um produto, mas uma infraestrutura. A implicação é que, depois que o treinamento ajusta a base do modelo, a exploração da produtização é o núcleo do "segundo empreendedorismo" de muitos players.
A "reprodutização" de modelos grandes em telefones celulares é uma questão de curso, mas os grandes modelos implantados em telefones celulares ainda precisam ser mais produzidos. A julgar pelas informações expostas até agora, a vivo perceberá a capacidade de modelo grande por meio de um aplicativo chamado assistente Xiao V, e a rota mainstream atual na indústria é incorporar a capacidade de modelo grande no assistente de inteligência artificial existente.
Os usuários de smartphones têm uma necessidade real da capacidade de entender grandes modelos, seja um assistente inteligente chamado jocosamente de "deficiência intelectual artificial" ou um aplicativo e dados cada vez mais inchados sob a explosão de capacidade, os telefones celulares precisam ser capazes de entender melhor a interação e ajudar os usuários a classificar informações. A adição de modelos grandes é essencialmente para trazer recursos de compreensão de linguagem natural para telefones celulares.
No caso de implementação não implementada, problemas como consumo de energia, dissipação de calor e latência que podem ocorrer no modelo do lado do dispositivo podem ser ignorados por enquanto. Na opinião de Wang Yang, o principal problema enfrentado pelo modelo vivo é como distinguir os limites de capacidade de diferentes modelos e como chamá-los quando vários modelos são usados juntos, "o que está relacionado à forma e apresentação do produto final".
Face ao lado C com cenários generalizados e requisitos complexos, os modelos invocados por requisitos diferentes são diferentes. Por exemplo, o modelo de especificação de 1 bilhão e o modelo de especificação de 7 bilhões no lado do dispositivo precisam aprender com os dados locais do usuário na tentativa de "entender melhor o usuário". Portanto, se a capacidade do modelo e o sistema operacional adaptado a ele podem ser usados para implementar instruções complexas no telefone celular é um indicador importante.
Até agora, a complexa função de comando demonstrada pelo BlueLM é bastante destacada. Sob o recém-lançado OriginOS 4, o V-assistant reside no canto inferior direito da barra lateral e pode ser exibido clicando nele. Não só a lógica de operação é mais curta do que a do modelo do lado da nuvem, que é mais adequado para o uso do celular, mas também algumas instruções complexas no sistema operacional, como pesquisa inteligente de álbuns, conclusão preliminar de comandos de aplicativos de terceiros e configurações no sistema operacional.
Vale a pena mencionar que o pequeno assistente V é isolado da voz Jovi existente da Vivo em termos de função e caminho, e os dois são independentes um do outro, o que é obviamente diferente do caminho do modelo grande do lado do dispositivo proposto por outros fabricantes antes.
Do ponto de vista funcional, o pequeno assistente V pode basicamente alcançar a cobertura total da voz de Jovi, então o objetivo de distinguir os dois provavelmente será facilitar que os usuários sintam a diferença entre os dois. Além disso, a lógica de produto do pequeno assistente V é semelhante à do Copilot transportado no bucket da família Microsoft, e os dois caminhos diferentes provavelmente serão integrados no futuro.
Isso também reflete que o BlueLM atual ainda está em fase de testes, e a forma do produto é difícil de dizer madura.
De acordo com o feedback de quem participou do teste interno do BlueLM, com a capacidade de modelo do modelo carro-chefe da Vivo, ainda há um atraso de 2s~5s no requisito de geração de texto simples dentro de 20 tokens, o que não é uma boa notícia para implementação subsequente - o atraso do modelo do lado da nuvem não foi bem resolvido. Isso pode ser melhorado em modelos equipados com os mais recentes chips de IA dos fabricantes de chips, mas para os consumidores, isso não constitui um motivo para mudar seus telefones.
Além disso, como o primeiro modelo de celular do setor, a capacidade de modelo do lado da nuvem da Vivo também está enfrentando o "cerco" de muitos modelos grandes de fornecedores de nuvem.
Por exemplo, a vivo anunciou que lançará o robô conversacional Lanxin Qianxun na loja de aplicativos, e as especificações de parâmetros de 175 bilhões não são visíveis em comparação com os grandes modelos nas lojas de aplicativos atuais. Entre os fornecedores de nuvem, a Baidu já cobrou pela recém-lançada versão profissional Wenxin 4.0 para testar as águas, enquanto a Lanxin Qianxun parece ser mais um membro não tão atraente do ecossistema de modelos grandes vivos, e seu caminho é obviamente obstrutivo e longo.
É preciso mencionar que a vivo está atrasada e a lacuna na precipitação tecnológica também limitará o avanço de seu negócio de modelos em larga escala.
Em termos de software, o modelo vivo large tornou-se o material promocional da plataforma de aprendizado de máquina Pai do Alibaba Cloud, e podemos até encontrar a sombra de "Tongyi Qianwen" do nome de "Blue Heart Qianwen". Executar na nuvem significa custos de longo prazo, e isso é refletido de forma mais vívida na OpenAI. Do ponto de vista dos custos, se a vivo quiser desenvolver o BlueLM em um ecossistema de longo prazo, a IDC autoconstruída é obviamente mais propícia ao desenvolvimento de longo prazo do que a migração para a nuvem.
Em termos de hardware, Huawei e Apple, os dois principais fabricantes, já integraram recursos NPU autodesenvolvidos em suas linhas de produtos existentes, enquanto a vivo ainda precisa contar com fabricantes de chips. Mesmo que certas barreiras possam ser construídas no treinamento e ajuste do modelo, a lacuna de hardware como o núcleo ainda leva a várias posições com os principais fabricantes.
Grande Modelo Terminal Battle
A adição do modelo grande nos faz reperceber que a essência do smartphone é um terminal inteligente que integra vários recursos, e tem entradas de hardware e sistema operacional. As condições únicas tornam natural que os telemóveis sejam combinados com modelos grandes.
Então, outros terminais também podem ser conectados ao modelo grande e redefinir os limites de capacidade do terminal, assim como refazer o aplicativo?
A exploração deste problema pode ser rastreada até o surto de redes de aprendizagem profunda, e a discussão sobre a possibilidade de modelos finais também decorre dos problemas "clichês" de latência, consumo de energia, privacidade e outras questões na indústria.
De facto, muito antes do início oficial desta mania de enfiar grandes modelos em telemóveis, os novos veículos energéticos com condução autónoma já se tornaram um terminal de grandes modelos. Não falta imaginação na indústria de que os dispositivos vestíveis inteligentes são equipados com modelos grandes, mas os telefones celulares parecem estar prestes a vir em primeiro lugar com a diversidade de cenas e conveniência de rede.
Além disso, quando os fabricantes de telemóveis lançam intensivamente modelos grandes e os colocam em uso, será um excelente campo de treino para modelos finais. Também podemos discutir a metodologia de uma variedade de terminais equipados com modelos grandes a partir do desembarque de modelos grandes de telefonia móvel.
Afinal, por melhor que seja o modelo no celular, o melhor desempenho que pode ser alcançado em um curto período de tempo nada mais é do que uma "secretária" no campo da vida do usuário. A imaginação trazida pelo grande modelo de outros terminais inteligentes é, sem dúvida, maior.
Por exemplo, os caixas automáticos, que estão gradualmente a retirar-se da fase histórica devido ao pagamento móvel, podem contar com modelos de grande dimensão para permitir que os utilizadores saltem o banco para entrar na fila para negócios aprofundados; É também uma câmera inteligente que pertence ao cenário B-end, que identifica os sinais básicos dos pacientes na área médica, inspeção rápida de qualidade no campo industrial e irrigação inteligente no campo agrícola. Agora, o mercado B-end, que não foi amplamente aberto confiando no modelo do lado da nuvem, também pode inaugurar a variável do lado final.
É também por isso que a vivo vai mostrar o sistema operativo Blue River (BlueOS) equipado com o novo vivo Watch nesta conferência de imprensa, quando a sua ecologia não é tão perfeita como a Huawei e a Xiaomi. Sendo um sistema cross-terminal desenvolvido pela vivo para a era da inteligência artificial em geral, o seu lançamento visa impulsionar uma série de produtos IoT através de telemóveis, que sem dúvida tem uma boa imaginação.
A vivo também anunciou o código aberto de seu modelo de especificação 7B e lançou o kit de desenvolvimento BlueKit, que é uma ambição clara para a construção ecológica. Talvez no momento, a vivo só tenha chegado ao estágio de permitir que a IoT entenda instruções, mas isso é muito importante para as futuras estratégias high-end, ecológicas e outras da vivo.
As capacidades do modelo de telefone móvel são desconhecidas, e há muitos desafios, e após o lançamento oficial e pouso, é provável que traga mais direções de "volume aberto" para a indústria. Posturas de pouso mais bizarras estão esperando para serem desbloqueadas pela indústria.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
O telefone está recheado de modelos grandes, e é apenas o começo
Fonte original: Photon Planet
Os fabricantes de telemóveis, que precisam urgentemente de encontrar um novo volante, estão de olho em modelos grandes.
Na conferência de desenvolvedores no início de agosto, a Huawei anunciou que integraria Xiaoyi, um assistente de IA no HarmonyOS 4, no modelo grande, e convidou-a para testá-lo no final de agosto. A Xiaomi também abriu o teste de convite de sua assistente de IA Xiaoai para acessar o modelo grande mais ou menos ao mesmo tempo. Seguiram-se a OPPO e a Vivo, que começaram a experimentar grandes modelos de telemóveis em novembro.
"Enfiar grandes modelos em telemóveis" não é uma novidade na indústria,Para não falar da vivo, que tem estado intensamente aquecida desde meados de outubro,Rongmi O três revelaram novidades relevantes na conferência de imprensa realizada este ano。 A visão geral na indústria é que a parte de hardware da pista do smartphone é quase inenrolável, e a maioria dos grandes modelos rodando na nuvem são apenas uma variável que está livre do hardware.
Deve-se notar que a implantação do lado do dispositivo também é uma tendência do setor para grandes faixas de modelos. Tomando o ChatGPT como exemplo, como um representante típico do modelo grande do lado da nuvem, seu treinamento e inferência são executados no Azure da Microsoft, e os usuários obtêm resultados por meio de navegadores ou aplicativos. Entre entradas-saídas e idas e vindas, não há apenas um atraso que afeta a experiência do usuário, mas também custos de nuvem, como consumo de energia e poder de computação.
Do ponto de vista dos cenários e necessidades reais, muitas necessidades podem ser satisfeitas por dispositivos de borda, especialmente terminais que são amplamente utilizados, como telefones celulares, PCs e novos veículos de energia.
Como resultado, a implantação final de grandes modelos tornou-se gradualmente um consenso, não apenas os fabricantes de telefones celulares aumentaram seus esforços para treinar modelos, mas também a Lenovo na pista de PC e a Qualcomm na trilha de chips lançaram soluções relevantes para IA de lado final há algum tempo. Em particular, os recém-lançados Qualcomm Snapdragon 8 Gen3 e MediaTek Dimensity 9300, a melhoria de seu desempenho de IA pode ser dito ser a base do modelo grande no telefone celular.
As necessidades da indústria e as condições de hardware foram atendidas, e o modelo grande pode finalmente entrar no telefone celular. O que é bastante surpreendente é que a primeira fabricante de telemóveis a contratar um "produto completo" é a Vivo.
**Qual é a condição do modelo vivo grande? **
Em 1º de novembro, a vivo realizou uma conferência de desenvolvedores, na qual lançou a matriz de grandes modelos auto-desenvolvida "BlueLM", incluindo 1 bilhão, 10 bilhões, 100 bilhões e outras escalas de parâmetros diferentes. Ao mesmo tempo, também lançou o OriginOS 4, um sistema operacional auto-desenvolvido adaptado ao seu modelo grande.
Diante da "terra prometida" dos grandes modelos, a ânsia da Vivo está quase estampada no rosto.
De acordo com os últimos dados divulgados pela Canalys, uma agência de pesquisa de mercado, em 26 de outubro, os embarques e embarques da Vivo diminuíram, e o ranking também caiu. A vivo precisa urgentemente de modelos grandes e do OriginOS 4 para virar a maré, e não é de estranhar que seja a primeira a "abrir o livro".
E em comparação com o modelo grande, o tempo de atualização do OriginOS 4 lançado pela vivo desta vez é ligeiramente fraco. Na discussão de domínio público, não só a iteração de sua placa gráfica virtual, espaço de computação heterogêneo e leve não é como esperado, mas também os módulos como a notificação atômica, que é bastante barulhenta entre os usuários da vivo, não foram atualizados. Ou seja, o grande modelo é o protagonista desta conferência.
Do ponto de vista do modelo de negócio, o percurso da Vivo nesta conferência de imprensa é semelhante ao de outros players da indústria antes, com assistente de inteligência artificial como operadora, adotando um método de implementação híbrida do lado do dispositivo + do lado da nuvem, em que o modelo grande do lado do dispositivo, que é o principal jogo, apresenta as características óbvias de localização e leveza.
O objetivo disso é óbvio, o consumo de energia e o poder de computação fornecidos pelo pequeno mundo dos telefones celulares não são os mesmos que os da sala de computadores. É apenas como combinar a capacidade do modelo com a profundidade do telefone móvel tornou-se o "know how" que os fabricantes de telefones celulares precisam urgentemente para romper.
Nesse sentido, a solução da Vivo é lançar um modelo de especificação multiparâmetro, dos quais 1 bilhão de especificações são principalmente para cenários de texto e 7 bilhões de especificações para diálogo natural e telefoto de perguntas e respostas de conhecimento são os destaques da implantação do lado do dispositivo. Na introdução oficial, as especificações de 1 bilhão são orientadas separadamente para o lado do dispositivo, e as especificações de 7 bilhões devem ser de dupla finalidade para o dispositivo e a nuvem, e todas elas foram implantadas na nuvem desde 70 bilhões, o que também reflete a ideia matricial da Vivo de "deixe Deus voltar a Deus, e César a César" na colaboração dispositivo-nuvem.
Isso é o mesmo que a conferência de desenvolvedores de E/S do Google em maio deste ano, quando o Google lançou um grande modelo PaLM2 com quatro especificações de parâmetros, dos quais o modelo de parâmetros pequenos pode processar 20 tokens por segundo no estado offline, o que é adequado para uso offline de terminais.
Se você acha que a vivo está "colhendo os dentes das pessoas", é muito duro. Na verdade, a vivo se propôs a criar uma equipe interna de IA já em 2017 e, hoje, o vivo AI Research Institute tem mais de 1.000 pesquisadores.
Embora sua precipitação técnica seja geralmente inferior ao primeiro escalão, como Ali e Baidu, a existência da comunidade de código aberto também permite que os jogadores que entram no mercado um pouco mais tarde alcancem rapidamente o grande exército. O Knowledge Graph Research Institute, criado pela vivo em 2018, também pode reforçar a falta de dados de treinamento que pode encontrar como fabricante de celulares até certo ponto.
Quanto à capacidade do modelo, a vivo entregou uma boa folha de respostas durante o período de aquecimento. É relatado que BlueLM ganhou o primeiro lugar na categoria de "modelo de acesso restrito" no conjunto de avaliação de terceiros C-do modelo chinês grande. De acordo com seu anúncio oficial, o BlueLM é o primeiro modelo grande do lado do dispositivo 7B da indústria.
No entanto, não são poucos os modelos que obtiveram pontuações altas na avaliação, mas têm desempenho real insatisfatório, e algumas pessoas na indústria dizem que essa lista foi "eliminada" no período de tempo passado, o que só pode representar a capacidade do modelo de "fazer perguntas" e não pode refletir a capacidade de raciocínio, segurança e adaptabilidade. Desse ponto de vista, fica claro que os resultados de negócios da Vivo precisam de testes mais práticos.
Além disso, os recursos atuais do modelo de nuvem da Vivo, como diagrama de Wensheng e interação, não saíram da armadilha dos modelos grandes, e a novidade é limitada. Além disso, sua capacidade de modelo do lado do dispositivo como uma grande jogada ainda está em fase de testes, e a exibição de recursos finais é inevitavelmente limitada pelo hardware do telefone celular.
Soubemos que muitos usuários que foram convidados a participar dos testes internos do Blue Heart estão usando telefones flagship representados pelo X90 Pro, e esses modelos também são os mais altos no cronograma público de adaptação beta para aplicativos de modelos em larga escala lançados pela Vivo.
Não há dúvida de que os modelos grandes estão se tornando o segundo campo de batalha para os fabricantes de celulares abrirem high-end, e eles também são uma variável importante para revitalizar os usuários e ativar a IoT. Apesar disso, ainda há muitas variáveis na intenção da Vivo de aumentar o valor dos produtos high-end confiando em modelos grandes
Em última análise, o lançamento do modelo de grande porte não é apenas a nova pedra angular do high-end da Vivo, mas também sua tentativa de puxar novas máquinas e produtos high-end.
Os modelos low-end são naturalmente difíceis de lidar com esta guerra high-end. Tomemos como exemplo o modelo básico Y100 lançado pela vivo antes desta conferência de imprensa, este é um dos modelos mais recentes do plano de adaptação acima mencionado, e por trás de um movimento de "backstab" semelhante está a esperança de "pequeno ábaco" da Vivo de voltar ao trono com produtos topo de gama.
Mesmo assim, o lançamento de modelos grandes ainda não é uma vantagem para os produtos high-end da Vivo.
Wang Yang (pseudônimo), um empreendedor da comunidade de código aberto do modelo grande do lado do dispositivo, disse ao Photon Planet que a capacidade do modelo grande do lado do dispositivo está no desempenho de IA trazido por seu NPU (processador especialmente projetado para computação de rede neural profunda). No entanto, nos modelos anteriores da Vivo, ele não prestava atenção às capacidades NPU, então é provável que seja difícil para os modelos mais antigos rodarem modelos grandes sem problemas.
Quanto ao próximo lançamento, o novo modelo vivo X100 da série equipado com chip principal MediaTek Dimensity 9300 e uma nova geração de processador AI pode ser capaz de usar as capacidades do modelo sem problemas, mas no caso de já existirem grandes aplicações de modelos como Wenxin Yiyan e iFLYTEK Xinghuo no mercado, o espaço deixado para o telefone celular não é tão grande quanto se imaginava. Em comparação com a habilidade, talvez a jogabilidade mostrada pela vivo desta vez seja mais digna de um estudo aprofundado.
**Torne o seu telemóvel mais inteligente? **
Kevin Scott, CTO da Microsoft, que pressionou a Microsoft a se tornar um investidor-anjo na OpenAI, declarou publicamente que o modelo em si não é um produto, mas uma infraestrutura. A implicação é que, depois que o treinamento ajusta a base do modelo, a exploração da produtização é o núcleo do "segundo empreendedorismo" de muitos players.
A "reprodutização" de modelos grandes em telefones celulares é uma questão de curso, mas os grandes modelos implantados em telefones celulares ainda precisam ser mais produzidos. A julgar pelas informações expostas até agora, a vivo perceberá a capacidade de modelo grande por meio de um aplicativo chamado assistente Xiao V, e a rota mainstream atual na indústria é incorporar a capacidade de modelo grande no assistente de inteligência artificial existente.
Os usuários de smartphones têm uma necessidade real da capacidade de entender grandes modelos, seja um assistente inteligente chamado jocosamente de "deficiência intelectual artificial" ou um aplicativo e dados cada vez mais inchados sob a explosão de capacidade, os telefones celulares precisam ser capazes de entender melhor a interação e ajudar os usuários a classificar informações. A adição de modelos grandes é essencialmente para trazer recursos de compreensão de linguagem natural para telefones celulares.
No caso de implementação não implementada, problemas como consumo de energia, dissipação de calor e latência que podem ocorrer no modelo do lado do dispositivo podem ser ignorados por enquanto. Na opinião de Wang Yang, o principal problema enfrentado pelo modelo vivo é como distinguir os limites de capacidade de diferentes modelos e como chamá-los quando vários modelos são usados juntos, "o que está relacionado à forma e apresentação do produto final".
Face ao lado C com cenários generalizados e requisitos complexos, os modelos invocados por requisitos diferentes são diferentes. Por exemplo, o modelo de especificação de 1 bilhão e o modelo de especificação de 7 bilhões no lado do dispositivo precisam aprender com os dados locais do usuário na tentativa de "entender melhor o usuário". Portanto, se a capacidade do modelo e o sistema operacional adaptado a ele podem ser usados para implementar instruções complexas no telefone celular é um indicador importante.
Até agora, a complexa função de comando demonstrada pelo BlueLM é bastante destacada. Sob o recém-lançado OriginOS 4, o V-assistant reside no canto inferior direito da barra lateral e pode ser exibido clicando nele. Não só a lógica de operação é mais curta do que a do modelo do lado da nuvem, que é mais adequado para o uso do celular, mas também algumas instruções complexas no sistema operacional, como pesquisa inteligente de álbuns, conclusão preliminar de comandos de aplicativos de terceiros e configurações no sistema operacional.
Vale a pena mencionar que o pequeno assistente V é isolado da voz Jovi existente da Vivo em termos de função e caminho, e os dois são independentes um do outro, o que é obviamente diferente do caminho do modelo grande do lado do dispositivo proposto por outros fabricantes antes.
Do ponto de vista funcional, o pequeno assistente V pode basicamente alcançar a cobertura total da voz de Jovi, então o objetivo de distinguir os dois provavelmente será facilitar que os usuários sintam a diferença entre os dois. Além disso, a lógica de produto do pequeno assistente V é semelhante à do Copilot transportado no bucket da família Microsoft, e os dois caminhos diferentes provavelmente serão integrados no futuro.
Isso também reflete que o BlueLM atual ainda está em fase de testes, e a forma do produto é difícil de dizer madura.
De acordo com o feedback de quem participou do teste interno do BlueLM, com a capacidade de modelo do modelo carro-chefe da Vivo, ainda há um atraso de 2s~5s no requisito de geração de texto simples dentro de 20 tokens, o que não é uma boa notícia para implementação subsequente - o atraso do modelo do lado da nuvem não foi bem resolvido. Isso pode ser melhorado em modelos equipados com os mais recentes chips de IA dos fabricantes de chips, mas para os consumidores, isso não constitui um motivo para mudar seus telefones.
Além disso, como o primeiro modelo de celular do setor, a capacidade de modelo do lado da nuvem da Vivo também está enfrentando o "cerco" de muitos modelos grandes de fornecedores de nuvem.
Por exemplo, a vivo anunciou que lançará o robô conversacional Lanxin Qianxun na loja de aplicativos, e as especificações de parâmetros de 175 bilhões não são visíveis em comparação com os grandes modelos nas lojas de aplicativos atuais. Entre os fornecedores de nuvem, a Baidu já cobrou pela recém-lançada versão profissional Wenxin 4.0 para testar as águas, enquanto a Lanxin Qianxun parece ser mais um membro não tão atraente do ecossistema de modelos grandes vivos, e seu caminho é obviamente obstrutivo e longo.
É preciso mencionar que a vivo está atrasada e a lacuna na precipitação tecnológica também limitará o avanço de seu negócio de modelos em larga escala.
Em termos de software, o modelo vivo large tornou-se o material promocional da plataforma de aprendizado de máquina Pai do Alibaba Cloud, e podemos até encontrar a sombra de "Tongyi Qianwen" do nome de "Blue Heart Qianwen". Executar na nuvem significa custos de longo prazo, e isso é refletido de forma mais vívida na OpenAI. Do ponto de vista dos custos, se a vivo quiser desenvolver o BlueLM em um ecossistema de longo prazo, a IDC autoconstruída é obviamente mais propícia ao desenvolvimento de longo prazo do que a migração para a nuvem.
Em termos de hardware, Huawei e Apple, os dois principais fabricantes, já integraram recursos NPU autodesenvolvidos em suas linhas de produtos existentes, enquanto a vivo ainda precisa contar com fabricantes de chips. Mesmo que certas barreiras possam ser construídas no treinamento e ajuste do modelo, a lacuna de hardware como o núcleo ainda leva a várias posições com os principais fabricantes.
Grande Modelo Terminal Battle
A adição do modelo grande nos faz reperceber que a essência do smartphone é um terminal inteligente que integra vários recursos, e tem entradas de hardware e sistema operacional. As condições únicas tornam natural que os telemóveis sejam combinados com modelos grandes.
Então, outros terminais também podem ser conectados ao modelo grande e redefinir os limites de capacidade do terminal, assim como refazer o aplicativo?
A exploração deste problema pode ser rastreada até o surto de redes de aprendizagem profunda, e a discussão sobre a possibilidade de modelos finais também decorre dos problemas "clichês" de latência, consumo de energia, privacidade e outras questões na indústria.
De facto, muito antes do início oficial desta mania de enfiar grandes modelos em telemóveis, os novos veículos energéticos com condução autónoma já se tornaram um terminal de grandes modelos. Não falta imaginação na indústria de que os dispositivos vestíveis inteligentes são equipados com modelos grandes, mas os telefones celulares parecem estar prestes a vir em primeiro lugar com a diversidade de cenas e conveniência de rede.
Além disso, quando os fabricantes de telemóveis lançam intensivamente modelos grandes e os colocam em uso, será um excelente campo de treino para modelos finais. Também podemos discutir a metodologia de uma variedade de terminais equipados com modelos grandes a partir do desembarque de modelos grandes de telefonia móvel.
Afinal, por melhor que seja o modelo no celular, o melhor desempenho que pode ser alcançado em um curto período de tempo nada mais é do que uma "secretária" no campo da vida do usuário. A imaginação trazida pelo grande modelo de outros terminais inteligentes é, sem dúvida, maior.
Por exemplo, os caixas automáticos, que estão gradualmente a retirar-se da fase histórica devido ao pagamento móvel, podem contar com modelos de grande dimensão para permitir que os utilizadores saltem o banco para entrar na fila para negócios aprofundados; É também uma câmera inteligente que pertence ao cenário B-end, que identifica os sinais básicos dos pacientes na área médica, inspeção rápida de qualidade no campo industrial e irrigação inteligente no campo agrícola. Agora, o mercado B-end, que não foi amplamente aberto confiando no modelo do lado da nuvem, também pode inaugurar a variável do lado final.
É também por isso que a vivo vai mostrar o sistema operativo Blue River (BlueOS) equipado com o novo vivo Watch nesta conferência de imprensa, quando a sua ecologia não é tão perfeita como a Huawei e a Xiaomi. Sendo um sistema cross-terminal desenvolvido pela vivo para a era da inteligência artificial em geral, o seu lançamento visa impulsionar uma série de produtos IoT através de telemóveis, que sem dúvida tem uma boa imaginação.
A vivo também anunciou o código aberto de seu modelo de especificação 7B e lançou o kit de desenvolvimento BlueKit, que é uma ambição clara para a construção ecológica. Talvez no momento, a vivo só tenha chegado ao estágio de permitir que a IoT entenda instruções, mas isso é muito importante para as futuras estratégias high-end, ecológicas e outras da vivo.
As capacidades do modelo de telefone móvel são desconhecidas, e há muitos desafios, e após o lançamento oficial e pouso, é provável que traga mais direções de "volume aberto" para a indústria. Posturas de pouso mais bizarras estão esperando para serem desbloqueadas pela indústria.