O Google Gemini 3.1 Flash-Lite é oficialmente lançado: preço de entrada 75% mais barato que o Claude 4.5 Haiku, pontuação do GPQA 86,9%

De acordo com Beating, o Google Gemini 3.1 Flash-Lite saiu da prévia e entrou em disponibilidade geral (GA) em 8 de maio, tornando-se o modelo mais barato e mais rápido da série Gemini 3. O preço de entrada foi definido em US$ 0,25 por 1 milhão de tokens e o de saída em US$ 1,50 por 1 milhão de tokens — os custos de entrada ficam 75% menores do que o Claude 4.5 Haiku (US$ 1,00) e os de saída ficam 70% menores (US$ 5,00). O modelo tem uma janela de contexto de 1 milhão de tokens e alcança 363 tokens por segundo de throughput, 45% mais rápido do que seu antecessor Gemini 2.5 Flash.

Em benchmarks de desempenho, o GPQA Diamond (raciocínio em ciência no nível de graduação) chega a 86,9%, superando os 73,0% do Claude 4.5 Haiku e os 82,3% do GPT-5 mini. O MMMU-Pro (raciocínio multimodal) atinge 76,8%. Entre os primeiros adotantes estão a plataforma de atendimento ao cliente Gladly, que relata redução de 60% de custos e taxa de sucesso de 99,6% em cargas de trabalho em produção, e a JetBrains, que está integrando o Flash-Lite em ferramentas de assistência dentro do IDE.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

O sistema Maven da Palantir atinge 1.000+ alvos nas primeiras 48 horas da operação contra o Irã

De acordo com a Yonhapnews, o sistema inteligente Maven da Palantir (MSS) teve um papel importante ao atingir mais de 1.000 alvos durante as primeiras 48 horas da operação militar dos EUA contra o Irã. O Departamento de Defesa dos EUA tem cada vez mais integrado sistemas de IA aos processos de tomada de decisão militar, com P

GateNews11m atrás

O chip Kunlun da Baidu busca listagens duplas no conselho STAR de Xangai e em Hong Kong, avaliado em mais de US$ 30 bilhões

De acordo com a Bloomberg, a subsidiária de chips de inteligência artificial da Baidu, a Kunlun Chip, está buscando listagens duplas no STAR Board de Xangai e em Hong Kong. A empresa, da qual a Baidu detém 58%, protocolou um pedido de IPO junto ao regulador de valores mobiliários da China por meio do China International Capital Corporation e

GateNews28m atrás

A API do Google Gemini quebra compatibilidade em 8 de junho, SDKs legados vão apresentar erros

De acordo com o Google, a Gemini Interactions API passará por uma atualização que quebra a compatibilidade. A nova versão passa a ser padrão em 26 de maio, com a versão legada totalmente descontinuada em 8 de junho. Requisições usando versões 1.x.x dos SDKs em Python ou JavaScript retornarão erros após essa data. Os desenvolvedores precisam modificar dois

GateNews48m atrás

SoftBank divulga resultados do ano fiscal, enquanto investidores questionam o plano de financiamento da US$60B OpenAI

De acordo com a Bloomberg, a SoftBank Group reportou os lucros do ano fiscal inteiro encerrado em março, enquanto os investidores analisam como a empresa vai financiar o investimento planejado de US$60 bilhões na OpenAI. A empresa registrou lucro líquido de aproximadamente 3,3 trilhões de ienes (US$20,8 bilhões) no ano fiscal, ajudada por

GateNews2h atrás

Anúncios de vagas de emprego com IA aumentam 50% à medida que a disputa por talentos na Ásia redefine o emprego

Desorganização do talento em IA por toda a Ásia As ofertas de emprego relacionadas à IA aumentaram 50% ano a ano, mesmo com o mercado de trabalho mais amplo permanecendo estável, de acordo com Peter Bithos, diretor comercial da Seek, que discutiu o cenário de emprego em mudança em um episódio recente de podcast com foco em como

CryptoFrontier2h atrás

Yu Wenhao, ex-pesquisador de IA da Tencent, ingressa na OpenAI como pesquisador de AGI no mês passado

De acordo com Beating, Yu Wenhao, ex-pesquisador sênior do laboratório de IA da Tencent em Seattle, entrou na OpenAI no mês passado como pesquisador de AGI. Ele confirmou no LinkedIn que vai contribuir para moldar modelos de IA de próxima geração e impulsionar o desenvolvimento de AGI. Yu tem um Ph.D. em Ciência da Computação de

GateNews2h atrás
Comentário
0/400
Sem comentários