Kimi K2 Thinking estabeleceu novos recordes na avaliação de referência de raciocínio, codificação e capacidades de agentes

GateNews
Dados do Jin10 de 8 de novembro: Segundo o site oficial do Moon's Dark Side, o Kimi K2 Thinking estabeleceu novos recordes nas avaliações de referência de raciocínio, codificação e capacidades de agentes. O K2 Thinking alcançou uma pontuação SOTA de 44,9% na avaliação de referência HLE, atingiu 60,2% no teste BrowseComp e 71,3% no teste SWE-Bench Verified, demonstrando uma forte capacidade de generalização como um modelo de agente de pensamento de última geração.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário