据 Beating 称,Google Gemini 3.1 Flash-Lite 于 5 月 8 日从预览转为正式可用(GA),成为 Gemini 3 系列中最便宜、最快的模型。输入定价为每百万 tokens 0.25 美元,输出为每百万 tokens 1.50 美元——输入成本比 Claude 4.5 Haiku(1.00 美元)低 75%,输出成本比其低 70%(5.00 美元)。该模型具备 100 万 token 的上下文窗口,并实现 363 tokens/秒的吞吐量,比其前身 Gemini 2.5 Flash 快 45%。
性能基准显示,GPQA Diamond(研究生级别的科学推理)达到 86.9%,超越 Claude 4.5 Haiku 的 73.0% 以及 GPT-5 mini 的 82.3%。MMMU-Pro(多模态推理)达到 76.8%。早期采用者包括客服平台 Gladly,该平台称在生产工作负载中实现 60% 的成本降低和 99.6% 的成功率,以及 JetBrains,将 Flash-Lite 集成到 IDE 辅助工具中。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
IMF:AI 可能对金融稳定构成威胁
国际货币基金组织关于 AI 与金融稳定风险的报告
国际货币基金组织在 5 月 7 日发布的一份报告称,人工智能(AI)正在改变金融系统对网络漏洞和安全事件的响应方式,同时放大网络安全风险,并且
Crypto Frontier28 分钟前
SpaceXAI 推出 Grok Build 桌面端编码工具,于今日曝光;竞争对手包括 Claude Code 和 OpenAI Codex
据称,Beating 说 SpaceXAI(原 xAI)正在推出 Grok Build,这是一款桌面端编码工具,今天意外地在 Grok 的网页界面上公开了。该工具直接与 Claude Code 以及 OpenAI Codex 竞争。
Grok Build 将支持 macOS、Linux 和 Windows。不同于传统的先聊天后编码的
GateNews29 分钟前
Palantir 的 Maven 系统在伊朗行动的前 48 小时内打击了 1,000+ 个目标
据 Yonhapnews 报道,Palantir 的 Maven Smart System(MSS)在美国对伊朗的军事行动前 48 小时内打击超过 1,000 个目标中发挥了重要作用。美国国防部已越来越多地将 AI 系统整合到军事决策流程中,P
GateNews1小时前
百度的昆仑芯片瞄准在上海科创板和香港双重上市,估值超 300 亿美元
据彭博报道,百度的人工智能芯片子公司昆仑芯片正在寻求在上海科创板和香港进行双重上市。该公司由百度持股 58%,已通过中国国际金融公司向中国证券监管机构提交了首次公开募股(IPO)申请,并
GateNews1小时前
Google Gemini API 将于 6 月 8 日终止兼容性,旧版 SDK 将出错
据 Google 称,Gemini Interactions API 将进行一次破坏性更新。新版本将在 5 月 26 日成为默认版本,遗留版本将在 6 月 8 日被完全弃用。使用 Python 或 JavaScript SDK 版本 1.x.x 的请求在该日期之后将返回错误。
开发者必须修改两个
GateNews2小时前
软银公布全年业绩,投资者质疑 US$60B OpenAI 融资计划
据彭博报道,软银集团公布了截至 3 月的全年收益,因为投资者正在审视该公司将如何为其计划向 OpenAI 投入 600 亿美元的投资提供资金。该公司在本财年实现约 3.3 万亿日元(208 亿美元)的净利润,得益于
GateNews3小时前