Gate 广场|3/5 今日话题: #比特币创下近一月新高
🎁 解读行情走势,抽 5 位锦鲤送出 $2,500 仓位体验券!
随着白宫表示已向参议院提交凯文·沃什担任美联储主席的提名,美国参议院未通过叫停特朗普打击伊朗的投票,比特币于今日凌晨创下 2 月 5 日以来新高,最高触及 74,050 美元,加密货币总市值回升突破 2.538 万亿美元。
💬 本期热议:
1️⃣ 凯文·沃什的提名是否意味着降息预期升温?
2️⃣ 当前关口,你是持币待涨、顺势追多,还是反手布局回调?
分享观点,瓜分好礼 👉️ https://www.gate.com/post
📅 3/6 15:00 - 3/8 12:00 (UTC+8)
不受欢迎的观点:AI模型发布变得越来越无聊。
不是因为模型没有在改进……它们确实在改进。
但每次发布都只是……基准测试。
@OpenAI 刚刚推出了 GPT-5.4,整个公告基本上就是这张表。
75% 在 OSWorld。57.7% 在 SWE-Bench Pro。94.4% 在 GPQA Diamond。
酷……但这对我凌晨2点做东西意味着什么?
在AI Twitter之外,没有人在意 MMLU 上的2%的提升。没有人。零人。
最搞笑的部分?仔细看看这张表……
> Opus 4.6 在几乎每个基准上都接近领先。
> Gemini 3.1 Pro 在 BrowseComp 上悄然击败所有人,得分85.9%。
“赢家”会根据你看哪一行而变化。
你知道我真正想看到的是什么吗?
展示它在处理现实世界中更复杂任务时表现得更好的地方。展示那个让我脑袋有点炸的演示。展示有人用它做的事情,而这些事情上个月还不可能实现。
最好的基准是“这让我的生活更轻松了吗?”
就这些。这就是全部的评估。
公司们在庆祝数学成绩,而用户只关心它是否终于能处理一个4K行代码库而不崩溃一半功能。
从这里开始。