jolestar

vip
币龄 8 年
最高VIP等级 5
用户暂无简介
一个 bug,和 AI 改了几次,最后 AI 给了结论说这个方案搞不定,要换方案。我想了另外一个途径让它试试,它试了一下成功了,然后在命令行🎉,那一刻,我突然有点共情,似乎真的感受到它的情绪。
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
周末教媳妇用 Claude Code。
她是产品经理,从没用过命令行,我从 cd / mkdir / pwd 开始教起。
终于打开 Claude Code 之后,基本就不需要我了:
她自己通过 Claude 配好了 git,甚至还装好了 Docker。
命令行工具的可组合性,在 Agent 场景下被发挥到了极致。
但这种可组合性,也天然伴随着安全与标准化的挑战。
  • 赞赏
  • 评论
  • 转发
  • 分享
一直默认用 GitHub Copilot 来 review PR,毕竟 GitHub 会自动跑,而且看起来也不收费。
但最近几次 review,让我开始怀疑它到底“看懂”了什么。
比如一个很基础的问题:它依然会把 1.82.0 认为比 1.91.1 高,完全是早期大模型常见的版本号判断错误。
如果说这是模型问题,那它还会认为 rust 1.91.1 尚未发布,这又暴露了 agent 的检索和现实状态判断能力也不太行。
另一个更大的问题是:Copilot 的 review 明显是按单文件来的。
查代码风格、边界条件还行,但缺乏全局视角。比如有个 PR 里,agent 因为相对路径算错,把同一个文件 copy 了多份,实际上只有一份生效——这种问题它完全没发现,甚至也不关心 PR 对应的原始 issue 在要求什么。
在我看来,一个合格的 code reviewer agent,首先应该从全局判断:
PR 是否满足 issue、是否符合项目目标、文件布局和架构选择是否合理,最后才是语法和细节问题。
最近准备给 holon 加一个 reviewer 模式了。
大家现在真的在用 reviewer agent 吗?一般用什么?
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
Cursor 给我生成的年度报告。Cursor 的更新速度确实厉害,一天能发几个版本。很多功能用的时候觉得要是能改一下就好,结果新版更新它就改好了。不过我最近已经主要切换到异步后台模式了。明年这个时候再看整个生态,估计又是另外一番景象了。
  • 赞赏
  • 评论
  • 转发
  • 分享
用 Gemini Vibe Coding 了一个 AI 作曲的应用,思路是用 AI 来生成曲谱,然后转换成音乐。当前只能转换成 midi,后面如果接个更好的混音服务,效果会更好一些。
这个主要是用来测试 AI 对曲谱 -> 音乐的映射的理解,我测试下来发现还不错,只是我的音乐水平有限,是否有玩音乐的推友,可以试试给个反馈。
这是视频演示:
这是试用地址,需要 Google 账户登陆
  • 赞赏
  • 评论
  • 转发
  • 分享
x402 v2 发布,这不是一次简单升级,而是把 x402 从「一套实现」,推进为「一套可演进的标准 + 可插拔的参考实现」。让 x402 不再只是一个 SDK,而真正像一门互联网原生的付费接口语言。
在 v1 时代,x402 的模型非常简单:
服务端要钱 → 客户端签名并支付 → 服务端验证 → 结算完成。
这个模型很好理解,但也非常“直线”。
一旦你需要更多网络、更多支付方式,或者更复杂的结算形态,你很快就会走到 fork SDK、打补丁、私下维护协议边角的路径上。能跑,但生态很难协同演进。
x402 v2 的核心变化可以压缩成一句话: 它把“变化”从核心协议里移了出去。
变化不再通过“改 spec / 改 core”引入,而是被明确安放在 Extensions、插件式机制(mechanisms)和生命周期 hooks 中。
这一步非常关键,因为它决定了生态中的新能力,能否在不修改核心协议的前提下并行演进。
在这个前提下,v2 的几项变化可以被更好地理解。
首先是协议层:x402 变得更加 HTTP-native。
402 的语义回到 402,本该标准化的支付元数据进入 header;
应用层可以自由返回 HTML paywall、JSON 或任意 body,而中间件和 facilitator 依然可以稳定处理支付语义。这让支付协议第一次真正适配了现有的互联网基础设施。
其次是
  • 赞赏
  • 评论
  • 转发
  • 分享
让 AI 实现一个挺复杂的特性,我没顾上持续 review,就通过 Vibe Coding 的模式,让它自己加 e2e 测试,然后让另外一个 AI 来 review 迭代反馈。最后报告非常完美,功能都实现了并且测试没有错误。
美滋滋提交 PR,让 Github Copilot review 了一下。结果发现最底层的核心逻辑它给弄了两个版本,一个版本实现了代码但没有 import,实际生效的是另外一个 mock 的版本😅。
Vibe Coding 后面的挑战是如何验收成果,防止被 AI 糊弄。
  • 赞赏
  • 评论
  • 转发
  • 分享
用了 AI 后,恨不能让它持续工作,半夜起来上厕所发现 AI 干完活了,都要给它继续再分配个活,但一不小心就又折腾半宿。
后来想到一个办法,让主 Claude 启动另外一个 Claude 去干活,自己监督。折腾半天,和它一起设计了一套工作流方案,结果发现 Claude 学不会启动自己,似乎是搞不定交互式的输入。
最后它说:“我认为由我来直接执行会更合适和高效”,然后吭哧吭哧自己干起来了😂。
感觉 Claude 应该内置一个 fork 功能,像进程一样, fork 自己启动一个新进程,但和子进程之间可以直接通信。
有没有人搞过类似的方案。
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
遇到个疑难杂症,让 AI 协助排查。Claude Opts 4.5 和 GPT 5.1 Codex Max 给的结论不一样。我就把它们的回复复制给对方让辩论。后来觉得有点麻烦,我就弄一个文档,让它们通过修改文档的方式来辩论。哪家的 AI 编程工具弄个专家会诊模式呀,可以把几个模型拉到一个聊天会话中辩论,最后给个会诊建议😅
post-image
post-image
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
AI 的两条路径:云端入口竞争,还是用户侧的原生应用?
最近看到阿里发布了通义千问 App,正式卷入 C 端 App 大战。Sam Altman 以前也多次表达过对“超级应用”的执念,不断往 ChatGPT 里塞入各种类社交功能。
在大厂的叙事里,未来的 AI App 似乎注定是当前互联网超级应用的翻版——成为唯一的入口,集众功能于一身。
但 AI 应用的未来,真的会收敛到这一条路径上吗?是否有别的途径的可能?
如果我们把目光从通用的 AI Chat 应用移开,去看看 Cursor、Windsurf 这些编程类工具,集成一下各种 MCP 工具,或许能管中窥豹,感受到 AI 原生应用(AI Native App)截然不同的脉搏。
消失的护城河与全员不安全感
当前的 AI 应用生态,如果用一个生物体来做隐喻,可以拆解为三个角色:
* 大脑(LLM 模型提供方): 提供推理、决策和基础知识。
* 身体(客户端提供方): 提供用户交互界面(UI/GUI)和上下文环境(Context)以及记忆。
* 手脚(工具服务提供方): 提供具体能力,比如搜索、日历、订票、支付等 MCP 工具。
在理想状态下,客户端(身体)把大脑和手脚链接起来,帮用户解决问题。
在互联网时代,应用的壁垒来自两个东西:界面(UI)和接口(API)。用户只能通过特定界面完成特定服务。但当需求可以通过自然语言表达,Promp
  • 赞赏
  • 1
  • 转发
  • 分享
Heydar34vip:
保持坚强 💪
Cloudflare 挂了? 好多网站都挂了, ChatGPT 也因为打不开那个 challenges 挂了。还是我的网络出问题了?
  • 赞赏
  • 评论
  • 转发
  • 分享
让 AI 重构一个大模块,它欢快的拆出了好几个模块,搞了个新版本。然后让它集成测试,它反复测试好多次,中间模型配额限制到了,给它提升到 200刀的档位。结果最后它删了所有的新模块,然后告诉我还是用旧版本比较划得来🤣。气得我直接开骂,就在聊天框里骂。它又重新开始干了,还说感到用户很生气..
  • 赞赏
  • 评论
  • 转发
  • 分享
用了两天 Claude-4, AI 编程能力提升确实明显。很多问题可以自动检索代码找到方案,需要人工干预的情况少了许多。吃饭睡觉的时候可以安排个任务让它去做,但就是有点费钱,这样下去这个月账单要炸了😅。
post-image
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
Cetus 被黑客攻击后 Sui 冻结黑客资金,引起了“去中心化”争论。但去中心化是一个连续的光谱,从 Bitcoin 到 CEX,中间还有大量的空间,不同链的解决方案有不同的生态位置,现在是中间地带的解决方案太少而不是太多。Web3 发展到现在,仅靠去中心化的理念已经很难突破了,可以少谈点主义多解决问题。
CETUS-11.81%
SUI-12.17%
BTC-2.73%
  • 赞赏
  • 评论
  • 转发
  • 分享
让 AI 写代码,我会首先让它先写个计划,避免后面上下文超出后迷失了。AI 写计划的时候习惯会写上一个时间表,像是在和领导讨论工期一样,会留够足够的缓冲时间。比如让它完善一下项目的测试,它能规划出 5 周时间,实际上它一顿饭的功夫差不多就能搞定😅。
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
👍,感觉很适合 AI Agent 发布内容
AGENT-5.46%
  • 赞赏
  • 评论
  • 转发
  • 分享
框架上套框架,framework 的套娃比赛开始了😅
  • 赞赏
  • 评论
  • 转发
  • 分享
大家在批评向大学生推广合约的做法,但感觉批评估计没啥效果,不如反其道行之,搞个合约模拟盘大赛,玩法如下:
1. 给一笔模拟的初始资金,比如 10000 U。
2. 要求杠杆倍数大于 N,比如 10 ~ 100,算一个权重。
3. 根据仓位比例算一个权重。
5. 存活时间算一个权重。
最后来个排行。看你能在高杠杆,高仓位的情况下,活多少天。我觉得玩过一把之后就理解其中的风险了吧?
保护年轻人最好的办法不是挡着藏着不让他们参与(主要也是挡不住),而是让他们理解和认识到其中的风险。如果一定要经历了风险才能长记性,早经历比晚经历好。
  • 赞赏
  • 评论
  • 转发
  • 分享
浏览器直接创建一个私钥,不需要任何插件就可以参与测试 nuwa 了
  • 赞赏
  • 评论
  • 转发
  • 分享
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)