Gate Ventures 研究洞察:第三次浏览器战争:人工智能代理时代的入场战斗

9/4/2025, 8:24:44 PM
获取对专有分析、投资论点和深入研究的访问,深入了解塑造数字资产未来的项目,包括最新的前沿技术分析和生态系统发展。

TL;DR

第三场浏览器战争悄然展开。回顾历史,从1990年代的Netscape和微软的Internet Explorer,到开源的Firefox和谷歌的Chrome,浏览器战争一直是平台控制和技术范式转变的集中体现。Chrome凭借其快速的更新速度和集成生态系统巩固了其主导地位,而谷歌通过其搜索和浏览器的双头垄断,形成了一个信息访问的闭环。

但是今天,这一格局正在动摇。大型语言模型(LLM)的崛起使越来越多的用户能够在不点击搜索结果页面的情况下完成任务,而传统网页点击量正在下降。同时,有传言称苹果计划更换Safari中的默认搜索引擎,这进一步威胁到Alphabet(谷歌母公司)的利润基础,市场也开始对“搜索的正统性”表达不安。

浏览器本身也面临着角色的重塑。它不仅是显示网页的工具,还包含多种功能,包括数据输入、用户行为和私人身份。虽然人工智能代理功能强大,但它们仍然依赖于浏览器的信任边界和功能沙箱来完成复杂的页面交互、访问本地身份数据以及控制网页元素。浏览器正在从人机界面演变为代理的系统调用平台。

在本文中,我们探讨了浏览器是否仍然必要。我们相信,真正能够颠覆当前浏览器市场格局的,不是另一个“更好的Chrome”,而是一种新的交互结构:不仅仅是信息展示,而是任务调用。未来的浏览器必须为AI代理设计——不仅能够阅读,还能够写作和执行。像Browser Use这样的项目正在尝试语义化页面结构,将视觉界面转化为可被LLM调用的结构化文本,将页面映射到命令,并显著降低交互成本。

主要项目已经开始探索:Perplexity正在构建一个本地浏览器Comet,取代传统搜索结果,使用AI;Brave结合了隐私保护与本地推理,利用大语言模型增强搜索和阻止功能;而像Donut这样的加密原生项目则瞄准AI与链上资产互动的新切入点。这些项目的一个共同特征是它们试图重塑浏览器的输入层,而不是美化其输出层。

对于企业家来说,机会存在于输入、结构和代理接入的三角形之中。作为未来基于代理的世界的接口,浏览器意味着谁能够提供结构化、可调用和可靠的“能力”,谁就将成为下一代平台的组成部分。从SEO到AEO(代理引擎优化),从页面流量到任务链调用,产品形态和设计思维正在被重塑。第三场浏览器战争正在围绕“输入”而非“展示”展开。胜利不再由谁捕获用户的注意力来决定,而是由谁赢得代理的信任并获得接入权来决定。

浏览器发展简史

在1990年代初,互联网还未成为日常生活的一部分,Netscape Navigator突然出现在人们面前,就像一只帆船为数百万用户打开了通往数字世界的大门。虽然它不是第一个浏览器,但却是第一个真正触及大众并塑造互联网体验的浏览器。人们第一次可以通过图形界面如此轻松地浏览网页,仿佛整个世界突然变得触手可及。

然而,荣耀往往是短暂的。微软迅速认识到浏览器的重要性,并决定将Internet Explorer强行捆绑到Windows操作系统中,使其成为默认浏览器。这一策略,真正的“平台杀手”,直接削弱了Netscape的市场主导地位。许多用户并没有主动选择IE;相反,他们只是将其视为默认选项。利用Windows的分发能力,IE迅速成为行业领导者,而Netscape则陷入衰退。

在逆境中,Netscape 的工程师们选择了一条激进而理想的道路——他们公开了浏览器的源代码,并呼吁开源社区。这一决定在科技界就像是一次“马其顿退位”,标志着一个旧时代的结束和新力量的崛起。那段代码后来成为 Mozilla 浏览器项目的基础,最初被命名为 Phoenix(象征重生),但经过几次商标争议后,最终更名为 Firefox。

Firefox并不是Netscape的简单复制。它在用户体验、插件生态系统和安全性方面取得了突破。它的诞生标志着开源精神的胜利,并为整个行业注入了新的活力。一些人将Firefox称为Netscape的“精神继承者”,就像奥斯曼帝国继承了拜占庭帝国的衰退荣耀。虽然这种比较有些夸张,但确实具有意义。

然而,在Firefox正式发布之前,微软已经推出了六个版本的Internet Explorer。通过利用早期的时机和系统捆绑策略,Firefox从一开始就处于追赶的状态,确保这场竞赛从未是从同一起跑线开始的公平竞争。

与此同时,另一个早期参与者悄然登场。1994年,Opera浏览器在挪威诞生,最初只是一个实验项目。但从2003年7.0版本开始,它引入了自主开发的Presto引擎,率先支持CSS、自适应布局、语音控制和Unicode编码。尽管其用户基础有限,但它在技术上始终引领行业,成为“极客的最爱”。

同年,苹果推出了Safari浏览器——一个重要的转折点。当时,微软已向陷入困境的苹果投资了1.5亿美元,以维持竞争的表象并避免反垄断审查。尽管Safari的默认搜索引擎从一开始就是谷歌,但与微软的这种纠缠象征着互联网巨头之间复杂而微妙的关系:合作与竞争,总是交织在一起。

2007年,IE7与Windows Vista一起发布,但市场反应平平。另一方面,由于更新周期更快、扩展机制更友好,以及对开发者的自然吸引,Firefox的市场份额稳步增加到约20%。IE的主导地位开始松动,风向正在改变。

然而,谷歌采取了不同的方法。虽然它从2001年就开始计划自己的浏览器,但花了六年时间说服首席执行官埃里克·施密特批准该项目。Chrome于2008年首次亮相,基于Chromium开源项目和Safari使用的WebKit引擎。它曾被嘲笑为“臃肿”的浏览器,但凭借谷歌在广告和品牌建设方面的深厚专业知识,它迅速崛起。

Chrome的关键武器不是其功能,而是其频繁的更新周期(每六周一次)和统一的跨平台体验。在2011年11月,Chrome首次超过Firefox,达到了27%的市场份额;六个月后,它超越了IE,完成了从挑战者到主导者的转变。

与此同时,中国的移动互联网正在形成自己的生态系统。阿里巴巴的UC浏览器在2010年代初期迅速流行,特别是在印度、印尼和中国等新兴市场。由于其轻量设计和节省带宽的数据压缩功能,它赢得了低端设备用户的青睐。到2015年,其全球移动浏览器市场份额超过17%,在印度一度高达46%。但这一胜利并没有持续太久。随着印度政府收紧对中国应用的安全审查,UC浏览器被迫退出关键市场,逐渐失去了往日的荣耀。

到2020年代,Chrome的主导地位已经确立,其全球市场份额稳定在约65%。值得注意的是,尽管谷歌的搜索引擎和Chrome浏览器都属于Alphabet,但从市场角度来看,它们代表着两个独立的霸权——前者控制着约90%的全球搜索流量,后者则作为大多数用户访问互联网的“第一窗口”。

为了维持这种双重垄断结构,谷歌不惜一切代价。2022年,Alphabet支付给苹果大约200亿美元,仅仅是为了让谷歌成为Safari的默认搜索引擎。分析师指出,这笔费用约占谷歌从Safari流量中获得的搜索广告收入的36%。换句话说,谷歌实际上是在支付“保护费”来捍卫其护城河。

但潮流再次发生了变化。随着大型语言模型(LLMs)的兴起,传统搜索开始感受到影响。在2024年,谷歌的搜索市场份额从93%降至89%。虽然它仍然占据主导地位,但裂痕开始显现。更具颠覆性的是,有传言称苹果可能会推出自己的人工智能搜索引擎。如果Safari的默认搜索切换到苹果自己的生态系统,这不仅会重塑竞争格局,还可能动摇Alphabet利润的根基。市场反应迅速:Alphabet的股价从170美元跌至140美元,这不仅反映了投资者的恐慌,也表明对搜索时代未来方向的深刻不安。

从Navigator到Chrome,从开源理念到以广告驱动的商业化,从轻量级浏览器到AI搜索助手,浏览器的争斗始终是一场关于技术、平台、内容和控制的战争。战场不断变换,但本质从未改变:谁控制了Gate,谁就定义了未来。

在风险投资家的眼中,一场第三次浏览器战争正在逐渐展开,这场战争是由人们在LLMs和AI时代对搜索引擎的新需求推动的。以下是一些知名AI浏览器项目的融资详情。

现代浏览器的过时架构

当谈到浏览器架构时,经典的传统结构如下面的图所示:

1. 客户端 — 前端入口

查询通过HTTPS发送到最近的Google前端,在那里执行TLS解密、QoS采样和地理路由。如果检测到异常流量(例如DDoS攻击或自动抓取),则可以在此层应用速率限制或挑战。

2. 查询理解

前端需要理解用户输入的词语的含义。这涉及三个步骤:

  • 神经拼写纠正,例如将“recpie”变成“recipe”。

  • 同义词扩展,例如将“如何修理自行车”扩展为“修理自行车”。

  • 意图解析,它确定查询是信息性、导航性还是交易性,然后分配适当的垂直请求。

3. 候选人检索


谷歌的查询技术被称为倒排索引。在正向索引中,您可以根据其 ID 检索文件。但由于用户不可能知道数百亿文件中所需内容的标识符,因此谷歌使用传统的倒排索引,它通过内容查询以识别哪些文件包含相应的关键字。

接下来,谷歌应用向量索引来处理语义搜索——即查找与查询在意义上相似的内容。它将文本、图像和其他内容转换为高维向量(嵌入),然后基于这些向量之间的相似性进行搜索。例如,如果用户搜索“如何制作比萨饼面团”,搜索引擎可以返回与“比萨饼面团准备指南”相关的结果,因为这两者在语义上是相似的。

通过倒排索引和向量索引,在初步筛选阶段大约过滤掉数十万网页。

4. 多阶段排名

该系统通常使用数千个轻量级特征,例如BM25、TF-IDF和页面质量评分,将数十万候选页面筛选到约1,000个,从而形成初始候选集。这样的系统统称为推荐引擎。它们依赖于从各种实体生成的大量特征,包括用户行为、页面属性、查询意图和上下文信号。例如,Google结合了用户历史、其他用户的反馈、页面语义和查询含义,同时还考虑了上下文元素,例如时间(一天中的时间、一周中的某一天)和突发事件,如突发新闻。

5. 深度学习用于初级排名

在初始检索阶段,Google使用RankBrain和神经匹配等技术来理解查询的语义,并从大量文档集合中筛选出最相关的结果。

RankBrain是谷歌在2015年推出的一种机器学习系统,旨在更好地理解用户查询的含义,特别是那些从未见过的查询。它将查询和文档转换为向量表示,并计算它们之间的相似性,以找到最相关的结果。例如,对于查询“如何制作披萨面团”,即使没有文档包含精确的关键词匹配,RankBrain也能识别与“披萨基础”或“面团准备”相关的内容。

神经匹配于2018年推出,旨在进一步捕捉查询与文档之间的语义关系。通过使用神经网络模型,它识别单词之间的模糊关系,以更好地匹配查询与网络内容。例如,对于查询“为什么我的笔记本风扇如此嘈杂”,神经匹配可以理解用户可能在寻求有关过热、灰尘积聚或高CPU使用率的故障排除信息——即使这些术语并未明确出现在查询中。

6. 深度重排序:BERT的应用

在初步筛选相关文档后,Google 应用 BERT(双向编码器表示从变换器)来优化排名,确保最相关的结果出现在最上方。BERT 是一种基于变换器的预训练语言模型,可以理解句子中单词之间的上下文关系。

在搜索中,BERT被用于重新排序在早期阶段检索到的文档。它共同编码查询和文档,计算它们的相关性得分,然后重新排列文档。例如,对于查询“在没有路缘的山坡上停车”,BERT可以正确解释“没有路缘”的含义,并返回建议司机将车轮转向路边的结果,而不是误解为有路缘的情况。

对于SEO工程师来说,这意味着他们必须仔细研究谷歌的排名和机器学习推荐算法,以便有针对性地优化网页内容,从而在搜索排名中获得更高的可见性。

为什么人工智能将重塑浏览器

首先,我们需要澄清:为什么浏览器这种形式仍然需要存在?在AI代理和浏览器之外,是否存在第三种范式?

我们相信存在意味着不可替代性。为什么人工智能可以使用浏览器但不能完全取代它们?因为浏览器是一个通用平台。它不仅是读取数据的入口,也是输入数据的通用入口。世界不能仅仅消费信息——它还必须生成数据并与网站互动。因此,集成个性化用户信息的浏览器将继续广泛存在。

关键点是:作为一个通用网关,浏览器不仅仅是用来读取数据;用户往往需要与数据互动。浏览器本身是一个优秀的存储用户指纹的库。更复杂的用户行为和自动化操作必须通过浏览器进行。浏览器可以存储所有用户的行为指纹、凭证和其他私人信息,使得在自动化过程中能够无信任地调用。与数据的互动可能演变成这种模式:

用户 → 调用 AI 代理 → 浏览器。

换句话说,唯一可以被替代的部分在于世界的自然趋势——朝着更大的智能化、个性化和自动化发展。确实,这部分可以由AI代理处理。但是AI代理本身并不适合承载个性化用户内容,因为它们面临着数据安全和可用性方面的多重挑战。具体来说:

浏览器是个性化内容的存储库:

  • 大多数大型模型托管在云端,会话上下文依赖于服务器存储,这使得直接访问本地密码、钱包、Cookie 和其他敏感数据变得困难。

  • 将所有浏览和支付数据发送给第三方模型需要重新获得用户授权;欧盟的DMA和美国各州的隐私法都要求跨境数据最小化。

  • 自动填写双因素认证代码、调用相机或使用GPU进行WebGPU推理都必须在浏览器沙箱内完成。

  • 数据上下文高度依赖于浏览器。选项卡、Cookie、IndexedDB、服务工作者缓存、密码凭据和扩展数据都存储在浏览器内。

互动形式的深刻变化

回到最初的话题,我们在使用浏览器时的行为通常可以分为三类:阅读数据、输入数据和与数据互动。大型语言模型(LLMs)已经深刻改变了我们阅读数据的效率和方法。用户通过关键词搜索网页的旧做法现在显得过时且低效。

关于用户搜索行为的演变——无论目标是获取总结性的答案还是点击进入网页——许多研究已经分析了这一变化。

在用户行为模式方面,2024年的一项研究显示,在美国,每1,000个Google查询中,只有374个以打开网页点击结束。换句话说,近63%是“零点击”行为。用户已经习惯于直接从搜索结果页面获取天气、汇率和知识卡片等信息。

然而,真正能够引发浏览器大规模变革的,可能是数据交互层。在过去,人们主要通过输入关键词与浏览器互动——这是浏览器自身能够处理的最高理解水平。现在,用户越来越倾向于使用完整的自然语言来描述复杂的任务,例如:

  • “在某个时间段内帮我找到从纽约到洛杉矶的直飞航班。”

  • “帮我找一趟从纽约到上海再到洛杉矶的航班。”

即使对于人类来说,这些任务也需要花费大量时间访问多个网站,收集信息并比较结果。但这些代理任务正逐渐被人工智能代理取代。

这也符合历史的发展轨迹:自动化和智能。人们渴望解放双手,人工智能代理不可避免地将深度嵌入浏览器。未来的浏览器必须以完全自动化为设计考虑,特别是考虑到:

  • 如何平衡人类的阅读体验与AI代理的机器可解释性。

  • 如何确保单个网页同时服务于终端用户和代理模型。

只有满足这两个设计要求,浏览器才能真正成为AI代理执行任务的稳定载体。

接下来,我们将重点关注五个重要项目——Browser Use、Arc(浏览器公司)、Perplexity、Brave 和 Donut。这些项目代表了 AI 浏览器发展的未来方向,以及它们在 Web3 和加密环境中的本地集成潜力。

从用户心理的角度来看,2023年的一项调查显示,44%的受访者认为常规的自然搜索结果比特色摘要更值得信赖。学术研究也发现,在存在争议或缺乏单一权威真相的情况下,用户更倾向于选择包含多个来源链接的结果页面。

换句话说,虽然部分用户并不完全信任人工智能生成的摘要,但行为的显著比例已经转向了“零点击”。因此,人工智能浏览器仍需探索正确的交互范式——特别是在数据阅读方面。由于大模型中的幻觉问题尚未完全解决,许多用户仍然难以完全信任自动生成的内容摘要。在这方面,将大模型嵌入浏览器并不一定需要颠覆性的转变。相反,它只需要在准确性和可控性方面的逐步改进——这一过程已经在进行中。

浏览器使用

这正是Perplexity和Browser Use获得大量资金的核心逻辑。特别是,Browser Use已成为2025年初第二大最具前景的创新机会,具有确定性和强大的增长潜力。

Browser Use 已构建了一个真正的语义层,核心关注点是为下一代浏览器创建语义识别架构。

Browser Use 将传统的“DOM = 人类可见的节点树”重新诠释为“语义 DOM = LLMs 可读取的指令树”。这使得代理可以准确地点击、填写和上传,而无需依赖“像素坐标”。与使用视觉 OCR 或基于坐标的 Selenium 不同,这种方法采用“结构化文本 → 函数调用”的方式,使执行更快,节省代币并减少错误。TechCrunch 将其描述为“允许 AI 真正理解网页的粘合层”。在三月,Browser Use 关闭了 1700 万美元的种子轮融资,押注于这一基础创新。

它的工作原理如下:

HTML渲染后,形成一个标准的DOM树。浏览器随后派生出一个可访问性树,为屏幕阅读器提供更丰富的“角色”和“状态”标签。

  1. 每个交互元素(按钮、输入等)被抽象为一个包含角色、可见性、坐标和可执行操作等元数据的JSON片段。

  2. 整个页面被翻译成一个扁平化的语义节点列表,LLM可以在一个系统提示中读取。

  3. LLM 输出高级指令(例如,click(node_id="btn-Checkout" )),然后在真实浏览器中重放这些指令。

官方博客将此过程描述为“将网站界面转化为LLM可以解析的结构化文本。”

此外,如果这个标准被W3C采纳,它可以大大解决浏览器输入问题。接下来,我们将查看来自The Browser Company的公开信和案例研究,以进一步解释他们的方法为何存在缺陷。

浏览器公司(Arc的母公司)在其公开信中表示,Arc浏览器将进入常规维护模式,而团队将把重点转向开发DIA,这是一款完全面向AI的浏览器。在信中,他们还承认DIA的具体实施路径尚未确定。与此同时,团队概述了关于浏览器市场未来的几项预测。

基于这些预测,我们进一步相信,如果当前的浏览器环境真的要被颠覆,关键在于改变交互的输出侧。

以下是Arc团队分享的关于未来浏览器市场的三个预测。


https://browsercompany.substack.com/p/letter-to-arc-members-2025

首先,Arc团队认为网页将不再是主要的交互界面。诚然,这是一个大胆且具有挑战性的说法,这也是我们对他们创始人的反思持怀疑态度的主要原因。在我们看来,这种观点显著低估了浏览器的作用,并突显了团队在探索AI浏览器路径时忽视的关键问题。

大型模型在捕捉意图方面表现出色——例如,理解“帮我预订航班”这样的指令。然而,在信息密度方面,它们仍然不够充分。当用户需要仪表板、类似布隆伯格终端的笔记本或像Figma这样的视觉画布时,没有什么能超越具有像素级精度的精细调整网页。每个产品的符合人体工程学的设计——图表、拖放功能、快捷键——并不是表面的装饰,而是压缩认知的基本功能。这些能力无法通过简单的对话交互来复制。以Gate.com为例:如果用户想要执行投资操作,仅仅依赖AI对话远远不够,因为用户在很大程度上依赖于结构化输入、准确性和信息的清晰呈现。

Arc团队的路线图存在一个根本性的缺陷:它未能清楚地区分“交互”由两个维度组成——输入和输出。在输入方面,他们的观点在某些情况下是有一定有效性的,因为人工智能确实可以提高命令式交互的效率。但在输出方面,他们的假设显然是不平衡的,忽视了浏览器在信息呈现和个性化体验中的核心作用。例如,Reddit有其独特的布局和信息架构,而AAVE则有完全不同的界面和结构。作为一个同时存储高度私密数据并呈现多样化产品界面的平台,浏览器在输入方面的可替代性有限,而其在输出方面的复杂性和非标准化特性使得干扰变得更加困难。

相比之下,目前的人工智能浏览器主要集中在“输出摘要”层面:对页面进行摘要、提取信息、生成结论。这不足以对主流浏览器或像谷歌这样的搜索系统构成根本性的挑战——它仅仅是在削弱搜索摘要的市场份额。

因此,真正能够动摇Chrome 66%市场份额的技术注定不会是“下一个Chrome”。要实现真正的颠覆,浏览器的渲染模型必须从根本上重构,以适应AI代理时代的交互需求,特别是在输入端架构设计方面。这就是为什么我们认为Browser Use所采取的技术路径更具说服力——它专注于浏览器底层机制的结构性变化。一旦任何系统实现了“原子”或“模块化”设计,由此衍生的可编程性和可组合性就会释放出颠覆性的潜力。这正是Browser Use今天所追求的方向。

总之,AI代理的运作仍然在很大程度上依赖于浏览器的存在。浏览器不仅是复杂个性化数据的主要存储库,也是多种应用的通用渲染接口,因此将继续作为未来交互的核心Gateway。随着AI代理在浏览器中深入嵌入以完成固定任务,它们将主要通过输入端与用户数据和特定应用进行交互。因此,当前浏览器的渲染模型必须进行创新,以实现与AI代理的最大兼容性和适应性——最终使它们能够更有效地捕捉应用。

困惑

Perplexity是一款以其推荐系统而闻名的AI搜索引擎。其最新估值已飙升至140亿美元,几乎是2024年6月30亿美元估值的五倍。它现在每月处理超过4亿个搜索查询。在2024年9月,它处理了大约2.5亿个查询,标志着用户搜索量同比增长了八倍,活跃用户超过3000万。

其主要特点是能够实时总结网页,使其在获取最新信息方面具有强大的优势。今年早些时候,Perplexity开始构建自己的原生浏览器Comet。该公司将Comet描述为一种不仅“显示”网页而且还“思考”网页的浏览器。官方宣称,它将在浏览器内部深度嵌入Perplexity的答案引擎,采用一种“整体机器”的方法,这让人想起史蒂夫·乔布斯的理念:在基础浏览器层面深度集成AI任务,而不仅仅是构建侧边栏插件。

Comet 旨在通过引用支持的简洁答案取代传统的“十个蓝色链接”,并直接与 Chrome 竞争。

但Perplexity仍需解决两个核心问题:高搜索成本和来自边际用户的低利润率。尽管Perplexity目前在AI搜索领域处于领先地位,但谷歌在其2025年I/O大会上宣布对其核心产品进行大规模智能改造。对于浏览器,谷歌推出了一种名为AI Model的新浏览器标签体验,整合了概览、深度研究和未来的Agentic能力。整个倡议被称为“Project Mariner。”

谷歌正在积极推进其人工智能转型,这意味着表面的功能模仿——例如概述、深度研究或代理——几乎不会构成真正的威胁。在混乱中真正建立新秩序的可能是从头重建浏览器架构,深度嵌入大型语言模型(LLMs)到浏览器内核中,并从根本上改变交互方式。

勇敢

Brave是加密行业中最早和最成功的浏览器之一。基于Chromium架构构建,兼容Google Store的扩展。Brave通过基于隐私的模型和通过浏览赚取代币来吸引用户。它的发展路径展示了一定的增长潜力。然而,从产品的角度来看,虽然隐私确实重要,但需求仍然集中在特定的用户群体中。对于更广泛的公众,隐私意识尚未成为主流的决策因素。因此,单靠这一特性来颠覆现有巨头不太可能成功。

截至目前,Brave 已达到 8270 万月活跃用户 (MAU) 和 3560 万日活跃用户 (DAU),市场份额约为 1%–1.5%。其用户基础显示出稳定增长:从 2019 年 7 月的 600 万,到 2021 年 1 月的 2500 万,再到 2023 年 1 月的 5700 万,到 2025 年 2 月时超过 8200 万。其复合年增长率仍保持在双位数。

Brave 每月处理大约 13.4 亿个搜索查询,这大约是 Google 搜索量的 0.3%.

Brave计划升级为一个隐私优先的AI浏览器。然而,它对用户数据的有限访问减少了大型模型的定制化水平,这反过来又阻碍了快速和精确的产品迭代。在即将到来的Agentic Browser时代,Brave可能在特定的隐私关注用户群体中保持稳定的市场份额,但要成为主导玩家将会很困难。它的AI助手Leo更像是一个插件增强——提供一些内容摘要功能,但缺乏向AI代理全面转型的明确策略。交互创新仍然不足。

甜甜圈

最近,加密行业在代理浏览器领域也取得了进展。早期项目Donut在一轮种子前融资中筹集了700万美元,由红杉中国、HackVC和Bitkraft Ventures领投。该项目仍处于早期概念阶段,愿景是实现“发现 – 决策 – 以及加密原生执行”作为一种综合能力。

核心方向是结合加密本土的自动化执行路径。正如a16z所预测的,代理可能会在未来取代搜索引擎成为主要的流量Gateway。企业家将不再围绕谷歌的排名算法竞争,而是争夺来自代理执行的流量和转化。业界已经将这一趋势称为“AEO”(答案/代理引擎优化),甚至更进一步称为“ATF”(代理任务履行)——其目标不再是优化搜索排名,而是直接服务于可以为用户完成任务的智能模型,例如下订单、订票或写信。

为企业家

首先,必须承认:浏览器本身仍然是互联网世界中最大的未改造的“Gateway”。全球约有21亿台桌面用户和超过43亿台移动用户,它作为数据输入、交互行为和个性化指纹存储的共同载体。它持续存在的原因不是惰性,而是浏览器固有的双重性质:它既是读取数据的入口,也是写入操作的出口。

因此,对于企业家而言,真正的颠覆潜力不在于优化“页面输出”层。即使可以在新标签中复制类似 Google 的 AI 概览功能,那也只是插件层面的迭代,而不是根本性的范式转变。真正的突破在于“输入端”——如何让 AI 代理主动调用您的产品以完成特定任务。这将决定一个产品是否能够嵌入代理生态系统,捕获流量,并分享价值分配。

在搜索时代,竞争是关于点击;在代理时代,竞争是关于电话。

如果你是一名企业家,你应该将你的产品重新构想为一个API组件——一种智能代理不仅可以理解而且可以调用的东西。这要求你在产品设计的最初阶段就考虑三个维度:

1. 接口结构标准化:您的产品是否可调用?

一个代理调用产品的能力取决于其信息结构是否能够标准化并抽象为一个清晰的模式。例如,用户注册、订单下单或评论提交等关键操作是否可以通过语义DOM结构或JSON映射进行描述?系统是否提供状态机,以便代理可以可靠地复制用户工作流程?页面上的用户交互是否可以被脚本化?该产品是否提供稳定的webhooks或API端点?

这正是为什么Browser Use成功筹集资金的原因——它将浏览器从一个平面的HTML渲染器转变为一个可被LLM调用的语义树。对于企业家来说,在网页产品中采用类似的设计理念意味着为AI代理时代的结构化适应做好准备。

2. 身份与访问:你能帮助代理人“跨越信任障碍”吗?

代理人要完成交易或调用支付和资产功能,需要一个可信的中介——你能成为那个中介吗?浏览器自然具备读取本地存储、访问钱包、处理验证码和集成双因素认证的能力。这使得它们比云托管模型更适合执行任务。在Web3中尤其如此,因为资产交互接口并没有标准化。没有“身份”或“签名能力”,代理人无法继续前进。

对于加密创业者来说,这打开了一个高度富有想象力的白色空间:区块链世界的“MCP(多能力平台)”。这可以采取通用命令层的形式(允许代理调用去中心化应用程序),一个标准化的合同接口集,甚至是一个轻量级的本地钱包 + 身份中心。

3. 重新思考流量机制:未来不是SEO,而是AEO / ATF。

在过去,你必须赢得谷歌的算法;现在你需要嵌入到AI代理的任务链中。这意味着你的产品必须具有明确的任务粒度:不是一个“页面”,而是一系列可调用的能力单元。这也意味着开始优化代理引擎优化(AEO)或适应代理任务履行(ATF)。例如,注册过程可以简化为结构化步骤吗?定价可以通过API提取吗?库存可以实时访问吗?

你可能甚至需要适应不同的 LLM 框架中的调用语法——例如,OpenAI 和 Claude 对函数调用和工具使用有不同的偏好。Chrome 是旧世界的终端,而不是通往新世界的 Gate。未来的项目不会重建浏览器,而是让浏览器为代理服务——为新一代的“指令流程”搭建桥梁。

您需要构建的是“接口语言”,通过它代理人可以调用您的世界。
你需要获得的是智能系统信任链中的一个位置。
你需要构建的是一个“API 城堡”在下一个搜索范式中。

如果Web2通过用户界面捕获用户注意力,那么Web3 + AI代理时代将通过调用链捕获代理执行意图。

免责声明

本内容不构成要约、招揽或推荐。在做出任何投资决策之前,您应始终寻求独立的专业建议。请注意,Gate和/或Gate Ventures可能会限制或禁止在限制地区提供部分或全部服务。有关更多详细信息,请阅读适用的用户协议。

关于Gate Ventures

Gate Ventures是Gate的风险投资部门,专注于对去中心化基础设施、生态系统和应用程序的投资——这些技术将重塑Web 3.0时代的世界。Gate Ventures与全球行业领导者合作,赋能团队和初创企业,运用创新思维和能力重新定义社会与金融的互动方式。

网站: https://www.gate.com/ventures

* 本文章不作为 Gate 提供的投资理财建议或其他任何类型的建议。 投资有风险,入市须谨慎。
即刻开始交易
注册并交易即可获得
$100
和价值
$5500
理财体验金奖励!