AI agent基建持续火热, 又一笔4000万美金大额融资, 16个月估值3亿
- 2025-06-24 15:05:09
- 544
Browserbase16个月估值达3亿美元,完成4000万美元B轮融资。它致力于解决AI如何像人类一样使用互联网的问题,提供无头浏览器基础设施,支持编程控制和大规模运行。公司不仅提供基础设施,还构建生态系统,开发Stagehand框架和Director产品,降低Web自动化门槛,满足广泛客户需求。
你有没有想过,为什么互联网时代的工作还是这么繁琐?为什么我们还在重复填写表格、点击按钮、手动查找信息?当AI能够写代码、画图、甚至思考复杂问题时,为什么我们仍然被困在一个个网页界面中,像机器人一样执行着重复性任务?
我发现一个很有意思的现象。身边越来越多的朋友在讨论如何让AI帮他们完成网上的各种任务,比如自动续费服务、定期下载报告、监控竞品价格等等。大家都有同样的困惑:AI看起来很聪明,但为什么它不能直接帮我在网站上完成这些简单任务?问题的答案其实很简单,AI需要一个”浏览器”才能像人类一样操作网站。而这正是Browserbase想要解决的核心问题。
最近,这家成立仅16个月的公司刚刚完成了4000万美元的B轮融资,估值达到3亿美元。NotableCapital领投,KleinerPerkins和CRV等知名投资机构参与跟投。更令人印象深刻的是,公司在15个月内总共融资6750万美元,从无到有发展到超过1000个客户。这样的发展速度让我不得不认真思考:他们到底在解决什么样的问题,为什么会有这么多企业愿意为此买单?
重新理解Web自动化的本质
在我看来,Browserbase正在解决一个被严重低估但极其重要的问题:如何让AI能够像人类一样使用互联网。我们现在生活在一个奇怪的时代,AI可以写出复杂的代码,但却无法帮你在网站上订一张机票。这种矛盾的根源在于,现有的互联网基础设施是为人类设计的,而不是为AI设计的。每个网站都有自己的界面、按钮、表单,AI需要理解这些元素的含义并正确操作它们,就像人类用鼠标和键盘一样。
Browserbase提供的解决方案被称为”无头浏览器(headlessbrowser)”基础设施。简单来说,就是运行在云端的浏览器,它们没有用户界面,但可以执行所有浏览器的功能:访问网页、点击按钮、填写表单、下载文件等等。关键是,这些浏览器可以被编程控制,可以大规模运行,而且专门针对AI和自动化场景进行了优化。
创始人PaulKlein的背景让我觉得他是解决这个问题的合适人选。他曾在Twilio工作三年,从实习生做到团队负责人,期间经历了公司IPO的全过程。后来他联合创立了StreamClub,这是一个直播软件工具公司,最终被Mux收购。在Mux工作期间,Klein大量接触了无头浏览器技术,这让他深度理解了这个领域的痛点和机会。当ChatGPT兴起后,越来越多的人向他咨询如何使用无头浏览器来支持AI应用,这让他意识到市场上缺乏一个专业的基础设施平台。
更重要的是,Klein对这个问题有着独特的理解。他认为我们不应该指望互联网会为AI重新设计,就像我们不能指望所有道路都为自动驾驶汽车重新铺设一样。相反,我们需要让AI学会使用现有的互联网基础设施。这个观点让我深有感触,因为确实有太多老旧但重要的网站永远不会提供API接口,比如政府部门网站、传统企业内部系统、各种专业数据库等等。
从技术角度看,Browserbase的架构设计很有意思。他们的平台可以在几分之一秒内启动数千个浏览器实例,每个实例都配备四个虚拟CPU来确保快速响应。更重要的是,他们在全球部署了数据中心,开发者可以从最近的数据中心发送请求,大大降低了延迟。这种全球化部署对于需要访问不同地区网站的应用来说至关重要,比如监控海外市场价格、收集国际新闻信息等等。
从基础设施到生态系统的转变
让我印象深刻的是,Browserbase不仅仅提供基础设施,还在构建一个完整的生态系统。他们开发了Stagehand框架,这是一个专门为浏览器自动化设计的开源工具。与传统的Puppeteer和Selenium相比,Stagehand最大的特点是可以将传统脚本和AIagent结合在同一个工作流中。这种设计很聪明,因为它解决了一个关键矛盾:传统脚本很可靠但不够灵活,AIagent很灵活但可能出现幻觉。通过让开发者在需要适应性的地方使用AI,在需要高可靠性的地方使用脚本,Stagehand实现了两者的平衡。
更令我兴奋的是他们新推出的Director产品。这个产品让我看到了Browserbase的野心:他们不只想服务开发者,还想让普通用户也能使用Web自动化。Director允许用户用自然语言描述他们想要完成的任务,然后自动生成可执行的浏览器工作流。比如,你可以告诉Director:”去加州护理执照数据库,查找Julia的执照号码94156,告诉我她的资质是否有效。”Director会自动生成相应的代码并执行这个任务。
Klein提到了一个很有意思的概念:”vibecoders”。这些是那些有一定技术背景但不是专业开发者的人,比如牙医、律师、小企业主等等。他们知道什么是Cursor,了解AI工具,想要自动化一些工作流程,但不想从零开始学习编程。Director正是为这些人设计的。Klein说他经常接到牙医的电话,询问如何自动化保险门户网站的操作。这让我意识到,Web自动化的需求其实远比我想象的要广泛。
这种设计理念让我想起了Vercel的v0或者其他无代码平台的发展路径。Browserbase本质上是在降低Web自动化的门槛,让更多人能够享受到自动化带来的效率提升。而且,Director生成的代码可以很容易地交给工程师进行进一步开发,这为企业提供了一个很好的概念验证工具。
我特别欣赏Browserbase对开源的投入。他们有一名工程师全职负责开源项目,还赞助了ScrapegraphAI等项目。据Klein介绍,Browserbase支持的工具每月在GitHub上被下载130万次。这种开源策略不仅帮助他们建立了开发者社区,也让他们的技术得到了更广泛的验证和改进。
让我印象深刻的是Browserbase在客户服务方面的投入。Klein说他们的客户工程团队都是高学历的工程师,包括哥伦比亚大学和哈佛大学的毕业生。这些人不是传统意义上的客服人员,而是能够真正帮助开发者解决技术问题的专家。他们的核心指标是帮助客户尽快将产品投入生产,而不是简单的响应时间。
从商业模式角度看,Browserbase采用基于使用量的定价,这意味着只有当客户成功时他们才能获得收益。这种对齐的商业模式让Klein把大量时间花在帮助客户成功上,包括提供产品发布建议、使用反馈等等。这种深度参与客户成功的方式让我觉得他们更像是客户的技术合作伙伴,而不仅仅是服务提供商。
创始人的深度思考:从挫折到顿悟的创业哲学
PaulKlein的创业历程让我看到了一个成熟创业者的思考深度。他来自一个有着深厚商业传统的家庭。他的祖父从夜校开始,最终成为NationalCashRegister公司的高管,后来还从事过企业转型工作。这种家庭背景让Klein对商业有着与众不同的理解。最有意思的是,当他邀请祖父参加B轮融资庆祝派对时,老人家说:”这很好,我很感激,但我更愿意只参加IPO派对。等那时候再叫我吧。”这种高标准让Klein意识到,现在的创业者确实比以前容易太多了。
Klein的第一次创业经历StreamClub给了他重要的教训。他坦率地说:”我开始那家公司是因为错误的原因。”当时他在Twilio工作了三年,从实习生做到IPO,然后留下来领导团队。有一天,他在一个重大架构决策上与技术负责人产生分歧,回家后恰好收到了未来联合创始人的短信,询问是否愿意在周末一起开发一个项目。他们构建了一个很棒的产品叫StreamClub。但Klein反思说:”我开始这家公司是因为我喜欢构建,我喜欢创业的想法,我想看看自己能做到什么。但我对直播市场没有任何差异化的观点。”
这种诚实的自我反思让我印象深刻。Klein说,那些因为想体验创业而开始公司的人往往会遇到困难,因为他们没有与所构建产品的深度情感联系来推动他们度过艰难时期。他说:”你会看到创业是什么样子的——非常困难。构建公司是非常痛苦的,你会掉头发,不会经常锻炼,你的生活不再一样,你不会经常见朋友。”这种对创业现实的坦诚描述,比那些光鲜亮丽的成功故事更有价值。
StreamClub的退出给了Klein时间反思为什么要创业。他意识到,只有当没有其他人在构建你需要的东西,而你又是构建它的合适人选时,你才应该创业。在Mux工作期间,他花了大量时间在浏览器自动化和无头浏览器技术上,逐渐形成了对这个基础设施的强烈观点。当AI和AIagent兴起时,越来越多的人向他咨询如何使用无头浏览器技术。在第20次这样的对话后,他意识到没有人在构建帮助这些人自动化网络的基础设施,而这需要由他来做。
Klein对独立创业的看法也很有启发性。他说:”我不是因为选择而成为独立创始人的,我试图让三个人成为我的联合创始人,他们都拒绝了。”但最终他发现这样反而更好。作为独立创始人,你消除了联合创始人之间的对齐步骤。当有多个联合创始人时,创始人必须先彼此对齐,然后再与公司的其他人对齐。而作为独立创始人,就是你和公司保持持续的和谐。如果他感觉公司的方向与他不一致,他可以召开全员会议重新对齐。
我特别欣赏Klein对压力的理解。他说:”压力是一种特权”,这个概念来自美国网球公开赛的标语。他解释说:”当你感受到客户压力、投资者压力或来自世界的压力时,这意味着你在做正确的事情,意味着你有机会构建某些东西,人们依赖于它。”这种将压力重新框架为机会的思维方式,对于任何创业者来说都是宝贵的心理工具。
Klein的团队建设哲学也体现了他的深度思考。Browserbase坚持在旧金山建立现场团队,每周五天在办公室工作。虽然这在远程工作时代显得逆潮流,但Klein有自己的逻辑:”现场招聘创造了更高的门槛。候选人必须愿意承诺每周在这里工作40-60小时。”他认为这种方法培养了强大的文化,吸引了真正投入于Browserbase愿景的顶级人才。更重要的是,他们雇佣了很多前创始人。”他们理解。他们了解压力和风险。他们来的时候已经与我们正在构建的东西保持一致。”
让我印象最深刻的是他们对”情感脆弱性”的强调。Klein说:”我们是一家情感脆弱的公司。我们最近在全员会议上做了一个练习,每个人轮流说一件他们最近搞砸的事情。”这种开放性建立了信任,鼓励了冒险精神。一个工程师说:”嘿,我触发了一个破坏生产环境的bug,这让我真的怀疑我是不是一个好工程师?”立即所有人都能说:”不,你是一个很棒的工程师,你在想什么?”但能够发现这些小的不安全感并验证它们,然后推动人们继续承担风险——这种文化深度是很少见的。
真实客户案例揭示的市场深度
通过深入了解Browserbase的客户案例,我发现这个市场比我最初想象的要深刻和多样化得多。每个案例都揭示了现代商业中被忽视但极其重要的自动化需求。
Pursuit的案例让我看到了政府采购这个巨大而复杂的市场。联合创始人兼CTOBrandonMax告诉我,当他们第一次见到Klein时,Pursuit刚刚花费了大量时间和精力建立自己的计算集群来抓取公共部门网站的数据,寻找即将发布的合同指标以及哪些部门有预算。Max对Klein说:”自己抓取和运行这些真的很糟糕。”几个月后,Pursuit转向了Browserbase,现在用它扫描超过13万个网站,代表城市、县、大学、消防区等等。然后Pursuit将这些信息与大量提交的购买订单的《信息自由法》请求相结合,为销售人员生成置信度分数,让他们知道最好联系谁以及如何联系。Max强调:”这些数据按法律要求必须是公开的。我们认为让政府以更便宜的价格获得更好的服务,对我们孩子成长的地方更有好处。”这个案例让我意识到,自动化不仅仅是为了效率,还可以促进政府透明度和公平竞争。
更令人惊讶的是那家55年历史的奶制品运输公司的故事。这家公司在其整个历史中从未雇佣过工程师,今年才雇佣了他们的第一个工程师。这个工程师使用Browserbase自动化了沿路线收集汽油价格的工作。以前,他们有一个运营人员会说:”好吧,你要走这条路线,这是你停下来加油的地方。”现在他们构建了一个AI助手,可以根据路线找到汽油价格,并告诉你应该在哪里加油。Klein说:”这都是由这个工程师使用Browserbase进行vibecoding完成的。”这个案例向我展示了AI确实已经逃离了硅谷泡沫,人们正在美国中部、国际上构建agent。
Structify的使用场景展现了Browserbase在处理大规模数据项目方面的能力。联合创始人RonakGandhi说他的初创公司使用Browserbase来帮助组建大型项目冲刺,可以在一天内运行多达十年的浏览器小时数。这种规模是惊人的,但更重要的是,Gandhi赞扬了Browserbase团队的响应性。他说,当Structify有大的数据推送时,他们会在Slack上联系Browserbase的技术负责人WalkerGriggs,让他亲自指导他们度过这些时刻。这种个性化的技术支持在基础设施公司中是很少见的。
让我最感兴趣的是Klein提到的牙医案例。他说:”我们不断听到专业人士试图自动化一个利基但重复性的任务。这个牙医预订了与我们的通话,说他们想使用AI自动化保险门户。那时我想到,我们需要让产品更加易于访问。”这个洞察导致了Director的推出。想象一下,一个牙医在处理保险授权时感到如此沮丧,以至于他们愿意学习使用无头浏览器技术来自动化这个过程。这说明了现有业务流程中的痛点有多么严重,也展示了自动化需求的广泛性。
Klein还分享了一个关于Kalshi的具体用例,这是美国第一个联邦监管的预测市场平台。他解释说:”你可以告诉你的agent去Kalshi,找到利率市场,下注50美元。这种交互需要在网页上阅读、点击和填写表单,这正是Browserbase构建的目的。”这个例子很有趣,因为它展示了AIagent如何与复杂的金融平台交互,这在传统的API集成中可能非常困难或不可能实现。
从这些案例中,我看到了几个重要的趋势。第一是”最后一英里”问题的普遍性。很多有价值的数据和功能被锁定在没有现代API的传统网站中。第二是”长尾需求”的重要性。每个行业都有其特定的、看似小众但实际上至关重要的自动化需求。第三是”技能民主化”的趋势。随着工具变得更容易使用,非技术专业人士也开始构建自己的自动化解决方案。
更深层次的是,这些案例揭示了现代经济中”隐藏的摩擦”问题。有太多的业务流程仍然依赖于人工执行重复性的网络任务,不是因为这些任务很复杂,而是因为缺乏合适的工具来自动化它们。Browserbase正在填补这个空白,让企业能够专注于更高价值的活动。
Klein的一个观察特别有洞察力:”我们的大多数客户实际上是自己构建过这个的人。我们真的触及了痛点。那些自己构建和维护这个技术栈的人会说:’去他的!我不想要了。'”这说明了市场的成熟度和需求的真实性。这些不是被营销说服的客户,而是已经尝试过自己解决问题并发现其困难的专业人士。
对未来Web交互的思考
从更宏观的角度看,我认为Browserbase代表了Web交互演进的一个重要方向。我们正处在一个转折点,传统的基于点击的用户界面开始让位于基于意图的交互。用户不再需要知道”如何”完成任务,只需要表达”想要”完成什么任务。这种转变的意义不亚于从命令行到图形界面的跨越。
Klein提到了一个很重要的观点:认证(authentication)是AIagent大规模应用的关键瓶颈。如果你想让AI帮你订机票,它需要登录你的航空公司账户。但与AI分享密码显然不是最好的方式,而大多数网站也没有为AIagent设计专门的认证系统。这个问题需要像Okta、Clerk这样的认证服务提供商来解决,他们需要提供某种”代理认证”功能,让AI能够代表用户安全地执行操作。
我也在思考Webscraping的伦理问题。虽然Klein强调Browserbase主要专注于自动化而不是抓取,但现实是很多客户确实在使用他们的服务来收集网络数据。这个问题很复杂,因为一方面,很多数据按法律要求应该是公开的;另一方面,大规模自动化收集可能会对网站造成负担。Browserbase的做法是对所有大规模客户的用例进行审查,这种”了解你的客户”(KYC)尽职调查可能超出了他们的法律义务。
从技术发展的角度看,我认为我们正在进入一个”非人类互联网用户”大量出现的时代。传统的验证码(CAPTCHA)是为了阻止恶意机器人而设计的,但现在我们需要区分”好机器人”和”坏机器人”。这可能需要更复杂的身份验证和意图验证机制。
我也很好奇ModelContextProtocol(MCP)这样的标准化协议如何影响这个生态系统。MCP是一种标准化的方式,让开发者可以将浏览器控制等工具作为可调用函数暴露给AIagent。这种标准化可能会让Web自动化变得更加普及和易用。
市场竞争与发展前景
从投资角度看,Browserbase的快速增长和高估值反映了市场对这个赛道的信心。NotableCapital的GlennSolomon将Browserbase比作Vercel,认为如果你能构建一个能够预见和满足开发者需求的优秀服务,那么这将是一个非常有吸引力的价值主张。在短短16个月内从零增长到超过1000个客户,这样的速度在基础设施公司中是很少见的。
竞争方面,我注意到Perplexity今年收购了Web浏览器初创公司Comet,这表明大型AI公司也在关注这个领域。但Klein认为来自模型提供商的竞争目前还不是主要威胁,因为Browserbase专注于基础设施和开发者工具,而不是直接的消费者应用。
我觉得Browserbase的护城河主要来自几个方面:首先是技术深度,特别是在大规模浏览器运行和优化方面的专业知识;其次是开发者生态系统,通过开源项目和社区建设形成的网络效应;最后是客户服务质量,通过深度参与客户成功建立的忠诚度。
从市场规模看,我认为这个市场还远未达到饱和。Klein提到的”vibecoders”概念特别有意思,因为它代表了一个巨大的潜在市场:那些有一定技术理解但不是专业开发者的人群。随着AI工具的普及,这个群体的规模会越来越大,他们对自动化工具的需求也会越来越强烈。
我也很看好Browserbase在垂直行业的发展潜力。从牙医到奶制品运输公司,从政府采购到数据收集,各个行业都有大量重复性的Web操作需要自动化。这些需求往往很具体、很专业,需要专门的解决方案。Browserbase作为基础设施平台,可以支持各种垂直应用的开发。
对整个行业的启示
最后,我想分享一些对整个行业的思考。Browserbase的成功让我看到了”boringtech”的价值。浏览器自动化听起来并不像AGI或者自动驾驶那样激动人心,但它解决的是真实存在的、迫切的问题。很多时候,最成功的技术公司都是那些专注于解决具体问题的公司,而不是那些追求最前沿技术的公司。
Klein经常提到的一个类比很有意思:Browserbase就像是Twilio对于电话、Stripe对于支付一样,是Web自动化的基础设施。这种”管道和铲子”的生意模式在技术革命中往往是最稳定和最有价值的。当所有人都在挖金子的时候,卖铲子的人往往赚得最多。
我也从Browserbase的发展中看到了开源策略的重要性。他们不仅开源了自己的工具,还积极参与和赞助开源社区。这种策略不仅帮助他们建立了技术声誉,也让他们能够从社区获得反馈和贡献。在开发者工具领域,开源几乎是建立信任和社区的必要条件。
从融资角度看,我觉得Browserbase展现了一个很好的融资节奏。他们在15个月内完成了四轮融资,每次都有明确的里程碑和使用计划。这种快速而有序的融资让他们能够在市场窗口期抓住机会,同时避免了过度稀释。
最终,我认为Browserbase的故事告诉我们,在AI时代,基础设施和工具层可能比应用层更加重要。每一个革命性的技术都需要配套的基础设施来支撑。就像云计算需要AWS,移动应用需要AppStore一样,AI应用也需要像Browserbase这样的基础设施来连接虚拟智能和现实世界。我相信随着AIagent的普及,Web自动化将成为一个价值数十亿美元的市场,而Browserbase很可能成为这个市场的重要参与者。
- 上一篇:陈赫炫耀衣服
- 下一篇:坠湖女司机独自抚养个大学生