谷歌醒了,新入口大战开打

2025-11-21 08:01 来源:《中国企业家》杂志
查看余下全文
(责任编辑:刘芃)
手机看中经经济日报微信中经网微信

谷歌醒了,新入口大战开打

2025年11月21日 08:01   来源:《中国企业家》杂志   

段永平:现在市场上的大模型10年后能活下来的不会超过10%。谁会活下来?我会猜Gemini,因为谷歌很强大,而且已经醒了。

文|《中国企业家》记者 王怡洁 见习记者 孙欣

蛰伏数月,谷歌再度出手甩出王炸——Gemini 3奇袭大模型圈,交出了一张几乎“全A”的模型测试成绩单。

11月19日凌晨,谷歌发布最新一代模型Gemini 3。随后,Gemini 3系列模型在多模态、推理、Agent 等三条大模型主线路的多项国际测试上全面“屠榜”。除了在编程能力测试略逊于GPT-5.1和Claude Sonnet 4.5外,在其他国际主流测试项目上,Gemini 3 Pro得分都是断档的领先。

其中,Humanity's Last Exam (HLE)被认为是衡量AI能否解决人类顶尖难题的试金石,Gemini 3 Pro在此项测试的得分为37.5%。而GPT-5.1、Claude Sonnet 4.5得分分别为26.5%、12.7%。

模型发布后,谷歌美股股价一度上涨5.8%,市值突破3.5万亿美元创历史新高。

OpenAI的CEO山姆·阿尔特曼也罕见对谷歌给予赞赏:“这看起来是一个很棒的模型。”短短一年前,谷歌在举办2024 I/O开发者大会时,阿尔特曼还曾直接嘲讽Gemini产品,甚至对发布会布置提出质疑:“我无法不去思考OpenAI和谷歌之间的美学差异。”

但在今年5月的开发者大会上,谷歌拿出十余种“AI万花筒”产品,能力大幅提升,给了阿尔特曼一记回旋镖。半年后,谷歌再度“炸场”,更表明在多年技术积累之下,谷歌已经重新找回节奏。

“谷歌已不再把自己视为一家搜索公司,而是要成为下一代计算平台的创建者。”谷歌CEO皮查伊今年多次强调。2025年,谷歌的搜索、安卓系统、Chrome浏览器、YouTube、硬件乃至手机等核心业务,都在围绕基座大模型Gemini进行重构。一年高达900亿美元的资本开支以及工程资源,也都向模型供电倾斜。

基座模型迭代之际,谷歌也同步披露了一个关键数据:谷歌浏览器的AI模式月活跃用户已达20亿。这意味着,从模型到应用,谷歌正利用其庞大的生态系统,重新定义AI上的话语权。

谷歌全栈布局的示范效应,也势必将大模型竞争拉到下一高度。近期,国内外围绕入口的争夺也不约而同地打响。OpenAI上线桌面浏览器,同时强势进军搜索功能;阿里千问App近期回归,高调瞄准ChatGPT入局AI to C;字节也在通过豆包探索电商新入口。

几天前,伯克希尔-哈撒韦公司披露的今年三季度持股报告显示:巴菲特在退休前,首次建仓买入了谷歌。

近日,段永平在接受采访时也表示:“现在市场上的大模型很多,10年后能活下来的大概率不会超过10%。大家可以猜猜10年后,大家还在用的主流大模型会是什么?我会猜Gemini,因为背后的谷歌很强大,而且已经醒了。”

模型屠榜,应用升级

Gemini 3发布前,谷歌相当低调。

2025年11月初,皮查伊在公司财报电话会议上谈及Gemini 3时态度谨慎:“前沿大模型的开发需要更多时间,而Gemini 3预计不会让人们立刻就看到突破性的进展。”

从结果看这像是一颗烟雾弹。据Model Card测试数据,Gemini 3成绩几乎全面碾压当前所有主流大模型;在开放评测平台 LMArena 上,Gemini 3 Pro以1501分位居通用模型榜首。

在博士级科学问答GPQA Diamond上,Gemini 3 Pro成绩为91.9%;数学难题集MathArena Apex上创造了最新纪录——23.4%;SimpleQA Verified(强调事实性与复杂问答准确度的测试)成绩是72.1%,这意味着其幻觉率和知识错误率被显著压低;在ARC-AGI-2(推理测试)的成绩为31.1%,而上一代 Gemini 2.5 Pro的该项成绩还不到5%。

Gemini 3在多模态的表现同样令人惊艳。目前,多模态模型上有两项“终极试题”:MMMU-Pro和Video-MMMU,Gemini 3 Pro在这两项的成绩分别为81%和87.6%,创下多模态模型能力历史最高纪录。在Agentic Coding上,Gemini 3 Pro在SWE-Bench Verified的成绩比GPT-5.1和Claude Sonnet 4.5分别仅差0.1%、0.9%。

某种程度上,Gemini 3是谷歌第一款给OpenAI构成实质性威胁的模型——它并非以某一项能力出圈,而是在多模态、推理、Agent这三条最难突破的线路上,全线抵达行业天花板。

谷歌的反攻还不止于在基座模型上“血洗”榜单,还有应用层的全面爆发。正是前者的能力跨越,才为应用页面、交互方式的迭代提供了关键基础。

2022年,ChatGPT把行业带入了小助手式“对话优先”的交互世界。然而,Gemini新版应用不再是单一对话框——用户发出自然语言请求,模型并非直接生成答案,而是即时生成一个结构化的、视觉化的界面,用户可以和AI共同操作。

这也让AI跳出了“小助手”的角色,不再只是在语言层面辅佐用户,而是开始和用户共享一个可操作的工作环境,向着真正的“工作伙伴”发展。据悉,Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews,以及企业级产品。

谷歌如何找回节奏?

谷歌在AI上的爆发,可以说是“后发先至”。2022年11月底,ChatGPT燃爆硅谷后,同年12月6日,谷歌推出了Gemini 1.0。此后,谷歌的AI研发进程一直不温不火。

模型开发滞后之下,OpenAI、Perplexity、Anthropic等对谷歌的搜索市场虎视眈眈。2024年底,谷歌搜索市场份额首次跌破90%。

“大企业病”“掉队”“落伍”曾是外界诟病谷歌的形容词。但谷歌通过对关键技术团队的成功整合,再度找回了自己的研发节奏与产品高度。

2023年4月,谷歌宣布将Google Brain和DeepMind合并,由DeepMind创始人戴米斯·哈萨比斯执掌。此前,两支团队都做出过骄人战绩:Brain创造了Transformer架构,DeepMind则拿出过震惊世界的AlphaGo。

“一山不容二虎”的故事没有在谷歌发生。团队合并后,虽然带头人是哈萨比斯,但Google Brain的联合创始人杰夫·迪恩仍然担任首席科学家。2024年底,在团队的共同努力下,Gemini模型顺利完成了迭代。

接下来,谷歌更力出一孔。到2025年5月,皮查伊在I/O开发者大会上,大胆打破了谷歌搜索的立命之本:“搜索框不重要了,Google要做你的AI助理,直接替你把事办了。”

大会上,谷歌共宣布了23项功能更新,覆盖了AI模型、视觉生产、谷歌搜索、Agent系统、AI眼镜、生态等几乎所有与AI相关的领域。

AI颠覆搜索后,谷歌的野心也被放到了下一代计算平台:其自研了TPU提供底层算力支持;用安卓与Chrome构成交互前台,Workspace承接具体任务执行;YouTube打造流媒体资产,为Gemini在多模态能力上奠定基础。此外,Gmail、Google Docs等成熟应用也逐步被注入AI功能。

Gemini 3的发布会上,谷歌宣布其浏览器AI模式的月活跃用户已达20亿,其中Gemini应用月活用户达6.5亿。皮查伊称:“令人惊叹的是,仅仅两年时间,AI已从单纯处理文本和图像,发展到能够读懂场景。从今天起,Gemini将在谷歌全系产品中全面铺开。”

入口大战开打

谷歌的系统性进击,也意味着AI新入口大战已经打响。AI角逐已从基模大战、技术竞速,转向了关乎下一个10年势力版图的场景落地竞争。

下一代入口在哪里?在移动互联网时代,得流量者胜出。但未来如果把答案扩展到“谁能帮用户解决问题”的效用之争,机会又重新在巨头面前摊平。

某种程度上,谷歌的全栈出击,也是阿里正在尝试“复刻”的道路。周靖人在云栖大会后,对《中国企业家》等媒体表示:阿里云是全球少数几家在大模型和云计算方面都能够做到全栈自研、联合创新的公司。

11月17日,阿里千问App公测版亮相,直接瞄准AI to C入口,计划打造会聊天、能办事的个人AI助手,并整合了阿里全生态的服务能力。次日,蚂蚁集团发布全模态通用AI助手“灵光”,用户可以在30秒内,生成可交互、可编辑、可分享的“闪应用”。这些都昭示着阿里准备抓住“生产力入口”的野心。

在不久前的2025年第三季度财报会上,腾讯集团总裁刘炽平亦明确表示:微信最终将成为一个AI Agent,帮助用户在微信内部完成大量任务。字节豆包则在流量加持下,正在从生态渗透,走向工具赋能,与抖音、剪映深度绑定,将豆包变为字节的生产力引擎。

最近,OpenAI已经将更多目光投向了企业服务与垂直场景落地。今年上半年,OpenAI实现43亿美元营收,其中消费者与企业订阅占据大头。

一位海外文旅开发从业者对《中国企业家》表示:他在使用了国内外多项大模型后,感到GPT-5在上下文理解层面,明显具备优势。“虽然我们海外数据相对匮乏,但因为ChatGPT好用,海外系统反而更容易做。”

不过,靠旧地图未必能拿到新船票。AI时代的赢家,不只属于技术领先者,或者有能力“大水漫灌”的超级App拥有者,更是能理解用户需求、将技术转化为解决问题能力,能将AI与行业场景深度绑定,对AGI有更透彻理解和追求的企业。

(责任编辑:刘芃)

精彩图片