谷歌醒了，新入口大战开打_中国经济网—

段永平：现在市场上的大模型10年后能活下来的不会超过10%。谁会活下来？我会猜Gemini，因为谷歌很强大，而且已经醒了。

文｜《中国企业家》记者王怡洁见习记者孙欣

蛰伏数月，谷歌再度出手甩出王炸——Gemini 3奇袭大模型圈，交出了一张几乎“全A”的模型测试成绩单。

11月19日凌晨，谷歌发布最新一代模型Gemini 3。随后，Gemini 3系列模型在多模态、推理、Agent 等三条大模型主线路的多项国际测试上全面“屠榜”。除了在编程能力测试略逊于GPT-5.1和Claude Sonnet 4.5外，在其他国际主流测试项目上，Gemini 3 Pro得分都是断档的领先。

其中，Humanity's Last Exam （HLE）被认为是衡量AI能否解决人类顶尖难题的试金石，Gemini 3 Pro在此项测试的得分为37.5%。而GPT-5.1、Claude Sonnet 4.5得分分别为26.5%、12.7%。

模型发布后，谷歌美股股价一度上涨5.8%，市值突破3.5万亿美元创历史新高。

OpenAI的CEO山姆·阿尔特曼也罕见对谷歌给予赞赏：“这看起来是一个很棒的模型。”短短一年前，谷歌在举办2024 I/O开发者大会时，阿尔特曼还曾直接嘲讽Gemini产品，甚至对发布会布置提出质疑：“我无法不去思考OpenAI和谷歌之间的美学差异。”

但在今年5月的开发者大会上，谷歌拿出十余种“AI万花筒”产品，能力大幅提升，给了阿尔特曼一记回旋镖。半年后，谷歌再度“炸场”，更表明在多年技术积累之下，谷歌已经重新找回节奏。

“谷歌已不再把自己视为一家搜索公司，而是要成为下一代计算平台的创建者。”谷歌CEO皮查伊今年多次强调。2025年，谷歌的搜索、安卓系统、Chrome浏览器、YouTube、硬件乃至手机等核心业务，都在围绕基座大模型Gemini进行重构。一年高达900亿美元的资本开支以及工程资源，也都向模型供电倾斜。

基座模型迭代之际，谷歌也同步披露了一个关键数据：谷歌浏览器的AI模式月活跃用户已达20亿。这意味着，从模型到应用，谷歌正利用其庞大的生态系统，重新定义AI上的话语权。

谷歌全栈布局的示范效应，也势必将大模型竞争拉到下一高度。近期，国内外围绕入口的争夺也不约而同地打响。OpenAI上线桌面浏览器，同时强势进军搜索功能；阿里千问App近期回归，高调瞄准ChatGPT入局AI to C；字节也在通过豆包探索电商新入口。

几天前，伯克希尔-哈撒韦公司披露的今年三季度持股报告显示：巴菲特在退休前，首次建仓买入了谷歌。

近日，段永平在接受采访时也表示：“现在市场上的大模型很多，10年后能活下来的大概率不会超过10%。大家可以猜猜10年后，大家还在用的主流大模型会是什么？我会猜Gemini，因为背后的谷歌很强大，而且已经醒了。”

模型屠榜，应用升级

Gemini 3发布前，谷歌相当低调。

2025年11月初，皮查伊在公司财报电话会议上谈及Gemini 3时态度谨慎：“前沿大模型的开发需要更多时间，而Gemini 3预计不会让人们立刻就看到突破性的进展。”

从结果看这像是一颗烟雾弹。据Model Card测试数据，Gemini 3成绩几乎全面碾压当前所有主流大模型；在开放评测平台 LMArena 上，Gemini 3 Pro以1501分位居通用模型榜首。

在博士级科学问答GPQA Diamond上，Gemini 3 Pro成绩为91.9%；数学难题集MathArena Apex上创造了最新纪录——23.4%；SimpleQA Verified（强调事实性与复杂问答准确度的测试）成绩是72.1%，这意味着其幻觉率和知识错误率被显著压低；在ARC-AGI-2（推理测试）的成绩为31.1%，而上一代 Gemini 2.5 Pro的该项成绩还不到5%。

Gemini 3在多模态的表现同样令人惊艳。目前，多模态模型上有两项“终极试题”：MMMU-Pro和Video-MMMU，Gemini 3 Pro在这两项的成绩分别为81%和87.6%，创下多模态模型能力历史最高纪录。在Agentic Coding上，Gemini 3 Pro在SWE-Bench Verified的成绩比GPT-5.1和Claude Sonnet 4.5分别仅差0.1%、0.9%。

某种程度上，Gemini 3是谷歌第一款给OpenAI构成实质性威胁的模型——它并非以某一项能力出圈，而是在多模态、推理、Agent这三条最难突破的线路上，全线抵达行业天花板。

谷歌的反攻还不止于在基座模型上“血洗”榜单，还有应用层的全面爆发。正是前者的能力跨越，才为应用页面、交互方式的迭代提供了关键基础。

2022年，ChatGPT把行业带入了小助手式“对话优先”的交互世界。然而，Gemini新版应用不再是单一对话框——用户发出自然语言请求，模型并非直接生成答案，而是即时生成一个结构化的、视觉化的界面，用户可以和AI共同操作。

这也让AI跳出了“小助手”的角色，不再只是在语言层面辅佐用户，而是开始和用户共享一个可操作的工作环境，向着真正的“工作伙伴”发展。据悉，Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews，以及企业级产品。

谷歌如何找回节奏？

谷歌在AI上的爆发，可以说是“后发先至”。2022年11月底，ChatGPT燃爆硅谷后，同年12月6日，谷歌推出了Gemini 1.0。此后，谷歌的AI研发进程一直不温不火。

模型开发滞后之下，OpenAI、Perplexity、Anthropic等对谷歌的搜索市场虎视眈眈。2024年底，谷歌搜索市场份额首次跌破90%。

“大企业病”“掉队”“落伍”曾是外界诟病谷歌的形容词。但谷歌通过对关键技术团队的成功整合，再度找回了自己的研发节奏与产品高度。

2023年4月，谷歌宣布将Google Brain和DeepMind合并，由DeepMind创始人戴米斯·哈萨比斯执掌。此前，两支团队都做出过骄人战绩：Brain创造了Transformer架构，DeepMind则拿出过震惊世界的AlphaGo。

“一山不容二虎”的故事没有在谷歌发生。团队合并后，虽然带头人是哈萨比斯，但Google Brain的联合创始人杰夫·迪恩仍然担任首席科学家。2024年底，在团队的共同努力下，Gemini模型顺利完成了迭代。

接下来，谷歌更力出一孔。到2025年5月，皮查伊在I/O开发者大会上，大胆打破了谷歌搜索的立命之本：“搜索框不重要了，Google要做你的AI助理，直接替你把事办了。”

大会上，谷歌共宣布了23项功能更新，覆盖了AI模型、视觉生产、谷歌搜索、Agent系统、AI眼镜、生态等几乎所有与AI相关的领域。

AI颠覆搜索后，谷歌的野心也被放到了下一代计算平台：其自研了TPU提供底层算力支持；用安卓与Chrome构成交互前台，Workspace承接具体任务执行；YouTube打造流媒体资产，为Gemini在多模态能力上奠定基础。此外，Gmail、Google Docs等成熟应用也逐步被注入AI功能。

Gemini 3的发布会上，谷歌宣布其浏览器AI模式的月活跃用户已达20亿，其中Gemini应用月活用户达6.5亿。皮查伊称：“令人惊叹的是，仅仅两年时间，AI已从单纯处理文本和图像，发展到能够读懂场景。从今天起，Gemini将在谷歌全系产品中全面铺开。”

入口大战开打

谷歌的系统性进击，也意味着AI新入口大战已经打响。AI角逐已从基模大战、技术竞速，转向了关乎下一个10年势力版图的场景落地竞争。

下一代入口在哪里？在移动互联网时代，得流量者胜出。但未来如果把答案扩展到“谁能帮用户解决问题”的效用之争，机会又重新在巨头面前摊平。

某种程度上，谷歌的全栈出击，也是阿里正在尝试“复刻”的道路。周靖人在云栖大会后，对《中国企业家》等媒体表示：阿里云是全球少数几家在大模型和云计算方面都能够做到全栈自研、联合创新的公司。

11月17日，阿里千问App公测版亮相，直接瞄准AI to C入口，计划打造会聊天、能办事的个人AI助手，并整合了阿里全生态的服务能力。次日，蚂蚁集团发布全模态通用AI助手“灵光”，用户可以在30秒内，生成可交互、可编辑、可分享的“闪应用”。这些都昭示着阿里准备抓住“生产力入口”的野心。

在不久前的2025年第三季度财报会上，腾讯集团总裁刘炽平亦明确表示：微信最终将成为一个AI Agent，帮助用户在微信内部完成大量任务。字节豆包则在流量加持下，正在从生态渗透，走向工具赋能，与抖音、剪映深度绑定，将豆包变为字节的生产力引擎。

最近，OpenAI已经将更多目光投向了企业服务与垂直场景落地。今年上半年，OpenAI实现43亿美元营收，其中消费者与企业订阅占据大头。

一位海外文旅开发从业者对《中国企业家》表示：他在使用了国内外多项大模型后，感到GPT-5在上下文理解层面，明显具备优势。“虽然我们海外数据相对匮乏，但因为ChatGPT好用，海外系统反而更容易做。”

不过，靠旧地图未必能拿到新船票。AI时代的赢家，不只属于技术领先者，或者有能力“大水漫灌”的超级App拥有者，更是能理解用户需求、将技术转化为解决问题能力，能将AI与行业场景深度绑定，对AGI有更透彻理解和追求的企业。

（责任编辑：刘芃）