AI巨头2026：Google多模态，OpenAI如何破局？

2025年快过完了。回头看这一年，AI圈子变了很多。现在比拼的不是谁的模型厉害，而是技术、商业、基础设施、还有整个生态。这是一场全面竞争。

Google：在多模态上站稳脚跟

以前，大家觉得Google在AI上不行。但是Gemini 3出来后，评价一下就好了。一份美国用户调查显示，Google在处理图片、视频这类多模态任务上，用户信任度很高。聊天时，60%的人选ChatGPT，不到40%的人用Google。但是，要识别物体、搜图片，用户就会换到Gemini。比如你拍了一张家里的电器照片，问AI这是什么，它能识别出来。或者你让它根据一张图写一段描述，它也能做到。就算Gemini用起来麻烦，用户也愿意选它。这说明Google在这方面确实厉害。

有人担心AI搜索会抢走Google的广告收入。但是测试发现，AI反而让广告赚更多钱。Google在AI搜索里加广告。现在广告不多，100次点击可能只有2次出现AI模式，其中1次广告才显示。但是，这些广告效果很好。点击率和用户停留时间，比以前的搜索广告高了30%-40%。Google不是乱放广告，而是AI让广告更准确，大家更愿意点。它会分析用户的喜好。比如你搜索过很多旅行信息，AI就会推荐机票、酒店广告，这些广告与你的需求更匹配。而且，以前很多搜索内容没法变现，AI大模型可能会把这些变成Google的新收入。这能让Google的广告业务继续增长。

Google在技术研发上也很猛，尤其在做视频和编辑视频方面。它有Imagen、Veo，还有Nano Banana，一步步更新。Nano Banana在图片编辑上展现了实力。有人觉得，Google有大量数据和算力，视频编辑也会像Nano Banana一样，做出一个行业标准。如果Google先把这个能力做成产品，加上它多模态的优势，2026年它在视频和内容创作上会很强。另外，开发者对Google的新产品Antigravity评价也不错。

但是Google也遇到难题。为了打破Google“硬件和软件一起做”（TPU加Gemini）的优势，Oracle、Nvidia、OpenAI正在组成一个“反对Google联盟”。Google的优势是TPU集群连接快，整体优化好。Nvidia为了应对，去年9月买了Enfabrica公司，这家公司专门做高速连接芯片。Nvidia想解决GPU集群连接慢的问题。有人说，Nvidia的芯片方案覆盖整个产业链，而Google的方案比较封闭。所以长远看，Nvidia芯片的效率和成本可能会比Google好。总之，2026年不只是模型竞争。这是“Google体系”和“反对Google联盟”在基础设施、芯片连接、模型上的全面竞争。Nvidia Blackwell架构一旦普及，这种软硬件之争会更激烈。

OpenAI：2026年可能是关键一年

对OpenAI来说，2026年可能是它翻盘的一年。有两种看法。乐观的人觉得，OpenAI在2025年看着没进展，不是技术到头了，而是因为算力不够。去年，CoreWeave和Oracle这些供应商发货慢，OpenAI训练用的算力没怎么增加。但是，2026年这个问题会解决。供应链会顺畅，Nvidia Blackwell架构的算力也会大量上线。OpenAI可能会突破现在的算力限制。而且，OpenAI的用户数（MAU）快9亿了，ChatGPT用户很喜欢用。如果OpenAI以后在广告、电商上努力，它在模型能力和大家评价上都可能反弹。故事会变。

悲观的人认为，OpenAI面临着竞争和赚钱的压力。它为了收入和融资，可能要多做广告和电商。但是，如果OpenAI在产品里放太多广告，可能会影响用户体验。比如你问AI一个学习问题，它却给你推教育机构的广告；或者你想查天气，结果先弹出一个购物链接。因为很多用户查询内容并不能直接赚钱。而且，OpenAI的技术优势在减少，特别是在多模态方面。前面说过，ChatGPT在文本上还行，但是处理图片识别、物体分析时，用户更喜欢用Gemini。用户这种习惯改变，是OpenAI在2026年要面对的大问题。

Anthropic：企业级AI的黑马

预测2026年模型公司时，Anthropic常常被低估。现在大家更关注C端应用。但是，明年企业级AI会全面爆发。有人认为，如果明年Anthropic和OpenAI都发布新模型，可以把更多希望放在Anthropic上。因为Anthropic在企业市场布局早，更懂企业痛点。它的优势不光是模型好，还在于围绕模型搭建的工程能力。去年，Anthropic推出了一些“脚手架”工具，比如10月的Skills功能。这些工具不是比拼参数，而是去解决大模型实际应用中的问题，帮企业更好地用LLM。比如，企业可以用这些工具让大模型更好地理解行业术语，或者在特定业务流程中，让AI的回复更准确、更符合企业规范。

Meta：AI带来广告收入增长

2026年是AI投资回报的关键一年，Meta值得关注。有人说，其他科技公司还没靠AI赚钱，Meta的AI年收入已经能达到600亿美元。Meta去年Q2财报显示，AI让广告效率提高了3-5%。但是市场还没完全看到这点。AI能更精准地找到可能对广告感兴趣的用户。比如，它能识别出用户喜欢看哪些类型的视频、关注哪些话题，然后把相关的广告展示给他们。Meta股价之前因为税务问题受影响，但如果去掉税务因素，每股收益（EPS）是超出预期的。所以现在看，Meta的股票很划算。但是，应用层的竞争也很重要。彭博社说，TikTok在2025年预计赚500亿美元。TikTok在2026年会继续努力，这会直接冲击Google和Meta的广告业务。

Tesla：Robotaxi值得期待，机器人进展慢

对特斯拉的Robotaxi和Optimus机器人，大家看法很不同。对Robotaxi，很多人比较乐观。因为这个商业模式可能行得通。Cybercab（特斯拉的自动驾驶车）成本大约3万美元。有人算过，Uber每英里要2.9美元。Robotaxi如果去掉一些成本，每英里能赚1美元，一辆车一年跑5-6万英里，一年就能回本。这个赚钱速度比传统卖车（一辆车赚2000-3000美元）快得多。而且，FSD（特斯拉的自动驾驶系统）越来越安全。数据显示，新车里30-40%都装了FSD。在奥斯汀测试，FSD跑了50万英里才出7次事故。这个数据已经接近Waymo（8-10万英里出1次事故）和人类驾驶员的安全水平。明年Version 14.3发布，可能会让自动驾驶接管率更低。

但是Optimus人形机器人进展没那么好。大家以前都觉得特斯拉会是机器人领域的领导者，最早推出产品。但是特斯拉坚持要完美，从头开始做，结果在灵巧手等关键硬件上遇到技术难题。比如灵巧手，要做到像人手一样灵活抓取不同形状的物体，需要解决材料、传感器、控制算法等很多细节问题。特斯拉不想用现成的方案，想从零开始做最完美的。而且，中国供应链在硬件更新和成本控制上竞争很厉害。所以，特斯拉机器人现在没有明显领先。甚至短期内可能不是世界第一。这意味着机器人真正投入使用的时间，可能比我们想的要长。

World Model：AI竞争的真正分水岭

2026年，看点是谁能先做出World Model。你可以把它想象成AI在大脑里建了一个真实世界的虚拟模型。如果谁做出来，而且比别人好很多，那么2026或2027年，他会在手机应用、虚拟世界、游戏、机器人、自动驾驶这些领域遥遥领先。因为这些应用都需要理解物理世界、生成视频和多模态能力。World Model是基础。

Meta做World Model的方式很特别，更像人。他们想让AI像人一样进化。现在的大模型（LLM）从文字开始学智能。但是Meta在2025年一直在做Segment Anything（分割万物），它能分割图片，后来还能分割声音、视频。这是因为人不是从文字开始认识世界的，我们先用眼睛看、用耳朵听，区分不同的东西。未来的模型，如果直接输入声音和视觉信息，可能会更接近World Model的本质。

而且，大家对Google在多模态和World Model上的进展也很期待。2026年，关键是看Google能不能推出更好的Veo模型，还有Gemini能不能变成更好的World Model。

AI应用会怎么发展？

AI入口的竞争，是操作系统（OS）公司和超级应用在争夺。Apple和Google这些OS公司有天然的优势，比如合规和权限。它们可以直接在系统里解决隐私和整合问题。因为AI助理不光是聊天，它需要很深的系统权限才能做复杂任务。比如你让AI帮你订餐，它需要知道你的位置，能打开订餐App，完成下单。

另一边是豆包（字节跳动）和智谱代表的“App派”。大公司产品不能直接控制OS，但是它们能做自己的生态。比如豆包今年就在更新产品，拓展场景。而且，大公司在多模态能力上更强。比如，你对手机说“找出我跟哆啦A梦的合影，然后发给妈妈”，AI需要知道照片在哪、识别照片内容、还要调用通讯软件发出去。这要求多模态模型能力很高。而且，大公司还在尝试出AI手机等硬件，想掌握流量。这就像当年移动互联网转型，谁能通过硬件抓住用户，谁的用户多，谁就能建立一个像微信一样强大的生态。

但是，这条路走起来很难。因为没有OS底层权限，这些大公司的方案很无奈。一个办法是用“视障模式”绕过限制，但这个没法大规模用。另一个是“截图模式”，获取屏幕信息，但是这会引起严重的隐私和合规问题。比如App只能截取屏幕信息，它不知道你屏幕背后到底在做什么，隐私风险很大。更严重的是，商业生态互相排斥。手机厂商以前只做“裁判”，赚过路费，态度比较开放。但是互联网大公司既想做“裁判”搭建平台，又自己下场做“运动员”竞争。这让它们很难建立合作共赢的生态。比如，豆包出了AI手机功能后，腾讯和阿里很快就封杀了它。

判断AI应用怎么发展，关键不是看技术，而是看它是不是真的满足用户需求。现在市面上有不少AI应用，比如帮你美团点单、拼多多下单。但是这些功能只是一部分，而且成功率不高。每个步骤完成率可能只有80%，多个步骤加起来，任务成功率就只剩50%了。用户用起来很糟心。所以现在很多产品都专注于提高“端侧效率”，比如帮你安排时间、设置闹钟、整理会议记录，而不是完全替代用户做复杂决策。

但是长远来看，这些功能只是暂时性的。比如会议纪要，只满足了一小部分高端用户。大多数用户的需求是零碎的、即时的。所以，助手产品好不好用，关键看它能不能不断开发出新场景和产品，满足这些零碎需求。从应用形式看，2026年就像2013年移动互联网爆发一样，是个转折点。2012年大家还在说PC上的Pinterest，到了2013、2014年，手机App就大爆发了，旧的说法很快就过时了。2026年也会这样。这不光是AI应用大量出现，更是形态上的巨大变化。有人认为，2026年以后，大家可能就不再提传统的App了。就像现在没人特别强调PC或网页一样。整个行业都会用Agent模式。到时候，你可能不需要打开某个App，直接跟AI说‘帮我订一张下周去上海的火车票’，AI Agent就会自动帮你查询、比价、下单，最后把票发给你。AI手机和Agent服务会很普遍。传统的App各自为政的局面会被打破。

用户想掌控自己的数据和隐私，这推动了端侧AI发展。端侧AI不只是设备功能变多，更像当年从大型机回归到个人电脑一样，计算权力转移了。现在，像ChatGPT这类公司想把用户数据和记忆都锁在云端，这是一种数据垄断。但是，这种垄断也促成了反向趋势：用户想要自己的数据和隐私，会推动市场回到本地设备。具体说，用开源模型和本地记忆的技术，把核心数据和记忆存在本地。用户不再依赖中心化系统。这种优势会给端侧AI带来长期回报。而且，强调本地隐私和能力，也促使硬件升级，特别是存储。在手机供应链里，存储是最不能省成本的部分。即使豆包的AI手机其他配置不很高，但DRAM和NAND的存储必须很大。原因很简单：如果要在本地存隐私数据，或者处理多模态（特别是视频）的缓存，本地存储的需求是硬性的。比如你想让手机上的AI记住你所有的健康数据、家庭照片、视频，它就得在本地有很大的存储空间。尤其是处理4K、8K视频，需要瞬时写入和读取大量数据。所以，端侧AI没有因为云端算力强就降低对终端硬件的要求。相反，它通过隐私计算和多模态应用需求，提高了消费电子设备的硬件标准。

赚钱的AI应用公司会去做模型研发。智谱的财报显示，它在研发上的投入不算高，比国外同行少。以前大家只能猜中国AI底层公司的研发投入。现在看智谱的财报，每年投入大约4亿美元，就能做到智谱的水平。这种研发成本不高的情况，可能会鼓励国外AI应用公司。也就是说，AI应用公司赚到钱后，就有可能去做底层AI研发。以前，应用公司只管用模型，不用管怎么做模型。但是现在，如果自己做模型能让产品更好用，而且成本又可控，它们就会自己去做。比如，Cursor这类AI应用公司，已经从只做应用，转向自己研发AI底层和核心模型。如果Manus的年收入（ARR）能达到1亿美元，它完全可能自己开发大模型。这种“应用公司反过来做底层研发”的趋势，预计2026年前后会更常见。

AI发展的最大瓶颈：基础设施

光通信和互联是算力产业链里涨价最快的环节。2026年，光通信技术需求可能增长3-5倍。光模块虽然不像HBM那么稀缺，但是技术更新会推动它的价值。因为数据量越来越大，服务器之间需要高速传输。以前的电缆不够快，需要光纤。而且，新的光模块技术研发成本也高。2026年有两个地方值得关注。首先是Google的OCS（光路交换）技术。这是一种创新技术，能让数据中心内部数据传输更快。这是明年很值得期待的技术。另一个是Nvidia的下一代集群方案。现在单个GPU卡的算力快到头了，未来竞争看的是集群效率。但是，大型集群的用电量成了大问题。为了解决这个，Nvidia预计明年会推出新的CPU方案。在新集群设计中，光互联技术会大量使用，而且会有很多创新。

存储正在从周期性变成持续增长。有人说，存储正在经历一个大周期，甚至开始持续增长。需求方面，这次不是靠消费电子产品带动，而是由企业级AI的强大需求推动。同时，预训练模型、多模态、长上下文等需求也需要大量存储。有人质疑，压缩技术发展了，存储需求会不会减少？但是，AI需要记住海量信息，比如用户上个月的聊天记录。所以，即使压缩技术在进步，模型公司为了好体验，需要存储的数据量仍然快速增长。特别是视频流，把视频变成Token需要大量DRAM，这导致存储缺口仍然很大。供给方面，行业格局变了。存储厂商们形成了一种默契的合作，都想赚更多钱。它们不再盲目扩产抢市场，也不再只满足消费电子厂商的需求。这种供需不平衡，让手机厂商等消费电子行业很被动。现在市场是“谁出价高谁得货”的竞价模式。手机厂商即使愿意给钱，现在也常常拿不到货，不像以前可以逼着降价。而且，为了让端侧AI保护隐私和处理本地数据，手机对DRAM和NAND的存储容量有硬性要求。所以，只要AI趋势不停止，存储行业会一直是卖方市场。美光等厂商在2026年的业绩增长和价格上涨会很确定，可能持续一整年。

电力会是限制AI发展的最大问题。2026年，算力发展的瓶颈不再是芯片，而是电。Nvidia下一代集群推出后，单卡算力提高，但是用电量也变得很大。如果按现在的速度发展，电力会是AI发展的最大物理瓶颈。这不只是发电量够不够的问题。更深层的是基础设施不匹配。特别是在美国，电网老旧，输电效率低。传输损耗大，而且升级改造需要时间。即使电厂能发出足够的电，也可能因为输电线路不够，无法送到几十个甚至上百个数据中心。这种缺电危机，直接让微电网和储能有了大机会。微电网发电主要靠燃气轮机、光伏和水力，这些能源不太稳定。所以为了让算力中心稳定运行，调峰和储能是必须的。这个趋势也会影响上游大宗商品，特别是铜和锂。锂的需求正在从“电动车时代”转向“储能时代”。现在锂矿和铜矿都在周期底部，加上AI电力需求爆发，预计2026年价格会有很大上涨。宁德时代（CATL）被看作“产业链之王”。虽然最近宁德时代压制锂矿价格，但这更多是短期影响。从长期看，AI对电力的需求是挡不住的。Nvidia等大公司都在开电力相关的会议，这说明电力需求爆发很明确。

AI会先在哪些具体领域落地？

企业级AI会在2026年加快普及。以前大家谈论企业用AI，多是想象。但是今年，Anthropic、OpenAI这些AI实验室，已经在企业场景中做了很多数据准备和模型训练。这些前期投入成熟后，预计2026年会有实际可用的产品出现。特别是在金融、HR、财务这些领域，可能会有成熟的AI产品跑出来，带来实际的业务增长。比如在金融领域，AI可以自动分析海量报告，找出投资机会；在HR，AI可以筛选简历，甚至初步面试。这个趋势给传统SaaS行业带来了大挑战，甚至可能是个分界线。过去五年，传统SaaS软件公司靠预算不断增加，过得很好。但是2026年情况会变。企业的IT预算增长可能会放慢，但是AI会来分这块蛋糕。这意味着，传统SaaS大公司（包括那些市值高的平台公司）会面临风险。它们的预算可能被AI模型和应用分走，甚至被AI取代。对美股的软件公司来说，2026年是它们真正感受到AI竞争和业绩压力的一年。而且，企业落地AI的条件也成熟了。有钱的企业客户在数据整合、系统改造、合规管理上都准备好了。埃森哲这类系统集成商预计明年会和大模型公司更紧密合作，一起推动AI在企业里大规模落地。由AI实验室、系统集成商、企业客户三方一起推动，企业级AI不再是空谈，它会在B端市场带来结构性的增长机会。

AI让预测市场从赌博变成理性的风险对冲。AI和预测市场结合，2026年可能会出现新玩法。以前，体育博彩或彩票，大家觉得是凭感觉赌博，押球队或个人。但是，AI加入预测市场（比如Polymarket）后，它的价值就变了。它从单纯的竞争，变成了风险对冲和辅助决策。一个例子是“对冲生活成本”。比如你预测明天外卖涨价，你可以在预测市场买一个相关的产品。如果有人接单，明天外卖真的涨价了，你虽然多付了饭钱，但是你在预测市场赢了钱（比如赢了5块钱），这正好抵消了多付的钱。这里，AI会用数据分析帮你更准确地预测，甚至自动帮你做这些小的对冲交易。AI可以分析历史数据、新闻、社交媒体情绪，帮你判断某个事件发生的概率，给出更科学的预测。这样一来，预测市场就有了金融属性。它不仅能对冲风险，还能帮你分摊收益，锁定生活成本。这样普通人也能像大机构一样，管理自己的小钱。

2026年，Agent会在支付领域落地。现在市场有很多支付产品。有人认为，2026年Agent会在跨支付、自动化理财、电商等场景落地。这可以分成三类。第一类是自动交易机器人，比如在Polymarket平台上的Agent。用户授权后，Agent的交易和资金操作都在区块链上进行。用户可以确认Agent没问题，而且它还能和其他Agent合作交易。自动交易机器人就像一个帮你盯盘、自动买卖股票或加密货币的智能助手。第二类是电商。Agent可以实现电商的自动化管理，比如跨平台、跨系统的流程合作和数据互通，让运营更高效。电商Agent可以帮你自动比价、凑单，甚至在你睡觉时帮你把购物车里的东西买好。第三类是针对加密货币用户的，比如Agent帮你收集小积分。它自动参加各种奖励活动，帮你找投资机会或赚钱策略。

监管风险与新商业机会

监管和技术发展不匹配，可能会带来一个“黑天鹅”事件，这会产生新的商业角色。2026年有一个大风险。中国的AI大模型备案制度，审批很严格，需要很多测试和高层批准。但是这更像是一次性许可。监管主要在审批前，对模型上线后的管理和事后监管比较弱。比如，公司备案通过后，如果换底层模型、升级版本或调整参数，现在没有严格的实时监控机制。随着AI应用越来越多，产品形式会很多样。在这种宽松的管理下，如果某个热门AI应用输出的内容，涉及敏感政治问题，或者违反社会道德，很可能会被网信办这类监管机构倒查。到时候，行业可能会出现一些大的安全事件，然后引来严厉的行政处罚，甚至上升到刑事责任。

这种风险出现后，会促使行业格局变化，产生新的商业角色。为了解决内容安全问题，以后可能会有国家授权的公司，提供专门的“过滤”或“安全合规”API。这就像一个必须通过的“关卡”。未来的AI应用，可能被强制要求连接这个接口，确保输出内容合法合规。现在看，像蚂蚁或阿里这样市场占有率高，而且有合规技术背景的大公司，最有可能获得这种国家授权。它们会成为AI时代不可缺少的“合规基础设施”提供商。

# AI提示词