AI巨头2026:Google多模态,OpenAI如何破局?

AI提示词3周前更新 jinlian
11 0

2025年快过完了。回头看这一年,AI圈子变了很多。现在比拼的不是谁的模型厉害,而是技术、商业、基础设施、还有整个生态。这是一场全面竞争。

AI巨头2026:Google多模态,OpenAI如何破局?

Google:在多模态上站稳脚跟

以前,大家觉得Google在AI上不行。但是Gemini 3出来后,评价一下就好了。一份美国用户调查显示,Google在处理图片、视频这类多模态任务上,用户信任度很高。聊天时,60%的人选ChatGPT,不到40%的人用Google。但是,要识别物体、搜图片,用户就会换到Gemini。比如你拍了一张家里的电器照片,问AI这是什么,它能识别出来。或者你让它根据一张图写一段描述,它也能做到。就算Gemini用起来麻烦,用户也愿意选它。这说明Google在这方面确实厉害。

有人担心AI搜索会抢走Google的广告收入。但是测试发现,AI反而让广告赚更多钱。Google在AI搜索里加广告。现在广告不多,100次点击可能只有2次出现AI模式,其中1次广告才显示。但是,这些广告效果很好。点击率和用户停留时间,比以前的搜索广告高了30%-40%。Google不是乱放广告,而是AI让广告更准确,大家更愿意点。它会分析用户的喜好。比如你搜索过很多旅行信息,AI就会推荐机票、酒店广告,这些广告与你的需求更匹配。而且,以前很多搜索内容没法变现,AI大模型可能会把这些变成Google的新收入。这能让Google的广告业务继续增长。

Google在技术研发上也很猛,尤其在做视频和编辑视频方面。它有Imagen、Veo,还有Nano Banana,一步步更新。Nano Banana在图片编辑上展现了实力。有人觉得,Google有大量数据和算力,视频编辑也会像Nano Banana一样,做出一个行业标准。如果Google先把这个能力做成产品,加上它多模态的优势,2026年它在视频和内容创作上会很强。另外,开发者对Google的新产品Antigravity评价也不错。

但是Google也遇到难题。为了打破Google“硬件和软件一起做”(TPU加Gemini)的优势,Oracle、Nvidia、OpenAI正在组成一个“反对Google联盟”。Google的优势是TPU集群连接快,整体优化好。Nvidia为了应对,去年9月买了Enfabrica公司,这家公司专门做高速连接芯片。Nvidia想解决GPU集群连接慢的问题。有人说,Nvidia的芯片方案覆盖整个产业链,而Google的方案比较封闭。所以长远看,Nvidia芯片的效率和成本可能会比Google好。总之,2026年不只是模型竞争。这是“Google体系”和“反对Google联盟”在基础设施、芯片连接、模型上的全面竞争。Nvidia Blackwell架构一旦普及,这种软硬件之争会更激烈。

OpenAI:2026年可能是关键一年

对OpenAI来说,2026年可能是它翻盘的一年。有两种看法。乐观的人觉得,OpenAI在2025年看着没进展,不是技术到头了,而是因为算力不够。去年,CoreWeave和Oracle这些供应商发货慢,OpenAI训练用的算力没怎么增加。但是,2026年这个问题会解决。供应链会顺畅,Nvidia Blackwell架构的算力也会大量上线。OpenAI可能会突破现在的算力限制。而且,OpenAI的用户数(MAU)快9亿了,ChatGPT用户很喜欢用。如果OpenAI以后在广告、电商上努力,它在模型能力和大家评价上都可能反弹。故事会变。

悲观的人认为,OpenAI面临着竞争和赚钱的压力。它为了收入和融资,可能要多做广告和电商。但是,如果OpenAI在产品里放太多广告,可能会影响用户体验。比如你问AI一个学习问题,它却给你推教育机构的广告;或者你想查天气,结果先弹出一个购物链接。因为很多用户查询内容并不能直接赚钱。而且,OpenAI的技术优势在减少,特别是在多模态方面。前面说过,ChatGPT在文本上还行,但是处理图片识别、物体分析时,用户更喜欢用Gemini。用户这种习惯改变,是OpenAI在2026年要面对的大问题。

Anthropic:企业级AI的黑马

预测2026年模型公司时,Anthropic常常被低估。现在大家更关注C端应用。但是,明年企业级AI会全面爆发。有人认为,如果明年Anthropic和OpenAI都发布新模型,可以把更多希望放在Anthropic上。因为Anthropic在企业市场布局早,更懂企业痛点。它的优势不光是模型好,还在于围绕模型搭建的工程能力。去年,Anthropic推出了一些“脚手架”工具,比如10月的Skills功能。这些工具不是比拼参数,而是去解决大模型实际应用中的问题,帮企业更好地用LLM。比如,企业可以用这些工具让大模型更好地理解行业术语,或者在特定业务流程中,让AI的回复更准确、更符合企业规范。

Meta:AI带来广告收入增长

2026年是AI投资回报的关键一年,Meta值得关注。有人说,其他科技公司还没靠AI赚钱,Meta的AI年收入已经能达到600亿美元。Meta去年Q2财报显示,AI让广告效率提高了3-5%。但是市场还没完全看到这点。AI能更精准地找到可能对广告感兴趣的用户。比如,它能识别出用户喜欢看哪些类型的视频、关注哪些话题,然后把相关的广告展示给他们。Meta股价之前因为税务问题受影响,但如果去掉税务因素,每股收益(EPS)是超出预期的。所以现在看,Meta的股票很划算。但是,应用层的竞争也很重要。彭博社说,TikTok在2025年预计赚500亿美元。TikTok在2026年会继续努力,这会直接冲击Google和Meta的广告业务。

Tesla:Robotaxi值得期待,机器人进展慢

对特斯拉的Robotaxi和Optimus机器人,大家看法很不同。对Robotaxi,很多人比较乐观。因为这个商业模式可能行得通。Cybercab(特斯拉的自动驾驶车)成本大约3万美元。有人算过,Uber每英里要2.9美元。Robotaxi如果去掉一些成本,每英里能赚1美元,一辆车一年跑5-6万英里,一年就能回本。这个赚钱速度比传统卖车(一辆车赚2000-3000美元)快得多。而且,FSD(特斯拉的自动驾驶系统)越来越安全。数据显示,新车里30-40%都装了FSD。在奥斯汀测试,FSD跑了50万英里才出7次事故。这个数据已经接近Waymo(8-10万英里出1次事故)和人类驾驶员的安全水平。明年Version 14.3发布,可能会让自动驾驶接管率更低。

但是Optimus人形机器人进展没那么好。大家以前都觉得特斯拉会是机器人领域的领导者,最早推出产品。但是特斯拉坚持要完美,从头开始做,结果在灵巧手等关键硬件上遇到技术难题。比如灵巧手,要做到像人手一样灵活抓取不同形状的物体,需要解决材料、传感器、控制算法等很多细节问题。特斯拉不想用现成的方案,想从零开始做最完美的。而且,中国供应链在硬件更新和成本控制上竞争很厉害。所以,特斯拉机器人现在没有明显领先。甚至短期内可能不是世界第一。这意味着机器人真正投入使用的时间,可能比我们想的要长。

World Model:AI竞争的真正分水岭

2026年,看点是谁能先做出World Model。你可以把它想象成AI在大脑里建了一个真实世界的虚拟模型。如果谁做出来,而且比别人好很多,那么2026或2027年,他会在手机应用、虚拟世界、游戏、机器人、自动驾驶这些领域遥遥领先。因为这些应用都需要理解物理世界、生成视频和多模态能力。World Model是基础。

Meta做World Model的方式很特别,更像人。他们想让AI像人一样进化。现在的大模型(LLM)从文字开始学智能。但是Meta在2025年一直在做Segment Anything(分割万物),它能分割图片,后来还能分割声音、视频。这是因为人不是从文字开始认识世界的,我们先用眼睛看、用耳朵听,区分不同的东西。未来的模型,如果直接输入声音和视觉信息,可能会更接近World Model的本质。

而且,大家对Google在多模态和World Model上的进展也很期待。2026年,关键是看Google能不能推出更好的Veo模型,还有Gemini能不能变成更好的World Model。

AI应用会怎么发展?

AI入口的竞争,是操作系统(OS)公司和超级应用在争夺。Apple和Google这些OS公司有天然的优势,比如合规和权限。它们可以直接在系统里解决隐私和整合问题。因为AI助理不光是聊天,它需要很深的系统权限才能做复杂任务。比如你让AI帮你订餐,它需要知道你的位置,能打开订餐App,完成下单。

另一边是豆包(字节跳动)和智谱代表的“App派”。大公司产品不能直接控制OS,但是它们能做自己的生态。比如豆包今年就在更新产品,拓展场景。而且,大公司在多模态能力上更强。比如,你对手机说“找出我跟哆啦A梦的合影,然后发给妈妈”,AI需要知道照片在哪、识别照片内容、还要调用通讯软件发出去。这要求多模态模型能力很高。而且,大公司还在尝试出AI手机等硬件,想掌握流量。这就像当年移动互联网转型,谁能通过硬件抓住用户,谁的用户多,谁就能建立一个像微信一样强大的生态。

但是,这条路走起来很难。因为没有OS底层权限,这些大公司的方案很无奈。一个办法是用“视障模式”绕过限制,但这个没法大规模用。另一个是“截图模式”,获取屏幕信息,但是这会引起严重的隐私和合规问题。比如App只能截取屏幕信息,它不知道你屏幕背后到底在做什么,隐私风险很大。更严重的是,商业生态互相排斥。手机厂商以前只做“裁判”,赚过路费,态度比较开放。但是互联网大公司既想做“裁判”搭建平台,又自己下场做“运动员”竞争。这让它们很难建立合作共赢的生态。比如,豆包出了AI手机功能后,腾讯和阿里很快就封杀了它。

判断AI应用怎么发展,关键不是看技术,而是看它是不是真的满足用户需求。现在市面上有不少AI应用,比如帮你美团点单、拼多多下单。但是这些功能只是一部分,而且成功率不高。每个步骤完成率可能只有80%,多个步骤加起来,任务成功率就只剩50%了。用户用起来很糟心。所以现在很多产品都专注于提高“端侧效率”,比如帮你安排时间、设置闹钟、整理会议记录,而不是完全替代用户做复杂决策。

但是长远来看,这些功能只是暂时性的。比如会议纪要,只满足了一小部分高端用户。大多数用户的需求是零碎的、即时的。所以,助手产品好不好用,关键看它能不能不断开发出新场景和产品,满足这些零碎需求。从应用形式看,2026年就像2013年移动互联网爆发一样,是个转折点。2012年大家还在说PC上的Pinterest,到了2013、2014年,手机App就大爆发了,旧的说法很快就过时了。2026年也会这样。这不光是AI应用大量出现,更是形态上的巨大变化。有人认为,2026年以后,大家可能就不再提传统的App了。就像现在没人特别强调PC或网页一样。整个行业都会用Agent模式。到时候,你可能不需要打开某个App,直接跟AI说‘帮我订一张下周去上海的火车票’,AI Agent就会自动帮你查询、比价、下单,最后把票发给你。AI手机和Agent服务会很普遍。传统的App各自为政的局面会被打破。

用户想掌控自己的数据和隐私,这推动了端侧AI发展。端侧AI不只是设备功能变多,更像当年从大型机回归到个人电脑一样,计算权力转移了。现在,像ChatGPT这类公司想把用户数据和记忆都锁在云端,这是一种数据垄断。但是,这种垄断也促成了反向趋势:用户想要自己的数据和隐私,会推动市场回到本地设备。具体说,用开源模型和本地记忆的技术,把核心数据和记忆存在本地。用户不再依赖中心化系统。这种优势会给端侧AI带来长期回报。而且,强调本地隐私和能力,也促使硬件升级,特别是存储。在手机供应链里,存储是最不能省成本的部分。即使豆包的AI手机其他配置不很高,但DRAM和NAND的存储必须很大。原因很简单:如果要在本地存隐私数据,或者处理多模态(特别是视频)的缓存,本地存储的需求是硬性的。比如你想让手机上的AI记住你所有的健康数据、家庭照片、视频,它就得在本地有很大的存储空间。尤其是处理4K、8K视频,需要瞬时写入和读取大量数据。所以,端侧AI没有因为云端算力强就降低对终端硬件的要求。相反,它通过隐私计算和多模态应用需求,提高了消费电子设备的硬件标准。

赚钱的AI应用公司会去做模型研发。智谱的财报显示,它在研发上的投入不算高,比国外同行少。以前大家只能猜中国AI底层公司的研发投入。现在看智谱的财报,每年投入大约4亿美元,就能做到智谱的水平。这种研发成本不高的情况,可能会鼓励国外AI应用公司。也就是说,AI应用公司赚到钱后,就有可能去做底层AI研发。以前,应用公司只管用模型,不用管怎么做模型。但是现在,如果自己做模型能让产品更好用,而且成本又可控,它们就会自己去做。比如,Cursor这类AI应用公司,已经从只做应用,转向自己研发AI底层和核心模型。如果Manus的年收入(ARR)能达到1亿美元,它完全可能自己开发大模型。这种“应用公司反过来做底层研发”的趋势,预计2026年前后会更常见。

AI发展的最大瓶颈:基础设施

光通信和互联是算力产业链里涨价最快的环节。2026年,光通信技术需求可能增长3-5倍。光模块虽然不像HBM那么稀缺,但是技术更新会推动它的价值。因为数据量越来越大,服务器之间需要高速传输。以前的电缆不够快,需要光纤。而且,新的光模块技术研发成本也高。2026年有两个地方值得关注。首先是Google的OCS(光路交换)技术。这是一种创新技术,能让数据中心内部数据传输更快。这是明年很值得期待的技术。另一个是Nvidia的下一代集群方案。现在单个GPU卡的算力快到头了,未来竞争看的是集群效率。但是,大型集群的用电量成了大问题。为了解决这个,Nvidia预计明年会推出新的CPU方案。在新集群设计中,光互联技术会大量使用,而且会有很多创新。

存储正在从周期性变成持续增长。有人说,存储正在经历一个大周期,甚至开始持续增长。需求方面,这次不是靠消费电子产品带动,而是由企业级AI的强大需求推动。同时,预训练模型、多模态、长上下文等需求也需要大量存储。有人质疑,压缩技术发展了,存储需求会不会减少?但是,AI需要记住海量信息,比如用户上个月的聊天记录。所以,即使压缩技术在进步,模型公司为了好体验,需要存储的数据量仍然快速增长。特别是视频流,把视频变成Token需要大量DRAM,这导致存储缺口仍然很大。供给方面,行业格局变了。存储厂商们形成了一种默契的合作,都想赚更多钱。它们不再盲目扩产抢市场,也不再只满足消费电子厂商的需求。这种供需不平衡,让手机厂商等消费电子行业很被动。现在市场是“谁出价高谁得货”的竞价模式。手机厂商即使愿意给钱,现在也常常拿不到货,不像以前可以逼着降价。而且,为了让端侧AI保护隐私和处理本地数据,手机对DRAM和NAND的存储容量有硬性要求。所以,只要AI趋势不停止,存储行业会一直是卖方市场。美光等厂商在2026年的业绩增长和价格上涨会很确定,可能持续一整年。

电力会是限制AI发展的最大问题。2026年,算力发展的瓶颈不再是芯片,而是电。Nvidia下一代集群推出后,单卡算力提高,但是用电量也变得很大。如果按现在的速度发展,电力会是AI发展的最大物理瓶颈。这不只是发电量够不够的问题。更深层的是基础设施不匹配。特别是在美国,电网老旧,输电效率低。传输损耗大,而且升级改造需要时间。即使电厂能发出足够的电,也可能因为输电线路不够,无法送到几十个甚至上百个数据中心。这种缺电危机,直接让微电网和储能有了大机会。微电网发电主要靠燃气轮机、光伏和水力,这些能源不太稳定。所以为了让算力中心稳定运行,调峰和储能是必须的。这个趋势也会影响上游大宗商品,特别是铜和锂。锂的需求正在从“电动车时代”转向“储能时代”。现在锂矿和铜矿都在周期底部,加上AI电力需求爆发,预计2026年价格会有很大上涨。宁德时代(CATL)被看作“产业链之王”。虽然最近宁德时代压制锂矿价格,但这更多是短期影响。从长期看,AI对电力的需求是挡不住的。Nvidia等大公司都在开电力相关的会议,这说明电力需求爆发很明确。

AI会先在哪些具体领域落地?

企业级AI会在2026年加快普及。以前大家谈论企业用AI,多是想象。但是今年,Anthropic、OpenAI这些AI实验室,已经在企业场景中做了很多数据准备和模型训练。这些前期投入成熟后,预计2026年会有实际可用的产品出现。特别是在金融、HR、财务这些领域,可能会有成熟的AI产品跑出来,带来实际的业务增长。比如在金融领域,AI可以自动分析海量报告,找出投资机会;在HR,AI可以筛选简历,甚至初步面试。这个趋势给传统SaaS行业带来了大挑战,甚至可能是个分界线。过去五年,传统SaaS软件公司靠预算不断增加,过得很好。但是2026年情况会变。企业的IT预算增长可能会放慢,但是AI会来分这块蛋糕。这意味着,传统SaaS大公司(包括那些市值高的平台公司)会面临风险。它们的预算可能被AI模型和应用分走,甚至被AI取代。对美股的软件公司来说,2026年是它们真正感受到AI竞争和业绩压力的一年。而且,企业落地AI的条件也成熟了。有钱的企业客户在数据整合、系统改造、合规管理上都准备好了。埃森哲这类系统集成商预计明年会和大模型公司更紧密合作,一起推动AI在企业里大规模落地。由AI实验室、系统集成商、企业客户三方一起推动,企业级AI不再是空谈,它会在B端市场带来结构性的增长机会。

AI让预测市场从赌博变成理性的风险对冲。AI和预测市场结合,2026年可能会出现新玩法。以前,体育博彩或彩票,大家觉得是凭感觉赌博,押球队或个人。但是,AI加入预测市场(比如Polymarket)后,它的价值就变了。它从单纯的竞争,变成了风险对冲和辅助决策。一个例子是“对冲生活成本”。比如你预测明天外卖涨价,你可以在预测市场买一个相关的产品。如果有人接单,明天外卖真的涨价了,你虽然多付了饭钱,但是你在预测市场赢了钱(比如赢了5块钱),这正好抵消了多付的钱。这里,AI会用数据分析帮你更准确地预测,甚至自动帮你做这些小的对冲交易。AI可以分析历史数据、新闻、社交媒体情绪,帮你判断某个事件发生的概率,给出更科学的预测。这样一来,预测市场就有了金融属性。它不仅能对冲风险,还能帮你分摊收益,锁定生活成本。这样普通人也能像大机构一样,管理自己的小钱。

2026年,Agent会在支付领域落地。现在市场有很多支付产品。有人认为,2026年Agent会在跨支付、自动化理财、电商等场景落地。这可以分成三类。第一类是自动交易机器人,比如在Polymarket平台上的Agent。用户授权后,Agent的交易和资金操作都在区块链上进行。用户可以确认Agent没问题,而且它还能和其他Agent合作交易。自动交易机器人就像一个帮你盯盘、自动买卖股票或加密货币的智能助手。第二类是电商。Agent可以实现电商的自动化管理,比如跨平台、跨系统的流程合作和数据互通,让运营更高效。电商Agent可以帮你自动比价、凑单,甚至在你睡觉时帮你把购物车里的东西买好。第三类是针对加密货币用户的,比如Agent帮你收集小积分。它自动参加各种奖励活动,帮你找投资机会或赚钱策略。

监管风险与新商业机会

监管和技术发展不匹配,可能会带来一个“黑天鹅”事件,这会产生新的商业角色。2026年有一个大风险。中国的AI大模型备案制度,审批很严格,需要很多测试和高层批准。但是这更像是一次性许可。监管主要在审批前,对模型上线后的管理和事后监管比较弱。比如,公司备案通过后,如果换底层模型、升级版本或调整参数,现在没有严格的实时监控机制。随着AI应用越来越多,产品形式会很多样。在这种宽松的管理下,如果某个热门AI应用输出的内容,涉及敏感政治问题,或者违反社会道德,很可能会被网信办这类监管机构倒查。到时候,行业可能会出现一些大的安全事件,然后引来严厉的行政处罚,甚至上升到刑事责任。

这种风险出现后,会促使行业格局变化,产生新的商业角色。为了解决内容安全问题,以后可能会有国家授权的公司,提供专门的“过滤”或“安全合规”API。这就像一个必须通过的“关卡”。未来的AI应用,可能被强制要求连接这个接口,确保输出内容合法合规。现在看,像蚂蚁或阿里这样市场占有率高,而且有合规技术背景的大公司,最有可能获得这种国家授权。它们会成为AI时代不可缺少的“合规基础设施”提供商。

© 版权声明

相关文章

暂无评论

暂无评论...