聊天的AI,现在基本就这样了。技术还会更新,但是牌桌上的人已经坐满了。
OpenAI的GPT-5在8月出来了。它把以前所有功能都塞进一个模型里。用起来是方便了,你不用再切来切去。官方说它胡说八道的问题改好了很多。复杂的问题也能想得更明白。我用下来的感觉是,它确实稳重了。但是,没有那种从GPT-3到4的惊喜感。你跟它聊得久一点,它还是会忘掉前面的内容。

1. 聊天类AI
然后是谷歌的Gemini。谷歌不跟别人单挑技术。它直接用自己的全部产品来推Gemini。你在Gmail里写邮件,Gemini能帮你写。你在谷歌相册里找照片,Gemini能帮你找。它就在你用的所有谷歌工具里,你躲都躲不开。它的Gemini 3 Pro模型,在一些科学问题上,比其他模型都强。有些程序员觉得它在某些编程任务上,直接让别的工具没法玩了。
再就是Claude。这个工具很偏科。但是它在编程方面做得最好。程序员现在很喜欢用它。因为它写代码很厉害,而且能记住很长的代码逻辑,不会写到后面忘了前面。但是它也有个毛病,就是太小心了。有时候你问一个很正常的问题,它都拒绝回答。这点很烦人。
现在就是这三家最强。短期内不会有第四家了。因为训练一个新模型的成本太高了。听说GPT-5的训练费就接近10亿美金。这个钱,小公司根本拿不出来。所以这个游戏,以后就是巨头的战场。
2. 图像和视频AI
现在网上看到好看的图和视频,你都得先怀疑一下。很可能是AI做的。AI视频工具的市场增长很快。这说明它不再是少数人的玩具,很多人开始用它来工作了。
Sora 2的视频质量很高。看起来就像电影一样。那个篮球弹跳的演示视频,跟真的一样。但是用起来很麻烦。生成视频又贵又慢。免费用户一天只能用6次,根本不够。
Runway解决了一个大问题。就是视频里的人物能保持一致。这对拍广告的人很有用。他们需要同一个角色出现在不同的镜头里,而且样子不能变。Runway正好能做到这点。
Pika用起来很简单。你想做一个动画。先给它一张开始的图,再给一张结束的图。它就能自动生成中间的过渡动画。用它做社交媒体上的短视频,很快。
Midjourney V7还是搞艺术创作的首选。它画画有自己的风格。而且现在画人手,也不像以前那么奇怪了。据说Meta公司都想跟它合作。
Flux是开源的。它的好处是你可以自己控制很多细节。而且它在图片里生成文字,效果比很多工具都好,字是正的,不是歪的。
但是2025年最厉害的,是谷歌的Nano Banana Pro。它11月才出来。一出来就很强。它能生成4K分辨率的图。图里的文字也是对的,不是乱码。它最厉害的地方,是能连接谷歌搜索。这样就能保证图里的信息是真的。比如你要一张“下雨天的埃菲尔铁塔”的图,它不会给你画成晴天。
而且,谷歌把自己的工具都连起来了。这是它的工作原理:第一步,你用Nano Banana Pro生成一张静态图。第二步,你把这张图导入谷歌另一个视频工具Veo。第三步,Veo能把这张静态图变成动态视频。整个流程都在谷歌内部完成,很顺畅。
所以现在分工很清楚了。
想做电影级视频,用Sora。
想做广告,用Runway。
想做短视频,用Pika。
想搞艺术创作,用Midjourney。
想自己控制所有细节,用开源的Flux。
如果你用很多谷歌工具,那就用Nano Banana Pro,它能跟所有工具配合。
3. AI编程
很多人还在讨论哪个聊天AI更聪明。但AI编程这个领域,已经在悄悄赚钱了。程序员手写代码的工作,正在被快速代替。
Cursor是一个很猛的新工具。它为什么厉害?因为它不是一个插件。它是一个全新的编程工具。整个工具就是为AI辅助写代码设计的。它的年营收已经超过10亿美金。这说明程序员很喜欢它,愿意为它付钱。
GitHub Copilot还是大公司里的首选。它有超过5万个企业客户。因为它和程序员最常用的网站GitHub绑在一起,用起来很方便。
有些程序员不喜欢图形界面。他们喜欢用黑色的命令行窗口。Claude Code就是为他们做的。你可以在终端里直接跟它对话,让它帮你写代码或者改代码。
Devin更像一个全能的AI工程师。它不光能写代码,还能帮你找代码里的问题,告诉你哪里效率低。
AI编程的出现,没有让程序员失业。但是程序员的工作内容变了。现在的工作流程是这样的:第一步,你告诉AI你想实现什么功能。第二步,AI帮你写出第一版代码。第三步,你来检查和修改AI写的代码。AI就像一个速度很快的实习生,它负责干活。但你,也就是程序员,是那个最终拍板和负责的人。AI写的函数可能有bug,你就要找出这个bug,然后修复它。所以,程序员现在更像一个项目经理,而不是一个打字员。
4. 自动驾驶
自动驾驶喊了很多年。每年都说要来了,但每年都还没来。
特斯拉的FSD最爱出风头。新版本确实变聪明了。在路上开得更像真人了。但是它的争议也很大。马斯克很会宣传,他让你觉得明天就能实现完全自动驾驶。但实际上还有很多问题。
Waymo在美国慢慢发展。它很稳。是现在全球唯一敢把车上的安全员去掉的公司。这说明它的技术很可靠。但是它太依赖高精地图了。只能在几个固定的城市里跑。扩展速度很慢。
百度的萝卜快跑在中国已经能赚钱了。尤其是在武汉。它的车开得很小心。为了保证绝对安全,有时候在路口会很犹豫,像个新手司机。但是在武汉那种复杂的交通里能正常开,已经很不错了。
华为的自动驾驶很强。它的技术上已经能做到L3级了。但是华为很聪明。它在宣传上说,如果出了交通事故,还是按照L2级来处理。这是什么意思呢?就是说,技术是L3的,但责任还是L2的。车主还是要负责。这样华为就避免了很多麻烦。
小鹏、理想和小米这些公司,都在搞“端到端大模型”。小鹏的车开得很大胆,有时候变道比老司机还果断。理想靠这个技术补上了自己的短板。小米有自己的手机和家电,它的车能收集更多数据,追赶速度也很快。
5. 中国AI
很多人对中国AI的印象,还停留在DeepSeek拿了世界第一。但那已经是去年的事了。
DeepSeek在12月发布了新模型V3.2-Speciale。这个模型在一些地方比GPT-5还强。它还在国际数学奥林匹克竞赛上拿了金牌。这是实打实的成绩,不是刷分。而且它用起来很便宜。很多国外的程序员也开始用了。
阿里的通义千问,用户增长很快。它的手机APP,一个月用户就多了149%。模型也很大,参数超过一万亿。他们的团队还在一个世界顶级的学术会议上,拿了最佳论文奖。这说明中国AI不光有市场,还有自己的研究能力。
中国AI现在有个大问题。就是缺高端的芯片。但是这个问题,也逼着中国的公司想别的办法。比如,他们花更多精力去优化算法,提高训练效率。用有限的资源做出更好的模型。所以短期内,中国AI还是很有竞争力。
总的来说,2025年,AI的热潮第一阶段结束了。现在进入了第二阶段。大家不再追求做一个“什么都能干”的通用工具。而是开始在各自的领域里,做得更深,更专业。就像当年的互联网一样,最早都是想做门户网站,后来分化成了专门做搜索的谷歌,专门做社交的Facebook。AI现在也走到了这个十字路口。