树莓派最近出了个新东西,叫AI HAT+ 2扩展板。这是他们第一次专门给树莓派5做这种板子,就是为了跑那种能“生成”东西的AI,比如写文章、画画之类的。这个板子比之前的老款好很多,它有个很厉害的芯片,能让整个系统跑得更快,能做的事情也更多。不只是看图识物那种简单的活儿,它还能干更复杂的事。

AI HAT+ 2 的架构与核心性能
我说实话,这个AI HAT+ 2板子,它的大小是全尺寸HAT+。这意味着什么?就是它能完美装在你的树莓派5上,就像原装的一样。它上面有个叫Hailo-10H的AI芯片。
这个芯片有多强呢?它每秒能算40万亿次(这是8位整数的算法)。听起来很专业对吧?简单说,就是它比以前的板子快很多。以前的AI HAT+,最快也就每秒26万亿次。现在直接翻了快一倍。
所以,如果你想让树莓派跑那种复杂的AI模型,比如现在流行的Transformer模型或者扩散模型,这个板子就非常适合。这些模型需要不停地算,数据量也大,以前的树莓派就吃不消。但是有了这个板子,它就能跑得动了。
而且,这个Hailo-10H芯片是直接通过树莓派5的一个接口(PCIe x1)连上去的。这很重要。你想想,USB接口就像一条窄路,数据过去会堵车。但是PCIe接口就像一条高速公路,数据跑得飞快。这样,树莓派的内存和AI芯片之间,数据交换就很快,延迟也低。
还有,板子上自带了电源管理模块。它能保证AI芯片在全力工作的时候,也能稳定供电。你不用担心树莓派的电不够用。
再说说内存。这个AI HAT+ 2板子,自己带了8GB的专用内存。这么大的内存,就能让它处理更大的AI模型了。以前那种小内存,很多大模型根本装不下。现在有了8GB,Hailo官方说,它能跑那种有60亿个参数的大语言模型(LLM),还有能看图理解的视觉语言模型(VLM)。
什么叫“60亿参数”?你就把AI模型想象成一个非常非常复杂的公式,参数就是公式里的各种数字。数字越多,公式就越复杂,模型就越“聪明”,但同时,它也需要更多的内存和算力。有了8GB内存,就能让这些“聪明”的模型在树莓派上动起来。
这个板子也很好装。它跟树莓派的标准外壳、散热片都能配上,板子自己也送了一个散热片。如果你想让它长时间、高强度地工作,官方建议你再加个风扇,这样它就不会“热晕头”了。
软件方面也不用担心。它能直接用树莓派的官方系统Raspberry Pi OS。而且,Hailo公司也提供了一套完整的软件工具,帮你把AI模型“翻译”成芯片能懂的语言,然后让它跑起来。这就像给你配好了翻译官和司机,你只要把模型交给它就行。
为生成式AI 打造的边缘加速方案
现在说的生成式AI,和我们以前用的那种AI不太一样。传统的AI,比如你拍张照片,它告诉你这是猫是狗,这是识别。生成式AI呢,是能自己创造一些东西。比如你给它几个词,它就能帮你写一首诗;你给它几张图,它能帮你生成一张新的图。
这些生成式AI模型,它们结构很复杂。里面有很多重复的计算,数据量也特别大。而且,它不是算一次就完事儿,它会反复地算一个东西,直到满意为止。所以,它对内存和数据处理的速度要求特别高。
你想想,如果用树莓派的普通CPU去跑这些复杂的生成式AI模型,那它会很慢,还会很费电。就像你用一把普通的小刀去砍大树,不是不行,但是会累死人,效率也低。
所以,我们需要这种专门的AI芯片。它就像一把专门的链锯,就是为了砍大树设计的。这种芯片,它里面有很多小的计算单元,能同时处理很多数据,特别适合算那些8位整数之类的“小数”。这样,它就能又快又省电地完成任务。
而且,这个芯片它离内存很近,数据不用跑很远的路就能到。这就减少了等待时间,让计算效率更高。
但是,想在树莓派上用这些生成式AI模型,还有个小问题。这些模型需要先“翻译”和“压缩”一下,让它们能在这个AI芯片上跑。这个过程叫量化和编译。翻译的时候,还得保证翻译出来的模型效果不能差太多。这需要好的翻译工具。比如,你想让一个外国朋友看懂你的文章,你得找个好翻译,不能把意思搞错了。现在生成式AI技术发展很快,所以,翻译工具也要跟着快点更新才行。
举个例子。比如你有一个AI模型,它能在电脑上帮你写一段话。这个模型可能很大,有很多参数。你想让它在你的树莓派上也能工作。
- 先准备模型:你得拿到那个能写字的AI模型。
- 然后是“翻译”和“压缩”:你需要用Hailo提供的工具,把这个大模型进行“量化”和“编译”。这个过程就是把模型里的数据从大块的、精细的数字,变成小块的、简单一些的数字(比如从32位浮点数变成8位整数)。就像你把一篇很长的文章,精简成一份摘要。同时,这个工具还会把模型调整成Hailo芯片能理解的格式。
- 最后运行:等你把模型“翻译”好了,就可以把它放到AI HAT+ 2扩展板上跑了。当你在树莓派上输入一段文字,让它继续写的时候,AI芯片就会快速计算,然后把写好的文字返回给你。
这个过程听起来有点复杂,但其实Hailo的软件就是来简化这些步骤的。它就像一个自动化的工厂,你把原材料(大模型)扔进去,它帮你处理好,然后输出产品(能在芯片上跑的小模型)。这样,你就能在树莓派上用上原本电脑才能跑的大模型了。
解锁树莓派全新应用场景
AI HAT+ 2出来后,树莓派就能做以前做不到的事情了。以前那些对算力要求高的任务,树莓派跑不动。现在,当大模型能在树莓派上很快地跑起来时,很多新玩法就来了。
比如,你可以在本地让树莓派帮你生成文本。想象一下:
- 写邮件草稿:你给树莓派几个关键词,它就能帮你写封邮件。你不用联网,就能完成。比如你对它说:“帮我写一封感谢信给王老师,感谢他上次的帮助。” 树莓派收到指令后,它会用板子里的AI芯片算一算,然后生成一封完整的感谢信,直接显示在你的屏幕上。
- 创作故事:你给树莓派一个开头,比如“一只猫在月光下散步”,它就能接着写出一段故事。这样你就能用树莓派当你的私人写作助手了。
- 总结会议纪要:你把会议录音转换成文字(下面会说到),然后让树莓派帮你把长长的会议记录总结成几个要点。这能省很多时间。
还有,它可以做语音转文字的预处理。比如你对着树莓派说话,它能把你的声音很快地变成文字。这有什么用呢?
- 本地语音助手:你可以在树莓派上打造一个完全属于你自己的语音助手。你说的话,它在本地处理,不会上传到网上。这就能保护你的隐私。
- 离线翻译:比如你收集了一些外语语音包,让树莓派把它们实时翻译成文字,即使没有网络也能工作。
- 会议录音整理:你开会的时候,用一个接在树莓派上的麦克风录音,然后让树莓派直接把录音转换成文字,形成会议记录。这样,你开完会就能马上拿到文字版的记录,不用再人工整理。
它还能生成图像描述。你给树莓派一张照片,它就能告诉你照片里有什么。
- 盲人助手:你可以用树莓派做一个设备,当盲人朋友拍照时,树莓派能“说”出照片里有什么,比如“照片里有一只金毛犬在草地上玩球”。这能帮助他们更好地“看”世界。
- 图片管理:你有很多照片,但没时间分类。把照片给树莓派,它能自动生成描述,然后你就能根据这些描述来搜索照片了。比如你想找所有“有海滩的照片”,它就能帮你找出来。
再比如,你可以做个多模态智能助手。什么叫多模态?就是它不光能听懂你的话,还能看懂你给的图片。
- 问答机器人:你给树莓派一张图片,然后问它:“这张图里穿红色衣服的人是谁?”它能看图,然后根据信息回答你。
- 智能家居中控:你把家里的摄像头连接到树莓派上。你对树莓派说:“看看厨房里有没有人?”树莓派会调出厨房的视频流,然后分析,如果它看到有人,它会告诉你:“厨房里有人在泡咖啡。”
这些应用,以前我们可能需要依赖云端的服务器才能实现。也就是你的数据需要上传到大公司的服务器,然后服务器处理完再发回给你。这样做,隐私是个问题,而且没有网络就不能用。
但是有了AI HAT+ 2,这些大模型就能在你的树莓派本地运行了。这意味着:
- 隐私更好:你的数据就在你的设备上处理,不会跑到网上。你对数据有完全的掌控权。
- 离线也能用:就算家里断网了,或者你带着树莓派去没有网络的地方,这些AI功能也能正常工作。这对于一些特殊的应用场景,比如野外作业、科研项目,就非常方便。
想象一下,你可以在自己的家里,用树莓派搭建一个完全私有的智能助理。它能听懂你说的话,也能看懂你拍的照片,而且所有的数据处理都在你的家里完成。你不用担心你的数据被别人拿走,也不用担心哪天网络不好就不能用了。这感觉,就像你拥有了一个属于自己的小脑袋,只听你的指挥。
现在,这个树莓派AI HAT+ 2已经开始卖了。如果你对这些新玩法感兴趣,我觉得它很值得一试。毕竟,能把以前那些只有大服务器才能做的事,搬到我们手掌大小的树莓派上,这本身就是一件很酷的事情。