智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影
大模型这把火,已经烧到了个人终端,尤其是与我们生活、工作相关的个人电脑。
进入2024年,大模型产业的竞争焦点已经从卷参数、卷性能延伸到商业落地,各类AI应用、工具迸发,让用户对于大模型的感知更强。
大模型产业中,对各类终端设备交互范式产生的颠覆性影响正在扩大,一方面,有企业继续在提高通用大模型能力之路上极速狂奔,另一方面,有企业开始探索大模型在终端设备上部署的可能性。各路手机玩家布局大模型技术,智能助手体验被颠覆;车圈自研大模型批量上车,重新定义智能座舱体验;还有智能家居、机器人、芯片等赛道的厂商也正加速进场……
而PC作为医疗、教育、制造等各行各业的超强生产力工具,插上大模型翅膀后,很可能将掀起一场生产力工具革命。
就在昨天,PC行业的领导者——联想集团发布了2023/24财年第三季度财报。财报显示,联想集团第三财季营收1136亿人民币,同比增长3%,净利润近26亿人民币,盈利能力连续两个季度环比提升。随之该公司同期发布了一支硬核科普视频,揭秘了联想AI PC的独创性。
视频通过炫酷的手法,对AI PC进行了环环相扣的讲解,以三维动画、立体感分镜、平面分镜等手法,对联想自研的AI OS生态和AI芯片TAC进行了真实呈现,并清晰地科普了大模型压缩、知识蒸馏、向量化等前沿技术。
2024年,生产力工具革命浪潮来袭,迎来AI For YOU的时代,联想集团正在为AI PC产业探索一种全新的可能。
一、大模型走向终端,AI PC天然适配
从最初以聊天机器人的形态出现,到现在基于大模型能力打造的产品和工具已经逐渐向更实用的生产力工具转型。
个人用户将这些产品融入自己日常生活、工作的同时,其需求也更加深入且细分,需要更符合自己使用习惯的个人大模型。
这些需求端的诸多变化趋势正在倒推大模型产业变革。大模型不再唯超大规模参数论,通过压缩技术让大模型保持性能稳定的同时,减小模型的大小和计算复杂度,使其更易部署。
当大模型能够部署到端侧设备后,有一个疑问浮出水面,如何让大模型的能力与用户的个性化需求更加契合。
PC设备脱颖而出,在交互方式、终端算力、本地存储能力方面的优势,使得这一终端设备成为AI技术惠及每一个人的重要途径。
首先,大模型驱动人机交互方式变革,可以对语音、文字、图像、视频实现高质量的识别和理解,从而使得人机交互的方式更加自然、智能且高效。与此同时,PC可连接更多外接终端,是多种交互方式的核心,未来体验会更加丰富。
其次,PC更适合大模型相应创作能力的呈现,从最初的大语言模型到多模态大模型,其生成的内容已经从单纯的文字向图片、视频、音频甚至于3D动画延伸。
最后就是算力与数据。PC是个人终端设备中最强的算力产品,也更适合用户存储个人数据、文件,因此其可以支持大模型计算、保护用户数据安全。
综上可以看出,PC与大模型的特征有着天然适配性。
二、生产力工具革命,AI PC五大核心特征
AI PC的出现,正在进一步放大PC的生产力工具属性。
首先要回答一个最本质的问题:AI PC是什么?联想集团董事长兼CEO杨元庆给出了AI PC的五大特征,相比于传统PC,AI PC拥有更强的运算能力、更大的存储空间、压缩了体积但不减性能的大模型、完整的AI应用生态、安全和隐私保护。
前三者关乎基础软硬件设施,也就是PC上能够运行经过压缩和性能优化的个人大模型,包括CPU、GPU、NPU在内的异构计算,以及容纳用户个人数据并形成的本地知识库。
后两者则更考验PC厂商的生态建设能力,让AI PC能够拥有更加丰富的自然语言交互形式,不止于文字、语音、手势交互。最后就是让AI PC更可靠,让用户的数据更安全。
基于此,未来PC既能承载通用大模型的能力,还可以独立运行专属于用户的个人大模型,成为更实用的工具。而这背后,其实面临着诸多挑战。
AI PC既要实现对超大规模参数模型压缩,还要保证PC可用、维持性能稳定。
在压缩后的大模型之上,AI PC要为用户打造自己的个人大模型,保持对用户使用习惯、数据等内容的持续学习与训练,还要有强大的算力以及存储空间去支持这些数据的训练与存储。
更为关键的是个人数据隐私和安全问题,PC与用户日常生活、工作连接十分紧密,因此对于用户数据安全保护的要求也将实现跨越式提升。
而现在,随着这些技术难点被攻克,AI PC将为生产力工具带来革命性的改变。
三、深度解析联想AI PC独创性背后的黑科技
联想集团展示的这台厚度仅有不到2cm的AI PC里,到底藏着多少黑科技?
视频使用三维动画,以建模特效还原了AI PC独创性背后的技术点,这台AI PC被立体化地拆解,我们可以看到,AI PC的根基就是强大的异构计算能力,高性能CPU、GPU、NPU形成了运转大模型的初步硬件架构。
在硬件架构之上,如何实现PC可驾驭的大模型?其实,超大参数规模的模型装进PC很难,当用一组数字去量化时,我们发现,OpenAI此前发布的大模型GPT-3.5参数规模为1750亿,预计占用内存超过330GB。
解决这一难题的答案是知识蒸馏,视频中通过平面分镜的手法,以拓扑图的形式对知识蒸馏的模型技术进行了可视化科普。
可以看到,知识蒸馏就是用大模型的监督信息,来训练轻量化小模型,从而让模型在参数规模较小的情况下获得更好的性能和精度。这之中,成熟的大模型就是“教师”,PC中部署的本地大模型就是“学生”。
这样一来,大模型的参数规模能从1750亿压缩到70亿,个人大模型装在硬盘中只需要占用4到5GB的空间。
PC中的大模型已经就绪,下一步就是如何让其更好地为用户所用,为每个人量身定制超强性能的生产力工具。
视频中运用立体感分镜庞大词云演示了如何通过向量化技术打造本地知识库,当用户授权置入后,个人的文档、PPT、PDF、日程表等涉及个人习惯的信息就会被存储到本地知识库中。
这些知识通过向量化被转变为可以被AI计算的形态,然后进行存储。当用户提出需求后,个人大模型也会将相应需求进行向量化,并在本地知识库中查询、匹配相似度最高的片段。个人大模型提取出相关文本块后,会根据用户的提示词,再结合大模型的生成、理解能力输出答案。
除了部署智能算力、个人大模型本地知识库这两个软硬件支撑外,联想集团自主研发的AI OS,是整台电脑的生态入口,能调用本地文档,调控数百个隐藏的系统、硬件设置等完成用户更个性化的需求。
联想集团打破了AI领域知识仅由模型主宰的格局,让AI在PC领域从“通用”回归“个人”,真正实现“千人千面”。
当用户与AI OS交互对话时,比如:“感觉电脑打游戏觉得不够流畅不够快,怎么办?”,AI OS会识别这一需求中涉及的关键词,然后理解用户想要适配游戏场景的相关设置,弹出“开启野兽模式”的设置选项。
值得注意的是,大模型的每一次响应需求、每一次学习都会占据大量系统功率,这就需要AI PC智能化调度、分配系统功率让用户的使用体验更好。
对于这些难题,联想集团的自研AI芯片TAC(Trusted AI Controller)就是关键,视频中通过绚丽流畅的三维动画,展现了TAC辅助调度算力分配并释放高性能的实力。
TAC与PC上的所有硬件相连接,并将这些硬件的状态传输给AI OS。正如视频所展示的,这些状态经过AI OS的理解,就会对应识别到具体是会议、游戏、学习等某一种使用场景。
基于不同的场景和任务识别调配多种模型,在这之中,TAC会将能耗压力精准分流,让CPU、GPU、NPU等算力芯片实现合理运行,保证AI PC的可持续性高效运转。
这块芯片不仅是支撑效率、功耗性能发挥到最大化的基础,还会成为用户个人数据保护的强大守卫。
TAC会将用户个人文件中用户的文件、使用习惯等信息通过密钥加密,并将密钥封存在芯片的ROM中独立供电,有效防止数据的外泄及被恶意攻击。
最后,联想AI PC独创性地将软件、硬件和生态相结合,提供的落地方案使其首次在个人终端上实现,层层黑科技使得我们看到个人人工智能双胞胎(Personal AI Twin)即将成为现实。
结语:AI PC颠覆个人智能终端
AI PC正在蓬勃生长,即将迎来落地的时刻。AI对用户而言,将不再津津乐道的话题,而是切实可用的工具。
正如联想集团科普视频中提到的,39年前PC走上历史舞台后,承载了几乎每一次数字世界的技术变革,39年后的今天,AI PC也可能即将成为人类与数字世界交互的最佳方案之一。
这一次的AI PC,既是突破,也是回归。面临生产力工具重大变革的时刻,联想集团作为PC行业的领航者,将人工智能的颠覆性力量带到了每个用户的终端,以AI PC,让每个人实现AI普惠。