产业新闻

高通的「圣杯」：生成式人工智能即将进入手机领域

2023-09-15

新浪VR

　　虽然ChatGPT和Midjourney等生成式人工智能工具彻底颠覆了行业，令人眼花缭乱，但其使用场景大多仅限于台式电脑上的浏览器窗口。明年，一旦内置高通顶级芯片的高端手机推出，用户将能够随时随地使用生成式人工智能。

　　高通作为全球知名科技巨头，其在芯片领域的能力可谓无敌，近期有消息称该公司希望其下一代Snapdragon芯片能够使用人工智能，而不仅仅是改善相机镜头。

　　多年来，手机一直在使用人工智能来润色照片并改进自动更正功能，但生成式人工智能工具可以将移动体验提升到新的水平。高通正在将生成式人工智能构建到其下一代高端芯片中，据悉，该芯片将于10月底在夏威夷举行的年度高通峰会上首次亮相。

　　峰会与会者将亲身体验生成式人工智能将给手机带来什么，但高通产品管理高级副总裁Ziad Asghar向CNET描述了为什么用户应该对设备上的人工智能感到兴奋。“我认为这是一座里程碑意义的圣杯，”Asghar说：“我们对这项技术的发展前景感到非常兴奋。”

　　显然相比于电脑来说，在移动设备上使用生成式人工智能还有其他优势。最重要的是，搜索的查询和个人数据都是保密的，不会通过远程服务器转发。使用本地人工智能也比等待云计算更快，而且它可以在飞机旅行或其他缺乏手机服务的地区工作。

　　同时移动设备上的生成式人工智能解决方案也具有极高的商业意义。正如高通在上个月发布的白皮书中所解释的那样，随着机器学习模型变得越来越复杂（从数十万个参数到数十亿个参数，阿斯加尔说），运行回答查询的服务器的成本越来越高。早在4月份，OpenAI估计每天要花费大约70万美元让ChatGPT顺利运行，并且成本预测是基于旧的GPT-3模型，而不是更复杂且维护成本可能更高的新GPT-4来进行的。

　　但是高通的解决方案不需要整个服务器场，而是让设备现有的硅大脑完成所需的所有思考，而无需额外成本。

　　Techsponential分析师阿维·格林加特（Avi Greengart）通过电子邮件告诉CNET：“在手机上运行人工智能实际上是免费的——你预先为计算能力付费。”

　　当芯片制造商在2月份的世界移动大会上展示高通的设备端生成人工智能时，Greengart看到了它的实际应用，使用搭载Snapdragon 8 Gen 2的Android手机运行图像生成软件Stable Diffusion。尽管是早期演示，但他发现它“非常令人兴奋”。

　　如果说高通对人们可以利用基于手机的生成式人工智能做什么有一些想法，那么或许从改善生产力任务到观看娱乐节目再到创建内容的种种同样可以为公众展示。

　　Asghar说，正如稳定扩散演示所展示的那样，设备上的生成式人工智能可以让人们根据命令调整图像，比如要求它改变背景，让你站在威尼斯运河前。或者他们可以让它生成一个全新的图像——但这只是开始，因为文本和视觉大型学习模型可以连续工作，从一个想法流向准备好的输出。

　　另外使用多个模型，可以通过自动语音识别将其语音翻译成文本，然后将其输入图像生成器。比如更进一步，让手机渲染一个人的脸，它使用生成式人工智能做出逼真的嘴巴动作和文本到语音转换来对用户说话，然后，就拥有了一个生成式人工智能驱动的虚拟助手，可以进行充分的对话。

　　这个具体示例可以部分由第三方人工智能提供支持，例如Facebook母公司Meta最近与微软和高通合作推出的大型语言模型Llama 2。

　　高通在当时的新闻稿中表示：“Llama 2将允许客户、合作伙伴和开发人员构建用例，例如智能虚拟助手、生产力应用程序、内容创建工具、娱乐等。这些新的设备端人工智能体验由Snapdragon提供支持，可以在没有连接的区域甚至在飞行模式下工作。”

　　另外，有消息称高通不会将这些功能限制在手机上。在即将举行的峰会上，该公司还计划宣布针对PC和汽车的生成式人工智能解决方案。该私人助理可以帮助用户列出待办事项、安排会议和发送电子邮件。Asghar说，如果用户被困在办公室外需要做演示，人工智能可以生成一个新的背景，这样就不会看起来像坐在车里打开幻灯片。

　　“对于我们这些看着《霹雳游侠》长大的人来说，KITT现在将成为现实，”Asghar说道，他指的是电视节目中标志性的智能汽车。

　　无论平台如何，核心的生成式人工智能解决方案都将存在于设备上。它可以帮助处理办公室的繁忙工作，比如自动从通话中生成笔记，并创建一个五张幻灯片来总结其要点，或者它可以在AR和VR中从头开始构建数字世界。

　　除了虚拟世界之外，生成式人工智能还可以帮助盲人探索现实世界。Asghar描述了一种情况，图像到3D图像到文本到语音模型的切换可以使用手机的摄像头来识别用户何时位于十字路口，并通知他们何时停车以及有多少辆车。从哪些方向来。

　　在教育方面，生成式人工智能可以通过使用网络摄像头或手机摄像头跟踪学生的表情和肢体语言来衡量学生吸收教学课程的情况。Asghar推测，生成式人工智能可以根据每个学生的优势和劣势定制材料。

　　这些都是高通的预测，但第三方必须决定如何最好地利用该技术来改进自己的产品和服务。Techsponential的Greengart表示，对于手机而言，生成式人工智能一旦与移动应用程序集成，可提供更加定制化的游戏体验、社交媒体和内容创建，就会产生真正的影响。

　　在应用程序制造商拥有生成式人工智能技术来修补并集成到他们的应用程序之前，很难判断这对用户意味着什么。根据人工智能目前如何帮助人们来推断它可以做什么更容易。Recon Analytics分析师罗杰·恩特纳（Roger Entner）预测，生成式人工智能将有助于修复次优照片中的缺陷，为社交媒体生成过滤器，并改进自动更正——目前存在的问题。

　　恩特纳通过电子邮件告诉CNET：“生成式人工智能带来了使用质量的提高，很快我们就会认为这是理所当然的。”

　　当前的生成式人工智能解决方案依赖大型服务器群来大规模回答查询，但高通相信其设备上的芯片可以满足单用户需求。在Asghar的实验室中，该公司的芯片处理具有70亿个参数（评估数据并改变其输出的基调或准确性的方面）的AI模型，这远远低于为ChatGPT提供支持的OpenAI GPT-3模型的1750亿个参数，但应该适合移动搜索。

　　“我们实际上将能够在夏威夷峰会上展示在该设备上运行，”Asghar说。

　　该演示设备可能会搭载高通的下一款顶级芯片，可能是Snapdragon 8 Gen 3，最终将出现在明年的高端Android手机中。在MWC 2023上运行Stable Diffusion的演示设备使用的是去年夏威夷Snapdragon峰会上宣布的Snapdragon 8 Gen 2。

　　在手机只能续航一整天才需要充电的时代，人们还担心全天召唤生成人工智能精灵是否会更快耗尽电池电量。但必须等待现实世界的测试才能了解手机如何实施和优化该技术，不过Asghar指出，MWC 2023演示整天都在为与会者运行查询，并且没有耗尽电池，甚至摸起来也没有发热。他认为高通的芯片具有独特的能力，生成式人工智能主要运行在Snapdragon芯片组的Hexagon处理器和神经处理单元上，并且具有“非常好的功耗”。

　　“我认为那些没有专用硬件来进行此处理的人将会感到担忧，”Asghar说。

　　Asghar相信，明年搭载高通芯片的高端Android手机将能够使用生成式人工智能。但这种技术还需要一段时间才能渗透到更便宜的手机上。就像在当前的手机上，用于清理图像、音频和视频的人工智能辅助功能最好位于产品阵容的顶部，而对于更便宜的手机来说效果较差，生成式人工智能功能将越少（但仍然存在）。

　　与5G一样，高通可能是第一个采用生成式人工智能新技术的公司，但它不会是最后一个。苹果一直在悄悄改进其设备上的人工智能，软件高级副总裁克雷格·费德里吉（Craig Federighi）在全球开发者大会后的一次聊天中指出，他们更换了更强大的转换器语言模型以改进自动更正。据报道，苹果甚至在内部测试自己的“Apple GPT”聊天机器人。据称，这家科技巨头正在开发自己的框架来创建大型语言模型，以便在人工智能领域展开竞争。自OpenAI于2022年底向公众发布ChatGPT以来，人工智能领域的竞争一直在升温。

　　苹果的人工智能可能会与谷歌的巴德人工智能和微软的必应人工智能展开竞争，这两家公司今年都发布了有限的版本进行公开测试。这些遵循更传统的生成人工智能增强软件的“智能聊天机器人”模型，但它们有可能通过应用程序到达手机或通过网络浏览器访问。谷歌和微软都已经将生成式人工智能集成到他们的生产力平台中，因此用户可能会首先在移动版本的谷歌文档或微软Office中看到他们的成果。