中国国家创新与发展战略研究会

吕本富：端侧模型，AI创新的新赛道

2024-06-11

来源：环球网

随着人工智能（AI）技术的快速发展，大模型的竞争正在从技术驱动过渡到市场驱动。在这一背景下，2024年以来，全球主流大模型间的比拼有两个要点。一是重要产品发布，OpenAI等企业的重大发布吸引全球目光；二是关注大规模产业应用和成本控制。

成本是商业考量的第一要义，OpenAI目前已经4次降价，国内头部互联网企业的主力模型也不得不大幅降价或将全面免费。数字经济的发展经历表明，平台型通用技术一旦形成，市场会快速进入“马太效应”，形成一家独大或几家垄断的局面。当然AI+对人类社会的塑造，绝不仅仅生成式大语言模型这一个赛道。

5月22日，在欧洲最大的科技盛会“欧洲科技创新展览会”（Viva Technology）上，来自中国的百度和荣耀分别阐述了大模型的新赛道——“超级应用和端侧模型”，引起了大会的关注。其中，荣耀CEO赵明认为，基于手机端的AI模型能承载生活娱乐、工作、学习等多个场景，具备在知识问答、文字扩写、表格生成、编写代码、图像处理，实现图像填充、实时语音翻译、智能助手、面部识别解锁等多项功能。手机使用频率最高，使用时间最长，因此在AI的落地竞赛中，将处于最有利的位置。

大模型的参数规模正在快速增长，约每18个月时间会增长40倍。现在生成式大模型的计算和推理都在云端进行，大模型参数和使用量的成倍增长带来巨大计算推理压力，当数十亿用户都日常使用生成式AI时，云端模式显然难以支持生成式AI的规模化扩展。过大参数也造成了在开发及使用过程中的成本高企，在一定程度上限制了AI应用的拓展和变现。因此，需要针对应用场景的小参数模型。

相比之下，端侧模型通常不需要依赖云端服务器的计算资源，可以减少云端计算的成本，并且在没有网络连接的情况下也能工作。随着生成式AI模型使用量和复杂性的不断增长，仅在云端进行推理并不经济。将一些处理从云端转移到边缘终端，可减轻云基础设施的压力并减少推理服务成本。推动一部分算力下沉到端侧，尤其是与用户规模庞大的移动端设备结合，正是端侧模型的努力方向。据统计，我国存量手机算力是数据中心算力的12倍，但算力利用率不足15%；全国宽带用户规模达5.9亿，却有80%带宽资源处于闲置状态。发展端侧AI将极大地体现AI应用的中国特色。

除了成本以外，发展端侧模型还有两个因素。一是当前企业或个人用户的AI应用场景都在端侧，聊天记录、办公记录、视频和照片等数据也在端侧。只有使用端侧模型，才能打消用户使用AI的疑虑。二是很多工业场景和野外场景，与云端链接网络不稳定，甚至存在断线的情况，AI模型可靠性和稳定性就难以保障，必须有独立运行能力的端侧模型才能保障。

一旦大模型的竞争进入到端侧领域就面临几个需要：完成底层芯片到上层操作系统及应用开发的软硬一体深度适配；能够在较低的功耗下运行且适合电池供电的移动设备；有电子围栏技术感知周围的场景。端侧模型也需要链接智能音箱、安全监控、自动化家居控制系统等，提供更个性化和安全的服务。

对于很多中国企业来说，上述竞争就相当于进入主场。部分手机厂商，电池的超长待机、电子围栏的场景感知的专长技术，从魔法大模型巧妙融入手机硬件，到系统级AI手机操作系统的崛起，具备了对大模型进行量化、剪枝、蒸馏，轻量化、小型化的技术。中国厂商的端侧模型通常注重与国内市场的需求和特点相适应，正华丽变身为世界手机端侧AI创新的先锋。（作者是中国国家创新与发展战略研究会副会长）