人工智能浪潮席卷全球,正以前所未有的速度、广度和深度改变生产生活方式,习近平总书记指出人工智能是新一轮科技革命和产业变革的重要驱动力量,将对全球经济社会发展和人类文明进步产生深远影响。近年来,语言大模型、多模态模型、智能体和具身智能等领域不断出现突破性创新,推动人工智能迈向通用智能初始阶段。与此同时,人工智能的工程化持续加速推进,新产品新模式层出不穷,行业应用走深向实,成为推动经济社会高质量发展的关键动力。
2024年11月29日,中国信息通信研究院(简称“中国信通院”)发布《人工智能发展报告(2024年)》,立足产业新发展、新变化、新需求,聚焦新形势下全球人工智能发展重点,总结梳理人工智能技术创新方向、产业升级重点、行业落地趋势和安全治理进展,展望人工智能发展机遇,以期与业界分享,共同推动人工智能产业蓬勃发展。
一、总体态势
人工智能工具链覆盖数据处理、模型训练微调、部署推理、应用开发、监控运维和安全可信全流程。开发工具链加速大模型技术迭代速度,应用工具链拓展大模型应用广度。全球人工智能安全治理合作愈发紧密,国际合作方面,交流合作更加频繁,强调“负责任”、普惠发展理念。麻省理工学院、伯克利大学和南洋理工大学等研究机构提出模型间对抗新范式,深入探索人工智能模型自身安全边界。据IDC预测,2024年全球人工智能产业规模将达到6233亿美元,同比增长21.5%。2024年上半年,全球人工智能投融资金额达316亿美元,同比上升84%。
1、技术演进
以Transformer架构为基础的大模型不断取得新突破,逐渐实现从单任务智能到可扩展、多任务智能的跨越。模型的规模可扩展性不仅体现在参数的扩大,更依赖高质量数据集的供给以及大规模算力集群能力的增强。大模型支持多任务多模态能力持续增强,可执行任务已经从文本对话拓展到多模态理解、多模态生成等场景。通用大模型在训练阶段通过结合增量预训练、有监督微调、知识图谱等方法,提升大模型在专业领域的应用能力。
图 1 语言、视觉和多模态三类基础模型布局
2、工程化新阶段
开发工具链围绕分布式训练持续优化,显著提升了大模型的训练效率。例如,DeepSpeed、Megatron-LM等分布式训练框架通过支持更丰富的并行策略和计算加速策略,有效支持产业界超大规模模型的预训练。同时,训练框架在参数高效微调等方面进行技术创新,有效降低计算和存储成本。聚焦量化、剪枝等压缩技术,加速推理过程并降低部署成本,同时通过并行推理、混合精度推理等技术提升推理服务速度。
应用工具链拓展大模型应用广度,极大降低了大模型应用的开发门槛,显著提升了智能应用的性能与用户体验。大模型应用工具主要围绕Agent(智能体)、多模型编排、大小模型协同、知识库集成、检索增强生成(RAG)及多组件融合等核心要素持续创新。
Agent的引入实现了复杂任务的自动化执行与智能决策;多模型编排有效解决了单一模型局限性问题,通过灵活组合大小模型提升系统性能;大小模型协同机制在确保精度的同时优化了计算资源利用;知识库与RAG技术的结合极大增强了模型的知识推理与生成能力,确保结果的精确性;多组件的融合应用进一步丰富应用场景,提升了系统的灵活性与可扩展性。
工具链不仅极大降低了大模型应用的开发门槛,还显著提升了智能应用的性能与用户体验。例如,百度飞桨已凝聚1070万开发者,基于飞桨创建了86万个模型,服务23.5万家企事业单位;华为Mindspore社区用户达到780万,总PR数达到97.7k,已在互联网、医疗、安防、政府、科学计算领域广泛落地应用。
图 2 大模型工具链架构图
二、技术创新
全球大模型井喷式发展,技术层面,缩放定律依然有效,语言大模型技术多维度能力持续进化,视觉大模型和多模态模型加速迭代。计算平台与模型创新紧密耦合,大规模分布式训练成为框架的新发力点。软件工具链全面优化升级,加速模型生产质效变革、提升模型部署推理效能、助力智能应用快速部署。高质量多模态数据集成为推动模型能力提升的关键。
OpenAI的o1系列模型通过模仿人脑思考的思维过程,显著提升数学、物理、编程等复杂任务的性能水平。ViT模型将Transformer架构从自然语言扩展到视觉领域,成为判别式视觉任务的主流架构。扩散模型成为图像生成领域的主流方案,展现巨大应用潜力。多模态理解模型通过跨模态特征对齐学习实现多模态输入的统一和融合。多模态生成模型结合扩散模型与Transformer优势,成为视频生成模型主流架构。
1、基础模型演进
语言大模型能力提升主要体现为上下文窗口长度扩展、知识密度增强、MoE混合专家架构和强化学习。视觉Transformer模型(Vision Transformer, ViT)成为判别式视觉任务的主流架构,扩散模型成为图像生成领域的主流方案。多模态大模型主要有理解类和生成类两条主要路径,分别通过语言大模型调度和扩散模型实现。
2、计算平台与模型创新
大模型的创新与基础软硬件体系正加速耦合,强调应用、算法、关键软件栈、底层硬件全方位协同发展。PyTorch引领框架发展,国产框架快速崛起,大规模分布式训练成为框架的新发力点。大模型热潮进一步推动计算底座迭代升级,芯片架构向定制化演进,存储与互联重要性日益提升。
3、工具链完善
训练工具能力全面升级,有效支撑大规模训练任务,涌现出多种训练加速技术。推理工具能力不断升级优化,为大模型落地提供高效支撑,模型压缩工具持续整合更多压缩技术。大模型服务化供给加速了智能技术的普惠化落地,激发了基于大小模型的智能应用开发需求。
4、高质量多模态数据集
多模态词元化序列向量有效融合,自动化与智能化程度持续提高,实时处理与流式数据处理能力不断增强。新一代高水平数据标注提升高质量数据集供给能力,自动化与智能化标注工具创新成为焦点。数据质量评估和模型反馈机制共同推动数据质量不断提升,偏差与公平性评估成为数据质量评估重要组成部分。合成数据有望解决大模型潜在数据瓶颈,合成数据技术创新主要呈现深度进化、多模态合成能力突破、强化学习与合成数据融合发展等趋势。
三、应用赋能
专用智能应用逐步成熟,通用智能落地前景广阔。重点行业人工智能应用走深向实,贯穿产品研发设计、生产制造、营销服务、运营管理全流程。大模型落地呈现“两端快、中间慢”的阶段特征。体系化推动落地应用成为加速人工智能走向实用化、普惠化的行业共识。
图 3 基于百个优秀案例统计的AI应用产业链分布
1、阶段性特征显现
专用小模型与行业场景融合深入,大模型凭借更强大的分析、预测和交互能力,带动工业技术产业实现创新性变革。企业侧大模型应用更注重专业定制和效益反馈,在软件开发、交通、医疗等领域成效显现。消费侧大模型应用更强调普惠适用和创意生成,对话助手类产品热度不减,创新应用不断涌现。
2、重点行业应用
装备行业重点关注研发与制造流程优化、产品智能化升级,逐步渗透并重塑生产模式。
- 智能制造流程优化:Anylogic仿真平台通过强化学习降低重型机械运动,实现制造产线优化,协调对象的数量增加66%,运动次数减少11%。
- 智能产品与服务:汽车、轨道交通、工程机械等装备逐步向智能化产品演进,基于视觉的环境识别成为主要探索方向。航空和交通领域成为开展增值服务的重点行业,如某航天公司飞行器座舱内
的AI驱动系统可以通过评估和通知燃油水平、系统状态、天气状况和其他基本参数来帮助优化实时飞行路径。 - 产品设计与仿真优化:北汽福田应用AI找到最佳的设计路径,消除原结构太重和产品质量缺陷带来的问题,零部件从最初的4个零件变为1个,重量减轻70%,强度增强18.8%。
- 环保与可持续发展:人工智能在节能减排、废弃物管理等方面发挥重要作用,宝钢集团利用人工智能技术实时监控高炉运行状态,提高了冶炼效率和产品质量,减少了能源消耗和环境污染。
消费品行业聚焦产品创新与智能化营销管理,正逐步改变消费者的购物习惯与体验。
- 新产品研发:人工智能技术助力消费品企业快速响应市场变化,开发具有创新性和差异化优势的新产品。例如,小米生态链中的智能灯泡、智能门锁等产品,通过集成人工智能技术实现了语音控制、场景联动等多种功能。
- 精准营销与智能客服:衔远科技的ProductGPT营销大模型结合商品特性与热门趋势,可在几分钟内生成富有创意的营销内容,利用率高达80%。基于自然语言处理技术提供面向顾客的智能聊天与推荐等服务,替代传统的人工客服24小时不间断地为用户提供咨询解答、订单跟踪等服务,提升服务效率与用户体验。
- 供应链管理智能化:京东物流利用大模型的数智化供应链技术,聚焦从智能规划到智能仓储与运配,再到智能客服与营销的全链路降本增效,实现采购自动化率超过85%,平均现货率超过95%,库存周转天数降至近30天。
原材料行业聚焦生产过程管控优化,利用人工智能技术逐步改变传统的资源开发、加工和利用方式。
- 资源勘探与开发智能化:加拿大的GoldSpot Discoveries公司使用机器学习算法分析地质数据,成功预测了多个金矿的位置,提高了勘探的成功率。
- 生产流程优化与节能减排:宝钢股份利用人工智能技术实时监控高炉运行状态,通过调整操作参数,提高了冶炼效率和产品质量,减少了能源消耗和环境污染。
- 废弃物管理与资源回收:瑞典的Recycleye公司开发了一套基于人工智能的废物分类系统,能够准确识别不同类型的废弃物,并进行分类处理。同时,还可以利用人工智能分析废弃物成分,探索其再生利用途径,促进循环经济发展。
3、体系化推动
开展战略需求分析是企业布局大模型的前提,全方位开展战略需求分析,统筹规划大模型所需各类资源。明确选型方案是企业研发大模型的关键一步,综合评估自身开发成本、开发周期、性能、安全性等要求。建设企业人工智能能力平台是工程落地的核心,统一管理算法、数据、计算资源和模型。
构建智能体应用进一步释放大模型应用潜能,通过智能体工具调用、智能体工作流、智能体人机交互等方式。打造运维管理体系助力AI生产过程规范化,实现模型的快速迭代、持续交付和持续运营。注重风险管理为大模型落地保驾护航,构建“风险识别-风险评估-风险应对”的风险管理链路。
四、安全治理
全球人工智能安全治理合作紧密,国际合作频繁,强调“负责任”、普惠发展理念。各主要经济体治理体系渐趋明晰,安全技术应用能力明显提升。人工智能技术应用带来自身安全、衍生安全两大类风险挑战,各国治理进程不断提速,全球人工智能治理正处于“从原则走向实践”的关键阶段。
图 4 人工智能风险示例
1、多重挑战
人工智能技术系统的安全问题,涉及技术系统部署所依赖的传统基础设施,以及模型、框架等人工智能系统特有的部分。自身安全包括算法模型可解释性不足、框架安全漏洞、数据标注不规范等挑战。例如,深度神经网络存在非线性、大规模特点,导致在理论上难以证明其行为,同时因“模型幻觉”造成生成内容不可信。
衍生安全由于技术系统风险管控不当,以及技术系统被滥用、误用或遭到外部攻击,对个人组织、国家社会,乃至全人类造成的安全问题。例如,不法分子利用人工智能换脸、换声技术实施诈骗的案例。
2、全球治理进展
全球围绕安全议题开展紧密合作,推动将治理落在实处。例如,联合国成立“人工智能高级别咨询机构”,负责分析人工智能国际治理并提出政策建议。各国积极构建人工智能治理体系,建设标准体系,提升技术安全能力。例如,欧盟采取统一立法治理架构,布局风险管理等标准配套举措;美国沿袭行业自律治理方案,开展安全测试夯实技术监管;英国治理方案注重“促进创新”,新加坡实施温和干预方案。
通过发布治理框架,制定标准规范等多种形式促进人工智能治理。例如,NIST发布《人工智能风险管理框架》(AIRMF1.0),提供了一套组织流程和活动来评估和管理风险。加强对算法模型毒性、鲁棒性、公平性等方面的评测技术工具研究,强化技术治理能力。发挥技术研究和治理协同优势,通过发布治理框架,制定标准规范等多种形式促进人工智能治理。例如,MLCommons制定基准测试v0.5验证评估AI模型的安全性。
企业设置内部治理组织,统筹人工智能治理工作,发布伦理准则指引,指导企业具体实践。积极开展负责任的技术研发与应用,管理体系更加重视全流程管控,安全技术方案向一体化、定制化发展。例如,IBM、微软、谷歌、百度等公司设立伦理委员会,并统筹推动对相关产品实施伦理审查。
3、全球主要经济体的举措
欧盟统一立法治理架构,在2024年5月通过的《人工智能法案》,按照人工智能潜在的不同风险级别,划分为不可接受风险、高风险、有限风险、低风险四种风险等级,并引入不同的规则来解决这些风险。成立专门的人工智能办公室,以监管人工智能的发展,支持可信人工智能的使用,并防范人工智能风险。发布支持欧盟人工智能政策的标准化请求,包含人工智能系统风险管理、符合性评估和质量管理在内的10余项标准。
美国拜登总统签署的行政令发布全面的人工智能治理方法,明确了各监管机构的行动目标与期限。由美国国家标准与技术研究院(NIST)负责标准研制工作,制定指导方针和最佳实践,促进开发和部署安全、可靠和值得信赖的人工智能系统。《前沿人工智能模型安全可靠创新法案》2024年8月发布,明确各类测试、安全和执法标准。
英国发布《促进创新的人工智能监管方法》,优先考虑指导、资源措施等较轻的干预手段,强调监管的合比例性。推出“Inspect”人工智能模型安全评估平台,帮助产业评估人工智能模型的核心知识储备量、推理能力与自主能力等性能。
新加坡在2019年发布的《人工智能治理模型框架》,2024年迭代发布《生成式人工智能治理模型框架》,细化相关原则,为企业提供详细的指导和建议。发布人工智能治理工具包“人工智能验证”(AI Verify),结合技术测试和基于流程的检查方法,帮助企业对自身的人工智能系统进行评估。
中国以新型举国体制治理优势出台《关于加强科技伦理治理的意见》《科技伦理审查办法(试行)》等文件,加强科技伦理审查和监管。通过安全评估、备案等举措,保障信息服务领域安全,2024年4月发布首批生成式人工智能服务已备案信息的公告。
人工智能正处于迈向通用智能的初始阶段,并成为推动经济社会持续发展的关键动力。未来,人工智能技术将继续演进,推动更大范围的行业转型升级,助力行业迈向智能化新阶段。
五、未来展望
引入强化学习等技术增强大模型能力,多模态模型、智能体有望加速突破,具身智能成为迈向通用人工智能的重要一步。类脑智能等颠覆性技术的成熟可能带来更广阔的想象空间。
增强语言大模型能力仍是技术升级的重点方向之一,推理或将获得更多关注和资源投入。多模态模型有望加速突破,从以语言大模型为骨干的多模态模型,向原生多模态模型演变。智能体凭借其强大的环境交互、任务执行、自我优化等能力,将进一步拓宽人工智能的应用场景。具身智能为智能体赋予“身体”,使其能够与物理世界交互、探索、获取经验并改进自身行为。
模拟计算、量子计算芯片等硬件或将逐步成熟,类脑智能等颠覆性技术将为人工智能发展带来更广阔的想象空间。行业大模型发展将聚焦于增强行业通用性、提升模型的专业稳定性与准确性、多元化的人机交互方式。人工智能安全治理工作迈向深水区,探索切实有效、多方共治、敏捷应对的落实方案成为全球共同议题。
来源:《人工智能发展报告(2024年)》,中国信通院。本篇针对全文由生成式 AI 做出的核心摘要和解答,仅作为参考,请以原文为准。下载报告请在数治网微信公众号对话框发送“241213”获取链接。
在此声明以上观点和内容,仅代表原作者和出处,与数治网DTZed 无关,如有出错或侵害到相关合法权益,请通过电邮与我们联系:cs@dtzed.com。
有数治Pro在手,年费¥999 起落政策、学法规、用标准、推业务、促客户、助招投不再愁,在下方扫码添加老邪企业微信即可。