近年来,数字经济己经成为推动全球经济发展的新动力,各国纷纷出台战略规划,依托数字化技术实现新一轮产业变革,进而抢占全球价值链的制高点。中国政府也做出了重大战略部署,相继出台了多项数字科技发展引导政策,全面推进数字科技发展,并明确提出数字中国战略,构筑国家竞争新优势,加快建成社会主义现代化强国。
数字科技是基于物理世界和数字世界映射互动的体系提炼的一个新概念,是当今世界创新速度最快、通用性最广、渗透性和引领性最强的领域之一。本报告通过人工智能技术,从海量大规模非结构化的数据中抽取数字科技相关知识,生成结构化的知识数据,并根据关系和属性链接等构建数字科技知识图谱,确保了知识体系的完整性,本次研究范围覆盖与数字科技高度相关的八大方向,依次是人工智能、区块链、大数据、云计算、物联网、量子科技、新一代无线通信、XR 技术。
全球数字科技领域排名靠前的 10 大热点前沿技术分别是生物大数据、生成式对抗网络算法(Generative adversarial networks,GANs)、沉浸式扩展现实(Extended Reality,XR)、量子计算机、AI 破解蛋白质和基因结构、移动边缘网络、可解释的AI、联邦学习、混合计算和能源区块链技术。其中,生成对抗网络算法、可解释的AI、混合计算和能源区块链技术的相关科研成果的平均出版年均在 2019 年以后,均为最新的新兴前沿技术。
趋势一:生物大数据
随着对生命系统的不断深入探究和各种其他高通量组学技术的产生和发展,生物信息学的研究范畴不断扩大,各种组学数据(转录组、蛋白质组、非编码RNA 组、表观遗传组、代谢组、宏基因组等)以及生物系统层面的解读不断扩展,生命科学从定性描述开始实现动态、精准和定量解读。
大数据是互联网技术快速发展的重要产物,包括数据量大、速度快、种类多、有价值等特点。随着大数据时代的来临,大数据技术在各行各业都发挥了极为重要的作用,具有十分广阔的发展前景。生物大数据按来源属性主要分为科学数据和真实世界数据两类。科学数据产生于科研活动中,主要是生物医学研究中的基因组数据、蛋白质组数据、代谢组数据等各类组学研究数据,质量较高,并包含对数据的机理性解读。
趋势二:生成式对抗式网络算法
作为人工智能学界的热门方向,生成式对抗式网络算法(Generative adversarial networks) 已法被广泛应用于图像和视觉、语音和语言、信息安全等领域,并被图灵奖得主 LeCun 评为为“过去十年间机器学习领域最让人激动的点子”。未来,随着 GANs 为代表的深度学习不断迭代,AIGC 百花齐放,产出效果或将逐渐逼真接近至人类作品。
生成式对抗网络GANs(Generative adversarial networks)模型是 Goodfellow 等最早在2014 年提出的一种生成式模型。GANs 模型具有“无限”的生成能力,在图像和视觉计算、语音和语言处理、信息安全等领域具有重大的应用价值。GANs 模型不仅可以生成与真实数据分布一致的数据样本,例如图像、视频等。同时,GANs 可以解决学习过程中标注数据不足的问题,例如无监督学习(Unsupervised Learning)、半监督学习等(Semi-Supervised Learning)。此外,GANs 还可以用于语音和语言处理任务,例如对话生成(dialogue generation)、文本生成图像(text to image)等。
趋势三:沉浸式扩展现实娱乐平台
扩展现实是元宇宙连接虚拟与现实的关键设备,随着扩展现实产业链和技术不断发展、内容应用逐渐繁荣,整个元宇宙娱乐生态正在持续丰满,沉浸式扩展现实娱乐平台有望迎来爆发。
扩展现实(Extended Reality,XR)技术是虚拟现实(Virtual Reality,VR)、增强现实(Augmented Reality,AR)、混合现实(Mixed reality, MR)的合称,该技术通过计算机将真实与虚拟相结合,打造一个可人机交互的虚拟环境。沉浸式扩展现实利用图形系统和各种控制接口设备,在计算机上生成可交互和具有沉浸感觉的现实世界的模拟仿真,也就是利用电脑模拟产生一个三维空间的虚拟世界,给使用者在虚拟环境中提供关于视觉、触觉、听觉等感官模拟,让使用者身临其境。
趋势四:量子原型样机和专用处理器的研制
当前,量子计算机的研制已从以院校、研究所为主的基础性研究阶段,过渡到以 Google、 IBM 等创新企业为主体的“量子霸权”研究阶段。随着量子计算机研制成果的不断涌现,通用量子计算机研制问题将在未来五年内被攻破,可实际使用的量子处理器将会落地。
量子计算机(Quantum computer)是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。量子计算机的特点主要有运行速度较快、处置信息能力较强、应用范围较广等。与一般计算机相比,信息处理量愈多,量子计算机实施运算就越有利,更能确保运算具备精准性。量子计算机的优势使得其在加密和破译等领域有着巨大的应用。
趋势五:AI 解码蛋白质结构
2021 年,Deepmind 公司的蛋白质解码预测系统——AlphaFold 横空出世。与此同时,公司还公布了约 35 万种蛋白质的结构,该项成果因此入选《科学》2021 年度十大科学突破。随着人工智能技术的不断发展,对具有内在无序特性的蛋白质以及通过翻译后修饰或环境条件改变结 构的蛋白质建模问题在将来有望解决。
自上世纪五六十年代起,蛋白质序列、结构与功能间的关系就一直是生命科学的核心问题。作为这一信息链条的中心点,蛋白质结构既可以帮助人们理解生命活动的分子机理,也能有效地辅助蛋白质设计和基于结构的药物设计,因而结构解析已经成为生物物理领域最重要的研究方向之一。
自 20 世纪八九十年代起,人们就开始发展计算机算法,通过研究序列和结构间的关系,根据氨基酸序列预测蛋白质的三维结构。1994 年,约翰·莫尔特(John Moult)等人组织了第一届国际蛋白质结构预测评估竞赛(Critical Assessment of protein Structure Prediction, CASP),用于系统评测各种计算方法的预测准确性。2015 年,克里斯·桑德斯(Chris Sanders)等人提出可以从多重序列比对中获得氨基酸残基间的共进化关系,从而为结构预测提供额外信息。
2021 年,DeepMind 提出 AlphaFold2 算法,该算法采用了一种全新的端对端模型直接根据序列预测结构,可以提高绝大多数目标蛋白预测模型的精准。对有些蛋白质而言,AlphaFold2 预测的结果与实验解析的模型高度相似,甚至仅根据实验数据都很难区分孰优孰劣。
趋势六:移动边缘计算网络
随着物联网、5G、工业自动化、智能制造的兴起,处于物理实体和工业连接之间的移动边缘计算越来越发挥出重要的作用,也逐步实现了集中化和智能化,其低时延、高带宽、个性化、高安全性、高隐私性等特性满足了分布式服务、自动工业控制的需求。
移动边缘计算(Mobile Edge Computing, MEC)技术作为第五代移动通信系统的核心技术之一,将云计算能力与业务平台下沉到网络边缘(基站/ 终端)。靠近用户的无线接入网能就近向终端用户针对计算密集型、时延敏感型业务提供云计算与互联网技术服务,比如车载导航、虚拟现实技术等。目前,云计算数据中心的集中式处理时代已逐渐转入以万物互联为核心的边缘计算时代,其核心思想是利用网络功能虚拟化和软件定义网络技术,使网络中的存储和计算资源更接 近终端用户。随着物联网、5G、工业自动化、智能制造的兴起,移动边缘计算越来越发挥出重要的作用。
趋势七:可解释的 AI
由于人类社会的价值观念和价值体系存在多元化的特点,未来发展具有可解释性的人工智能,加强人机之间的理解,让人工智能技术跳出“黑箱”,建立可解释、可理解、可信任的人工智能 体系成为趋势。
可解释人工智能(explainable artificial intelligence,XAI)是指人类可以理解人工智能做出的决定或预测的人工智能,是一套流程和方法,可以帮助人类理解模型决策,并发现黑盒模型的问题,如偏差或对抗攻击易感性。可解释性可以帮助 AI 模型的使用者理解机器学习模型是如何得出预测,这就像理解哪些特征驱动模型决策那样简单,但在试图解释复杂模型时会变得困难。
可解释的AI 与机器学习中的黑匣子概念形成对比。在机器学习中,即使其设计者也无法解释为什么人工智能会得出一个特定的决定。通过完善人工智能系统用户的心智模型,拆除他们的错误观念,可解释的 AI 有望帮助用户更有效地执行。可解释的 AI 可能是对社会解释权的实施。即使没有法律权利或监管要求,可解释的 AI 也是相关的。目前,可解释的 AI 已经在许多领域得到了应用,包括神经网络坦克成像、天线设计、算法交易、医学诊断、自动驾驶汽车等。
趋势八:基于算法模型和安全隐私的联邦学习技术
近年来,联邦学习作为解决数据孤岛问题的重要技术引起业界广泛关注,并被广泛应用于金融、医疗健康以及智慧城市等领域。未来,联邦学习技术的发展将与边缘计算、区块链和网络安全等多个领域关联,更好的发挥其隐私性、高效性和便捷性。
联邦学习是一种分布式机器学习技术,其本质上是一种分布式机器学习框架,在保障数据隐 私安全及合法合规的基础上,实现数据共享,共同建模。它的核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过交换模型参数或中间结果的方式,构建基于虚拟融合数据下的全局模型,从而实现数据隐私保护和数据共享计算的平衡,即“数据可用不可见”、“数据不动模型动”的应用新范式。
随着社会对隐私安全的日益重视,联邦学习作为下一代人工智能大规模协作的基础理论,为目前发展人工智能面临的小数据和隐私等关键问题提供了有效的解决思路。同时,作为网络安全领域新的研究热点,联邦学习在边缘计算、物联网、智慧医疗、金融风控、智慧城市以及涉密数据的安全共享等领域均有着广阔的应用前景。
趋势九:混合计算
随着万物互联市场的发展,产业界逐渐认识到单一的计算方式不能解决所有问题,“混合计算”借鉴了异构计算的思想——用不同的计算资源处理适合该结构的任务,构建出某领域专用的高效应用组件,从而更好地满足无线互联、视频处理、图像识别、智能制造等多领域的高效处理需求。
混合计算(Hybrid Computing)指利用 5G 的万物互联能力,综合利用云计算、雾计算、边缘计算等计算方式,实现高效协同计算,主要解决云计算、边缘计算、家庭计算、个人计算的协议适配、海量连接、数据存储、设备管理、规则引擎、事件告警等应用场景的共性问题。混合计算三大核心能力包括算力的自协同、算法的自成长、赋能各场景的商业应用自构建。
趋势十:能源区块链
针对能源互联网应用系统中各个模块存在的问题,区块链技术能够依靠自身的链式特征和独特的区块结构融合到能源互联网中的各个层面,解决能源互联网系统中的相关问题。未来,创建区块链一体化能源系统可有效促进清洁能源的产量和能源的及时高效消费利用,提高地区性能源的综合利用率,在保证经济性和稳定性的基础上,实现节能环保目标。
区块链(Blockchain)技术起源于“比特币”,是分布式数据存储、P2P 传输、共识机制、加密算法等计算机技术的新型应用模式。与传统数据库技术相比,区块链技术具有去中心化、数据不可篡改、集体维护、信息公开透明、智能合约、可追溯性、开放性、无需信任系统等特点。虽然,区块链在能源领域的应用案例较少且规模较小,并且实际运营经验不足。但是,随着新能源技术与信息技术的发展和成熟,能源区块链将成为双碳背景下能源结构转型的重要解决方案。
本文摘编自阿里研究院、智谱 AI 发布的《2023全球数字科技技术发展研究报告》。