传媒、电商、文娱等全面开花 AIGC多元化的未来应用场景知多少

AIGC 已经在多个领域得到广泛应用,如金融、传媒、文娱、电商等,未来应用场景会进一步多元化,场景与场景的融合交互也是未来的发展趋势之一。

人工智能生成内容的应用场景-头图
出处:中国信息通信研究院和京东探索研究院

在全球新冠肺炎疫情延宕反复的背景下,各行业对于数字内容的需求呈现井喷态势,数字世界内容消耗与供给的缺口亟待弥合。AIGC 以其真实性、多样性、可控性、组合性的特征,有望帮助企业提高内容生产的效率,以及为其提供更加丰富多元、动态且可交互的内容,或将率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展。

图 2 AIGC 应用视图

一、AIGC+传媒:人机协同生产,推动媒体融合

近年来,随着全球信息化水平的加速提升,人工智能与传媒业的融合发展不断升级。AIGC 作为当前新型的内容生产方式,为媒体的内容生产全面赋能。写稿机器人、采访助手、视频字幕生成、语音播报、视频锦集、人工智能合成主播等相关应用不断涌现,并渗透到采集、编辑、传播等各个环节,深刻地改变了媒体的内容生产模式,成为推动媒体融合发展的重要力量。

在采编环节,一是实现采访录音语音转写,提升传媒工作者的工作体验。借助语音识别技术将录音语音转写成文字,有效压缩稿件生产过程中录音整理方面的重复工作,进一步保障了新闻的时效性。2022 年冬奥会期间,科大讯飞的智能录音笔通过跨语种的语音转写助力记者 2 分钟快速出稿。

二是实现智能新闻写作,提升新闻资讯的时效。基于算法自动编写新闻,将部分劳动性的采编工作自动化,帮助媒体更快、更准、更智能化地生产内容。比如 2014 年 3 月,美国洛杉矶时报网站的机器人记者 Quakebot,在洛杉矶地震发生后仅 3 分钟,就写出相关消息并进行发布;美联社使用的智能写稿平台Wordsmith 可以每秒写 2000 篇报道;中国地震台网的写稿机器人在九寨沟地震发生后 7 秒内就完成了相关消息的编发;第一财经“DT稿王”一分钟可写出 1680 字[26]。

三是实现智能视频剪辑,提升视频内容的价值。通过使用视频字幕生成、视频锦集、视频拆条、视频超分等视频智能化剪辑工具,高效节省人力时间成本,最大化版权内容价值。2020 年全国两会期间,人民日报社利用“智能云剪辑师”快速生成视频,并能够实现自动匹配字幕、人物实时追踪、画面抖动修复、横屏速转竖屏等技术操作,以适应多平台分发要求。2022 年冬奥会期间,央视视频通过使用 AI 智能内容生产剪辑系统,高效生产与发布冬奥冰雪项目的视频集锦内容,为深度开发体育媒体版权内容价值,创造了更多的可能性。

在传播环节,AIGC 应用主要集中于以 AI 合成主播为核心的新闻播报等领域。AI 合成主播开创了新闻领域实时语音及人物动画合成的先河,只需要输入所需要播发的文本内容,计算机就会生成相应的 AI 合成主播播报的新闻视频,并确保视频中人物音频和表情、唇动保持自然一致,展现与真人主播无异的信息传达效果。

纵观 AI 合成主播在传媒领域的应用,呈现三方面的特点。一是应用范围不断拓展。目前新华社、中央广播电视总台、人民日报社等国家级媒体及湖南卫视等省市媒体都开始积极布局应用 AI 合成主播,先后推出“新小微”、“小 C”等虚拟新闻主持人,并推动其从新闻播报向晚会主持、记者报道、天气预报等更广泛的场景应用,为全国两会、冬奥会、冬残奥会等重大活动传播深度赋能。

二是应用场景不断升级。除了常规的新闻播报,AI 合成主播开始陆续支持多语种播报和手语播报。2020 年全国两会期间,多语种虚拟主播采用中、韩、日、英等多种语言进行新闻报道,实现了一音多语的播报,将中国新闻传递给世界, 顺应了信息化时代信息共享的发展潮流。2022 年冬奥会期间,百度、腾讯等企业推出手语播报数字人,为千万听障用户提供手语解说,进一步推动观赛的无障碍进程。

三是应用形态日趋完善。在形象方面,逐步从 2D 向 3D 拓展;在驱动范围上,开始从口型向面部表情、肢体、手指、背景内容素材延伸;在内容构建上,从支持 SaaS 化平台工具构建向智能化生产探索。例如腾讯 3D 手语数智人“聆语”,实现了唇动、面部表情、肢体动作、手指动作等内容的生成,并配套可视化动作编辑平台,支持对手语动作进行精修。

AIGC 对传媒机构、传媒从业者和传媒受众都产生深刻影响。对传媒机构来说,AIGC 通过参与新闻产品的生产过程,大幅提高生产效率,并带来新的视觉化、互动化体验;丰富了新闻报道的形式,加速了媒体的数字化转型,推动传媒向智媒转变。对传媒从业者来说,AIGC 可助力生产更具人文关怀、社会意义和经济价值的新闻作品;将部分劳动性的采编播工作自动化,让其更加专注于需要深入思考和 创造力的工作内容,如新闻特稿、深度报道和专题报道等此类更需发挥人类在精准分析事物、妥善处理情感元素等方面优势的细分领域。对传媒受众来说,AIGC 的应用可使其在更短时间内获得以更丰富多 元的形态呈现的新闻内容,提高了其获取新闻信息的及时性和便捷性; 降低了传媒行业的技术门槛,促使传媒受众具有更多参与内容生产的 机会,极大增强其参与感。

二、AIGC+电商:推进虚实交融,营造沉浸体验

随着数字技术的发展和应用、消费的升级和加快,购物体验沉浸化成为电商领域发展的方向。AIGC 正加速商品 3D 模型、虚拟主播乃至虚拟货场的构建,通过和 AR、VR 等新技术的结合,实现视听等多感官交互的沉浸式购物体验。

生成商品 3D 模型用于商品展示和虚拟试用,提升线上购物体验。基于不同角度的商品图像,借助视觉生成算法自动化生成商品的 3D 几何模型和纹理,辅以线上虚拟“看、试、穿、戴”,提供接近实物的差异化网购体验,助力高效提升用户转化。百度、华为等企业都推出商品自动化 3D 建模服务,支持在分钟级的时间内完成商品的 3D 拍摄和生成,精度可达到毫米级。相较于传统 2D 展示,3D 模型可720°全方位展示商品主体外观,可大幅度降低用户选品和沟通时间,提升用户体验感,快速促成商品成交。同时生成出的 3D 商品模型还可用于在线试穿,高度还原商品或服务试用的体验感,让消费者有更多机会接触到产品或服务的绝对价值。

如阿里于 2021 年 4 月上线 3D 版天猫家装城,通过为商家提供 3D 设计工具及商品 3D 模型 AI 生成服务,帮助商家快速构建 3D 购物空间,支持消费者自己动手做家装搭配,为消费者提供沉浸式的“云逛街”体验。数据显示,3D 购物的转化率平均值为 70%,较行业平均水平提升了 9 倍,同比正常引导成交客单价提升超 200%,同时商品退换货率明显降低。此外,不少品牌企业也开始在虚拟试用方向上开展探索和尝试,如优衣库虚拟试衣、阿迪达斯虚拟试鞋、周大福虚拟试珠宝、Gucci 虚拟试戴手表和眼镜、宜家虚拟家具搭配、保时捷虚拟试驾等。尽管目前还是采用的传统手动建模方式,但随着 AIGC 技术的不断进步,未来有望涌现更多消费级工具,从而逐步降低 3D 建模的门槛和成本,助力虚拟试穿应用大规模商用。

打造虚拟主播,赋能直播带货。基于视觉、语音、文本生成技术,打造虚拟主播为观众提供 24 小时不间断的货品推荐介绍以及在线服务能力,为商户直播降低门槛。相比真人直播间带货,虚拟主播具备三大优势:

一是虚拟主播能够填补真人主播的直播间隙,使直播间能不停轮播,既为用户提供更灵活的观看时间和更方便的购物体验,也为合作商家创造更大的生意增量。如欧莱雅、飞利浦、完美日记等品牌的虚拟主播一般会在凌晨 0 点上线,并进行近 9 个小时的直播,与真人主播形成了 24 小时无缝对接的直播服务。

二是虚拟化的品牌主播更能加速店铺或品牌年轻化进程,拉近与新消费人群的距离,塑造元宇宙时代的店铺形象,未来可通过延展应用到元宇宙中更多元的虚拟场景,实现多圈层传播。如彩妆品牌“卡姿兰”推出自己的品牌虚拟形象,并将其引入直播间作为其天猫旗舰店日常的虚拟主播导购。同时对于已具备虚拟品牌 IP 形象的传统企业,可直接利用已有形象快速转化形成虚拟品牌主播。如在2020 年 5 月海尔直播大促活动中,大家所熟知的海尔兄弟虚拟 IP 来到直播间,并同主持人和粉丝一起互动,高达千万播放量。

三是虚拟主播人设更稳定可控。在头部主播有限并且可能“人设崩塌”的情况下,虚拟主播人设、言行等由品牌方掌握,比真人明星的可控性、安全性更强。品牌不必担心虚拟形象人设崩塌,为品牌带来负面新闻、差评及资金损失。

赋能线上商城和线下秀场加速演变,为消费者提供全新的购物场景。通过从二维图像中重建场景的三维几何结构,实现虚拟货场快速、低成本、大批量的构建,将有效降低商家搭建 3D 购物空间的门槛及成本,为一些原本高度倚重线下门店的行业打开了线上线下融合的想象空间,同时为消费者提供线上线下融合的新消费体验。目前一些品牌已经开始尝试打造虚拟空间。

例如奢侈品商 Gucci 在一百周年品牌庆典时,把线下的 Gucci Garden Archetypes 展览搬到了游戏 Roblox 上,推出了为期两周的虚拟展,5 个主题展厅的内容与现实展览相互对应。2021 年 7 月,阿里巴巴首次展示了其虚拟现实计划“Buy+”, 并提供 360°虚拟的购物现场开放购物体验。2021 年 11 月,Nike 和Roblox 合作,推出虚拟世界 Nikeland,并向所有 Roblox 用户开放。随着基于图像的 3D 重建技术在谷歌地图沉浸式视图功能中的成功应用,虚拟货场的自动化构建未来将得到更好的应用和发展。

三、AIGC+影视:拓展创作空间,提升作品质量

随着影视行业的快速发展,从前期创作、中期拍摄到后期制作的过程性问题也随之显露,存在高质量剧本相对缺乏、制作成本高昂以及部分作品质量有待提升等发展痛点,亟待进行结构升级。运用 AIGC 技术能激发影视剧本创作思路,扩展影视角色和场景创作空间,极大地提升影视产品的后期制作质量,帮助实现影视作品的文化价值与经济价值最大化。

AIGC 为剧本创作提供新思路。通过对海量剧本数据进行分析归纳,并按照预设风格快速生产剧本,创作者再进行筛选和二次加工,以此激发创作者的灵感,开阔创作思路,缩短创作周期。国外率先开展相关尝试,早在 2016 年 6 月,纽约大学利用人工智能编写的电影剧本《Sunspring》,经拍摄制作后入围伦敦科幻电影(Sci-Fi London) 48 小时挑战前十强。2020 年,美国查普曼大学的学生利用 OpenAI 的大模型GPT-3 创作剧本并制作短片《律师》。国内部分垂直领域的科技公司开始提供智能剧本生产相关的服务,如海马轻帆推出的“小说转剧本”智能写作功能,服务了包括《你好,李焕英》《流浪地球》等爆款作品在内的剧集剧本 30000 多集、电影/网络电影剧本 8000 多部、网络小说超过 500 万部。

AIGC 扩展角色和场景创作空间。一是通过人工智能合成人脸、声音等相关内容,实现“数字复活”已故演员、替换“劣迹艺人”、多语言译制片音画同步、演员角色年龄的跨越、高难度动作合成等,减少由于演员自身局限对影视作品的影响。如央视纪录片《创新中国》中,央视和科大讯飞利用人工智能算法学习已故配音员李易过往纪录片的声音资料,并根据纪录片的文稿合成配音,配合后期的剪辑优化,最终让李易的声音重现。在 2020 年播出的《了不起的儿科医生》中,主角人物的学历事件影响了影视作品的宣传与发行,该作品便采用了智能影视换脸技术将主角人物进行替换,从而减少影视作品创作过程中的损失。2021 年,英国公司 Flawless 针对多语言译制片中角色唇形不同步的问题推出了可视化工具 TrueSync,能通过 AI 深度视频合成技术精准调整演员的面部特征,让演员的口型和不同语种的配音或字幕相匹配。

二是通过人工智能合成虚拟物理场景,将无法实拍或成本过高的场景生成出来,大大拓宽了影视作品想象力的边界,给观众带来更优质的视觉效果和听觉体验。如 2017 年热播的《热血长安》,剧中的大量场景便是通过人工智能技术虚拟生成。工作人员在前期进行大量的场景资料采集,经由特效人员进行数字建模,制作出仿真的拍摄场景,演员则在绿幕影棚进行表演,结合实时抠像技术,将演员动作与虚拟场景进行融合,最终生成视频[31]。

AIGC 赋能影视剪辑,升级后期制作。一是实现对影视图像进行修复、还原,提升影像资料的清晰度,保障影视作品的画面质量。例如中影数字制作基地和中国科技大学共同研发的基于 AI 的图像处理系统“中影·神思”,成功修复《厉害了,我的国》《马路天使》等多部影视剧。利用 AI 神思系统,修复一部电影的时间可以缩短四分之三,成本可以减少一半。同时,爱奇艺、优酷、西瓜视频等流媒体平台都开始将 AI 修复经典影视作品作为新的增长领域开拓。

二是实现影视预告片生成。IBM 旗下的人工智能系统 Watson 在学习了上百部惊悚预告片的视听手法后,从 90 分钟的《Morgan》影片中挑选出符合惊悚预告片特点的电影镜头,并制作出一段 6 分钟的预告片。尽管这部预告片需要在制作人员的重新修改下才能最终完成,但却将预告片的制作周期从一个月左右缩减到 24 小时。

三是实现将影视内容从2D 向 3D 自动转制。聚力维度推出的人工智能 3D 内容自动制作平台“峥嵘”支持对影视作品进行维度转换,将院线级 3D 转制效率提升1000 多倍。

四、AIGC+娱乐:扩展辐射边界,获得发展动能

在数字经济时代,娱乐不仅拉近了产品服务与消费者之间的距离,而且间接满足了现代人对归属感的渴望,重要性与日俱增。借助于AIGC 技术,通过趣味性图像或音视频生成、打造虚拟偶像、开发 C 端用户数字化身等方式,娱乐行业可以迅速扩展自身的辐射边界,以更加容易被消费者所接纳的方式,获得新的发展动能。

实现趣味性图像或音视频生成,激发用户参与热情。在图像视频生成方面,以AI 换脸为代表的AIGC 应用极大满足用户猎奇的需求,成为破圈利器。例如 FaceAPP、ZAO、Avatarify 等图像视频合成应用一经推出,就立刻病毒式在网络上引发热潮,登上 App Store 免费下载榜首位;人民日报新媒体中心在国庆 70 周年推出互动生成 56 个民族照片人像的应用刷屏朋友圈,合成照片总数超 7.38 亿张;2020 年3 月,腾讯推出化身游戏中的“和平精英”与火箭少女 101 同框合影的活动,这些互动的内容极大地激发出了用户的情感,带来了社交传播的迅速破圈。在语音合成方面,变声增加互动娱乐性。如 QQ 等多款社交软件、和平精英等多款游戏均已集成变声功能,支持用户体验大叔、萝莉等多种不同声线,让沟通成为一种乐此不疲的游戏。

打造虚拟偶像,释放 IP 价值。一是实现与用户共创合成歌曲,不断加深粉丝黏性。以初音未来和洛天依为代表的“虚拟歌姬”,都是基于 VOCALOID 语音合成引擎软件为基础创造出来的虚拟人物,由真人提供声源,再由软件合成人声,都是能够让粉丝深度参与共创的虚拟歌手。以洛天依为例,任何人通过声库创作词曲,都能达到“洛天依演唱一首歌”的效果。从 2012 年 7 月 12 日洛天依出道至今十年的时间内,音乐人以及粉丝已为洛天依创作了超过一万首作品,通过为用户提供更多想象和创作空间的同时,与粉丝建立了更深刻联系。

二是通过 AI 合成音视频动画,支撑虚拟偶像在更多元的场景进行内容变现。随着音视频合成、全息投影、AR、VR 等技术的成熟,虚拟偶像变现场景逐步多元化,目前可通过演唱会、音乐专辑、广告代言、直播、周边衍生产品等方式进行变现。同时随着虚拟偶像商业价值被不断发掘,品牌方与虚拟 IP 的联动意愿随之提升。如由魔珐科技与次世文化共同打造的网红翎Ling 于 2020 年 5 月出道至现在已先后与VOGUE、特斯拉、GUCCI 等品牌展开合作。

开发 C 端用户数字化身,布局消费元宇宙。自 2017 年苹果手机发布 Animoji 以来,“数字化身”技术迭代经历了由单一卡通动物头像,向 AI 自动生成拟真人卡通形象的发展,用户拥有更多创作的自主权和更生动的形象库。各大科技巨头均在积极探索“数字化身”相关应用,加速布局“虚拟数字世界”与现实世界大融合的“未来”。例如百度在 2020 年世界互联网大会上展现了基于 3D 虚拟形象生成和虚拟形象驱动等 AI 技术设计动态虚拟人物的能力。在现场只需拍摄一张照片,就能在几秒内快速生成一个可以模仿“我”的表情、动作的虚拟形象。在 2021 年的云栖大会开发者展区,阿里云展示了最新技术——卡通智绘项目,吸引了近 2000 名体验者,成为了大会爆款。阿里云卡通智绘采用了隐变量映射的技术方案,对输入人脸图片,发掘其显著特征如眼睛大小、鼻型等,可以自动化生成具有个人特色的虚拟形象,同时还可跟踪用户的面部表情生成实时动画,让普通人也能有机会创造属于自己的卡通形象。在可预见的未来,作为用户在虚拟世界中个人身份和交互载体的“数字化身”,将进一步与人们的生产生活相融合,并将带动虚拟商品经济的发展。

五、AIGC+其他:推进数实融合,加快产业升级

除以上行业之外,教育、金融、医疗、工业等各行各业的 AIGC 应用也都在快速发展。教育领域,AIGC 赋予教育材料新活力。相对于阅读和讲座等传统方式,AIGC 为教育工作者提供了新的工具,使原本抽象、平面的课本具体化、立体化,以更加生动、更加令人信服的方式向学生传递知识。例如制作历史人物直接与学生对话的视频,给一场毫无吸引力的演讲注入新的活力;合成逼真的虚拟教师,让数字教学更具互动性和趣味性等。

金融领域,AIGC 助力实现降本增效。一方面可通过 AIGC 实现金融资讯、产品介绍视频内容的自动化生产,提升金融机构内容运营的效率;另一方面,可通过 AIGC 塑造视听双通道的虚拟数字人客服,让金融服务更有温度。

医疗领域,AIGC 赋能诊疗全过程。在辅助诊断方面,AIGC 可用于改善医学图像质量、录入电子病历等,完成对医生的智力、精力的解放,让医生资源专注到核心业务中,从而实现医生群体业务能力的提升。在康复治疗方面,AIGC 可以为失声者合成语言音频,为残疾者合成肢体投影,为心理疾病患者合成无攻击感的医护陪伴等,通过用人性化的方式来抚慰患者,从而舒缓其情绪,加速其康复。

工业领域,AIGC 提升产业效率和价值。一是融入计算机辅助设计 CAD(Computer-aided Design),极大缩短工程设计周期。AIGC 通过将工程设计中重复的、耗时的和低层次的任务自动化,可使原来需要耗费数千小时的工程设计缩短到分钟级。同时支持生成衍生设计,为工程师或设计师提供灵感。此外,还支持在设计中引入变化,实现动态模拟。如宝马公司在其 BMW VISION NEXT 100 概念车中通过 AIGC 辅助设计开发了汽车动态功能性外表皮和内饰。二是加速数字孪生系统的构建。通过将基于物理环境形成的数字几何图形,快速转化为实时参数化的 3D 建模数据,高效创建现实世界中工厂、工业设备和生产线等的数字孪生系统。总体来看,AIGC 正在发展成与其他各类产业深度融合的横向结合体,其相关应用正加速渗透到经济社会的方方面面。

目前,AIGC 已经在多个领域得到广泛应用,如金融、传媒、文娱、电商等,未来应用场景会进一步多元化。

  • 例如在“AIGC+数据科学”领域,可以自动生成具有安全性、标签化、经过预处理的标准数据以满足越来越“饥饿”的人工智能模型。目前由人工智能生成的数据占所有数据的 1%不到,根据 Gartner 预测,到 2025 年,人工智能生成数据占比将达到 10%;
  • 在“AIGC+游戏”领域,通过训练,人工智能可以生成针对不同玩家阶层的游戏攻略和教学手册,并且无重复自动创建不同难度、高交互性、高可玩性的剧情和关卡;
  • 在“AIGC+ 医药”领域,相关模型可以克服医疗数据的稀缺性,自动寻找带有特定性质的分子结构,以此大幅缩短新药的研发和临床试验的科研成本,据 Gartner 预测,到 2025 年,超过 30%的药物和材料将通过生成式人工智能(AIGC 的工具之一)被发现;
  • 在“AIGC+安全”领域,在公众场合或者活动中,人工智能将会自动生成用户虚拟形象以保护用 户的数据安全和个人隐私;
  • 在“AIGC+艺术”领域,除目前火爆的 NFT(Non-Fungible Token,非同质化代币)以外,AIGC 还可涉及绘画、作曲、演唱、编剧、设计等,不同于目前在这些细分领域以辅助内容生成为主的现状,未来这些领域的自主生成内容将会达到人类水平,经人工智能创作后无需人为优化即可投放市场。

除应用场景的横向扩展外,场景与场景的融合交互也是未来的发展趋势之一。

  • 例如通过“文旅+游戏”,以高度沉浸式体验深度挖掘传统文旅产业新特点,以新颖的、无重复的、高吸引力互动游戏形式吸引年轻消费群体深度探索传统文旅的深刻内涵,激发传统文旅产业新活力;
  • 通过“教育+政务”,AIGC 可以针对不同年龄、不同学历、不同职业、不同地区的人群依照政策导向生成类型各异的教育及科普内容,极大平衡教育资源、更好普及全民教育、创造全民科学氛围、提升全民科学素养;
  • 通过“商业+艺术”,AIGC 可以打造更具人文关怀和时代意义的数字藏品,数字藏品将从目前缺乏实质内涵的虚拟货品蜕变为拥有特定纪念意义的虚拟化身,以此深度挖掘艺术的商业潜力,从而反哺并推进未来艺术高质量发展。

本文摘编自中国信息通信研究院联合京东探索研究院共同发布《人工智能生成内容(AIGC)白皮书(2022年)》,全文下载:

发条评论

你的电邮不会被公开。有*标记为必填。