生成式 AI 入门指南(附下载)

本文总结了生成式 AI 的入门指南,以帮助 CEO 更好了解 AI 日新月异的发展现状和可行技术选择,思考生成式 AI 的价值创造场景以及如何开始应用。

生成式 AI 入门指南
出处:Mckinsey Digital

生成式AI技术飞速发展。发布周期之短、初创公司数量之众、与现有软件的整合之快,皆不同凡响。我们将探讨生成式AI应用的广度,并简要介绍该技术,包括阐明其与传统 AI 的区别。生成式 AI 可用于工作自动化、辅助强化与加速推进。从本文宗旨出发,我们将着重阐述生成式 AI 如何辅助并强化人类工作,对其替代人类工作的潜力不作探讨。

生成式人工智能技术飞速演进

在 ChatGPT 推出后的几个月里,主要大型语言模型(LLM)的发展时间线:

  • 11月30日
    OpenAI 的 ChatGPT(由 2020 年 GPT-3 版本的改进版 GPT-3.5 驱动) 成为第一个被广泛使用的文本生成产品,在 2 个月内收获了创纪录的 1 亿用户量
  • 12月12日
    Cohere 发布首款支持 100 多种语言的 LLM,可在其企业人工智能平台使用
  • 12月26日
    谷歌的 Med-PaLM 等 LLM 针对临床知识等特定用例和领域接受训练
  • 2月2日
    亚马逊的多模态-CoT 模型包含了“思维链提示”,模型可解释其推理,且在多个基准上优于 GPT-3.5
  • 2月24日
    作为一款较小的模型,Meta 的 LLaMA 比其他一些模型更具使用效率,且与其他模型相比,在一些任务上持续表现良好
  • 2月27日
    微软推出 Kosmos-1,一款多模态 LLM,除了自然语言外,还能对图像和音频提示做出回应
  • 3月13日
    OpenAI 发布 GPT-4, 在准确性和减少幻觉方面有明显改进,声称与 GPT-3.5 相比有 40% 的提升
  • 3月14日
    Anthropic 推出 Claude,一款使用名为 “合宪人工智能”方法训练的人工智能助理,旨在减少有害输出概率
  • 3月16日
    微软宣布将 GPT-4 整合到其 Office 365 套件中,或有助于广泛提升工作效率
  • 3月21日
    谷歌发布基于LaMDA 系列 LLM 的人工智能聊天机器人 Bard
  • 3月30日
    彭博宣布以金融数据训练 LLM,以支持金融行业的自然语言任务
  • 4月13日
    亚马逊发布 Bedrock,这是第一款有完全管理的服务,除了亚马逊自己的 Titan LLMs,还可以通过 API 使用多个供应商(例如Anthropic)的模型

不仅是聊天机器人

ChatGPT 等文本生成式聊天机器人备受关注,不过,生成式 AI 同样可以在图像、视频、声音以及计算机代码等更广泛的内容领域提供助力。在企业,生成式 AI 也可以发挥广泛功能,比如分类、编辑、总结、回答问题和起草内容。针对上述每项活动,各个业务职能和工作流程的具体工作方式转变都有可能创造价值,部分示例如下:

分类

  • — 反欺诈分析师可以将交易描述和客户文件输入到生成式 AI 工具中,要求其识别欺诈交易。
  • — 客户服务经理可以使用生成式 AI 工具根据客户满意度对客户通话音频文件进行分类。

编辑

  • — 撰稿人可以利用生成式 AI 纠正语法,并使文字风格与顾客的品牌调性相匹配。
  • — 平面设计师可以利用生成式 AI 从图像中移除过时标志。

总结

  • — 制片助理可以用数小时的活动录像创作精彩视频集锦。
  • — 业务分析师可以创建维恩图(Venn diagram)总结高管发言要点。

回答问题

  • — 制造企业员工可以向基于生成式 AI 的“虚拟专家” 咨询有关操作流程的技术问题。
  • — 消费者可以向聊天机器人询问新家具的组装方式。

起草内容

  • — 软件开发者可以让生成式 AI 完成整段代码,或者提供建议以补全现有代码的未完成语句。
  • — 营销经理可以使用生成式 AI 起草不同版本的营销活动信息。

随着技术的发展和成熟,这类生成式 AI 可以更好地融入企业工作流程,实现任务自动化并直接执行特定操作(例如,在会议结束时自动发送纪要)。该领域已经有一些工具面市。

生成式 AI 与其他 AI 的不同之处

顾名思义,生成式 AI 和过往 AI 技术或分析工具的主要区别在于,该技术能够生成新内容,所生成的新内容通常以“非结构化”形式(如书面文本或图像)呈现,而非以表格形式排列。

其底层技术是一类被称为基础大模型的人工神经网络,其灵感来自于人类大脑中数十亿相互连接的神经元。人工神经网络需要通过深度学习加以训练,“深度”即指神经网络中的层数之众、之深。深度学习技术推动了 AI 领域的众多新进展。

而某些特质使得基础大模型区别于过往的深度学习模型。首先,训练基础大模型可以使用体量庞大、类型多样的非结构化数据。例如,一类被称为大型语言模型的基础大模型可以通过互联网上公开可用且涵盖各类主题的大量文本进行训练。其他深度学习模型虽然也可以处理大量非结构化数据,但训练所用的数据集通常更具体。例如,为了让模型识别照片中的某些物体,需要使用一组特定图像对其进行训练。

事实上,其他深度学习模型往往只能执行一项此类任务。例如,它们要么对照片中的物体分类,要么执行预测等其他功能。相比之下,基础大模型可以同时实现上述功能,并且还能够生成内容。上述能力的积累是通过从所摄取的广泛训练数据中学习规律和关系实现的,比如,通过规律和关系学习,基础大模型能够预测句子中的下一个单词。这就是为什么 ChatGPT 能够回答不同主题的问题、而 DALL-E 2 和 Stable Diffusion 能够根据描述生成图像。

鉴于基础大模型的多功能性,企业可以使用同一模型实现多个业务用例,这是早期深度学习模型难以实现的。一款纳入了公司产品信息的基础大模型可能同时用于回答客户问题和协助工程师开发新版产品。因此,企业可以搭建应用并更快实现收益。

然而,基础大模型当前的运行方式决定了它们并不适用于所有类型的应用。例如,大型语言模型容易产生“幻觉”,用看似可信、实则错误的论断回答问题。此外,基础大模型并不总能给出作答的基本推理或依据来源。这意味着在错误可能造成损害、或需要对回答进行解释的情况下,企业对应用无人监督的生成式 AI 需慎之又慎。生成式 AI 目前也不适用于直接分析大量的表格数据或解决高级数值优化问题。研究人员正在努力克服这些限制。

生成式 AI 生态系统正在兴起

基础大模型是生成式 AI 的“大脑”,而正在兴起的整 个价值链将支持该技术的训练和使用(见图2)1。 专用硬件提供了训练模型所需的庞大算力。云平台则提升了对这类硬件的利用。MLOps和模型中心供应商提供企业所需工具、技术和实践,让企业能够调试使用基础大模型并将其部署到终端用户应用之中。许多公司正在进入市场,主打依托基础大模型、能够执行特定任务的应用程序,例如帮助某公司处理客户服务问题。

图2

负责任地使用生成式 AI

生成式AI伴生了各种风险。企业 CEO 需要一开始从团队和流程设计上就做好风险防控。这不仅是为了满足不断变化的监管要求,也是为了保护业务并赢得消费者的数字信任。

公平性:不完美的训练数据或开发模型工程师的决策瑕疵,可能让模型产生算法偏向。

知识产权(IP):训练数据和模型输出可能带来重大的知识产权风险,包括侵犯版权、商标权、专利权或其他合法受到保护的材料权利。即便所使用的生成式 AI 工具来自供应商,企业也需要了解训练过程中使用了哪些数据以及这些数据在工具输出中的使用方式。

隐私性:如果用户的输入信息以某种可识别个人身份的形式出现在模型输出中,则可能引发隐私问题。生成式 AI 也可能被用于创作和传播虚假信息、深度伪造和仇恨言论等恶意内容。

安全性:生成式 AI 有可能被不法分子用来加剧网络攻击的复杂程度和侵害速度,也可被操纵用于制造恶意输出。例如,通过名为“提示注入”(prompt injection)的技术,第三方可以给模型提供新的指令,诱导模型产出模型制作者和终端用户用意之外的输出。

可解释性:生成式 AI 依赖拥有数十亿参数的神经网络,人们因而很难解释某个答案从何而来。可靠性:模型对相同的提示会产生不同的回答,使用户难以评估输出的准确性和可靠性。

组织影响:生成式 AI 可能会对劳动力产生重大影响,对某些特定群体和社区的负面影响可能尤为巨大。

社会和环境影响:基础大模型的开发和训练可能会危害社会和环境,包括增加碳排放。

鉴于训练模型需要庞大的计算资源而完善模型需要大量人力,因而首款基础大模型的开发需要巨大的投资。这导致相关开发工作被部分科技巨头、有充足投资支持的初创公司以及一些开源合作研究机构(例如 BigScience)主导。然而,针对有效处理若干任务的小规模模型的研究、以及提高训练效率的工作,均方兴未艾。这最终可能为更多企业打开市场。部分初创公司已经成功开发了自己的模型,例如,Cohere、Anthropic 和 AI21 实验室都建立并训练了自己的大型语言模型。

将生成式 AI 应用于工作

生成式 AI 在企业中的很多应用(尽管未必是全部价值)将来自员工对现有软件中新嵌入功能的使用。电子邮件系统可以给出邮件初稿;生产应用将根据描述生成演示文稿的初稿;财务软件可对财务报告中的要点给出文字描述;客户关系管理系统则可以提供客户互动建议。

生成式 AI 不仅可以为企业开辟新用例,还可以加速、扩展或改进现有用例。以电销场景为例,经过专门训练的 AI 模型可以帮助销售人员发现追加销售机会,但截至目前,这些模型通常还只能根据通话前收集的人口统计信息和购买规律等静态客户数据来判断追加销售的可能性。生成式 AI 工具则可根据实际对话内容,利用内部客户数据、外部市场趋势和社交媒体影响者数据,实时为销售人员提供追加销售建议。同时,生成式 AI 还可以为销售人员撰写销售话稿,供其根据具体情况进行调整。

CEO 们应将探索生成式 AI 列入工作议程,不能仅视之为“可选项”。生成式 AI 可通过广泛用例创造价值。起步的经济和技术要求并非高不可攀,而无所作为则可能导致迅速被竞争对手甩开。每一名 CEO 都应同管理团队一起思考竞争领域与方法。一些 CEO 可能会认定,生成式 AI 将为企业带来变革性机遇,全面重塑从研发到营销、从销售到客户运营等各个领域。还有些 CEO 则可能选择从小处着手,再逐渐扩大规模。一旦做出决策,AI 专家便可根据场景需要,通过相应技术路径执行战略。

本文摘编自Mckinsey Digital发布的《生成式 AI:CEO 必读指南》,谨代表其旗下科技委员会(McKinsey Technology Council)和QuantumBlack, AI by McKinsey的观点。全文下载:

更多标准、白皮书、报告等高质量纯净资料下载,在文末扫码关注官方微信公众号“idtzed”,进入公众号菜单“治库”,或按自动回复发送引号内关键词。

更多相关内容推荐:

AI 和数据民主化影响下 企业人工智能的入门技巧
随着 AI 工具变得更容易被所有级别的用户使用,各行各业的企业都看到了新的效率和增长机会, AI 在企业中具有推动创新、提高效率和改善决策的巨大潜力。

用 AI 工具打败工具人 给 CDO 和 HR 的数据素养组织先导指南
这有份循序渐进的指南带你了解招聘和搭建一个成功的数字团队所需的关键要素,给出你可以采取的具体行动,促使你的数字团队和招聘达到新的高度。

发条评论

你的电邮不会被公开。有*标记为必填。