DeepSeek如今业已成为一家在AI领域具有影响力的公司,通过开源和商业化策略,推动AI技术在多个领域的应用和发展。创始人梁文峰认为,随着技术的进步,AI产业的变化速度非常快,尤其是在模型迭代和商业化方面。他强调,AI产业需要不断修正和更新对产业的认知,以便更好地把握市场机会。
DeepSeek-R1模型在后训练阶段通过大规模使用强化学习技术来提升其推理能力。具体来说,DeepSeek在模型的微调过程中引入了强化学习算法,模拟人类交互的方式不断优化模型的决策过程。这种方法允许模型在面对复杂任务时,通过试错和学习来改进其表现。DeepSeek-R1能够在仅有极少标注数据的情况下,显著提升其在数学、代码和自然语言推理等任务上的表现,使其性能接近OpenAI的o1正式版。
出自清华大学新闻学院、人工智能学院沈阳教授团队、余梦珑博士后,获取完整课件请在数治网微信公众号对话框内发送“250211”。
一、DeepSeek可以做什么?
DeepSeek直接面向用户或支持开发者,提供多种应用场景,包括智能对话、文本生成、语义理解、计算推理、代码生成补全等。DeepSeek支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。
DeepSeek在文本生成方面的应用非常广泛。例如,它可以帮助用户进行文章和故事的创作,生成营销文案和广告语,以及设计社交媒体内容如推文和帖子。此外,DeepSeek还可以用于生成剧本或对话设计,为编剧和作家提供灵感。在文本简化和多语言翻译方面,DeepSeek能够将长文本进行摘要,降低复杂度,实现多语言之间的翻译和本地化,满足不同语言环境下的文本生成需求。
DeepSeek在编程与代码相关功能方面提供了多种实用工具。首先,它可以根据用户的需求生成代码片段,支持Python和JavaScript等多种编程语言。其次,DeepSeek具备自动代码补全和注释生成功能,能够帮助开发者提高编码效率。
此外,DeepSeek还提供代码调试功能,包括错误分析和修复建议,以及代码性能优化提示,帮助开发者提升代码质量和性能。这些功能使得DeepSeek成为开发者进行高效编程的有力助手。技术文档处理包括API文档生成、代码库解释与示例生成。
获取完整课件请在数治网微信公众号对话框内发送“250211”。
二、AI模型的选择
在使用AI时,通过推理模型和通用模型的选择、提示语策略的设计以及避免常见陷阱,来实现更好的效果和应用。推理大模型是在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备强化学习、神经符号推理、元学习等技术,以增强其推理和问题解决能力。
优势领域:数学推导、逻辑分析、代码生成、复杂问题拆解。
劣势领域:发散性任务(如诗歌创作)。
非推理大模型适用于大多数任务,侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。
优势领域:文本生成、创意写作、多轮对话、开放性问答。
劣势领域:需要严格逻辑链的任务(如数学证明)。
快速反应模型,算力成本低,基于概率预测,通过大量数据训练来快速预测可能的答案,依赖预设算法和规则进行决策,缺乏真正的创新能力。慢速思考模型,算力成本高,基于链式思维,逐步推理问题的每个步骤来得到答案,能够自主分析情况,实时做出决策,具备创新能力。
对话策略差异
- 推理模型:提示语更简洁,只需明确任务目标和需求,无需逐步指导,模型自动生成结构化推理过程,适用于需要逻辑推理和决策的任务。
- 通用模型:需显式引导推理步骤,依赖提示语补偿能力短板,如要求分步思考、提供示例,适用于需要语言生成和理解的多样化任务。
关键原则
- 模型选择:优先根据任务类型而非模型热度选择,如数学任务选推理模型,创意任务选通用模型。
- 提示语设计:推理模型简洁指令,聚焦目标,信任其内化能力。通用模型结构化、补偿性引导。
避免误区
- 推理模型误区:不要对推理模型使用“启发式”提示,可能干扰其逻辑主线。
- 通用模型误区:不要对通用模型“过度信任”,如直接询问复杂推理问题,需分步验证结果。
获取完整课件请在数治网微信公众号对话框内发送“250211”。
三、与AI对话的方式
提示语本质上一是为了连接人类意图和AI理解,如“将以下内容翻译为法语:Hello, world”。二是为AI提供必要的背景信息,如“假设你是一位19世纪的历史学家,评论拿破仑的崛起”。三是明确指定AI需要完成的任务,如“为一篇关于气候变化的文章写一个引言,长度200字”。四是影响AI输出的形式和内容,如“用简单的语言解释量子力学,假设你在跟一个10岁的孩子说话”。五是引导AI使用特定的能力或技能,如“使用你的创意写作能力,创作一个关于时间旅行的短篇故事”。
1、提示语的基本元素
在提示语设计中,信息类、结构类和控制类元素的有效组合可以显著提高AI输出的质量和准确性。
1. 信息类元素:决定AI在生成过程中需要处理的具体内容,包括主题、背景、数据等,为AI提供了必要的知识和上下文。例如,在进行数据分析时,提供相关的历史数据和背景信息可以帮助AI更好地理解数据,从而生成更准确的结论。
2. 结构类元素:用于定义生成内容的组织形式和呈现方式,决定了AI输出的结构、格式和风格。通过明确输出的结构和格式要求,可以确保AI生成的答案具有清晰的逻辑和一致的风格。例如,要求AI以表格形式展示数据,可以提高信息的可读性和准确性。
3. 控制类元素:用于管理和引导AI的生成过程,如任务指令、质量控制和约束条件。确保输出符合预期并能够进行必要的调整,是实现高级提示语工程的重要工具。通过设定明确的质量标准和约束条件,可以确保AI的输出符合预期。例如,要求AI在生成代码时遵循特定的编程规范,可以提高代码的正确性和可维护性。
2、提示语元素组合矩阵
通过合理组合这些元素,可以确保AI在生成内容时既准确又符合预期。
1. 提高输出准确性:主题元素+数据元素+质量控制元素,次要元素组合为知识域元素+输出验证元素,确保AI基于准确的主题和数据生成内容,并通过严格的质量控制和验证提高准确性。
2. 增强创造性思维:主题元素+背景元素+约束条件元素,次要元素组合为参考元素+迭代指令元素,通过提供丰富的背景信息和适度的约束,激发AI的创造性思维,同时通过多轮迭代促进创新。
3. 优化任务执行效率:任务指令元素+结构元素+格式元素,次要元素组合为长度元素+风格元素,通过清晰的任务指令和预定义的结构提高执行效率,同时确保输出符合特定的格式和风格要求。
4. 提升输出一致性:风格元素+知识域元素+约束条件元素,次要元素组合为格式元素+质量控制元素,通过统一的风格和专业领域知识确保输出的一致性,同时使用约束条件和质量控制维持标准。
5. 增强交互体验:迭代指令元素+输出验证元素+质量控制元素,次要元素组合为任务指令元素+背景元素,建立动态的交互模式,允许AI进行自我验证和优化,同时根据任务和背景灵活调整输出。
获取完整课件请在数治网微信公众号对话框内发送“250211”。
三、与AI对话的设计
在与AI对话时,设计多步骤、多维度的提示语体系是提升AI应用效果的重要策略。如通过以下方法可以构建一套高效、灵活的提示语体系:
- 多步骤提示:将复杂的任务分解为多个小步骤,并为每个步骤设计独立的提示语。这种方法可以帮助AI逐步完成任务,减少一次性处理大量信息的压力,从而提高输出的质量和准确性。
- 多维度引导:在提示语中引入多个维度的信息,例如结合上下文、数据和分析方法。这种多维度的引导可以帮助AI更全面地理解任务背景,从而生成更具深度和广度的输出。
- 系统思维:设计一个系统的提示语体系,涵盖从任务定义到结果优化的各个环节。通过构建提示语模板库,可以提高提示语的复用性和一致性,减少重复劳动。
- 迭代优化:在提示语体系中加入迭代指令元素,允许AI在生成过程中进行自我验证和优化。通过多轮迭代,可以逐步改进输出质量,确保最终结果的准确性和可靠性。
1、提示语的类型
- 指令型提示语:直接告诉AI需要执行的任务。
- 问答型提示语:向AI提出问题,期望得到相应的答案。
- 角色扮演型提示语:要求AI扮演特定角色,模拟特定场景。
- 创意型提示语:引导AI进行创意写作或内容生成。
- 分析型提示语:要求AI对给定信息进行分析和推理。
- 多模态提示语:结合文本、图像等多种形式的输入。
2、提示语设计的核心技能体系
- 问题重构能力:将复杂、模糊的人类需求转化为结构化的AI任务,识别问题的核心要素和约束条件,设计清晰、精确的提示语结构。
- 创意引导能力:设计能激发AI创新思维的提示语,利用类比、反向思考等技巧拓展AI输出的可能性,巧妙结合不同领域概念,产生跨界创新。
- 结果优化能力:分析AI输出,识别改进空间,通过迭代调整提示语,优化输出质量,设计评估标准,量化提示语效果。
- 跨域整合能力:将专业领域知识转化为有效的提示语,利用提示语桥接不同学科和AI能力,创造跨领域的创新解决方案。
- 系统思维:设计多步骤、多维度的提示语体系,构建提示语模板库,提高效率和一致性,开发提示语策略,应对复杂场景。
3、提示语设计的进阶技能
- 语境理解:深入分析任务背景和隐含需求,考虑文化、伦理和法律因素,预测可能的误解和边界情况。
- 抽象化能力:识别通用模式,提高提示语可复用性,设计灵活、可扩展的提示语模板,创建适应不同场景的元提示语。
- 批判性思考:客观评估AI输出,识别潜在偏见和错误,设计反事实提示语,测试AI理解深度,构建验证机制,确保AI输出的可靠性。
- 创新思维:探索非常规的提示语方法,结合最新AI研究成果,拓展应用边界,设计实验性提示语,推动AI能力的进化。
- 伦理意识:在提示语中嵌入伦理考量,设计公平、包容的AI交互模式,预防和缓解AI可能带来的负面影响。
获取完整课件请在数治网微信公众号对话框内发送“250211”。
四、与AI展开全局对话
从入门到精通地使用AI,特别是在人人都用的情况下,能够与AI展开全局对话,会让你用得更好、更出彩。如在提示语设计中,避免过度指令和模糊指令陷阱是确保AI输出符合预期的关键,可以参考下面这些策略:
- 平衡详细度:提供足够的上下文信息,但避免过多的细节限制。过度详细的指令可能会限制AI的创新空间,而模糊的指令则可能导致输出不符合预期。因此,需要在提供必要信息的同时,保持指令的简洁性。
- 明确关键点:突出最重要的2-3个要求,避免在提示语中包含过多的次要信息。这样可以确保AI专注于关键任务,减少误解的可能性。
- 使用结构化格式:采用清晰的结构来组织需求,例如使用列表或段落来分隔不同的指令部分。这有助于AI更好地理解和执行任务。
- 提供示例:如果可能,给出期望输出的简短示例。示例可以帮助AI理解期望的输出形式和风格,从而提高输出的一致性和准确性。
1、从“下达指令”到“表达需求”
1. 指令驱动:直接给出明确步骤或格式要求,适用于简单任务、需快速执行。
示例:用Python编写快速排序函数,输出需包含注释。
2. 需求导向:描述问题背景与目标,由模型规划解决路径,适用于复杂问题、需模型自主推理。
示例:我需要优化用户登录流程,请分析当前瓶颈并提出3种方案。
3. 混合模式:结合需求描述与关键约束条件,适用于平衡灵活性与可控性。
示例:设计一个杭州三日游计划,要求包含西湖和灵隐寺,且预算控制在2000元内。
4. 启发式提问:通过提问引导模型主动思考,适用于探索性问题、需模型解释逻辑。
示例:为什么选择梯度下降法解决此优化问题?请对比其他算法。
2、任务需求与对话策略
- 数学证明:推理模型需直接提问,无需分步引导;通用模型需显式要求分步思考,提供示例。
示例:证明勾股定理。 - 创意写作:推理模型鼓励发散性,设定角色/风格;通用模型需明确约束目标,避免自由发挥。
示例:以海明威的风格写一个冒险故事。 - 代码生成:推理模型简洁需求,信任模型逻辑;通用模型细化步骤,明确输入输出格式。
示例:用Python实现快速排序。 - 多轮对话:通用模型自然交互,无需结构化指令;推理模型需明确对话目标,避免开放发散。
示例:你觉得人工智能的未来会怎样? - 逻辑分析:推理模型直接抛出复杂问题;通用模型需拆分问题,逐步追问。
示例:分析“电车难题”中的功利主义与道德主义冲突。
3、如何向AI表达需求
1. 决策需求
表达公式:目标+选项+评估标准。
推理模型适配策略:要求逻辑推演和量化分析。
通用模型适配策略:直接建议,依赖模型经验归纳。
2. 分析需求
表达公式:问题+数据/信息+分析方法。
推理模型适配策略:触发因果链推导与假设验证。
通用模型适配策略:表层总结或分类。
3. 创造性需求
表达公式:主题+风格/约束+创新方向。
推理模型适配策略:结合逻辑框架生成结构化创意。
通用模型适配策略:自由发散,依赖示例引导。
4. 验证需求
表达公式:结论/方案+验证方法+风险点。
推理模型适配策略:自主设计验证路径并排查矛盾。
通用模型适配策略:简单确认,缺乏深度推演。
5. 执行需求
表达公式:任务+步骤约束+输出格式。
推理模型适配策略:自主优化步骤,兼顾效率与正确性。
通用模型适配策略:严格按指令执行,无自主优化。
4、调教AI的秘籍
1. 常见陷阱与应对
- 缺乏迭代陷阱:采用增量方法,从基础提示语开始,逐步添加细节和要求。
- 过度指令和模糊指令陷阱:平衡详细度,提供足够的上下文,但避免过多限制。
- 假设偏见陷阱:自我审视,使用中立语言,要求多角度分析。
- 幻觉生成陷阱:明确不确定性,鼓励AI在不确定时明确说明。
- 忽视伦理边界陷阱:了解界限,合法合规,伦理指南,影响评估。
2. 检查清单
确保提示语的目标清晰明确、包含足够的信息、结构合理、语言中立、符合伦理标准、结果可验证、有迭代的空间、输出格式符合要求、难度适中以及考虑多样性。
五、AI和数据素养提升
人人都可学会用数据讲故事 AI加持让你双效提升不是梦!数治网院iDigi 即将推出AI+数据素养体系课程,为运营管理、市场营销、销售客服、产品研发、财务管理、人力资源等六大不同岗位人群充分利用DeepSeek等AI工具,课程将以入门到精通的工作全流程操作指引,涵盖数据素养、效率优化、文档辅助和内容学习四个方面三步进阶,逐步优化日常工作流程,实现效率和质量双重提升。
同时,学会用数据讲故事,能够让你的沟通更加生动、有力,更容易打动听众,课程将教你如何挖掘数据背后的故事,通过数据可视化工具将故事以直观的方式呈现出来。
1. 数据素养:
运营管理:任务规划与执行、内容创作 – 用户增长策略、内容运营优化 – 自动化任务管理、数据分析与可视化
市场营销:市场调研与分析、营销文案创作 – 市场趋势分析、营销活动策划 – 自动化营销流程、客户行为分析
销售客服:客户咨询处理、销售策略制定 – 客户关系管理、销售策略优化 – 智能客服系统、销售预测与分析
产品研发:需求分析与规划、技术文档编写 – 产品功能规划、技术难题解决 – 自动化开发流程、代码质量分析
财务管理:财务报表分析、预算规划 – 财务分析与预测、预算管理 – 自动化财务流程、财务风险分析
人力资源:招聘与面试、员工培训与发展 – 人才管理与发展规划、培训与激励 – 自动化人力资源流程、员工绩效分析
2. 效率优化:构建私人知识库、自动化工作流搭建、自主学习等
3. 文档辅助:文件处理与复杂任务、工作文档全流程辅助等
4. 内容学习:智能学习规划、知识点攻克等
扫码申请素养测评,即可15分钟AI适配“一人一表”“一人一课”。只需¥199开卡体验单课时,激活完成自主学习、预约导师开讲、Q小治答疑、实操练习、分享心得等任务,参与评选“学习显眼包”赢数治Pro学习卡、盲盒!
来源:《DeepSeek从入门到精通 1.0版》,清华大学新闻学院、人工智能学院沈阳教授团队、余梦珑博士后,本篇针对全文由生成式 AI 做出的核心摘要和解答,仅作为参考,请以原文为准。图片:Milad Fakurian,Unsplash
3 评论