5分钟创建第一个Agent！

2025 AI 冬令营第二期由 Datawhale 主办、联合蚂蚁集团（支付宝百宝箱）、字节跳动（豆包MarsCode）等顶尖人工智能企业和团队，结合最新AI应用，为学习者提供学习机会，提升专业能力和就业竞争力。

风之桠

3917人浏览 · 2024-12-23 23:15:51

风之桠 · 2024-12-23 23:15:51 发布

2025 AI 冬令营第二期
由 Datawhale 主办、联合蚂蚁集团（支付宝百宝箱）、字节跳动（豆包MarsCode）等顶尖人工智能企业和团队，结合最新AI应用，为学习者提供学习机会，提升专业能力和就业竞争力。

方向一：动手学 AI Agent

方向二：动手学 AI 辅助编程

5分钟创建第一个Agent！

Step1：注册支付宝百宝箱（点击打开官网）

链接：百宝箱

1.点击体验专业版

2. 支付宝扫码登录

3. 确认授权

4. 同意协议，开通产品

5.恭喜进入专业版界面

Step2：创建对话型应用

1.创建应用

2.选择对话型应用并命名

Step3：制作【万能文章生成助手应用】

1.简单填写agent能力并使用AI优化指令

2.应用AI优化的指令

点击了解用AI优化指令的价值

Step4：应用发布与配置

1. 点击【发布】

2. 同意协议，确认发布

3. 开启web服务~

温馨提示：完成学习记得打卡哟~

你的每一次学习，都值得被记录！快去实践，然后打卡吧！

思考一下：如何实现良好的 AI Agent 效果？

AI Agent是什么？

AI Agent 是目前大模型应用领域的主流研究方向，其核心价值在于借助先进AI技术，打造出更加智能、更加自主的系统。

Agent不仅在处理复杂自然语言任务方面游刃有余，更在图像生成、数据分析、教育指导等多个前沿领域展现出卓越的应用潜力。

关于 AI Agent 框架的定义，目前最广为流传的版本出自前OpenAI应用研究主管翁丽莲(Lilian Weng)的一篇blog: LLM Powered Autonomous Agents，

Lilian Weng定义的Agent结构图

在博客里，Lilian 将 Agents 定义为 LLM + memory + planning skills + tool use，即大语言模型、记忆、任务规划、工具使用的集合。

其中，LLM是Agent的大脑，属于“中枢”模型，要求有以下3种能力：

planning skills：对问题进行拆解得到解决路径，既进行任务规划
tool use：评估自己所需的工具，进行工具选择，并生成调用工具请求
memory：短期记忆包括工具的返回值，已经完成的推理路径；长期记忆包括可访问的外部长期存储，例如知识库最早由不仅具备了感知、记忆和决策的全面能力，更能在复杂多变的环境中自主执行任务，并通过与外部工具的紧密协作，显著提升任务处理的效率与准确性。

更多相关知识可见大模型关键技术与应用，这篇文章介绍了自ChatGPT发布以来，大模型关键技术和应用的主要进展。

支付宝百宝箱有什么优势？

在这次AI Agent的学习中，我们选择了 支付宝百宝箱 作为开发工具，它具备以下优势和特点——

产品亮点，来源：支付宝百宝箱

百宝箱智能体开发平台生态图，来源：支付宝百宝箱

它除了支持 零代码开发、支持多平台发布、和无限使用多种主流大模型 之外，

有一定的模板辅助开发入门、让小白也能轻松上手
基于支付宝多年的积累，拥有成熟的开放生态，能辅助更多场景落地

当然，支付宝百宝箱现在才刚发布不久，处于初期阶段，如果大家学习过程中有好的建议或意见也可以积极评论、通过各种方式（打卡表单、QA文档等）反馈，让支付宝百宝箱的产品经理和开发者看到，帮助产品迭代优化！

我们目前做出来的智能体，缺少了什么？

在本节中使用的智能体创造方式比较简单，还没有加上记忆能力、工具使用能力等，还不能算是一个完整的Agent~

大家可能对目前的效果并不完全满意，请坚持学习，后面我们会逐渐解决这个问题！

怎么让 AI 回答的内容更接近自己的想法？

ai回答内容不尽人意可能是问题描述不够清晰明确，导致ai对你的意思没有完全理解。可以试试对你在意的文字描述更清晰一些~

这个部分，就需要学习更多的Prompt工程的知识！能够不断迭代，达成这个目标！

进阶一下：尝试更多功能和案例

探索更多百宝箱功能

点击了解百宝箱更多功能

百宝箱智能体编辑界面

其下方的功能说明如下表所示：

用文本型应用模式创建更可控的万能文章助手

学习目标

实践目标：创建一个 更可控的智能体 ，可以满足稍微复杂的文本生成定制需求。

相关学习内容：一定 Prompt技巧，并理解 字段 的意义。

学习价值：为 prompt工程、工作流及复杂的内容学习做铺垫。

点击展开学习

1. 新建文本型应用

2. 配置智能体

2.1 增加字段配置

本次目标是实现一个万能文章生成助手plus应用，请大家按照下面的步骤配置。

添加字段配置

2.2 输入字段信息

填入字段信息

对应字段内容如下：

题目：单行文本，输入文章标题
文章类别 ：单行文本，输入文章类别，如：工作总结、日报、科研论文、小红书文案、知乎文案
字数：单行文本，输入文章目标字数，如：300
写作风格 ：单行文本，输入文章写作风格，如：故事感、口语化、科研论文、网感
参考内容 ：多行文本，输入参考内容，如参考文章等

2.3 填入对应的Prompt

填入对应的Prompt

参考Prompt

帮我写一个关于{{题目}}的文章。需要以{{文章类型}}的文章类型撰写。字数严格限制在{{字数}}字。需要以：{{写作风格}}写作风格你可以参考：{{参考内容}}。

3. 发布并体验

方法与上面介绍的相同~

大致效果展示

用文生图应用模式创建头像生成助手

学习目标

实践目标：创建一个可控的头像生成智能体，可以满足稍微复杂的定制需求

相关学习内容：学习并使用文生图应用创建模式，并初步了解图像生成ai的工作原理

点击展开学习

1. 创建一个文生图应用

2. 配置智能体

2.1 选择模型

2.2 设置相关字段

同样要添加字段，然后输入Prompt

对应字段内容如下：

主题：单行文本，填写头像主题，如：帅气男头
颜色：单行文本，如：蓝色、黑色等
风格：单行文本，如：可爱风、漫画风、写实风
特殊要求 ：单行文本，可以写一些细节描述等。

2.3 设置Prompt

参考Prompt

请帮我画一幅关于个性化头像的图，头像主题是{{主题}}，主题颜色是{{颜色}}，需要的绘画风格是{{风格}}画风。需要突出主题，背景色彩和结构不要杂乱。需要满足特殊要求：{{特殊要求}}

2.4 设置限定词

参考Prompt

皮肤斑点,痤疮,皮肤瑕疵,老年斑,丑陋,重复,病态,变性人,残缺,变异的手,模糊,比例不当,不适合上班时间浏览,低分辨率,单色,灰度

点击了解限定词

限定词：输入一段话描述不希望出现画面里的内容。防止图像模型绘制出奇怪的图像影响输出，这里我们选定了系统默认的限定词，大家也可以加一些。

2.5：效果展示

更多细节介绍

点击了解图像控制

如果你想做自己的动漫图可以参考下面这个例图，在图像控制里加入图片并且选择边缘检测。

点击了解更多设置

人像优化：一般做头像时需要手动开启~

提示词相关性：如果想完全按照描述（描述的足够细致）可以适度提升这个属性。

迭代次数：如果需要更精细的图片可以拉高，但是需要付出时间代价，也有崩坏的可能。

采样器：在Stable Diffusion（简称SD）模型中，采样器（sampler）是一种用于生成图像的核心算法。其主要作用是在生成图像的过程中逐步去除噪声，从而得到清晰的图像。

随机种子：如果需要复现每次的结果可以固定一个正整数值。

https://edu.csdn.net/learn/39067/627173?utm_source=2019755004

汇聚全球AI编程工具，助力开发者即刻编程。

更多推荐

揭秘与评测 30K+ Star 的 Graphify：企业存量系统 AI 编码的“第二大脑“。

AI编程社区

GPT-5.5 Codex 国内使用教程：Windows / macOS / Linux 配置

本文介绍了在国内环境下配置和使用GPT-5.5 Codex的详细方法。主要内容包括： Codex是OpenAI的AI编程助手，能够理解项目上下文、修改代码、执行测试等复杂任务国内使用需要准备API访问入口，通过API Key方式配置详细说明了Windows、macOS和Linux三大系统的配置步骤：安装Node.js和Codex CLI 创建.codex目录和配置文件配置auth.json

AI编程社区

Claude Code 完全使用指南：从入门到精通的终端AI编程助手

本文介绍了ClaudeCode是一款基于Claude4系列模型的终端原生AI编程工具，可直接在终端中实现代码生成、调试和自动化任务处理。其核心优势包括200k超长上下文支持、直接文件操作能力和Unix哲学集成。文章详细介绍了安装方法、核心功能（斜杠命令、快捷键、高效技巧）、CLAUDE.md配置的重要性以及进阶玩法（MCP服务器、PlanMode、并行工作流）。最新桌面版新增多会话管理、SSH远程