2025 AI 冬令营 第二期
由 Datawhale 主办、联合蚂蚁集团(支付宝百宝箱)、 字节跳动(豆包MarsCode) 等顶尖人工智能企业和团队,结合最新AI应用,为学习者提供学习机会,提升专业能力和就业竞争力。

方向一:动手学 AI Agent

方向二:动手学 AI 辅助编程

5分钟创建第一个Agent!

Step1:注册支付宝百宝箱(点击打开官网)

链接:百宝箱

1.点击体验专业版

1.点击体验专业版

2. 支付宝扫码登录

2. 支付宝扫码登录

3. 确认授权

3. 确认授权

4. 同意协议,开通产品

4. 同意协议,开通产品

5.恭喜进入专业版界面

5.恭喜进入专业版界面

Step2:创建对话型应用

1.创建应用

1.创建应用

2.选择对话型应用并命名

2.选择对话型应用并命名

Step3:制作【万能文章生成助手应用】

1.简单填写agent能力并使用AI优化指令

1.简单填写agent能力并使用AI优化指令

2.应用AI优化的指令

2.应用AI优化的指令

点击了解用AI优化指令的价值

Step4:应用发布与配置

1. 点击【发布】

1. 点击【发布】

2. 同意协议,确认发布

2. 同意协议,确认发布

3. 开启web服务~

3. 开启web服务~

Step5:在预览里快速体验

然后就可以愉快地对话啦~

然后就可以愉快地对话啦~

点击快速跳转万能生成助手的体验地址

温馨提示:完成学习记得打卡哟~

你的每一次学习,都值得被记录!快去实践,然后打卡吧!

思考一下:如何实现良好的 AI Agent 效果?

AI Agent是什么?

AI Agent 是目前大模型应用领域的主流研究方向,其核心价值在于借助先进AI技术,打造出更加智能、更加自主的系统。

Agent不仅在处理复杂自然语言任务方面游刃有余,更在图像生成、数据分析、教育指导等多个前沿领域展现出卓越的应用潜力。

关于 AI Agent 框架的定义,目前最广为流传的版本出自 前OpenAI应用研究主管翁丽莲(Lilian Weng)的一篇blog: LLM Powered Autonomous Agents

Lilian Weng定义的Agent结构图

Lilian Weng定义的Agent结构图

在博客里,Lilian 将 Agents 定义为 LLM + memory + planning skills + tool use,即大语言模型、记忆、任务规划、工具使用的集合。

其中,LLM是Agent的大脑,属于“中枢”模型,要求有以下3种能力:

  1. planning skills:对问题进行拆解得到解决路径,既进行任务规划
  2. tool use:评估自己所需的工具,进行工具选择,并生成调用工具请求
  3. memory:短期记忆包括工具的返回值,已经完成的推理路径;长期记忆包括可访问的外部长期存储,例如知识库最早由不仅具备了感知、记忆和决策的全面能力,更能在复杂多变的环境中自主执行任务,并通过与外部工具的紧密协作,显著提升任务处理的效率与准确性。

更多相关知识可见大模型关键技术与应用 ,这篇文章介绍了自ChatGPT发布以来,大模型关键技术和应用的主要进展。

支付宝百宝箱有什么优势?

在这次AI Agent的学习中,我们选择了 支付宝百宝箱 作为开发工具,它具备以下优势和特点——

产品亮点,来源:支付宝百宝箱

产品亮点,来源:支付宝百宝箱

百宝箱智能体开发平台生态图,来源:支付宝百宝箱

百宝箱智能体开发平台生态图,来源:支付宝百宝箱

它除了支持 零代码开发、支持多平台发布、和无限使用多种主流大模型 之外,

  • 有一定的模板辅助开发入门、让小白也能轻松上手
  • 基于支付宝多年的积累,拥有成熟的开放生态,能辅助更多场景落地

当然,支付宝百宝箱现在才刚发布不久,处于初期阶段, 如果大家学习过程中有好的建议或意见也可以积极评论、通过各种方式(打卡表单、QA文档 等)反馈,让支付宝百宝箱的产品经理和开发者看到,帮助产品迭代优化!

我们目前做出来的智能体,缺少了什么?

在本节中使用的智能体创造方式比较简单,还没有加上记忆能力、工具使用能力等,还不能算是一个完整的Agent~

大家可能对目前的效果并不完全满意,请坚持学习,后面我们会逐渐解决这个问题!

怎么让 AI 回答的内容更接近自己的想法?

ai回答内容不尽人意可能是问题描述不够清晰明确,导致ai对你的意思没有完全理解。可以试试对你在意的文字描述更清晰一些~

这个部分,就需要学习更多的Prompt工程的知识!能够不断迭代,达成这个目标!

进阶一下:尝试更多功能和案例

探索更多百宝箱功能

点击了解百宝箱更多功能

百宝箱智能体编辑界面

百宝箱智能体编辑界面

其下方的功能说明如下表所示:

用文本型应用模式创建更可控的万能文章助手

学习目标

实践目标:创建一个 更可控的智能体 ,可以满足稍微复杂的文本生成定制需求。

相关学习内容:一定 Prompt技巧,并理解 字段 的意义。

学习价值:为 prompt工程、工作流及复杂的内容 学习做铺垫。

点击展开学习

1. 新建文本型应用

2. 配置智能体

2.1 增加字段配置

本次目标是实现一个万能文章生成助手plus应用,请大家按照下面的步骤配置。

添加字段配置

添加字段配置

2.2 输入字段信息

填入字段信息

填入字段信息

对应字段内容如下:

  • 题目 :单行文本,输入文章标题

  • 文章类别 :单行文本,输入文章类别,如:工作总结、日报、科研论文、小红书文案、知乎文案

  • 字数 :单行文本,输入文章目标字数,如:300

  • 写作风格 :单行文本,输入文章写作风格,如:故事感、口语化、科研论文、网感

  • 参考内容 :多行文本,输入参考内容,如参考文章等

2.3 填入对应的Prompt

填入对应的Prompt

填入对应的Prompt

参考Prompt

帮我写一个关于{{题目}}的文章。 需要以{{文章类型}}的文章类型撰写。 字数严格限制在{{字数}}字。 需要以:{{写作风格}}写作风格 你可以参考:{{参考内容}}。

3. 发布并体验

方法与上面介绍的相同~

大致效果展示

大致效果展示

用文生图应用模式创建头像生成助手

学习目标

实践目标:创建一个可控的头像生成智能体,可以满足稍微复杂的定制需求

相关学习内容:学习并使用文生图应用创建模式,并初步了解图像生成ai的工作原理

点击展开学习

1. 创建一个文生图应用

2. 配置智能体

2.1 选择模型

2.2 设置相关字段

同样要添加字段,然后输入Prompt

对应字段内容如下:

  • 主题 :单行文本,填写头像主题,如:帅气男头
  • 颜色 :单行文本,如:蓝色、黑色等
  • 风格 :单行文本,如:可爱风、漫画风、写实风
  • 特殊要求 :单行文本,可以写一些细节描述等。
2.3 设置Prompt

参考Prompt

请帮我画一幅关于个性化头像的图,头像主题是{{主题}},主题颜色是{{颜色}},需要的绘画风格是{{风格}}画风。 需要突出主题,背景色彩和结构不要杂乱。 需要满足特殊要求:{{特殊要求}}

2.4 设置限定词

参考Prompt

皮肤斑点,痤疮,皮肤瑕疵,老年斑,丑陋,重复,病态,变性人,残缺,变异的手,模糊,比例不当,不适合上班时间浏览,低分辨率,单色,灰度

点击了解限定词

限定词:输入一段话描述不希望出现画面里的内容。防止图像模型绘制出奇怪的图像影响输出,这里我们选定了系统默认的限定词,大家也可以加一些。

2.5:效果展示

更多细节介绍

点击了解图像控制

如果你想做自己的动漫图可以参考下面这个例图,在图像控制里加入图片并且选择边缘检测。

点击了解更多设置

人像优化:一般做头像时需要手动开启~

提示词相关性:如果想完全按照描述(描述的足够细致)可以适度提升这个属性。

迭代次数:如果需要更精细的图片可以拉高,但是需要付出时间代价,也有崩坏的可能。

采样器:在Stable Diffusion(简称SD)模型中,采样器(sampler)是一种用于生成图像的核心算法。其主要作用是在生成图像的过程中逐步去除噪声,从而得到清晰的图像。

随机种子:如果需要复现每次的结果可以固定一个正整数值。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐