Cursor + MCP + 文档智能体,疯了,太爽了呀!!!
摘要:本文介绍了基于AI技术的文档智能体开发流程。首先通过爬虫工具采集文档数据,经过清洗处理后上传至知识库平台创建智能体。同时搭建MCP(模型上下文)服务,并将其集成到Cursor AI编程工具中。整个流程包含文档采集、数据清洗、智能体创建、MCP服务部署和系统集成等步骤,最终实现了一个能够理解文档内容并提供智能问答服务的解决方案。文章还推荐了相关工具平台和测试方法,为开发者提供了一套完整的实施指
一、基础信息同步
1、Cursor
Cursor是Anysphere推出的AI编程工具 ,基于微软开源代码编辑器VS Code开发,将AI融入开发人员工作流程。它能自动用自然语言写代码,从代码库获取答案,参考特定文件文档,还能预测编辑内容。开发者通过指令编写代码,简单提示词就能更新类或函数。
2、MCP
MCP 即模型上下文,在人工智能领域意义重大。它指的是在模型运行期间,为其提供的相关信息集合。这些信息能帮助模型更好地理解任务需求、处理数据和做出决策。比如在对话式 AI 中,模型上下文包含之前的对话内容,使 AI 能结合前文准确回复。在图像识别里,上下文信息可以是图像的拍摄背景等。良好的 MCP 可提升模型的准确性和泛化能力,让其在复杂多变的实际场景中更出色地完成任务,从而为用户带来更优质、智能的服务体验。
3、智能体
AI智能体是一种基于人工智能技术构建的智能系统。它能够感知环境并做出决策,以实现特定目标。通过机器学习算法,AI智能体可以从大量数据中学习规律和模式,不断提升自身的性能。它具备自主性,能够在一定范围内独立行动,还能与人类或其他智能体交互。例如,在智能家居场景中,AI智能体可以自动调节室内温度、灯光等设备,根据用户习惯提供个性化服务,为人们的生活和工作带来便利。
4、RAG知识库
RAG知识库是一种结合检索(Retrieval)和生成(Generation)技术的知识库系统。它通过检索模块从海量数据中快速找到与问题最相关的片段,然后利用生成模块对这些片段进行整合和优化,生成准确、流畅的答案。这种结合方式既利用了检索的高效性和准确性,又发挥了生成的灵活性和创造性。RAG知识库广泛应用于智能问答、文本生成等领域,能够为用户提供高质量的知识服务,帮助人们快速获取所需信息,提升工作效率和知识获取的便捷性。
二、效果图
1、概念流程图
2、实际效果展示图
三、完整流程
1、文档智能体搭建
第一步:采集目标文档
我这里使用爬虫采集,推荐爬虫框架:DrissionPage - drissionpage.cn/。
哈哈哈哈!我用它自己抓取了它自己的文档!
第二步:文档数据清洗
我自己开发了一个工具(可以分享出来,思路很简单,就是调用大模型批量重写),支持对文件批量上传、大文件切割、调取大模型批量清洗、生成清洗后新文件列表、批量下载清洗后的文档。
清洗后的文件列表
原文件
清洗后
第三步:创建文档智能体
将文档上传到知识库,简单配置下就可以了。用过扣子,觉得不太好,后来使用阿里云百炼平台,觉得很好!
阿里云百炼平台:bailian.console.aliyun.com/
上传文档
创建文档智能体
第四步:发布智能体
发布之后,可验证下API调用是否正常。推荐Apifox。
2、MCP 服务搭建
看这个教程
Model Context Protocol(MCP) 编程极速入门
3、集成到Cursor
参考配置,这是本地的 MCP 服务。
{
"chat_with_drissionpage": {
"command": "cmd",
"args": [
"/c",
"cd /d C:\\MyGitHub\\mcp_curl && .venv\\Scripts\\python.exe main.py"
]
},
}
4、享受你的作品
四、进一步交流
摸鱼写的,很是仓促,多多包涵。有问题请评论或私信。
如何学习大模型?
学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。
这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!
这是一份大模型从零基础到进阶的学习路线大纲全览,小伙伴们记得点个收藏!
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
100套AI大模型商业化落地方案
大模型全套视频教程
200本大模型PDF书籍
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
LLM面试题合集
大模型产品经理资源合集
大模型项目实战合集
😝有需要的小伙伴,可以扫描下方二v码免费领取【保证100%免费】🆓
更多推荐
所有评论(0)