在数字化时代,企业对知识管理的需求日益增长。一个高效、智能的知识库问答系统不仅能提升员工的工作效率,还能优化客户服务体验。本文将详细介绍如何基于 MaxKB、Ollama 和 Llama3 打造产品的私有化知识库问答系统。

1 背景

随着产品的需求的不断增长,传统的conf管理方式已难以满足查找历史需求的要求。因此需要一个智能的知识库问答系统来提供快速、准确的信息支持。本文使用MaxKB、Ollama 和 Llama3 的结合为这一需求提供了完美的解决实践。

2 实践方案

  • 技术选型

知识管理:MaxKB 是一款基于大语言模型(LLM)的知识库问答系统,支持多种主流大语言模型,包括 Llama3、OpenAI 等。它具有开箱即用、模型中立、灵活编排和无缝嵌入等特点,能够快速搭建并部署知识库问答系统。

推理框架:Ollama 是一个轻量级的模型管理工具,可以方便地管理和运行大语言模型。它支持多种模型,包括 Llama3,并且可以通过简单的命令行操作进行部署和运行。

基础模型:Llama3 是一个高性能的大语言模型,具有强大的自然语言处理能力,能够提供准确的问答服务。


  • 实践路径

  • 环境准备

1. 安装 Docker运行环境

Docker Desktop 是适用于 Mac、Linux 或 Windows 环境的一键式安装应用程序 这允许您构建、共享和运行容器化应用程序和微服务。它提供了一个简单的 GUI(图形用户界面),允许您直接从计算机管理容器、应用程序和映像,Docker Desktop支持 Mac、Windows 或 Linux 上安装 。注:个人使用是免费的,但商业用途需要付费订阅。

以windows为案例:

1.使用页面顶部的下载按钮或从发行说明下载安装程序。
2.双击以运行安装程序。默认情况下,Docker Desktop 安装在 C盘
3.出现提示时,请确保是否选中“配置”页上的“使用 WSL 2 而不是 Hyper-V”选项,具体取决于你选择的后端。如果您的系统仅支持这两个选项之一,您将无法选择要使用的后端。
4.按照安装向导上的说明授权安装程序并继续安装。
5.安装成功后,选择 Close 以完成安装过程。6.启动 Docker Desktop

默认情况下,Docker Desktop会从Docker Hub下载镜像,但在国内由于网络的原因,下载速度可能较慢,配置国内镜像源可以提速镜像下载:

  • 安装 MaxKB

    MaxKB = Max Knowledge Base,是一款基于大语言模型和 RAG 的开源知识库问答系统,广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。

特性:
1.开箱即用支持直接上传文档 / 自动爬取在线文档,支持文本自动拆分、向量化和 RAG(检索增强生成),有效减少大模型幻觉,智能问答交互体验好;
2.快速接入支持零编码嵌入到第三方业务系统,以及快速接入企业微信、钉钉、飞书、公众号等应用,让已有系统快速拥有智能问答能力,提高用户满意度;
3.灵活编排内置强大的工作流引擎和函数库,支持编排 AI 工作过程,满足复杂业务场景下的需求;
4.模型中立支持对接各种大模型,包括本地私有大模型(Llama 3 / Qwen 2 等)、国内公共大模型(通义千问 / 腾讯混元 / 字节豆包 / 百度千帆 / 智谱 AI / Kimi 等)和国外公共大模型(OpenAI / Claude / Gemini 等)。

快速部署:

打开cmd窗口中下载模型,输入一下命令行

docker pull 1panel/maxkb

等下载成功后,然后在Docker Desktop Images目录可以看到该镜像

启动maxkb:

**MaxKB 镜像依赖 PostgreSQL 数据库来存储数据。为了确保数据的持久化和安全性,MaxKB 通过挂载文件卷的方式将数据库文件保存在宿主机上。因此,在 Windows 系统中,需要提前创建一个目录用于挂载卷,以保存数据库文件。**
步骤 1: 创建挂载目录
1.选择盘符:选择一个合适的盘符,例如 E:\。
2.创建目录:在该盘符下创建一个目录,用于挂载卷。假设目录路径为 E:\zzm\dockervolume。

步骤 2: 运行 MaxKB 容器

在运行 MaxKB 容器时,需要将该目录挂载到容器内部的 PostgreSQL 数据库文件目录。具体命令如下:

# Windows 操作系统``docker run -d --name=maxkb -p 8080:8080 -v E:\\zzm\\dockervolume\\maxkb:/var/lib/postgresql/data 1panel/maxkb

步骤 3: 访问 MaxKB 界面

运行容器后,打开浏览器,访问 http://<服务器IP>:8080/ui/login,使用默认账号 admin 和密码 MaxKB@123… 登录。


  • 安装 Ollama:运行 Llama3 模型。

    Ollama 是一个开源的大型语言模型服务工具,旨在帮助用户快速在本地运行大模型。通过简单的安装指令,用户可以通过一条命令轻松启动和运行开源的大型语言模型。Ollama 提供了一个简洁易用的界面,使得用户无需深入了解复杂的底层技术,就能轻松地加载、运行和交互各种大型语言模型(LLM)。

1.下载安装包:访问 Ollama 官方网站 https://ollama.com/ 的下载页面:Ollama 下载。选择Windows并点击下载。

2.安装 Ollama:下载完成后,双击安装包进行安装。安装过程中,遵循提示完成安装步骤。默认安装路径为 C:\Users\{你的电脑账户名}\AppData\Local\Programs\Ollama。要将 Ollama 应用程序安装在不同于用户目录的位置,请使用以下标志启动安装程序:

OllamaSetup.exe /DIR="d:\some\location"

3.修改模型的位置配置环境变量:

要更改 Ollama 存储下载模型的位置,而不是使用你的主目录,可以在你的用户账户中设置环境变量 OLLAMA\_MODELS。
  1. 启动设置(Windows 11)或控制面板(Windows 10)应用程序,并搜索 环境变量。

  2. 点击 编辑账户环境变量。

  3. 编辑或创建一个新的用户账户变量 OLLAMA_MODELS,设置为你希望存储模型的路径。

  4. 点击确定/应用以保存

4.验证安装

打开命令提示符,输入 ollama --version 来验证安装是否成功。

启动ollama 加载llama3 中文模型:

启动ollama

选择你需要的模型,并安装

ollama pull llama3

输入ollama list 查看已下载的模型镜像文件`` ``模型测试


  • 功能验证

maxkb 配置ollama

a. 在模型设置页面中,点击“添加模型”按钮。

API 地址:假设你的本地电脑 IP 是172.20.xxx.xxx,并且你已经开启了远程 IP 访问,确保容器可以访问本地 Ollama 服务。

注意:API 域名不可使用 127.0.0.1 或 localhost。 使用上述IP地址,需要配置环境变量OLLAMA_HOST=0.0.0.0

b.创建知识库

打开【知识库】页面,点击【创建知识库】,输入知识库名称、知识库描述、选择通用型知识库类型,然后将离线文档通过拖拽方式或选择文件上传方式进行上传。

目前 MaxKB 支持智能分段和高级分段两种分段方式。分段规则设置完成后,需要点击【生成预览】查看最新规则的分段效果。

点击【创建并导入】后,系统后台会对文档进行自动分段 -> 存储 -> 向量化处理操作,执行完成后在知识库文档列表中各个文件状态显示为成功。

c.创建应用

在右侧窗口中,输入与知识库相关的内容,系统将依据知识库中的内容检索到相关的产品需求信息,并将其发送至后端的 xxx中文模型进行推理处理,进而构建出一个专属的私有化知识库大模型应用。

  • 3

一些思考

  1. 构建高质量知识库

    单个文档规范:将相关性强的内容尽量聚集在同一段落或章节内,避免指代或缩略关键信息,避免无意义的空行,建议利用项目符号和有意义的缩进来分点阐述。

    多文档规范:确保多个文档之间做到知识独立、知识聚合、规范统一以及覆盖全面。这样做能够显著提高知识的召回准确度,从而提升整体效果。

2. 性能优化

硬件配置:确保运行 MaxKB 的设备配置足够高,以获得更好的性能。在高配置的设备上运行 MaxKB 系统。

模型选择:根据实际需求选择合适的模型,如 Llama3-Chinese:8B 中文模型,以确保推理速度和准确性。

3. 模型拓展

多模型支持:MaxKB 支持对接多种大语言模型,包括本地私有大模型和云端大模型。可以根据实际需求下载并运行其他大语言模型,以拓展 MaxKB 系统的问答能力。

4. 集成与嵌入

无缝嵌入:MaxKB 支持零编码快速嵌入到第三方业务系统中,进一步提升企业的智能化水平和用户体验。

5. 定期更新与维护

知识库更新:定期对知识库进行审核和更新,补充缺失的知识点,淘汰过时的内容,确保知识库的完整性和准确性。

模型更新:定期更新使用的语言模型,以获取最新的功能和性能改进。

6. 用户体验优化

交互设计:优化用户界面和交互设计,提供更直观、易用的操作体验。

反馈机制:添加用户反馈机制,收集用户对问答系统的使用体验和改进建议,持续优化系统。

通过以上优化工作,可以进一步提升基于 MaxKB+Ollama+Llama3 的产品私有化知识库问答系统的性能和用户体验,使其更好地服务于我们的问答需求。

参考文献

如何系统的去学习大模型LLM ?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

事实上,抢你饭碗的不是AI,而是会利用AI的人。

科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

与其焦虑……

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

基于此,我用做产品的心态来打磨这份大模型教程,深挖痛点并持续修改了近70次后,终于把整个AI大模型的学习门槛,降到了最低!

在这个版本当中:

第一您不需要具备任何算法和数学的基础
第二不要求准备高配置的电脑
第三不必懂Python等任何编程语言

您只需要听我讲,跟着我做即可,为了让学习的道路变得更简单,这份大模型教程已经给大家整理并打包,现在将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

在这里插入图片描述

五、AI产品经理大模型教程

在这里插入图片描述

LLM大模型学习路线

阶段1:AI大模型时代的基础理解

  • 目标:了解AI大模型的基本概念、发展历程和核心原理。

  • 内容

    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
    • L1.4.1 知识大模型
    • L1.4.2 生产大模型
    • L1.4.3 模型工程方法论
    • L1.4.4 模型工程实践
    • L1.5 GPT应用案例

阶段2:AI大模型API应用开发工程

  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

  • 内容

    • L2.1 API接口
    • L2.1.1 OpenAI API接口
    • L2.1.2 Python接口接入
    • L2.1.3 BOT工具类框架
    • L2.1.4 代码示例
    • L2.2 Prompt框架
    • L2.3 流水线工程
    • L2.4 总结与展望

阶段3:AI大模型应用架构实践

  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

  • 内容

    • L3.1 Agent模型框架
    • L3.2 MetaGPT
    • L3.3 ChatGLM
    • L3.4 LLAMA
    • L3.5 其他大模型介绍

阶段4:AI大模型私有化部署

  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

  • 内容

    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐