MaxKB(Max Knowledge Base)是一款基于 LLM 大语言模型的开源知识库问答系统,
飞致云是中国领先的开源软件公司。飞致云旗下开源产品包括 1Panel 开源面板、JumpServer 开源堡垒机、DataEase 开源数据可视化分析工具、MeterSphere 开源测试工具、Halo 开源建站工具、MaxKB 开源知识库问答系统等,涵盖运维面板、运维审计、BI 分析、软件测试、CMS 建站、知识库问答等多个领域。飞致云旗下的开源项目在开源社区表现出了卓越的成长性,在代码托管平台 GitHub 上所获得的 Star 总数已经超过 12 万。
官方网址:https://maxkb.cn/
记得使用最新版本!!
新增功能
功能优化
安装前请确保您的系统符合安装条件:
操作系统:Ubuntu 22.04 / CentOS 7 64 位系统;
CPU / 内存: 推荐 2C/4GB 以上;
磁盘空间:100GB;
浏览器要求:请使用 Chrome、FireFox、Edge 等现代浏览器;
生产环境推荐使用离线部署。
离线部署 [✔]
注意:离线包仅支持 x86 服务器。
打开社区网站下载 MaxKB 离线包 社区版离线包
上传至服务器后进行解压缩,执行以下命令:
#maxkb-v1.2.0-offline.tar.gz替换成下载包的名字
tar -zxvf maxkb-v1.2.0-offline.tar.gz
安装 MaxKB, 执行以下命令:
#进入安装包解压缩后目录
cd maxkb-v1.2.0-offline
#执行安装命令
bash install.sh
一文带你入门向量数据库milvus:含docker安装、milvus安装使用、attu 可视化,完整指南启动 Milvus 进行了向量相似度搜索
安装成功后,可通过浏览器访问 MaxKB:
http://目标服务器 IP 地址:8080
默认登录信息
用户名:admin
默认密码:MaxKB@123..
与 2 离线部署 执行步骤一样.
安装前请确保您的系统符合安装条件:
操作系统:Ubuntu 22.04 / CentOS 7 64 位系统;
CPU / 内存: 推荐 2C/4GB 以上;
磁盘空间:100GB;
浏览器要求:请使用 Chrome、FireFox、Edge 等现代浏览器;
可访问互联网。
在线快速部署
MaxKB 支持一键启动,仅需执行以下命令:
docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data cr2.fit2cloud.com/1panel/maxkb
友情提示:社区版限制 1 个团队成员,5 个应用,50 个知识库。
安装成功后,可通过浏览器访问 MaxKB:
http://目标服务器 IP 地址:目标端口
默认登录信息
用户名:admin
默认密码:MaxKB@123..
如果使用的是云服务器,请至安全组开放目标端口。
注意:升级前确认数据持久化目录(-v 后的目录),创建新容器时要跟上一次数据持久化目录保持一致,否则启动后数据为空。
执行以下命令:
1 下载最新镜像
docker pull cr2.fit2cloud.com/1panel/maxkb
2 确认上一次数据持久化目录,复制保存,第 4 步使用
3 删除正在运行的 MaxKB 容器
4 创建并启动 MaxKB 容器
docker run -d --name=maxkb -p 8080:8080 -v /opt/maxkb/pgsql/data:/var/lib/postgresql/data cr2.fit2cloud.com/1panel/maxkb
#注意:确认数据持久化目录(-v后的目录)要跟【第 2 步】的目录保持一致,否则启动后数据为空。
关于 1Panel 的安装部署与基础功能介绍,请参考 1Panel 官方文档。在完成了 1Panel 的安装部署后,根据提示网址打开浏览器进入 1Panel,如下界面。
进入应用商店应用列表,在【 AI / 大模型】分类下找到 MaxKB 应用进行安装。
在应用详情页选择最新的 MaxKB 版本进行安装,进行相关参数设置。
点击开始安装后,页面自动跳转到已安装应用列表,等待安装的 MaxKB 应用状态变为已启动。
安装成功后,通过浏览器访问如下页面登录 MaxKB:
地址: http://目标服务器IP地址:服务运行端口(默认 8080)
用户名: admin
密码: MaxKB@123..
第一次登录需修改 admin 用户的密码,修改密码后,重新登录系统即可使用 MaxKB。
MaxKB 离线安装包默认内置了命令行运维工具 kbctl,通过执行 kbctl help,可以查看相关的命令说明。
Usage:
kbctl [COMMAND] [ARGS...]
kbctl --help
Commands:
status 查看 MaxKB 服务运行状态
start 启动 MaxKB 服务
stop 停止 MaxKB 服务
restart 重启 MaxKB 服务
reload 重新加载 MaxKB 服务
uninstall 卸载 MaxKB 服务
upgrade 升级 MaxKB 服务
version 查看 MaxKB 版本信息
使用浏览器打开服务地址:http://目标服务器IP地址:目标端口。
默认的登录信息:
用户名:admin
默认密码:MaxKB@123..
点击【添加模型】,选择供应商【千帆大模型】,直接进入下一步填写千帆大模型表单。 或者左侧供应商先选择【千帆大模型】,然后点击【添加模型】,则直接进入千帆大模型表单。
API 域名和 API Key: 为供应商的连接信息(Ollama 服务地址, 如:http://42.92.198.53:11434 )。若没有 API Key 可以输入任意字符。
点击【添加】后 校验通过则添加成功,便可以在应用的 AI 模型列表选择该模型。
基础模型: 为供应商的 LLM 模型,支持自定义输入和下拉选项,当前可下拉选择的大语言模型如:gpt-3.5-turbo-0613、gpt-3.5-turbo-0301、gpt-3.5-turbo-16k-0613 等。
API 域名、API Key、部署名称: 是 Azure OpenAI 的模型部署中提供的,需要填写一致,参考下图:
基础模型: 为供应商的 LLM 模型,支持自定义输入,下拉选项是 OpenAI 常用的一些大语言模型如:gpt-3.5-turbo-0613、gpt-3.5-turbo、gpt-4 等。
API 域名(国外):https://api.openai.com/v1 。 API 域名:国内服务器反向代理地址 / v1。 API Key:访问 OpenAI 的 Key。
基础模型: 支持自定义输入,对应接口文档中 domain,下拉选项是讯飞星火常用的一些大语言模型。
API 域名:每个基础模型对应的 API 域名不同,请根据所选基础模型输入对应的 API 域名,参考讯飞星火官方文档。
APP ID、API Key、Secret Key 需要现在讯飞星火开放平台创建应用,并且应用的剩余 tokens>0,才能添加成功。
API Key: 需要现在智谱 AI 开放平台创建。
API Key: 需要在阿里云 ->DashScope 灵积模型服务 ->API Key 管理中获取。
API 域名: https://api.moonshot.cn/v1
API Key: 在 Kimi 账户中心的 API Key 管理中获取 key。
API Key: 在 DeepSeek 官方 获取 API Key。
注意:使用 Gemini API 需要确保程序所在服务器位于 Gemini API 所支持的地区 ,否则无法调用 API,并且无法进入 Google AI Studio。
打开【知识库】页面,点击【创建知识库】,进入创建知识库页面。 输入知识库名称、知识库描述、选择通用型知识库类型。 然后将离线文档通过拖拽方式或选择文件上传方式进行上传。
上传文档
文档规范建议:
智能分段
MarkDown 类型的文件分段规则为:根据标题逐级下钻式分段(最多支持 6 级标题),每段的字符数最大为 4096 个字符;
当最后一级的文本段落字符数超过设置的分段长度时,会查找分段长度以内的回车进行截取。
HTML、DOCX 类型的分段规则为:识别标题格式转换成 markdown 的标题样式,逐级下钻进行分段(最多支持 6 级标题)每段的字符数最大为 4096 个字符;
TXT和 PDF 类型的文件分段规则为:按照标题# 进行分段,若没有#标题的则按照字符数4096个字符进行分段,会查找分段长度以内的回车进行截取。
高级分段
用户可以根据文档规范自定义设置分段标识符、分段长度及自动清洗。
分段标识支持:#、##、###、####、#####、######、-、空行、回车、空格、分号、逗号、句号,若可选项没有还可以自定义输入分段标识符。
分段长度:支持最小 50个字符,最大 4096 个字符。
自动清洗:开启后系统会自动去掉重复多余的符号如空格、空行、制表符等。
导入时添加分段标题为关联问题
勾选后会把所有分段的标题设置为分段的关联问题。
预览
点击【创建应用】,输入应用名称,选择【简易配置应用】,点击【创建】
应用信息设置完成后,可以在右侧调试预览中进行提问预览,调试预览中提问内容不计入对话日志。
检索模式:
向量检索
:使用向量模型通过向量距离计算与用户问题最相似的文本分段;全文检索
:通过关键词检索,返回包含关键词最多的文本分段;混合检索
:同时执行全文检索和向量检索,再进行重排序,从两类查询结果中选择匹配用户问题的最佳结果。相似度:
引用分段数:
引用最大字符数:
无引用知识库时,有 2 种处理方式可设置:
继续提问
:可以自定义设置提示词,需要有 {question} 用户问题的占位符,才会把用户问题发送给模型。指定回复内容
:当没有命中知识库分段时可以指定回复内容。以上 4 步完成后,便可进行问答对话了。
在应用列表页面,点击【演示】或者点击应用面板,在概览页面点击演示或复制公开访问链接至浏览器进入问答页面进行提问。
在对话日志钟记录了所有用户会话中的问答详情,包括用户对 AI 回答的反馈信息。 维护人员可以通过查看对话日志和用户反馈来修正答案。
更多优质内容请关注公号:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。
更多优质内容请关注CSDN:汀丶人工智能;会提供一些相关的资源和优质文章,免费获取阅读。