首页

星云

工具

资源

星选

资讯

热门工具

自选颜色:

PDF转图片完全免费

小红书视频下载无水印

抖音视频下载无水印

数字星空

怎么在Windows操作系统部署阿里开源版通义千问（Qwen2）

编程知识

2024年09月01日 21:23

怎么在Windows操作系统部署阿里开源版通义千问（Qwen2）

| 原创作者/编辑：凯哥Java | 分类：人工智能学习系列教程

GitHub上qwen2截图

随着人工智能技术的不断进步，阿里巴巴通义千问团队近期发布了Qwen2系列开源模型，这一系列模型在多个领域展现出卓越的性能，特别是在自然语言理解、知识、代码、数学及多语言等能力上均显著超越当前领先的模型。本文将详细介绍如何在Windows操作系统上部署阿里开源版通义千问（Qwen2）模型，快速上手并体验这一强大的AI工具。

一、准备工作

在开始部署之前，请确保您的Windows系统满足以下要求：

1. 系统兼容性：确保您的Windows系统版本支持所需的软件安装。

2. 显卡驱动：如果您的计算机配备了独立显卡，请确保显卡驱动是最新的，以便更好地支持模型运行。

3. 硬盘空间：Qwen2模型文件较大，需要足够的硬盘空间来存储。

凯哥使用的电脑配置：

CPU：I7-12700F

内存：32GB

显卡：RTX3060 12G

cpu和内存

显卡

二、下载并安装Ollama

Ollama是一个用于运行大型AI模型的工具，支持多种模型格式，包括Qwen2。首先，您需要从Ollama的官方网站下载并安装Ollama。

访问Ollama官网：进入Ollama官网（https://ollama.com/download/windows）。

2. 下载并安装：点击“Download”按钮，选择Windows版本进行下载。下载完成后，按照提示进行安装。

这里凯哥就选择Windows版本的。

ollama官网下载页面

三、下载Qwen2模型

接下来，您需要从阿里通义千问的官方仓库下载Qwen2模型。

1. 访问官方教程：访问Qwen2官方教程（实际链接以官方提供为准）。

https://qwen.readthedocs.io/zh-cn/latest/

2. 选择适合的模型：根据您的硬件条件（如显卡显存大小），选择适合的Qwen2模型版本。在官方教程中，拉到最下面，可以看到效率评估。如下图：

找到效率评估

因为凯哥的显卡是12GB,所以凯哥选择Qwen2-7B-Instruct。如果你的显卡也是12GB，可以选择Qwen2-7B-Instruct版本。

Qwen2-7B-Instruct不同版本内存占用

凯哥使用的下载地址：https://modelscope.cn/models/qwen/Qwen2-7B-Instruct-GGUF/files

3. 下载模型文件：在官方教程中，找到模型下载链接，下载对应的.gguf文件。注意，模型文件可能包含多个精度版本（如q8、q16等），选择适合您需求的版本。

说明：

会看到不同的后缀，q”+ 用于存储权重的位数（精度）+ 特定变体，数字越大性能越强。

数字越大，精度越高，k是在所有的attention和feed_forward张量上将精度提升2位，m是在一半的attention和feed_forward张量上将精度提升2位。

根据自己的需求选择模型，凯哥这里直接选了q8。

凯哥选择的q8

四、部署Qwen2模型

下载完模型文件后，您可以使用Ollama来部署Qwen2模型。

1. 创建模型文件：在Windows上创建一个新文件夹（例如命名为“qwen”），将下载的.gguf文件放入该文件夹中。然后，在该文件夹内创建一个名为“Modelfile”的文本文件，内容填写为：

FROM ./qwen2-7b-instruct-q8_0.gguf

注意替换文件名以匹配您下载的模型文件。

2. 使用Ollama创建模型：打开命令行工具（如CMD或PowerShell），切换到包含Modelfile的文件夹。运行以下命令来创建Qwen2模型：

模型创建成功

如果显示“success”，则表示模型创建成功。

3. 运行模型：创建成功后，您可以通过以下命令来运行模型：

ollama run Qwen2-7B

此时，您应该能看到一个对话框或命令行界面，您可以在这里输入文本与模型进行交互。

命令行输入文案地方

在这里输入：你是谁？看看模型怎么交互的。

可以看到模型交互如下：

模型交互效果

补充说明：
如果要看本地有哪些大模型：ollama list

如果要删除这个模型的话：ollama rm xxx

如果要看运行了哪些大模型：ollama ps

运行结果：

运行效果

五、在Web界面中运行Qwen2

虽然直接在命令行中运行模型很方便，但为了获得更好的用户体验，您可以将Qwen2模型集成到Web界面中。

1. 安装Node.js：

首先，需要在Windows上安装Node.js。访问Node.js官网，下载并安装最新版本的Node.js。

凯哥使用的是版本号是18.6

凯哥本地node版本

2. 下载ollama-webui：

从GitHub或其他源下载ollama-webui的代码。

https://github.com/ollama-webui/ollama-webui-lite

3. 设置并启动Web界面：

按照ollama-webui的文档说明，设置Node.js环境，安装依赖，并启动Web服务器。然后，在浏览器中打开Web页面，选择您的Qwen2模型即可开始对话。

3.1镜像提速：

入ollama-webui文件夹，设置国内镜像源提速：

npm config set registry http://mirrors.cloud.tencent.com/npm/

3.2 安装依赖

npm install

错误解决办法：

如果报错说要audit，则依次进行即可：

npm auditnpm audit fix

启动

3.3 启动Web界面：

命令执行完成就可以用看到如下图的访问地址：

启动成功输出访问地址

打开Web页面，选择你的模型即可开始对话：

访问页面

通过web和模型进行交互：

我们依然输入：你是谁？

在web也没和模型交互效果

好了，至此，你就可以在自己电脑上和模型进行对话了。

大家好：我是凯哥Java(kaigejava)，如果大家感兴趣，可以一起学学AI。

六、总结

通过以上步骤，您可以在Windows操作系统上成功部署阿里开源版通义千问（Qwen2）模型，并通过命令行或Web界面与模型进行交互。Qwen2系列模型凭借其卓越的性能和广泛的应用场景，将为您的AI项目提供强大的支持。

希望本文能帮助您顺利部署阿里开源版通义千问模型，享受AI技术带来的便利与乐趣。如有任何疑问，请随时查阅官方文档或寻求技术支持。

From:https://www.cnblogs.com/kaigejava/p/18391855

本文地址: http://shuzixingkong.net/article/1641

0评论

提交

加载更多评论

其他文章

图文教程：从0到1将项目发布到 Maven 中央仓库

前言本文基于官方文档 https://central.sonatype.org/publish/publish-guide/ 编写。发布步骤：创建账号创建用户 Token 创建命名空间配置 GPG 配置项目发布注意事项：发布成功的项目无法修改或者删除准备阶段创建账号已有 Goo

图文教程：从0到1将项目发布到 Maven 中央仓库

图文教程：从0到1将项目发布到 Maven 中央仓库

图文教程：从0到1将项目发布到 Maven 中央仓库

【工具分享】红队重点资产指纹识别 -- P1finger -0.02(最新版本)

工具介绍： P1finger 红队行动下的重点资产指纹识别工具。P1finger 是一个重点资产指纹识别的工具，旨在通过HTTP请求特征来识别目标系统。其主要特点包括：语言和实现：语言：使用Go语言（Golang）实现。目的：强调跨平台能力和易于集成。指纹库和检测策略：指纹库：通过人工过滤

【工具分享】红队重点资产指纹识别 -- P1finger -0.02(最新版本)

【工具分享】红队重点资产指纹识别 -- P1finger -0.02(最新版本)

【工具分享】红队重点资产指纹识别 -- P1finger -0.02(最新版本)

Windows平台体验StableSwarmUI-0.6.4-Beta经验版

StableSwarmUI install 经验版，引导安装默认选择 comfyUI （local）立刻安装到本地。对于有经验的用户，此处可以选择跳过安装 ComfyUI 步骤，后期手动导入。

Windows平台体验StableSwarmUI-0.6.4-Beta经验版

Windows平台体验StableSwarmUI-0.6.4-Beta经验版

Windows平台体验StableSwarmUI-0.6.4-Beta经验版

云存储抽象层-FluentStorage

FluentStorage 是一个.NET云存储抽象层，支持多种云服务提供商。它提供了一个统一的API来处理不同云服务提供商的Blob存储（如AWS S3, GCP, FTP, SFTP, Azure Blob/File/Event Hub/Data Lake）和消息传递（如AWS SQS, Azu

云存储抽象层-FluentStorage

c#学习笔记（一）

基础语法文档注释&代码块 /// <summary> /// 待机 /// </summary> #region 物体移动 sq.transform.Translate(new Vector3(5,0,0)); #endregion 字符串格式化输出使用 $ 可进

c#学习笔记（一）

C#自定义控件—转换开关

C#用户控件之转换开关如何自定义一个转换键（Toggle）？三步绘制一个精美控件：定义属性；画布重绘；添加事件；主要技能：如何自定义属性；画布重绘的一般格式；控件的事件触发过程；技能扩展转换按钮使能时添加二次确认弹框？在From窗体中应用控件时，点击事件没有触发？属性名称在

C#自定义控件—转换开关

C#自定义控件—转换开关

失败的十年，回顾反思

开局依稀记得那是2014年11月大四上学期，学校已经没有课了。看着同寝室的其他室友都出去实习了，而我一个人还坐在电脑前发呆。因为的不敢出去面试。由于小学时牙齿有一颗龅牙，从小就产生了自卑的心理，也让自己有了严重的社交恐惧，我开始不敢一个人买车票，甚至不敢自己去食堂吃饭。从小学到大学，求学的过程中，

Go plan9 汇编：说透函数栈

原创文章，欢迎转载，转载请注明出处，谢谢。 0. 前言函数是 Go 的一级公民，本文从汇编角度出发看看我们常用的一些函数在干什么。 1. 函数 1.1 main 函数在 main 函数中计算两数之和如下： package main func main() { x, y := 1, 2 z :=

Go plan9 汇编：说透函数栈

Go plan9 汇编：说透函数栈

Go plan9 汇编：说透函数栈