欢迎光临散文网会员登陆 & 注册

Qwen-7B低资源量化推理

2023-08-08 22:09 作者:AI日日新 0人读过 | 我要投稿

可在线运行的notebook示例：在kaggle网站搜索 Qwen-7B-Chat

首先需要安装依赖：

接着使用4比特量化加载模型：（这里注意添加要 fp16=True）

然后你就可以向模型进行提问了：

标签：

Qwen-7B低资源量化推理的评论 (共条)