欢迎光临散文网 会员登陆 & 注册

Qwen-7B低资源量化推理

2023-08-08 22:09 作者:AI日日新  | 我要投稿

可在线运行的notebook示例:在kaggle网站搜索 Qwen-7B-Chat


首先需要安装依赖:

接着使用4比特量化加载模型:(这里注意添加要  fp16=True

然后你就可以向模型进行提问了:


Qwen-7B低资源量化推理的评论 (共 条)

分享到微博请遵守国家法律