可在线运行的notebook示例:在kaggle网站搜索 YuLan-Chat-2-13b-fp16
首先需要安装模型的量化包:(若你的电脑性能较好可以不进行量化)
接着加载量化后的模型:
现在你可以输入向模型提问的问题:
模型将会进行推理:
最后你可以得到模型的回复: