RISC-V 跑大模型（二）：LLaMA零基础移植教程

这是RISC-V跑大模型系列的第二篇文章，主要教大家如何将LLaMA移植到RISC-V环境里。

1. 环境准备

1）最新版Python

2）确保机器有足够的内存加载完整模型（7B模型需要13~15G）

3）下载原版LLaMA模型和扩展了的中文模型

LLaMA原版模型：

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

2. 模型下载
从LLaMA原版模型地址上下载下述文件（我们使用的是7B）：

最后文件下载完成后的结果如下：

3. 加载并启动

1）这一步需要下载llama.cpp，请输入以下命令进行下载和编译：

2）将第二步下载的文件移到llama.cpp/models/下，使用命令：

3）将.pth模型权重转换为ggml的FP32格式，生成文件路径为models/7B/ggml-model-f32.bin。

4）运行./main二进制文件，-m命令指定Q4量化模型（也可加载ggml-FP16的模型）。以下是解码参数：

参数解释：

4.结束

本篇教程到这里就结束了。是不是觉得LLaMA的速度比较慢而且不支持中文，没关系，在下一期中，我们会为LLaMA扩充中文，并优化加速LLaMA，记得继续关注我们哦。
另外，RISC -V跑大模型系列文章计划分为四期：

1. RISC -V跑大模型（一）
2. RISC-V 跑大模型（二）：LLaMA零基础移植教程（本篇）
3. LLaMA扩充中文+优化加速（计划）

4. 更多性能优化策略。（计划）

如果有朋友在移植过程中遇到了问题，欢迎加群一起交流，一起搞大模型

QQ群：906962594（RVBoards·Only RISC-V）。

想尝试自己移植又没有RISC-V平台的小伙伴可以看看最近澎峰科技推出的“0元GO”活动，可以免费试用RISC-V，详情可以在文章链接里了解https://www.bilibili.com/read/cv24856380

标签：

RISC-V 跑大模型（二）：LLaMA零基础移植教程的评论 (共条)