无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程

2023-07-10 13:52 作者:澎峰科技開啟算力時代  | 我要投稿

這是RISC-V跑大模型系列的第二篇文章,主要教大家如何將LLaMA移植到RISC-V環(huán)境里。

1. 環(huán)境準備

1)最新版Python

2)確保機器有足夠的內(nèi)存加載完整模型(7B模型需要13~15G)

3)下載原版LLaMA模型和擴展了的中文模型

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

2. 模型下載
從LLaMA原版模型地址上下載下述文件(我們使用的是7B):

最后文件下載完成后的結(jié)果如下:

3. 加載并啟動

1)這一步需要下載llama.cpp,請輸入以下命令進行下載和編譯:

2)將第二步下載的文件移到llama.cpp/models/下,使用命令:

3)將.pth模型權(quán)重轉(zhuǎn)換為ggml的FP32格式,生成文件路徑為models/7B/ggml-model-f32.bin。

4)運行./main二進制文件,-m命令指定Q4量化模型(也可加載ggml-FP16的模型)。以下是解碼參數(shù):

參數(shù)解釋:

4.結(jié)束

本篇教程到這里就結(jié)束了。是不是覺得LLaMA的速度比較慢而且不支持中文,沒關(guān)系,在下一期中,我們會為LLaMA擴充中文,并優(yōu)化加速LLaMA,記得繼續(xù)關(guān)注我們哦。
另外,RISC -V跑大模型系列文章計劃分為四期:

1.?RISC -V跑大模型(一)
2. RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程(本篇)
3.?LLaMA擴充中文+優(yōu)化加速(計劃)

4. 更多性能優(yōu)化策略。(計劃)

如果有朋友在移植過程中遇到了問題,歡迎加群一起交流,一起搞大模型

QQ群:906962594(RVBoards·Only RISC-V)。

想嘗試自己移植又沒有RISC-V平臺的小伙伴可以看看最近澎峰科技推出的“0元GO”活動,可以免費試用RISC-V,詳情可以在文章鏈接里了解https://www.bilibili.com/read/cv24856380




RISC-V 跑大模型(二):LLaMA零基礎(chǔ)移植教程的評論 (共 條)

分享到微博請遵守國家法律
泰州市| 邵武市| 深水埗区| 永宁县| 柳林县| 孙吴县| 将乐县| 石台县| 凤阳县| 交城县| 兴化市| 六盘水市| 吉安县| 长治市| 阜城县| 永宁县| 杂多县| 商洛市| 綦江县| 湖州市| 锡林浩特市| 汪清县| 诸暨市| 栾城县| 张家界市| 永仁县| 青州市| 江陵县| 乌鲁木齐县| 马尔康县| 东宁县| 阳信县| 葵青区| 波密县| 抚松县| 栖霞市| 邹平县| 毕节市| 甘肃省| 荃湾区| 木兰县|