在阿里云上快速跑起来自己本地部署的类chatgpt（llama.cpp)

发现AI实在是太火了，看到这个llama有泄露的版本。

想玩一下

在阿里云上租了一个普通服务器玩起来了。实测8C32G的大概200G硬盘的主机就能跑（实际我觉得应该可以更小）

实测开通Ubuntu 22版本非常方便。

CentOS 7.9bug很多，不再建议用了

部署步骤如下：

下载模型。我下载了7B模型脚本

curl -O https://raw.githubusercontent.com/shawwn/llama-dl/56f50b96072f42fb2520b1ad5a1d6ef30351f23c/llama.sh

脚本中修改如下的行

MODEL_SIZE="7B,13B,30B,65B"

为：MODEL_SIZE="7B"

执行下载文件

bash llama.sh

编译和运行llama.cpp

部署步骤如下：

# build this repo
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make

# obtain the original LLaMA model weights and place them in ./models
ls ./models
65B 30B 13B 7B tokenizer_checklist.chk tokenizer.model

# install Python dependencies
python3 -m pip install torch numpy sentencepiece

# convert the 7B model to ggml FP16 format
python3 convert-pth-to-ggml.py models/7B/ 1

# quantize the model to 4-bits
./quantize.sh 7B

# run the inference
./main -m ./models/7B/ggml-model-q4_0.bin -t 8 -n 128

然后就可以跑起来了

暂时还不支持中文（我考虑后续买个阿里云的机器翻译，中英文翻译一下玩）。感觉llama还是很不靠谱

展开阅读全文

页面更新：2024-03-14

标签：阿里机器翻译中英文中文脚本模型步骤硬盘主机版本

文心一言内测申请在哪？文心一言内测申请入口文心一言内测资格怎么获得？

文心一言内测申请在哪里？想要通过申请获得内测资格，那么用户就要了解百度的这款软件内测申请入口，作为一个类似chat的一个AI，相信很多小伙伴都想拥有内测资格，申请测试资格的入口小编这就分享在下面。文心一言内测申请入口

数藏中国助力《行业元宇宙》书籍面世

3月14-15日，首届TopAIGC+Web3创新大会在北京举行。会上，全球第一个用链上数字原生方法创作发行出版的行业元宇宙书籍《行业元宇宙》正式面世。本书由海南省区块链协会副会长、上方集团（835872）创始CEO王紫上，投资与资本运

Small：基于层状H2V3O8纳米线正极的高性能水系锌离子电池

研究背景氧化钒水合物属于层状钒化合物系列，由于它更好地描述了水分子的晶体结构，所以用H2V3O8代替了V3O7 H2O。H2V3O8由氢键连接的V3O8层组成，每一层由VO6八面体和VO5三角双金字塔组成。VO6八面体与沿c轴堆积的相邻八面

iPhone15ProMax概念图：95%屏占比+8G运存，无可挑剔

越是颜值高的旗舰手机，往往就越能吸引消费者的目光，毕竟颜值就是正义。苹果手机是一个手机市场中极具号召力和影响力的手机厂商，是一个硬件设计和软件设计能力非常强的手机厂商，再加上极致的产品体验，因此苹果手机为行业

隔空喊话中国邮政董事长刘爱力，我的快递去哪里啦？

2023年1月4日在忻州市代县邮政快递公司寄发的本省内包裹，如今已经70天时间啦，依旧不能接收到！拨打11183热线是包裹正在太原中转中心！70天的时间啦，一个本省内包裹就是用驴驼马拉的古人送信模式也应该完成啦，难道是我的包裹

道阻且长，未来可期，从GPT-4窥得通用人工智能时代的冰山一角！

大家这两天是不是又被满屏的ChatGPT相关的文章信息给轰炸得不轻，说实话，我真的对ChatGPT的热度如此经久不衰这个问题非常感兴趣。从去年刚面世时，小范围内造成的行业震荡，到今年二月份铺天盖地得铺舆论造势，引发全民热潮。

违规放贷亏损近亿元，这家游戏公司前董事被交易所谴责！曾是知名P2P平台创始人

3月16日晚，香港联交所发布纪律行动声明，对游戏公司云游控股两名前董事进行谴责批评。原因是作为公司小贷业务的最终审批人，他们在已收到风险提示的情况下，仍然批准了多笔贷款，导致公司在2019年出现近亿元的减值亏损。按照

亚洲先行者：由于市场担心流动性，比特币跌破 25,000 美元

另外：CoinDesk 的 Shaurya Malwa 写道，由于加密货币期货在本周早些时候的 24 小时内清算金额达到 3 亿美元，因此市场波动高于平常水平对多头和空头产生了同样的影响。早上好。这是正在发生的事情：价格：比特币和以太币结束

"零卡顿"千元机，这3款华为手机值得买，最低只要1649！

华为畅享50 Pro 1649元（8+128GB）华为畅享50 Pro配置了6.7英寸的无界全视屏，只有1.05mm的超窄侧边框，护眼夜光屏，94%的屏占比，支持90Hz刷新率，270Hz触控采样率，内置了5000mAh的大容量电池，支持40W智能安全快充。该手机最大的亮

保定市满城区生活用纸数字化平台建设正式启动

河北新闻网3月16日讯（河北日报记者徐华通讯员袁野）今天，在中国纸业高质量发展大会上，数字赋能·纸业腾飞—满城区生活用纸数字化平台建设正式启动。3月16日，在中国纸业高质量发展大会上，数字赋能·纸业腾飞—满城区生活用

最快2026年，戴尔将停止使用中国制造的芯片

今年1月，有消息称戴尔曾在2022年底，告知其供应商大幅降低使用在中国制造的芯片，包括由非中国企业所有但在中国境内的工厂生产的芯片。戴尔的目标是在2024年确保其产品中使用的所有芯片都由在中国大陆地区外的工厂生产。

微信支付网络变更

支付之家网获悉，微信支付运营主体财付通支付科技有限公司近日发布《微信支付网络变更通知》。通知称，财付通公司将于2023年4月17日新增3个回调接口网络出口IP：175.24.214.208、175.24.211.24、175.24.213.135。据悉，该调

25000多种高端医疗装备同台“PK” 第48届中国国际“医博会”在济南开幕

中国山东网-感知山东3月15日讯(记者刘自锐)3月15日，由山东省医学会、山东新丞华展览有限公司主办，60多家医疗机构共同协办的“2023第48届中国国际医疗器械(山东)博览会暨医院管理国际系列论坛(以下简称：医博会)”在山东

金融冲击将至，13.91万亿城投债券危矣！？

硅谷银行48小时迅速破产，在金融市场引发一片恐慌，有人因此联想到国内的城投债券也危险了。别杞人忧天自己吓自己。可以明确告诉你：城投债券不仅不会受到冲击，反而会因此更加安全！1、美国金融监管机构已经第一时间出手，为硅

余承东的特斯拉焦虑

在特斯拉的强力挤压下，新能源车企之间的竞争重点，会逐渐从目前的比拼智能化等等，变成“生产成本”的比拼。01 赛马结束后的销量焦虑近日，赛力斯与华为签署联合业务深化合作协议，双方联合业务目标是到2026年实现新能源汽车

上滑加载更多 ↓

推荐阅读：

英雄联盟手游 3月16日迎来坦克崛起版本，拿他稳赢！

使用有益菌群恢复生物多样性的安全步骤

中国版本ChatGPT：百度文言一心，今日发布

阿里不辱使命，电商外衣下的真实身份，美国出手为时已晚

蜗牛也准备直播卖电脑了，这款6199的一线品牌3070主机只

《实习班主任》好评发售中，更新繁体版本及更多游戏内容

腾讯大模型技术斩获两项世界冠军，已落地微信搜索

NSX-T ESXi 主机显示为未安装“无法访问主机密码不正

Adidas PureBOOST 全新版本實著欣賞

GPT-4来了，这个“史上最强AI模型”将颠覆多少职业？

友情链接：

更多：

本站资料均由网友自行发布提供，仅用于学习交流。如有版权问题，请与我联系，QQ：4156828

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top