分享文章
华为官宣!DeepSeek系列模型正式上线昇腾社区
今日,华为宣布,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用。
据了解,DeepSeek-V3首个版本于2024年上线并同步开源,为自研MoE模型,671B 参数,激活37B,在14.8T token上进行了预训练。
据DeepSeek介绍,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
以下以Deepseek-V3为例,演示在昇腾社区如何高效获取模型及使用

一、硬件要求
部署DeepSeek-V3模型需配置4台Atlas 800I A2(8*64G)服务器资源
二、模型调用实践
1、权重转换
GPU:
NPU:
2、加载镜像
在昇腾社区/开发资源下载适配DeepSeek-V3的镜像包:
mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64
完成之后,请使用docker images命令确认查找具体镜像名称与标签。
3、容器启动
提供的MindIE镜像预置了DeepSeek-V3模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为1001,执行权限为750,启动容器。
4、服务化测试
配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性。
修改服务化参数
拉起服务化
出现“Daemon start success!”,则认为服务成功启动。

[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 为子孙万代计 为长远发展谋 7904525
- 2 高市早苗仍不同意撤回发言 7809780
- 3 日本外务省官员离开中国外交部 7713346
- 4 少年负壮气 英雄不迟暮 7618643
- 5 外交部:日方必须给中国人民一个交代 7523654
- 6 中国代表联大发言让日本破大防 7427717
- 7 日本歌手美依礼芽:永远支持一个中国 7331593
- 8 高市早苗同时得罪中俄朝韩四国 7233542
- 9 列车单站停留近5小时 12306回应 7141280
- 10 联合国回应高市早苗涉台错误言论 7046788




![Luna稻田樱子太喜欢今天的妆容啦~下午出门拍摄[挤眼][挤眼][爱你] ](https://imgs.knowsafe.com:8087/img/aideep/2022/5/10/c53692f951805ae094f9a05d72c7f714.jpg?w=204)


锅锅酱
