
self-llm – 专为中国开发者推出的开源大模型教程
self-llm (开源大模型食用指南)是Datawhale专为国内初学者打造的开源大模型教程,基于Linux平台,提供从环境配置到模型部署、微调的全流程指导,涵盖LLaMA、ChatGLM等主流模型。项目能简化开源大模型的使用流程,帮助学生和研究者快速上手。教程提供多种模型的详细教程、微调方法(如LoRA、ptuning)及应用案例,适合不同层次的学习者。项目鼓励社区参与,共同完善内容,推动开源大模型的普及和应用。
self-llm的主要功能
环境配置指导:提供基于Linux平台的开源大模型环境配置指南,帮助用户搭建适合不同模型运行的基础环境。
模型部署教程:涵盖国内外主流开源大模型(如LLaMA、ChatGLM、InternLM等)的本地部署方法,包括命令行调用、在线Demo部署等。
微调方法指导:提供全量微调、LoRA微调、ptuning等高效微调方法的详细教程,帮助用户根据需求对模型进行定制化优化。
应用开发指导:结合LangChain等框架,指导用户如何将开源大模型集成到实际应用中,打造领域特色的私域模型。
社区共创与支持:鼓励用户提交问题(issue)或贡献代码(PR),共同完善教程内容,形成开源社区的协作与支持体系。
self-llm支持的模型
GLM-4.1-Thinking
GLM-4.1V-Thinking vLLM 部署调用
GLM-4.1V-Thinking Gradio 部署
GLM-4.1V-Thinking LoRA 微调及 SwanLab 可视化记录
GLM-4.1V-Thinking Docker 镜像
GLM-4.5-Air
GLM-4.5-Air vLLM 部署调用
GLM-4.5-Air EvalScope 智商情商评测
GLM-4.5-Air LoRA 微调
GLM-4.5-Air Ucloud Docker 镜像
ERNIE-4.5
ERNIE-4.5-0.3B-PT LoRA 微调及 SwanLab 可视化记录
ERNIE-4.5-0.3B-PT LoRA Docker 镜像
Hunyuan-A13B-Instruct
Hunyuan-A13B-Instruct 模型架构解析
Hunyuan-A13B-Instruct SGLang 部署调用
Hunyuan-A13B-Instruct LoRA SwanLab 可视化微调
Hunyuan-A13B-Instruct LoRA Docker 镜像
Qwen3
Qwen3 模型结构解析
Qwen3-8B vllm 部署调用
Qwen3-8B Windows LMStudio 部署调用
Qwen3-8B Evalscope 智商情商评测
Qwen3-8B LoRA 微调及 SwanLab 可视化记录
Qwen3-30B-A3B 微调及 SwanLab 可视化记录
Qwen3 Think 解密
Qwen3-8B Docker 镜像
Qwen3-0.6B 的小模型用途
Qwen3-1.7B 医学推理式对话微调及 SwanLab 可视化记录
Qwen3-8B GRPO 微调及 SwanLab 可视化
Kimi-VL-A3B
Kimi-VL-A3B 技术报告解读
Kimi-VL-A3B-Thinking WebDemo 部署(网页对话助手)
Llama4
Llama4 对话助手
SpatialLM
SpatialLM 3D点云理解与目标检测模型部署
Hunyuan3D-2
Hunyuan3D-2 系列模型部署
Hunyuan3D-2 系列模型代码调用
Hunyuan3D-2 系列模型 Gradio 部署
Hunyuan3D-2 系列模型 API Server
Hunyuan3D-2 Docker 镜像
Gemma3
Gemma-3-4b-it FastApi 部署调用
Gemma-3-4b-it ollama + open-webui 部署
Gemma-3-4b-it Evalscope 智商情商评测
Gemma-3-4b-it LoRA 微调
Gemma-3-4b-it Docker 镜像
Gemma-3-4b-it GRPO 微调及 SwanLab 可视化
DeepSeek-R1-Distill
DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
DeepSeek-R1-Distill-Qwen-7B Langchain 接入
DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用
DeepSeek-R1-0528-Qwen3-8B-GRPO 及 SwanLab 可视化
MiniCPM-o-2_6
MiniCPM-o-2.6 FastApi 部署调用
MiniCPM-o-2.6 WebDemo 部署
MiniCPM-o-2.6 多模态语音能力
MiniCPM-o-2.6 可视化 LaTeX_OCR LoRA 微调
InternLM3
InternLM3-8b-instruct FastApi 部署调用
InternLM3-8b-instruct Langchain 接入
InternLM3-8b-instruct WebDemo 部署
InternLM3-8b-instruct LoRA 微调
InternLM3-8b-instruct o1-like 推理链实现
phi4
phi4 FastApi 部署调用
phi4 Langchain 接入
phi4 WebDemo 部署
phi4 LoRA 微调
phi4 LoRA 微调 NER任务 SwanLab 可视化记录版
phi4 GRPO 微调及 SwanLab 可视化
Qwen2.5-Coder
Qwen2.5-Coder-7B-Instruct FastApi 部署调用
Qwen2.5-Coder-7B-Instruct Langchain 接入
Qwen2.5-Coder-7B-Instruct WebDemo 部署
Qwen2.5-Coder-7B-Instruct vLLM 部署
Qwen2.5-Coder-7B-Instruct LoRA 微调
Qwen2.5-Coder-7B-Instruct LoRA 微调 SwanLab 可视化记录版
Qwen2-vl
Qwen2-vl-2B FastApi 部署调用
Qwen2-vl-2B WebDemo 部署
Qwen2-vl-2B vLLM 部署
Qwen2-vl-2B LoRA 微调
Qwen2-vl-2B LoRA 微调 SwanLab 可视化记录版
Qwen2-vl-2B LoRA 微调案例 – LaTeXOCR
Qwen2.5
Qwen2.5-7B-Instruct FastApi 部署调用
Qwen2.5-7B-Instruct Langchain 接入
Qwen2.5-7B-Instruct vLLM 部署调用
Qwen2.5-7B-Instruct WebDemo 部署
Qwen2.5-7B-Instruct LoRA 微调
Qwen2.5-7B-Instruct o1-like 推理链实现
Qwen2.5-7B-Instruct LoRA 微调 SwanLab 可视化记录版
Apple OpenELM
OpenELM-3B-Instruct FastApi 部署调用
OpenELM-3B-Instruct LoRA 微调
Llama3_1-8B-Instruct
Llama3_1-8B-Instruct FastApi 部署调用
Llama3_1-8B-Instruct Langchain 接入
Llama3_1-8B-Instruct WebDemo 部署
Llama3_1-8B-Instruct LoRA 微调
动手转换 GGUF 模型并使用 Ollama 本地部署
Gemma-2-9b-it
Gemma-2-9b-it FastApi 部署调用
Gemma-2-9b-it Langchain 接入
Gemma-2-9b-it WebDemo 部署
Gemma-2-9b-it Peft LoRA 微调
Yuan2.0
Yuan2.0-2B FastApi 部署调用
Yuan2.0-2B Langchain 接入
Yuan2.0-2B WebDemo 部署
Yuan2.0-2B vLLM 部署调用
Yuan2.0-2B LoRA 微调
Yuan2.0-M32
Yuan2.0-M32 FastApi 部署调用
Yuan2.0-M32 Langchain 接入
Yuan2.0-M32 WebDemo 部署
DeepSeek-Coder-V2
DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用
DeepSeek-Coder-V2-L
self-llm的项目地址
GitHub仓库:https://github.com/datawhalechina/self-llm
self-llm的应用场景
教育与学习:为初学者提供从环境配置到模型微调的全流程指导,助力学生和开发者快速掌握开源大模型的使用方法。
企业应用开发:帮助企业根据自身业务需求对开源大模型进行定制化微调,开发智能客服、知识管理等专属应用。
个人项目开发:支持个人开发者利用开源大模型开发智能写作助手、个人智能助手等项目,提升个人生产力。
研究与创新:为研究人员提供实验平台,支持对开源大模型的架构优化、训练方法改进等研究工作。
[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/

随时掌握互联网精彩
- 1 山水工程绘就1.2亿亩生态新画卷 7904097
- 2 女子10万元卖掉男友 在泰国玩了10天 7808298
- 3 又一个“双机场”地级市来了 7714494
- 4 高温+暴雨双预警 7618078
- 5 陈奕迅回应开卡车撞飞伍佰:真不是我 7523110
- 6 DeepSeek正在遭遇“中年危机” 7425810
- 7 A股收评:沪指创近10年新高 7333965
- 8 日本多地中国公民遇袭 驻日使馆提醒 7238201
- 9 患精神分裂症男子杀1家3口被判死刑 7140483
- 10 马天宇养了三四百只鸡 7041065