跳到主要内容

冯才文大模型 K8s Cloud IDE 博客技术书籍感悟

LLM 大模型 Olloma 项目解读
LLM 大模型评测
大模型 LLM function call
LLM StableDiffusion 生成图片
ONNX 小模型
LlamaFactory 精调模型-环境搭建
LlamaFactory 精调模型-配置数据集
LlamaFactory 精调模型-SFT-lora训练
LlamaFactory 精调模型-Continue-pretrain训练
LlamaFactory 精调模型-RL-PPO 强化学习
vLLM PD 分离部署
MCP server 概念
LLM internlm-7b 模型文件下载部署
调用 replitLM
LLM 概念
accelerate 使用心得
chatglm3-6b
code 模型
coredump
gsk8k 评测
maas学习
sample-eval 评测
使用 nsys 分析 LLM 性能问题
分布式精调遇到的问题
华为昇腾 910b3 使用 hccl-test 排查问题
华为昇腾 910b3 单机多卡分布式训练报错复现
训练

LlamaFactory 精调模型-RL-PPO 强化学习

LlamaFactory 精调模型-RL-PPO 强化学习

步骤

LlamaFactory 精调模型-Continue-pretrain训练

vLLM PD 分离部署

步骤