🤖
AI Hot Tech每日 AI 技术热点
🏠首页🔥今日热点📚LLM系列
✨智能出题🎨创意工坊📁归档
系统在线
返回系列列表
📚
系列 05

模型部署与优化系列

掌握LLM生产环境部署与性能优化

8 期内容

全部集数

33

模型推理基础:vLLM与TensorRT-LLM

## 第一章:引言 - 大模型推理的性能瓶颈与破局之道...

146 分钟29106 字
34

模型量化技术:从GPTQ到GGUF

## 引言:大模型落地的最后一公里...

126 分钟25074 字
35

LoRA与QLoRA微调实战

## 引言:大模型时代的“平民化”微调之路...

121 分钟24180 字
36

模型压缩与剪枝

## 引言:大模型的“瘦身”时代...

120 分钟23934 字
37

服务化部署:Serving与API设计

## 引言:大模型落地的最后一公里...

122 分钟24309 字
38

边缘部署:移动端与嵌入式

## 引言:端侧AI的新纪元...

111 分钟22133 字
39

成本优化策略

## 引言:LLM时代的成本焦虑与破局之道...

135 分钟26837 字
40

监控与可观测性

## 引言:LLM时代的“黑盒”挑战与监控必要性...

129 分钟25789 字
上一个系列
📚提示工程系列
下一个系列
多模态与前沿技术系列📚