面向 PyTorch 推理的深度学习模型极致优化 Cursor Agent Skill。在用户提供模型代码或结构时,按阶段指导算子融合、量化、半精度、内存布局、SIMD、Winograd、并行与精度验证等流程。
- 主文档:SKILL.md(含 YAML 头:
name: dl-model-optimizer)
将本目录作为 Agent Skill 安装到 Cursor 的 skills 路径(与你在用的 skill 安装方式一致),或在对话中引用该 skill,使助手按 SKILL.md 中的工作流与约束执行优化任务。
性能剖析与基线 → 图级优化 → 精度压缩 → 算法替换 → 内存布局 → SIMD → 并行调优 → 精度回归。