MUSA 编程模型

MUSA 编程模型通过以下核心抽象，让开发者能够高效利用 GPU 的并行计算能力：

📄️ Host/Device 编程模型

MUSA Host/Device 编程——内存管理、数据传输、流与事件

MUSA 线程层次结构——网格、线程块、线程的组织、线程束、Occupancy

MUSA 线程索引计算方法——一维、二维、三维索引、边界检查、常用模式

MUSA 内存层次结构——寄存器、共享内存、全局内存、系统内存

MUSA SIMT 执行模型——线程束调度、分支分化、延迟隐藏、原子操作

MUSA 高级内存优化——锁定内存、零拷贝、L2 缓存管理、Cluster 内存、异步执行

MT GPU L2 缓存持久化访问管理——提升全局内存访问带宽与降低延迟

MUSA 抽象的设计遵循自动可扩展性原则：

入门 → 线程层次结构 → 内存层次结构 → L2 缓存管理  → 高级内存优化

建议先理解编程模型（如何使用），再深入硬件架构（为何如此设计），最后结合性能优化应用硬件知识。