MCCL 2.4
MCCL(Moore Thread Collective Communications Library)是摩尔线程提供的多 GPU 通信加速库,支持单机多卡和多机多卡场景。
安装
MCCL 随 MUSA SDK 一起发布。基础安装可参考 MUSA SDK 安装指南,多机通信所需的网络、MPI、安装与验证流程请参考 快速开始。
目录
MCCL 概览
摩尔线程集合通信库(MCCL)概述、特性、框架与支持的集合通信操作
快速开始
MCCL 安装配置、验证与多机场景部署指南
设置
MCCL 安全网络通信设置与进程管理说明
使用 MCCL
MCCL 使用指南,包含通信器创建、错误处理、集体操作、数据指针、MUSA stream、组调用、点对点通信等
MCCL API 文档
MCCL API 参考,包含通信器管理、集体通信、点对点通信等函数
从 MCCL 2.1 迁移到 MCCL 2.4
MCCL 2.1 到 2.4 的迁移指南,覆盖能力差异、兼容性影响与验证建议
示例
MCCL 使用示例,包括通信器创建销毁、单进程多设备、MPI 多进程等场景
MCCL 和 MPI
MCCL 与 MPI 的使用差异、API 对比以及在 MPI 程序中使用 MCCL 的注意事项
环境变量
MCCL 环境变量配置,包括系统配置、网络设置、调试参数等
FAQ
MCCL FAQ ,包含常见问题、RAS 功能、错误码和最佳实践

