MCCL 2.3
MCCL(Moore Thread Collective Communications Library)是摩尔线程提供的多 GPU 通信加速库,支持单机多卡和多机多卡场景。
目录
📄️ MCCL 概览
摩尔线程集合通信库(MCCL)概述、特性、框架与支持的集合通信操作
📄️ 快速开始
MCCL 安装配置、验证与多机场景部署指南
📄️ 设置
MCCL 安全网络通信设置与进程管理说明
🗃️ 使用 MCCL
MCCL 使用指南,包含通信器创建、错误处理、集体操作、数据指针、MUSA stream、组调用、点对点通信等
🗃️ MCCL API 文档
MCCL API 参考,包含通信器管理、集体通信、点对点通信等函数
📄️ 从 MCCL 2.1 迁移到 MCCL 2.3
MCCL 版本迁移指南,升级收益、兼容性影响与实施步骤
📄️ 示例
MCCL 使用示例,包括通信器创建销毁、单进程多设备、MPI 多进程等场景
📄️ MCCL 和 MPI
MCCL 与 MPI 的使用差异、API 对比以及在 MPI 程序中使用 MCCL 的注意事项
📄️ 环境变量
MCCL 环境变量配置,包括系统配置、网络设置、调试参数等
🗃️ FAQ
MCCL FAQ ,包含常见问题、RAS 功能、错误码和最佳实践

