CANN/hcomm通信操作API文档
2026/5/9 12:23:50 网站建设 项目流程

HcommWriteReduceWithNotifyOnThread

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

产品支持情况

  • Ascend 950PR/Ascend 950DT:支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:不支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:不支持

功能说明

向channel上的指定内存写数据,将src中长度为count*sizeof(dataType)的内存数据,与dst所指向的相同长度的内存数据进行reduceOp操作,并将结果输出到dst中,并向dst所在节点发送同步信号。接口调用方为src所在节点,该接口为异步接口。

函数原型

int32_t HcommWriteReduceWithNotifyOnThread(ThreadHandle thread, ChannelHandle channel, void *dst, const void *src, uint64_t count, HcommDataType dataType, HcommReduceOp reduceOp, uint32_t remoteNotifyIdx)

参数说明

参数名输入/输出描述
thread输入通信线程句柄,为通过HcclThreadAcquire接口获取到的threads。
ThreadHandle类型的定义可参见ThreadHandle。
channel输入通信通道句柄,为通过HcclChannelAcquire接口获取到的channels。
ChannelHandle类型的定义可参见ChannelHandle。
dst输出目的内存地址,使用HcclGetHcclBuffer、HcclChannelGetHcclBuffer获取到的内存。
src输入源内存地址,使用HcclGetHcclBuffer、HcclChannelGetHcclBuffer获取到的内存。
count输入元素个数。
dataType输入数据类型。
HcommDataType类型的定义请参见HcommDataType。
针对Ascend 950PR/Ascend 950DT,支持的数据类型:int8、int16、int32、uint8、uint16、uint32、float16、float32、bfp16。
reduceOp输入归约操作类型,支持:sum、max、min。
HcommReduceOp类型的定义请参见HcommReduceOp。
remoteNotifyIdx输入通信通道另一端的Notify索引。
取值范围:[0, HcclChannelAcquire接口传入的channelDescs参数中的notifyNum)。

返回值

int32_t:接口成功返回0,其他失败。

约束说明

该接口需要配合HcommChannelNotifyWaitOnThread使用。

在Ascend 950PR/Ascend 950DT上,仅支持AICPU_TS模式下、在Device侧调用该接口。

调用示例

// 申请通信线程资源 CommEngine engine = CommEngine::COMM_ENGINE_AICPU_TS; uint32_t threadNum = 1; uint32_t notifyNumPerThread = 1; ThreadHandle thread; HcclThreadAcquire(engine, threadNum, notifyNumPerThread, &thread); // 申请通信通道资源 uint32_t channelNum = 1; HcclChannelDesc channelDesc; HcclChannelDescInit(&channelDesc, channelNum); HcclComm comm; ChannelHandle channel; HcclChannelAcquire(comm, engine, &channelDesc, channelNum, &channel); // 获取本端通信内存信息 void * localBuffer; uint64_t localBufferSize; HcclGetHcclBuffer(comm, &localBuffer, &localBufferSize); // 获取对端通信内存信息 void * remoteBuffer; uint64_t remoteBufferSize; HcclChannelGetHcclBuffer(comm, channel, &remoteBuffer, &remoteBufferSize); // 拷贝参数并 Launch Kernel // Device 侧算法编排 uint64_t len = std::min(localBufferSize, remoteBufferSize); uint64_t sizeOfFP32 = 4; uint64_t count = len / sizeOfFP32; // 将本端内存的内容写到对端内存上并通知对端 uint32_t rmtNotifyIdx = 0; HcommWriteReduceWithNotifyOnThread(thread, channel, remoteBuffer, localBuffer, count, HCOMM_DATA_TYPE_FP32, HCOMM_REDUCE_SUM, rmtNotifyIdx); // 数据面操作 // ... // 等待对端通知本端 uint32_t lclNotifyIdx = 0; uint32_t notifyTimeout = 0; HcommChannelNotifyWaitOnThread(thread, channel, lclNotifyIdx, notifyTimeout);

【免费下载链接】hcommHCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。项目地址: https://gitcode.com/cann/hcomm

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询