CANN Gather算子API描述-酒店常州论坛

Gather 算子 API 描述

【免费下载链接】cann-bench评测AI在处理CANN领域代码任务的能力，涵盖算子生成、算子优化等领域，支撑模型选型、训练效果评估，统一量化评估标准，识别Agent能力短板，构建CANN领域评测平台，推动AI能力在CANN领域的持续演进。项目地址: https://gitcode.com/cann/cann-bench

1. 算子简介

从输入 Tensor 的指定维度按 index 提取元素。

主要应用场景：

嵌入层（Embedding）的查表操作
注意力机制中按索引提取 Key/Value
稀疏操作中按索引收集特征

算子特征：

难度等级：L2（IndexGather）
双输入（x 和 index）单输出（y），按索引进行元素提取
输入支持 ND 格式，支持任意维度

2. 算子定义

数学公式

$$ y[i][m][n] = x[index[i]][m][n] $$

更一般地，对于batch_dims=k，前 k 个维度作为 batch 维度，在第 k 个维度上按 index 进行 gather 操作。

3. 接口规范

算子原型

cann_bench.gather(Tensor x, Tensor index, int batch_dims) -> Tensor y

输入参数说明

参数	类型	默认值	描述
x	Tensor	必选	输入张量
index	Tensor	必选	索引张量
batch_dims	INT64	0	batch 维度数

输出

参数	Shape	dtype	描述
y	由 index shape 和 x 的非 gather 维度决定	与输入 x 相同	输出张量，gather 结果

数据类型

x dtype	index dtype	输出 dtype
float16	int32 / int64	float16
float32	int32 / int64	float32
bfloat16	int32 / int64	bfloat16
int8	int32 / int64	int8
int32	int32 / int64	int32
int64	int32 / int64	int64

规则与约束

输入支持任意维度的 ND 格式张量
batch_dims指定 batch 维度数，前batch_dims个维度作为 batch 维度，x 和 index 在这些维度上的大小必须一致
index 中的值必须为有效索引，即在 [0, x.shape[batch_dims]) 范围内
输出 dtype 与输入 x 的 dtype 一致
index 张量在 gather 维度之外的维度上，shape 必须与 x 对应维度一致

4. 精度要求

采用生态算子精度标准进行验证。

误差指标：

平均相对误差（MERE）：采样点中相对误差平均值
$$ \text{MERE} = \text{avg}(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)+\text{1e-7}}) $$
最大相对误差（MARE）：采样点中相对误差最大值
$$ \text{MARE} = \max(\frac{\text{abs}(actual - golden)}{\text{abs}(golden)+\text{1e-7}}) $$

通过标准：

数据类型	FLOAT16	BFLOAT16	FLOAT32	HiFLOAT32	FLOAT8 E4M3	FLOAT8 E5M2
通过阈值(Threshold)	2^-10	2^-7	2^-13	2^-11	2^-3	2^-2

当平均相对误差 MERE < Threshold，最大相对误差 MARE < 10 * Threshold 时判定为通过。

5. 标准 Golden 代码

import torch """ Gather算子Torch Golden参考实现 从输入Tensor的指定维度按index提取元素 公式: y[i][m][n] = x[index[i]][m][n] """ def gather( x: torch.Tensor, index: torch.Tensor, batch_dims: int = 0 ) -> torch.Tensor: """ 从输入Tensor的指定维度按index提取元素 公式: y[i][m][n] = x[index[i]][m][n] Args: x: 输入张量 index: 索引张量 batch_dims: batch维度数 Returns: 输出张量，gather结果 """ y = torch.gather(x, batch_dims, index.long()) return y

6. 额外信息

算子调用示例

import torch import cann_bench x = torch.randn(1024, 1024, dtype=torch.float32, device="npu") index = torch.randint(0, 1024, (512, 1024), dtype=torch.int32, device="npu") y = cann_bench.gather(x, index, batch_dims=0) # 沿第 0 维 gather x = torch.randn(128, 128, 64, dtype=torch.float16, device="npu") index = torch.randint(0, 128, (128, 64, 64), dtype=torch.int64, device="npu") y = cann_bench.gather(x, index, batch_dims=1) # batch_dims=1

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

企业官网建设流程全解析

Gather 算子 API 描述

1. 算子简介

2. 算子定义

数学公式

3. 接口规范

算子原型

输入参数说明

输出

数据类型

规则与约束

4. 精度要求

5. 标准 Golden 代码

6. 额外信息

算子调用示例

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

Gather 算子 API 描述

1. 算子简介

2. 算子定义

数学公式

3. 接口规范

算子原型

输入参数说明

输出

数据类型

规则与约束

4. 精度要求

5. 标准 Golden 代码

6. 额外信息

算子调用示例

热门文章

文章分类

标签云

相关文章

3步解锁网易云音乐NCM格式：ncmdumpGUI图形化转换工具完全指南

CANN/ge: GE 图拆分特性分析

GE自定义算子IR实现开发指南

需要专业的网站建设服务？