CANN ops-nn FatreluMul算子
2026/5/9 16:14:31 网站建设 项目流程

FatreluMul

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×
Kirin X90 处理器系列产品
Kirin 9030 处理器系列产品

功能说明

  • 接口功能:

    将输入Tensor按照最后一个维度分为左右两个Tensor:x1和x2,对左边的x1进行Threshold计算,将计算结果与x2相乘。

  • 计算公式:

    给定输入张量input,最后一维的长度为2d,进行以下计算:

    1. 将input分割为两部分:

      $$ x_1 = \text{input}[..., :d], \quad x_2 = \text{input}[..., d:] $$

    2. 对x1应用Threshold激活函数,定义如下:

      $$ \text{Threshold}(x, \text{threshold}) = \begin{cases} 0 & \text{if } x < \text{threshold} \ x & \text{if } x \geq \text{threshold} \end{cases} $$

      因此,计算:

      $$ x_1 = \text{Threshold}(x_1, \text{threshold}) $$

    3. 最终输出是x1和x2的逐元素乘积:

      $$ \text{out} = x_1 \times x_2 $$

参数说明

参数名输入/输出/属性描述数据类型数据格式
input输入公式中的输入input。BFLOAT16、FLOAT16、FLOATND
threshold输入
  • 公式中的输入threshold。
  • threshold不支持NaN和Inf。
BFLOAT16、FLOAT16、FLOATND
out输出公式中的out。BFLOAT16、FLOAT16、FLOATND
  • Kirin X90/Kirin 9030处理器系列产品:不支持BFLOAT16。

约束说明

典型场景尾轴为16的倍数,当尾轴为非32Byte对齐时,建议走小算子拼接逻辑。

调用说明

调用方式调用样例说明
aclnn调用test_aclnn_fatrelu_mul通过aclnnFatreluMul接口方式调用FatreluMul算子。
图模式调用-通过算子IR构图方式调用FatreluMul算子。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询