CANN加速库PagedCacheLoad示例
2026/5/9 19:59:35 网站建设 项目流程

加速库PagedCacheLoadOperation C++ Demo

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

介绍

该目录下为加速库PagedCacheLoadOperation C++调用示例,以下示例仅适用于Atlas A2/A3训练系列产品、Atlas 800I A2推理产品、Atlas A3 推理系列产品。

使用说明

  • 首先source 对应的CANN和nnal包的安装路径

    1. source [cann安装路径]/set_env.sh 默认:source /usr/local/Ascend/ascend-toolkit/set_env.sh
    2. source [nnal安装路径]/set_env.sh
      默认:source /usr/local/Ascend/nnal/atb/set_env.sh
      ①. 如果使用加速库源码编译,source [加速库源码路径]/output/atb/set_env.sh
      例如: source ./ascend-transformer-boost/output/atb/set_env.sh
  • 运行demo

    bash build.sh

    注意

    • 使用cxx_abi=0(默认)时,设置D_GLIBCXX_USE_CXX11_ABI为0,即:

      g++ -D_GLIBCXX_USE_CXX11_ABI=0 -I ...
    • 使用cxx_abi=1时,更改D_GLIBCXX_USE_CXX11_ABI为1,即:

      g++ -D_GLIBCXX_USE_CXX11_ABI=1 -I ...
    • 提供的build脚本仅用于编译和运行paged_cache_load_demo.cpp,如需编译其他demo,需要替换“paged_cache_load_demo”为对应的cpp文件名

额外说明

示例中生成的数据不代表实际场景,如需数据生成参考请查看根目录下的python用例目录: tests/apitest/opstest/python/operations/paged_cache_load/

场景说明

提供demo分别对应,编译运行时需要对应更改build脚本:

  • paged_cache_load_demo.cpp

    【注】:默认编译脚本可编译运行

    参数设置

    Paramvalue
    kvCacheCfgatb::infer::PagedCacheLoadParam::K_CACHE_V_CACHE_NZ
    hasSeqStartsfalse
    isSeqLensCumsumModefalse

    输入

    TensorNameDataTypeDataFormatShape
    keyCacheint8fractal_nz[4, 4, 128, 32]
    valueCacheint8fractal_nz[4, 4, 128, 32]
    blocktableint32nd[3, 1]
    contextlensint32nd[3]
    keyint8nd[384, 128]
    valueint8nd[384, 128]

    输出

    TensorNameDataTypeDataFormatShape
    keyint8nd[384, 128]
    valueint8nd[384, 128]

【免费下载链接】ascend-transformer-boost本项目是CANN提供的是一款高效、可靠的Transformer加速库,基于华为Ascend AI处理器,提供Transformer定制化场景的高性能融合算子。项目地址: https://gitcode.com/cann/ascend-transformer-boost

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询