别再死记硬背了!用‘黑叔红叔’口诀搞定红黑树插入(附王道数据结构实战案例)
2026/5/3 16:39:17
下面用PyTorch 代码把 CV(视频/时序视觉)里最常见的“时间注意力(Temporal Attention)模块”讲清楚:它们本质上都是在时间维 T上做加权/交互,让模型能建模跨帧依赖(动作、事件、时序一致性等)。
我统一用视频特征张量形状:
x形状为(B, T, C, H, W)把每一帧(或每个时间 token)当成一个 token,沿时间维做注意力:
Q=XWQ,K=XWK,V=XWVQ = XW_Q,\quad K = XW_K,\quad V = XW_VQ