心电自监督分类论文分享（1）-read your heart-酒店常州论坛

READING YOUR HEART

现有心电自监督学习分为对比学习、重构学习两类，但全部把心电当做普通时序信号，采用固定窗口、固定步长切割波形，存在两个核心缺陷：

为了解决这两个问题，作者提出了完整的自监督学习框架HeartLang，把单词心跳当做单词，把连续心律当做句子，从心跳形态、全局节律两层学习通用表征

整体框架图分为四步：

QRS-Tokenizer ：基于 QRS 波定位自适应分割心跳：先带通滤波 + Ricker 小波积分检测每个 QRS 波峰，以 QRS 为中心截取单心跳片段（单心电单词）；心率自适应拼接为心电句子，长度上限 256，不足补零、过长截断。区别于固定窗口，完全贴合心跳生理边界。
ST-ECGFormer：专门为心电设计的Transformer编码器，一维卷积将单心跳映射为高维Token，可学习空间嵌入+时序嵌入+位置嵌入，融合导联空间、时序上下文信息。
VQ-HBR 向量量化心跳重构（形态层级表征学习）
构建超大离散心电词表 V（8192 个通用心电单词）：用余弦相似度将不同人相似心跳映射至同一词向量，消除个体生理差异；通过 Transformer 解码器还原原始心电，MSE 量化重构损失训练词库，学习心跳形态特征。
掩码心电句子预训练（节律层级表征学习）
随机 50% 掩码句子内的心跳单词，基于未掩码上下文预测被掩码心跳对应的词表索引，交叉熵损失建模心跳间上下文语义，捕捉全局心律依赖。

线性微调的实验结果：
在 PTB-XL 全部四类心电任务下，HeartLang 在 1%/10%/100% 标注数据下 AUC 全面超越所有对比自监督方法，相比第二名平均提升 8.14；尤其在心电形态、节律分类任务提升超 9.85

优势

局限性：

未来拓展方向：

github地址：论文源码地址