4.EEG睡眠呼吸暂停检测CNN-BiLSTM

论文名称 Sleep Apnea Detection From Variational Mode Decomposed EEG Signal Using a Hybrid CNN-BiLSTM
期刊 IEEE Acess 3.476/Q2
方法 该方法利用变分模式分解(VMD)算法将脑电信号分解为多个模式。将这种分解的EEG信号用于特征提取提供了对在呼吸暂停事件期间引入频谱中的变化的有效处理,而与特定患者无关。然后,提出了一种全卷积神经网络(FCNN),以分别并行地从每个VMD模式中提取时间特征,同时保持它们的时间相关性。FCNN块利用因果扩展卷积,随着卷积中的多个核运算,其扩展率不断增加。随后,为了进一步探索模式间的时间变化,将这些从不同EEG模式提取的特征与一组双向长短时记忆(LSTM)层联合优化。因此,经过训练和优化的网络能够在评估阶段生成呼吸暂停帧的预测。
结论 在受试者独立交叉验证方案中,对三个公开可用数据集的广泛实验提供了93.22%、93.25%和89.41%的平均准确度。

主要工作

  • 使用用于中心模式频率自适应变化的变分模式分解(VMD)算法将预处理信号分解为多个模式。提出了一种深度全卷积网络(FCNN)来独立地从每个EEG模式中提取复杂的时间特征

  • 这些FCNN模块将每个EEG模式的时间信息投影到更小的子空间中,该子空间包含与呼吸暂停发作相关的特征的更广义的变化,利用多个核卷积进行有效合并。

  • 引入一个双向长短时记忆(BiLSTM)层堆栈,将所有FCNN的输出一起处理,以探索不同VMD模式下的模态间时间特征变化。

数据帧

提取的EEG帧表示为: \(D={(x_i,y_i)|i=0,1,2,…,N−1}\) 其中xi表示第i帧,对应的标签为yi。分别从原始信号X和注释向量Y中提取所有帧和标签,其可以表示为 \(x_{i}[1,2, \ldots, l]=X[(1+s * i), \ldots,(1+s * i+l)]\) \(y_{i}=Y[1+(s * i)+l / 2]\) \(\forall i \in\{0,1,2, \ldots, N-1\}\) 因此,后续帧之间的较小偏移s将增加帧之间的重叠样本。

符号 含义
l 表示每个帧的长度
s 是帧移位
N 是帧总数

将使用这些提取的帧和相应的标签来训练神经网络模型。因此,可以定义一个二进制交叉熵损失函数(L),该函数将在训练阶段进行优化,以从神经网络生成正确的预测,该函数由下式给出

\[\begin{aligned} \mathscr{L}(w)=-\frac{1}{n}\left[\sum_{i=1}^{n} y_{i} \ln \left(\tilde{y}_{i}\right)+\left(1-y_{i}\right) \ln \left(1-\tilde{y}_{i}\right)\right] \\ &+\frac{\lambda}{2 n} \sum_{w} w^{2} \end{aligned}\]

| 符号 | 含义 | | – | – | |n|是一批样本的总数| |w|表示权重向量| |$y_i$|第i个输入的实际标签| |$\hat y_i$|生成的预测| |λ|是为减少过拟合而调整的正则化参数| 在评估阶段,训练和优化的模型用于逐帧生成关于呼吸暂停发生的预测。对于每种情况,根据EEG帧中间样本的注释对帧进行标记。

VMD

::: tip 为什么使用VMD? 由神经活动引起的这些频带中的主频可能会随着时间和人的不同而变化。这种限制可以通过使用具有自适应中心频率的动态频带划分来克服,这可以通过使用变分模式分解(VMD)算法来实现 :::

VMD将输入信号$y(t)$分解为预定义的N个主模式$m_i(t)$,其由下式给出 \(y(t)=\sum_{i=1}^{N} m_{i}(t)\) 动态地确定这些模式以最小化所有模式的带宽之和,同时通过模式相加以最小二乘意义重建输入信号。因此,约束变分优化问题变为 \(\min _{\left\{m_{i}\right\},\left\{\omega_{i}\right\}}:\left\{\sum_{i=1}^{N}\left\|\partial_{t}\left[\left(\delta(t)+\frac{j}{\pi t}\right) * m_{i}(t)\right] e^{-j \omega_{i} t}\right\|_{2}\right\}\)

符号 含义
$m_i$ 表示第i个模式函数
$w_i$ 表示第i个模式函数对应的中心频率

神经网络结构

提出的深度神经网络架构由三个独立的子网络组成:

  • 全卷积神经网络
  • 双向LSTM网络
  • 密集连接层。

Img

FCNN

首先,使用全卷积神经网络(FCNN)分别处理从VMD获得的EEG帧的每个模式。并行使用多个这样的FCNN来分别从每个模式提取时间特征变化。这些操作将每个模式的特征空间转换为相对低的时间维度,同时保持所提取特征之间的因果时间关系。该过程有助于提取在呼吸暂停事件期间发生的单峰特征变化的一般趋势,而与患者无关。 Img 所提出的FCNN中的所有操作通常可分为两个操作块,即:因果膨胀块多核块。 ::: tip 为什么使用较长的时间窗? 在EEG信号的任何时刻,应考虑EEG信号之前的所有历史,以区分引发呼吸暂停事件的神经活动模式。此外,为了正确识别呼吸暂停事件,应在较长的时间窗内分析EEG信号的变化。由于睡眠不同阶段的短期波动可能导致对呼吸暂停事件的不正确识别. :::

因果膨胀块

如果输入信号对应于x∈ Rn和长度为k的滤波器表示为,$f:{0,1,…,k− 1} → R$、 任意元素s上的因果扩张卷积运算F由下式给出: \(F(s)=\left(x *_{d} f\right)(s)=\sum_{i=0}^{k-1} f(i) \mathbf{x}_{(s-d) i}\) 在第i个块处,扩张率随$(d=O^{2i})$呈指数变化

符号 含义
∗d 表示扩张率为d的因果扩张卷积
s-d 表示扩张率为d的因果扩张卷积
(k− 1) d 每层中的有效接收面积

在每个这样的块中,应用参数校正线性单元(PRelu)作为非线性激活函数,然后进行归一化操作,串联进行两个因果扩展卷积,其中 \(\operatorname{PRelu}(\mathrm{x})=\left\{\begin{array}{ll}x, & \text { if } x \geq 0 \\ \alpha x, & \text { otherwise }\end{array}\right.\) α是用于映射负输入值的斜率,这里α=0.2 如果$f_i$是从第i个CDB块获得的输出特征图,则还将生成残差输出Ri,该残差输出将被馈送到下一个CDB模块,其可以由以下表达式表示: Img 其中,$R_0=x_i$是输入信号,k是因果膨胀块的总数。然后,组合使用每个CDB单元块提取的特征,生成组合输出F,其可以表示为 \(\mathcal{F}=\sum_{i=1}^{k} f_{i}\) 在使用多个因果扩展块进行处理之后,相应EEG模式的输入数据帧被转换为结果特征图,该结果特征图包含包含不同时间关系的大量提取特征。

多核块

::: tip 为什么使用MKB模块? 该特征图的时间维度保持与输入数据帧相同,应进一步减小该维度以提取更一般的单峰时间特征。因此,提出了多核块(MKB)来减少特征映射的时间维度,同时并行执行多核卷积运算。 ::: 这里,在具有不同内核的卷积之间并行执行平均池操作,这有助于在池操作中合并不同的时间上下文。

随后,所有这些合并和卷积的特征图与提取一般变化的另一个卷积运算一起收敛。因此,每个MKB单元的输出可以概括为 \(O_{i}=H\left(h_{1}\left(O_{(i-1)}, \theta_{1}\right), h_{2}\left(O_{(i-1)}, \theta_{2}\right), h_{3}\left(O_{(i-1)}, \theta_{3}\right), \theta_{H}\right)\) \(\forall i=\{1,2, \ldots, m\}\)

符号 含义
$O_0=F;h_1、h_2、h_3$ 分别表示具有大小为1、3和5的时间核的卷积
H 表示组合卷积
$θ_1、θ_2、θ_3和θ_H$ 是它们各自的参数
m 此类MKB单元的总数

经过一系列多核块后,变换后的特征图将包含越来越多的广义单峰特征,且时间维度降低。最后,从包含特定EEG模式的广义时间表示的最终多核块获得输出特征图。

双向长短时记忆网络(BI-LSTM)

Img

随后,多层双向长-短期记忆网络(Bi-LSTM)被馈送从不同FCNN获得的这些时间特征图。该模块利用EEG帧的多模态特征进行操作,提取高维跨模态时间特征,这些特征在呼吸暂停事件期间应发生变化。

密集连接层和分类器

使用一系列密集连接的层来利用跨所有提取的时间特征的全局关系。这可以通过以下公式得出: \(d_{i}=\sigma\left(W_{i} d_{i-1}+\mathbf{b}_{\mathbf{i}}\right) \quad \forall i \in\{1,2,3\}\)

符号 含义
$d_i$ 表示第i个密集连接层的输出
$W_i$ 权重矩阵
$b_i$ 偏置向量
σ 表示激活函数
$d_0$ 表示输入特征向量

总共,三个密集连接的层被串联堆叠,以将堆叠的LSTM单元的输出特征向量收敛到最终预测。最后,使用sigmoid激活函数将从具有单个节点的最终密集连接层获得的输出映射到最终预测,该函数由下式给出 \(\operatorname{sigmoid}(\mathrm{x})=\frac{1}{1+e^{-x}}\) 最终,从Bi-LSTM模块生成组合特征向量,该组合特征向量包含对应EEG帧的所有模式的通用特征表示。该特征向量用一系列密集连接的层处理,这些层提取提取的特征中的一般表示,以收敛于呼吸暂停事件的最终预测。

结果

训练数据划分

Img

精度指标

传统的度量用于评估所提出方案的性能,如以下等式中所述的准确性、灵敏度和特异性: \(Accuracy ( Acc. )=\frac{\mathrm{TP}+\mathrm{TN}}{\mathrm{TP}+\mathrm{FP}+\mathrm{TN}+\mathrm{FN}} \times 100\) \(Sensitivity ( Sen. )=\frac{\mathrm{TP}}{\mathrm{TP}+\mathrm{FN}} \times 100\) \(Specificity ( Spec. )=\frac{\mathrm{TN}}{\mathrm{TN}+\mathrm{FP}} \times 100\) \(\mathrm{F} 1 \mathrm{Score}=\frac{\mathrm{TP}}{\mathrm{TP}+\frac{1}{2}(\mathrm{FP}+\mathrm{FN})}\)

消融实验

Img 第一行是未使用VMD的端到端DL架构 第二行是带通的端到端 第三行是有VMD的端对端

其他方法对比

Img