2.MI脑电分类框架AICA-WT-TEF

论文名称 EEG feature fusion for motor imagery: A new robust framework towards stroke patients rehabilitation
期刊 Computers in Biology and Medicine 6.698/Q1
方法 一是提出了一种新的基于运动成像(MI)的BCI特征融合方法,二是开发了一种自动检测康复前后变化的MI框架。这项工作的重点是研究时间、熵和频域,以估计一个健壮的TEF融合方法,以获得来自多个域的信息。
结论 首先,根据单个特征域进行分类。在时域中,测试了7个特征,其中HjAc特征对分类任务的改进影响最为显著,特别是在kNN、SVM和RF分类器的测试后期阶段。此外,相对于熵域的其他五个特征,impe特征对分类结果的影响更为显著。准确率的提高尤其可以在每个kNN、SVM和RF分类器的预训练阶段看到。但在测试阶段,该特征对kNN分类结果影响较小。
评价 给特征提取实验了更多选择方向,可以用于LSTM之类需要大量手工特征的模型

当前研究存在的问题

::::: row :::: col 难点 ::: warning 从临床角度来看,神经科医生通过观察波的以下特性来读取脑卒中后患者的脑电图信号。

  • 节律
  • 振幅
  • 不对称性
  • 幅度的变化
  • 是否存在波
  • 波与波之间的比值

然而,各种类型的伪影可能会扭曲所记录的波活动。这些伪影通常可以模仿或叠加大脑的病理行为。 ::: ::: warning 脑电图频率可能被与脑电图相冲突的主要伪影所交叉,噪声的存在使得脑电图信号难以分类。

  • 眨眼
  • 眼部运动
  • 心脏伪影
  • 肌肉活动
  • 电力线干扰噪声 ::: ::: warning 以往的MI脑电图数据分析方法大多忽略了在实施算法之前采用组合滤波方案进行脑电图信号去噪的优势 ::: ::: warning 在特征提取阶段,大多数现有的研究都使用了各种方法,如CSP或WT作为工作在单一领域特征中的特征提取技术。然而,现有的文献还没有针对不同的领域提出不同的特征提取方法,从而有很大的机会提高分类精度 ::: :::: :::: col 本文改进方法 ::: tip 采用常规滤波小波变换自动独立分量分析(AICA-WT)去噪技术 ::: ::: tip 计算时间域熵域频域属性,并将有效特征组合成时熵-频率(TEF)属性。 ::: ::: tip 采用支持向量机(SVM)、k-最近邻(kNN)和随机森林(RF)分类技术对基于MI的脑接口康复进行了测试 ::: :::: :::::

主要工作

  • 本研究采用常规滤波和AICA-WT技术对脑电图数据集进行降噪。从时间域、熵域和频域提取脑机接口的脑电图特征。这些特征是根据先前的研究选择的,这些研究表明它们在区分不同的精神任务(如AD患者的脑电图)方面有用。

  • 计算时间域、熵域和频域属性,并将有效特征合并为时间熵-频率(TEF)属性,以说明大脑对基于mi的BCI康复的反应。因此,AICA-WT和TEF融合集被用于开发AICA-WT-TEF框架。

  • 最后,分别在特征和TEF融合集上测试了支持向量机(SVM)、k-最近邻(kNN)和随机森林(RF)分类器的性能。

实验与数据集

| 名称 | 描述 | | – | – | | g.tec医疗工程有限公司的标准脑电图数据集 | 。。。 |

:::: col 整体实验安排 ::: tip 实验对象 对脑卒中后上肢偏瘫患者的脑电图数据进行了研究。3例卒中后患者接受了治疗,参与者平均年龄为22岁(SD = 4.582)。

每位参与者接受三个月的基于bci的MI培训,每周两次培训(共25次培训)。 ::: ::: warning 治疗手段 recoveriX系统治疗(g.tec医疗工程有限公司) ::: 研究小组进行了两次评估(训练前和训练后),并对其进行了评估。训练前评估安排在干预前30-35天,训练后评估安排在干预后几天进行。

该研究方案由奥地利国家医疗卫生委员会批准(D−42−17),每位患者在预评估前签署知情同意书。 ::: tip 具体实验

  • 患者被要求根据MI脑力任务的系统指示来想象手腕的背侧运动
  • 每一组由双手240次MI重复组成,分为组,每组80次。每个疗程的总时间约为1小时,包括准备和清洗时间。
  • 患者进行了25次基于mi的BCI会话,并随访评估访问,以检查脑电图神经康复前后的功能变化。基于mi的BCI任务以伪随机顺序说明,试验间隔时间随机,以256Hz采样率记录该数据集。

Img ::: ::::

Img

时域特征


::: tip 分形维数(FD) 这是因为它依赖于二进制序列,在大多数情况下,HFD对噪声不太敏感,n为时间间隔,$x_m(n)$为n个值的平均时间序列。 \(x(n)=\frac{1}{n} * \sum_{m=1}^n x_m(n)\) ::: ::: tip 偏度(Skw) $x_k(n)$为输入脑电图信号,$k$为特定通道,$H$为希尔伯特变换。 \(e_i(n)=\sqrt{x_k(n)^2+H\left(x_k(n)^2\right)}\) \(m_n = E(x−E_x)^2\) \(Skw=\frac{m_3}{\left(m_2\right)\left(\frac{3}{2}\right)}\) ::: ::: tip 峰度(Kurt) $x_k(n)$为输入脑电图信号,$k$为特定通道,$H$为希尔伯特变换。 \(e_i(n)=\sqrt{x_k(n)^2+H\left(x_k(n)^2\right)}\) \(m_n = E(x−E_x)^2\) \(Kurt =\frac{m_4}{\left(m_2\right)^2}-3\) :::

::: tip Hurst(Hur) 其中$n$为脑电图采样率,$R(n)/S(n)$为对应的重新标度值,其中$R(n)$为前$n$个累计偏离均值的范围,$S(n)$为前$n$个标准差的序列和 \(Hur=\log (R(n) / S(n) / \log (n)\) :::

::: tip Hjorth参数 Hjorth参数是一个由移动性活动性复杂性组成的特征,可以从时域特征中提取。 \(\operatorname{Moy}(f(i))==\sqrt{\frac{A C y\left(\frac{d f}{d i}\right)}{A C y(f(i))}}=\sqrt{\frac{S 2}{S 1}}\) \(\operatorname{Coy}(f(i))=\frac{\operatorname{Moy}\left(\frac{d f}{d i}\right)}{\operatorname{Moy}(f(i))}=\sqrt{\frac{S 3 / S 2}{S 2 / S 1}}\) :::

\(S 1=\frac{1}{n} \sum_{i=1}^n x_i^2\) \(S 2=\frac{1}{n-1} \sum_{i=1}^{n-1}\left(x_{i+1}-x_i\right)^2\) \(S 3=\frac{1}{n-2} \sum_{i=1}^{n-2}\left(\left(x_{i+2}-x_{i+1}\right)-\left(x_{i+1}-x_i\right)\right)^2\) \(A C y(f(i))=\operatorname{Var}(f(i))=S 1\)

符号 含义
$x$ 表示脑电图信号
$S_1$ 表示$x$的方差
$AC_y$ 指的是活动性
$Var$ 指的是方差
$M_{oy}$ 指的是移动性
$C_{oy}$ 指的是复杂性

熵域特征

::: tip 样本熵(SampEn)

  • $\operatorname{SampEn}$主要与记录长度无关,引入是为了减少偏差,消除$ApEn$中出现的自匹配,
  • $B_m(r)$是两个序列匹配$m$点的概率
  • $A_m(r)$是两个序列匹配$m + 1$点的概率。 \(\operatorname{SampEn}(m, r, N)=-\ln \left[\frac{\left(A^m(r)\right)}{\left(B^m(r)\right)}\right]\) ::: ::: tip 模糊熵(FuzEn) $FuzEn$用于表征不同类型的生物医学信号。当被分析的生物医学信号中存在缺失样本时,$FuzEn$是一个鲁棒熵估计器。其中,函数$\Phi_m$依赖于向量$x_m(i)$和$x_m(j)$的相似度Dij, m与模糊函数。 \(\operatorname{FuzEn}(m, n, r, N)=\ln \Phi m(n, r)-\ln \Phi m+1(n, r)\) ::: ::: tip Tsallis熵(TsEn) $TsEn$熵已被广泛用于显示由时域依赖熵估计的脑电图变化。例如,从相关疾病的阿尔茨海默病患者的脑电图中提取$TsEn$,并鉴别脑缺血损伤。其中$x_i$为信息事件,$p(xi)$为$x_i$的概率 \(S_T=\sum_{i=0}^n p\left(x_i\right) \ln _q\left(\frac{1}{p\left(x_i\right)}\right)=\frac{1-\sum p^q\left(x_i\right)}{q-1}\) \(\ln _q(x)=\left(\frac{X^{(1-q)-1}}{(1-q)}\right) \forall x>0, q \in \mathbb{R}\) ::: ::: tip 改进的多尺度排列熵(impe) Impe提高了熵估计的可靠性,得到了更加可靠和稳定的结果,可以描述影响多个时间尺度的生理变化,是一种很有前途的熵估计技术,其中$d$为嵌入维数。 \(\operatorname{impe}(x, n, d)=\frac{1}{n} \sum_{m=1}^n P E(x)\) ::: ::: tip 多尺度模糊熵(MFE) 非线性MFE被用于分析记录的EEG信号。MFE方法基于在多个尺度上使用FuzEn值;EEG时间序列记为$X = X (i): 1≤i≤N$,N是时间序列的长度,τ是一个正整数,参数τ = 1, r = 0.25 × SD, SD是原始时间序列的标准差。 \(y_i(\tau)=1 / \tau \sum_{i=(j-1) \tau+1}^j x(i), 1 \leq j \leq N / \tau\) \(MFE(X, τ, m, n, r) = FE(y(τ), m, n, r)\) ::: ::: tip 改进的复合多尺度模糊熵(RCMFE) 考虑到复杂的心理过程可能由大脑承担,我们采用非线性熵方法评估了输入的脑电图信号,其中$m$为嵌入维数,$x$为输入脑电图信号。

\(\operatorname{RCMFE}(x)=-\ln \left(\frac{\bar{\varphi}_t^{(m+1)}}{\bar{\varphi}_\tau^m}\right)\) :::

频域特征

::: tip 平均频率(meanF) 用$meanF$作为神经活动普遍减缓的指标来研究EEG的变化。为了计算$meanF$,将功率谱密度(PSD)归一化到总功率得到$PSD_{norm}$,其中$j$为频率箱,$f(j)$为每个频率箱计算的平均频率, \(PSD_{norm}(j)=PSD(j)/\sum_j(PSD)(j)\) \(meanF=\sum_j f(j)(P S D)_{\text {norm }}(j)\) ::: ::: tip 中值频率(MedF) 在计算$MedF$之前,先估计脑电功率谱。

  • 首先,计算脑电各epoch的自相关函数;
  • 通过自相关向量的傅里叶变换得到PSD,光谱分辨率等于0.05Hz。
  • 然后,使用$MedF$对MEG记录进行分析,$MedF$定义为包含50% PSD功率的频率。

考虑到本研究中使用的8~30Hz频段,其中PSD为每个脑电信号的功率谱密度,f1和f2为频带。 \(\operatorname{Med} F=1 / 2\left[\sum_{F=F}^5(P S D) f\right]=\sum_{F=f_1}^{F M}(P S D) f\) :::


整体流程

数据处理

利用(50 Hz)的低通滤波器(Butter-worth)去除电力线干扰噪声,然后使用频率在(8-30 Hz)左右的带通滤波器(BPF)限制记录的EEG数据的频带,再使用WT去噪。阈值的实际值是通过反复试验和根据以往的研究来选择的。

特征分类

==RBF-base核==用于多类SVM分类器,平滑参数σ为0.5,使训练数据集的误分类正确率最小化。

>>> linear_svc = svm.SVC(kernel='linear')
>>> linear_svc.kernel
'linear'
>>> rbf_svc = svm.SVC(kernel='rbf')
>>> rbf_svc.kernel
'rbf'

注:rbf核就是一般说的高斯核

训练

为避免分类分析中的过拟合和偏差,使用网格搜索方法,通过10倍交叉验证确定训练数据集和测试数据集的分类模型参数。在这项工作中,分类模型的标签分为康复前康复后

  • 康复前数据集被标记为类1
  • 康复后数据集被标记为类2

因此,每个康复前和康复后的数据集都被分为10个大小相等的不相连的子集。其中一个子集被用作测试集,其余9个子集被组合成一个训练集来学习分类器。该程序执行了10次,结果有10个准确性。这些准确度的平均值代表了从该数据集学习的10倍交叉验证准确度。 Img

实验结果

滤波器比较

Img

特征表征能力比较

Img

结论

  • 首先,根据单个特征域进行分类。在时域中,测试了7个特征,其中HjAc特征对分类任务的改进影响最为显著,特别是在kNN、SVM和RF分类器的测试后期阶段。

  • 此外,相对于熵域的其他五个特征,impe特征对分类结果的影响更为显著。准确率的提高尤其可以在每个kNN、SVM和RF分类器的预训练阶段看到。但在测试阶段,该特征对kNN分类结果影响较小。