HAPPE+ER软件:标准化事件相关电位ERP的预处理的pipeline
摘要
事件相關電位(ERP)設計是一種用腦電圖(EEG)評估神經認知功能的常用方法。然而,傳統的ERP數據預處理方法是手動、主觀、耗時的過程,許多自動化處理方法也很少有針對ERP分析有優化(特別是在發展或臨床人群中)。本文提出并驗證了HAPPE+事件相關(HAPPE+ER)軟件,標準化和自動化預處理過程,且優化了整個生命周期的ERP分析。HAPPE+ER通過預處理和事件相關電位數據的統計分析來處理原始數據。HAPPE+ER還包括數據質量和處理質量指標的事后報告,標準化對數據處理的評估和報告。最后,HAPPE+ER包括后處理腳本,以方便驗證HAPPE+ER的性能或與其他預處理方法的性能進行比較。本文用模擬和真實的ERP數據介紹了多種方法,HAPPE+ER軟件可在https://www.gnu.org/licenses/#GPL的GNU通用公共許可證條款下免費獲得。
1.介紹
傳統的腦電圖/ERP數據分析方法是通過主觀手工編輯去除含有偽跡的片段,這可能導致重要數據丟失,特別是來自具有高水平偽跡特征的發育和臨床人群的數據。現有軟件通常局限于腦電圖預處理的單個階段,如線噪聲去除或自動ICA成分拒絕,ADJUST;或僅在少偽跡數據上開發,缺乏嵌入式指標來定量評估其性能或數據質量。此外,很少有人對分析方法進行實證比較,研究人員可能很難評估哪些分析對他們的腦電圖數據最有效。此外,這些預處理分析會影響后續的分析,一些預處理方法僅限于為時頻分析或靜息狀態的腦電圖數據做準備數據。HAPPE軟件(Gabard-Durnam et al.2018)提出了一種自動化、可量化和標準化的腦電圖數據處理方法,該方法具有在發育和臨床人群中看到的高水平的偽跡,并提高了跨獲取設置和用戶編碼頻率的可訪問性。為了便于對整個生命周期的ERP數據處理,HAPPE+ER包括預處理ERP數據的代碼,以及高效、自動創建處理后的代碼。HAPPE+ER現在包括了對數據輸入(數據質量報告)和處理方法(管道質量報告)的補充的、可量化的質量度量。數據可以是多種格式,包括來自EGI、BioSemi和Brain Products等。
2.HAPPE+ER pipeline步驟
圖1. 圖像說明了HAPPE+ER pipeline的處理步驟
中間輸出由右邊的淺藍色方框標記,并根據保存它們的文件夾進行標記。用戶選項由左側淺藍框表示,亮的綠色箭頭表示選項之間所有可能的流動方法。
2.1 HAPPE+ER數據輸入
HAPPE+ER容納以不同的采集布局作為輸入的多種類型的腦電文件。HAPPE+ER管道所接受的完整布局和格式化選項見表1。為了設置格式化的文件,在運行HAPPE+ER之前,應該預先設置并嵌入文件中(例如,將其加載到EEGLAB并確認正確的電極位置)。每一批運行的數據都必須具有相同的通道布局(設備、腦電帽以及電極數)和模式(靜息狀態或事件相關),這些多需要用戶指定。文件格式也是,因為單次運行將只支持由用戶指定的單一文件類型。HAPPE+ER處理任何采樣率收集的數據,單次運行的文件可能各自的采樣率不同。刺激標記、范式事件和/或感興趣的條件(通常稱為前進的事件標記)應該出現在讀入HAPPE+ER的數據中。事件標記如何嵌入到數據文件中,將取決于刺激-呈現軟件和獲取系統。
表1 由HAPPE+ER支持的獲取布局和相關文件類型的列表
2.2 通道選擇
HAPPE+ER提供了多種通道選擇選項,以便用戶可以選擇最適合其數據集需求的通道。HAPPE+ER不將用戶限制在特定數量的通道上,因為以后的處理步驟不依賴于通道數量。
2.3 線性噪聲消除
HAPPE+ER可以消除電噪聲(例如,60或50 Hz),通過CleanLine program(Mullen,2012)的多維度回歸方法,可以在不犧牲或扭曲附近頻率的潛在腦電圖信號的情況下去除電噪聲。CleanLine多維度回歸掃描用戶指定頻率± 2 Hz附近的線性噪聲信號,4秒窗口為1秒步長,平滑度為100,在電噪聲去除過程中,正弦回歸系數的顯著性閾值為p = 0.01。這個過程是高度特定的電噪聲的頻率,用戶可以指定為60 Hz或50 Hz,如果有過多的線噪聲(如:30 Hz, 25 Hz)用戶還可以指定諧波來減少。
2.4 重采樣(250、500或1000Hz)(可選)
用戶可以選擇將他們的數據重采樣到250、500或1000 Hz。用戶可以使用此選項來減少文件大小,或將數據與以較低的采樣率收集的其他項目或文件對齊(注意,用戶可能不會對數據進行上采樣,例如從500到1000 Hz)。HAPPE+ER功能優化這些常見的采樣率(例如小波閾值步驟),用戶采樣率從高往下可以實現最佳性能重新采樣(例如從2000 Hz到1000 Hz)。
2.5 濾波(100 Hz低通)
HAPPE+ER在偽跡抑制和壞通道檢測(如果選擇)之前,應用一個100 Hz的自動低通濾波器,只評估在神經活動的頻率范圍內的數據。在去除偽跡之后,用戶會對特定的ERP (s)進行再濾波。注意,沒有高通濾波。
2.6 壞通道去除(可選)
HAPPE+ER可以檢測和去除由于高阻抗、電極損傷、頭皮接觸不足以及在整個記錄過程中過度運動或肌電圖(EMG)偽跡而污染數據的通道。HAPPE+ER對提交給處理的整個數據文件執行以下步驟(閾值由經驗優化確定,下面進行了證明):
1.檢測無信號通道(>5s則拒絕)
2.根據其功率譜檢測離群值信道(通過EEGLAB rej_chan函數運行兩次;如果與平均功率相比,拒絕大于3.5個標準差或小于-5個標準差)
3.檢測剩余的被壓制線噪聲污染(通過清潔RawData的線噪聲標準;如果平均線噪聲/神經信號比大于6個標準差)
4.基于與所有其他信道的相關性檢測離群信道(通過CleanRawData的信道準則;當小于0.8相關時拒絕)
為了測試不同壞通道檢測功能的有效性并確定檢測的最優標準值,作者將一系列自動偽跡識別與一組專家識別的EGI數據集(每個文件具有相同的39個通道評估子集,共20各數據集,一共780個通道)進行比較,以專家一致同意的壞通道為真實壞通道,評估結果見表2。
表2在EGI數據集的20個文件上測試識別壞通道參數性能
2.7 小波閾值
兩種主要的偽跡校正方法包括獨立分量分析(ICA)和小波閾值分析(由HAPPE+ER使用)。簡單地說,ICA將跨電極的數據聚類為獨立的成分,可以從神經時間序列中分離偽跡,而小波閾值使用系數解析頻率范圍內的數據,該系數可以檢測電極數據或獨立成分的時間局部偽跡波動(詳細解釋見Gabard-Durnam等人,2018年)。ICA要求拒絕整個時間序列,這依賴于神經與偽數據的充分分離,以及適當拒絕成分,以最小化從充滿偽數據的時間序列中提取神經信號。小波閾值法提供了時間和頻率局部化的偽跡檢測和去除,而不造成無偽跡的信號失真。HAPPE+ER應用小波閾值化,在分割和試驗拒絕之前執行這種偽跡校正。在HAPPE+ER中有兩個小波閾值選項可選—一個“軟”或“硬”閾值。軟閾值適合具有最少偽跡數據(如健康成人樣本),因為該選項可以在一般干凈的信號條件下最好地保持ERP振幅。硬小波閾值可能對高或可變偽跡污染的數據(例如,大多數發展樣本)是首選,這個選項提供了更嚴格的偽跡去除條件以減少振幅損失和保留更多的試次。
2.8 ERP過濾器
HAPPE+ER允許用戶選擇濾波器類型和濾波頻率,以將數據限制在ERPs中感興趣的頻率(例如0.1-30Hz)。具體來說,HAPPE+ER提供了兩種濾波器類型供選擇,(1)a Hamming windowed sinc FIR filter(EEGLAB的pop_eegfiltnew函數,濾波器順序從用戶輸入頻率截止估計), (2) IIR butterworth filter(ERPLab的pop_basicfilter,順序估計為(采樣率/高通頻率)的3*整數部分)。獨立于濾波器類型,用戶可以輸入任何想要的高通和低通頻率截止點。
2.9 分割(推薦)
如果選擇了分段,erp還有兩個附加選項:基線校正(推薦)和段內的數據插值(可選的偽跡校正步驟),下文將詳細描述。
2.11 壞數據插值(可選)
每個段中的每個通道根據四個FASTER的標準(方差、中值梯度、振幅范圍和偏離平均振幅)進行評估,并為每個指標生成該段中每個通道的Z分數。任何有一個或多個Z分數與單個段的平均值大于3個標準差的通道,都只對該段數據不利。這些標準可以識別在特定通道中具有殘留偽跡的段。隨后,對于每個段中標記為壞的通道的數據用球形插值,允許用戶保持最大數量可用段,同時仍然在單個段內最大化成分拒絕。然而,我們提醒用戶在他們選擇通道子集的情況下實現此選項,這樣通道之間的距離很大,因為插值過程將從不能反映該頭皮空間適當活動輪廓的遠端通道提取數據。
2.12 壞段剔除(推薦)
根據振幅、聯合概率或兩個準則拒絕壞段。基于振幅剔除有助于消除殘留的高振幅偽跡(例如,眨眼、來自干燥電極的漂移、不連續)。用戶將指定一個偽跡振幅閾值,這樣至少有一個通道的振幅超過所提供的閾值的任何段都將被標記。HAPPE+ER建議嬰兒數據的偽閾值為?200-200,兒童、青少年和成人數據的偽閾值為?150-150。概率用EEGLAB的pop_jointprob函數計算的。計算給定同一電極在所有其他段的活動在段中的聯合概率(單電極概率),并計算給定同一段的所有其他電極活動在段中的活動的聯合概率(電極組概率)。當(1)一個通道的單電極概率或(2)其電極組概率超出平均值3個標準差(半自動視覺檢查設置良好)時,任何片段都被標記為拒絕。然后同時拒絕用戶選擇步驟中的標記的所有段。值得注意的是,此段拒絕步驟可以在所有用戶指定的通道上運行,或者在特定感興趣區域(ROI)的通道子集上運行。ROI-信道子集選項允許用戶為特定的ROI分析定制細分拒絕,如果該ROI相對于信道中的其他ROI的偽跡污染較少,則可能為每個個體保留更多的數據。
2.13 壞通道插補
對于所有的HAPPE+ER運行,無論分割選項如何,任何在壞通道剔除處理步驟中被移除的通道現都會可球形插值。通道插值為用戶指定的完整通道集重新填充數據,并減少均值重參考時的偏差。插值的通道將被記錄在HAPPE的處理報告中,以供數據重用。
2.14重參考(平均或COI)(可選)
用戶可以指定使用所有通道的平均參考或使用一個或多個信道的信道子集。重參考還減少了電極間一致存在的偽信號,包括殘留的線噪聲。
2.15 按事件標記分割數據
對于具有多個事件標記讀入HAPPE+ER的文件,此階段的數據被解析并提供:1、包含所有事件標記的文件,2、每個文件中只包含具有相同事件標記的trial文件,3、只包含具有相同條件的trial的文件。
根據對數據的處理順序,將中間文件歸入文件夾,包括:(1)濾波到100 Hz和線噪聲降低后的數據,(2)壞通道剔除后數據,(3)小波后閾值的數據,(4)過濾分段ERP的數據。如果啟用分段,HAPPE+ER輸出一到三個額外的中間文件:(5)分段后的腦電圖數據,(6)基線校正數據(如果啟用基線校正),(7)插值數據(如果啟用不良數據插值)。如果選擇壞段剔除,HAPPE+ER也保存壞段剔除后數據。這個階段的所有文件都包含單個試次的數據(在預處理過程中不進行試驗平均)。
軟件結果可以輸出為.mat,set,和.txt 格式,建議使用.txt文件格式,它總共輸出三個文件:(1) A.包含每個采樣時間點每個電極各trial的平均值的Txt文件,(2) 包含每個單獨試驗中每個電極的數據,(3)完全處理的腦電圖的EEGLAB.set文件。對于具有多個事件標記的數據,提供包含所有事件標記的文件的輸出和每個包含一個事件標記的文件并相應標記。最后,如果用戶在半自動化設置下運行HAPPE+ER,那么該軟件將為包含完全處理過的數據的功率譜的每個文件生成一個圖像。
4.HAPPE+ER輸出:數據質量評估
HAPPE數據質量評估報告 每個腦電圖文件的描述性統計和數據度量的報告表格,以幫助快速有效地評估研究中或跨研究參與者的數據質量。包含所有這些度量的報告表以.csv文件的形式提供,它包含在HAPPE+ER期間生成的“質量評估輸出”文件夾中。具體有:
前/后線噪聲去除指標可能指示導致數據中線噪聲顯著增加的環境或處理偏差;選擇通道百分比和插值通道ID指標可用于跟蹤是否應用和檢查信號質量之前范式或信號通道是否需要修復。進一步指導,用戶可以參考使用HAPPE+ER軟件分發的用戶指南。
5.使用生成程序腳本創建ERP并計算ERP值
HAPPE+ER在插件/生成子文件夾中提供了一個可選的后處理腳本,稱為“generateERP”,能夠生成ERP波形并對生成的ERP執行一系列計算。這個腳本與HAPPE+ER管道的腳本是分開的,以鼓勵用戶在生成ERP數字和度量之前檢查他們的數據質量和HAPPE+ER的性能。任何沒有通過數據質量閾值的文件都應該在運行生成erp腳本之前從輸出文件夾中刪除,否則它們將包含在后續的數字和度量中。與HAPPE+ER類似,生成ERP在直接從命令行獲取的輸入上運行,并支持保存和重新加載運行的參數,繼續HAPPE+ER的目標,使所有編程熟悉程度的研究人員都可以訪問處理。要創建ERP波形,按圖1中的流程先處理后,用戶還被問及是否需要為批中的每個文件計算一套與ERP相關的標準度量,以便進行后續的統計分析。用戶必須指定:(1)感興趣的延遲窗口(例如,刺激后50-90 ms),(2)他們是否預期最大值或最小值出現在該窗口(即積極或消極的ERP成分),(3)是否計算曲線下面積和平均振幅使用時間窗口作為邊界,使用ERP數據中的零交叉作為邊界,或報告兩種方法措施,并報告該度量的值和延遲。結果樣例見圖2。
圖2. 在所有面板中,陰影區域不包括在計算中。A)表示指定延遲窗口內的最大值(綠色)和最小值(藍色),用垂直黑線表示。B)表示整個ERP波形的最大值(綠色)值和最小值(藍色)值。C)指定延遲窗口內的平均振幅用一條藍綠色的水平線表示,用戶指定的邊界用實心黑色豎線表示。D)平均振幅由一條藍綠色的水平線表示,由腳本在數據的零交叉處創建的邊界以虛線表示。E)曲線下的面積用淺紫色表示,用戶指定的邊界用實心黑色豎線表示。F)曲線下的面積用淺紫色表示,而由腳本在數據中的零交叉處創建的邊界用虛線表示。G) 曲線下50%的面積用深紫色表示。用戶指定的邊界用純黑色豎線表示。交替的點-虛線表示在窗口內達到曲線下50%面積的延遲。H) 曲線下50%的面積用深紫色表示。腳本生成的零交叉點的邊界用黑色虛線表示。交替的點-虛線表示在窗口內達到曲線下50%面積的延遲。
6. HAPPE+ER與其他預處理方法的比較
模擬的VEP(N1,P1,N2成分),以及這些干凈和偽添加的數據集和包含嵌入式模擬VEP的全長文件,作為測試(獲取網站https://zenodo.org/record/5172962)。分別經HAPPE+ER到小波閾值步驟(軟閾值用于clean vs. artifact-added dataset與硬閾值用于additional full-length dataset)。在EEGLAB中運行ICA,包括ICA與MARA 0.5自動拒絕閾值,ICA與ICLabel 0.8自動拒絕閾值,iMARA與0.2自動拒絕閾值(相當于0.8人工IC拒絕的概率),和ICA與人工IC拒絕(人工拒絕IC是由一位在人工預處理EEG和ERP數據方面有十多年經驗的專家通過EEGLAB進行的,在數據處理中,單專家拒絕與典型的(至少是報道的)實驗室實踐相一致)。
圖4. 箱圖和散點圖說明了成分N1、P1和N2的偽跡校正振幅的差異,作為校正前偽跡水平的函數(即干凈的ERP振幅-偽跡后校正減去偽跡添加的ERP振幅啟動后校正)。
7. HAPPE+ER與其他自動化預處理流程的比較
與最近也在ERP數據中應用的兩個流程:EEG-IP-L(Desjardins等人,2021年)和MADE(Debnath等人,2020年)比較。首先是多個概念、目標和用戶相關的差異。EEG-IP-L使用了本文測試的ICLabel算法,EEG-IP-L作者建議人工檢查和編輯ICA以獲得最佳性能;MADE軟件提供了全自動預處理,但是壞段剔除和偽跡去除的方法和HAPPE+ER不同,采用FASTER和ADJUST插件算法,且MADE沒有提供HAPPE+ER的通用ERP后處理功能的補充用于生成ERP指標和圖形,由于依賴ICA進行校正,它也不能容易地容忍用于ERP分析的低密度EEG數據。文中作者也通過模擬的數據和實驗數據對三種自動化流程進行了比較,得出:在嬰兒VEP數據集的評估標準中,MADE相對于HAPPE+ER導致了文件損耗,雖然兩個管道在試驗匹配條件下產生了穩健的ERP形態,HAPPE+ER比MADE保留了更多的試驗。這些結果可能反映了HAPPE+ER對偽跡校正中更多的偽跡類別的敏感性,或相對于ICA的優越性能。
最后作者提供了addSimERP.m腳本可以很容易地將上述模擬ERP信號添加到他們的連續基線/靜息狀態腦電圖數據中,與主HAPPE腳本和生成ERP一樣,用戶可以選擇所有要添加ERP時間序列的通道,或者使用前面描述的包括/排除方法選擇通道的子集。雖然目前只支持。set格式的連續腦電圖文件,并包括通道位置,但作者希望使腳本的功能也包括.mat和.raw格式的輸入。addSimERP.m只允許將模擬的VEP時間序列添加到所提供的數據中,但此選擇將被擴展,以促進其他模擬的ERP時間序列的選擇,并支持跨各種波形的驗證。HAPPE+ER完全通過MATLAB命令行運行,要運行HAPPE+ER,只需打開MATLAB,導航到HAPPE 2.0文件夾,然后打開HAPPE 2.0腳本。在屏幕頂部的“編輯器”選項卡中,點擊“運行”,并按照它們在MATLAB命令行中出現的提示進行操作。在命令行輸入所有相關輸入后,HAPPE+ER將自動運行完成。HAPPE+ER代碼和用戶指南可以在:https:// github.com/PINE-Lab/HAPPE上免費獲得。本手稿中使用的數據可以在:https://zenodo.org/record/5172962免費獲得。
參考文獻:The HAPPE plus Event-Related (HAPPE+ER) software: A standardized preprocessing pipeline for event-related potential analyses
總結
以上是生活随笔為你收集整理的HAPPE+ER软件:标准化事件相关电位ERP的预处理的pipeline的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: VScode配置C语言编译环境
- 下一篇: ICP许可证申请误区一:我是创业型小公司