睡眠音频分割及识别问题(二)
生活随笔
收集整理的這篇文章主要介紹了
睡眠音频分割及识别问题(二)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
輸入
通過手機麥克風錄制的任意長度睡眠聲音。
輸出
睡眠階段曲線,該曲線可以反映出深度睡眠,淺度睡眠、REM睡眠、清醒各個階段。
研究的核心問題
1、錄制策略
(1)每隔10分鐘錄制一段睡眠音;
2、采用什么策略來分割?
(1)滑動窗口
3、語音識別
(1)利用YAMNet框架(google),該框架將語音分為了521個類;
(2)或者利用PANN框架(youtube)進行識別,該框架將語音分為了527個類;
(3)識別后再將其分為鼾聲、夢話、翻身、咳嗽、打噴嚏、其他幾個大類。
由于目前沒有夢話、翻身這些類別,我們準備采集這些音頻,然后利用上面的框架進行識別后,看這些音頻最有可能被識別為哪些類型,則將這些類型作為夢話、翻身類型。
4、繪制曲線
(1)第一種方案按照深度睡眠,淺度睡眠、REM睡眠、清醒四個階段進行繪制,這種繪制有兩大難點,第一點在于如何定義這四個階段,第二點由于涉及到醫學術語,用戶不一定能看懂這些曲線的含義;
(2)第二個方案按照鼾聲、夢話、翻身、咳嗽、打噴嚏、其他進行繪制,這樣的曲線用戶可能更能理解。
總結
以上是生活随笔為你收集整理的睡眠音频分割及识别问题(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: RuntimeError: size m
- 下一篇: 真正聪明的人从来不自己做PPT,看完这篇