睡眠音频分割及识别问题(七)--接口输入输出讨论
生活随笔
收集整理的這篇文章主要介紹了
睡眠音频分割及识别问题(七)--接口输入输出讨论
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
簡介
關于接口輸入輸出的討論。
輸入
1、音頻文件路徑,類型為:字符串;
2、預測多標簽類型的排名,前n名,類型為:整型。
處理
1、將輸入的音頻分割為多個以1s為時間單位的音頻片段;
2、利用PANN框架預測音頻片段的標簽分布;
3、輸出鼾聲、夢話等音頻事件對應片段的標簽分布及開始結束時間。
輸出
1、鼾聲、夢話等音頻事件對應片段的標簽分布及開始結束時間;
2、多個音頻片段構成的自定義類列表。
下圖為音頻事件對應片段的類定義:
總結
以上是生活随笔為你收集整理的睡眠音频分割及识别问题(七)--接口输入输出讨论的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: (菜鸟入门)使用pytorch框架实现前
- 下一篇: 深度学习(1)--引言