汉语拼音标注,汉字加拼音
生活随笔
收集整理的這篇文章主要介紹了
汉语拼音标注,汉字加拼音
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
現狀:可以用WORD中的拼音指南解決,但是拼音指南一次性只能標注30個字。
思路:找到漢字庫,自己做一個工具
需要數據
1、漢字庫
2、漢字拼音對應庫
3、多音字庫,由于多音字沒有規律,但是一般有優先次序,比如都字常規念dou,在都市中念du,大都會,念du;
存在困難
多音字組詞庫網上找不到,初步搜了一下,高質量的要收費,比如海天瑞生。
一般的免費,但是數據不全。
解決途徑
1、初步建立多音字庫。
2、通過大量文本,識別多音詞庫,人工建立
猜測一下語音轉漢字怎么轉的:建立詞語庫,通過詞語庫來解決發音問題;
難和易的轉換,漢字和英語的幾個回合
| 回合 | 對比 | 英語 | 漢語 |
| 第1回合 | 書寫 | 容易 | 難 |
| 第2回合 | 單詞數量 | 多 | 少 |
| 第3回合 | 單詞增加 | 多 | 極少 |
| 第4回合 | 學習難度 | 容易 | 難 |
| 第5回合 | 文字庫大小 | 大 | 小 |
| 第6回合 | 語音庫大小 | 大 | 小 |
| 第7回合 | 組詞庫 | 小 | 大 |
| 第8回合 | 語音識別 | 簡單 | 復雜 |
以前的語音庫來說,中文相對是簡單的,倒過來就難很多了。
到了人工智能時代,語音識別中文太難了,主要是沒有公開的詞庫。?
總結
以上是生活随笔為你收集整理的汉语拼音标注,汉字加拼音的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: tf.data.Dataset与tfre
- 下一篇: 有关linux的一些真相