学习周报20200105 | CS224N
生活随笔
收集整理的這篇文章主要介紹了
学习周报20200105 | CS224N
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
【學習周報】
總結自己的學習和遇到的好材料。
往期回顧:
學習周報20191201 | 語義相似度,TF
學習周報20191208 | BILSTM-CRF,BERT
?學習周報20191215 | NER綜述
學習周報20191221 | charNER,bert-NER
學習周報20191228 | CS224N
CS224N
這周學到第五章,感覺還是有些收獲的,會感覺后續可以出一篇文章談談里面的細節問題。
NER
Ner(命名實體識別)這塊,自己最近已經逐步結項了,總結了一些經驗,后續也會有文章輸出,這里給大家一些初步的經驗吧。
規則是最快最好的,絕對的高準確。(這里的規則多半是詞典標注,最大逆向匹配那種,對詞典要求高)
模型的話,標注質量很大程度上決定了預測質量。(質量好的話,規則其實就能上線了,參考第一條)
模型的話,CRF需要的數據量大概在300w左右比較好(短句)。
名詞類比較多的,難度真的不小,真的推薦大家先走詞典。(福建是省,廈門是城市,這種模型來處理難度真的不低)
先聊這么多,這個看看有沒有成文的條件吧。
總結
以上是生活随笔為你收集整理的学习周报20200105 | CS224N的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 西部数据移动硬盘设置密码教程
- 下一篇: Android Studio首次连接不上