第14课:动手实战中文命名实体提取
生活随笔
收集整理的這篇文章主要介紹了
第14课:动手实战中文命名实体提取
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
命名實體識別(Named EntitiesRecognition,NER)是自然語言處理的一個基礎任務。其目的是識別語料中人名、地名、組織機構名等命名實體,比如,2015年中國國家海洋局對124個國際海底地理實體的命名。
由于命名實體數量不斷增加,通常不可能在詞典中窮盡列出,且其構成方法具有各自的一些規律性,因而,通常把對這些詞的識別從詞匯形態處理(如漢語切分)任務中獨立處理,稱為命名實體識別。
命名實體識別技術是信息抽取、信息檢索、機器翻譯、問答系統等多種自然語言處理技術必不可少的組成部分。
常見的命名實體識別方法綜述
命名實體是命名實體識別的研究主體,一般包括三大類(實體類、時間類和數字類)和七小類(人名、地名、機構名、時間、日期、貨幣和百分比)命名實體。評判一個命名實體是否被正確識別包括兩個方面:實體的邊界是否正確和實體的類型是否標注正確。
命名實體識別的主要技術方法分為:基于規則和詞典的方法、基于統計的方法、二者混合的方法等。
1.基于規則和詞典的方法。
總結
以上是生活随笔為你收集整理的第14课:动手实战中文命名实体提取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第15课:基于 CRF 的中文命名实体识
- 下一篇: 第13课:动手制作自己的简易聊天机器人