【年终总结】2019年有三AI NLP做了什么,明年要做什么?
時間不緊不慢的,從2019年6月中旬有三AI公眾號開始發布自然語言處理(NLP)相關的文章以來,已是半年有余。
回頭看看,NLP系列文章基本維持在了一周一到兩篇的更新頻率,基本上覆蓋了NLP所需要聊到的內容:從分詞、命名實體識別等基本的NLP任務到聊天機器人、知識圖譜等復雜的NLP任務;從RNN、LSTM等深度學習中最基本概念到Transformer、TransformerXL等最新的NLP概念;從詞向量、attention基礎的NLP模型到最新的BERT,GPT,XLNET等最新的NLP模型,總結文章鏈接如下:
【完結】 12篇文章帶你完全進入NLP領域,掌握核心技術
年底了,咱們聊聊過去的一年以及即將到來的2020年。
NLP這一年
NLP這一年不乏熱鬧,18年10月底BERT出來之后,影響頗大,余波自然到了2019年,XLNET,ALBERT,tiny-BERT這些一時風光的模型都基于它在做改進。GPT2.0展示的自然語言生成能力,被媒體描述成“可能會造成社會假新聞泛濫”以至于GPT沒敢全面公布他們的模型。總的來說,NLP的這一年是屬于預訓練語言模型的一年,越來越大的模型,越來越多的語料,讓這條路看起來還能再走一段時間。
跟學術界的熱鬧相比,產業界相對就要“安靜”太多。迄今為止,依然沒有出現一個基于NLP技術的,令廣大人民群眾驚艷的爆款出現。今年開始,各大互聯網公司都開始推出自己的智能音箱,天貓精靈,小度,小艾同學等等,這或許算是NLP領域還算拿得出手的產品了,但熟悉這一領域的同學或許都清楚,這些產品,離智能,還有多遠的路要走。我們知道,在這些盒子的內部,其實是一個或者多個chatbot,看過我們chatbot相關文章的同學都知道,目前的chatbot技術處于一個怎樣的水平和發展狀況。
然而,筆者認為,這也是NLP真正開始被產業界接受的一年。BERT的出現,特別是其在信息抽取領域的出色表現,讓很多文本挖掘的任務變得現實和低成本。知識圖譜的大規模流行,也證明各公司承認了發展屬于自己的NLP技術與系統的價值。
常常有人說AI寒冬將至,筆者認為是產業界變得更理性和實際而已。基于現有的技術,也能夠滿足很多行業相當一部分的智能化需求,接下來,應該會有越來越多行業開始+NLP。
我們這一年
在2019年,有三AI在NLP領域主要做了下面的事情。
1.系統的輸出了NLP相關的文章,基本上涵蓋了進入NLP領域所需要包含的知識,包括NLP預訓練模型,基本的機器學習模型與深度學習模型,聊天機器人以及知識圖譜等。
【NLP-詞向量】詞向量的由來及本質
【NLP-詞向量】從模型結構到損失函數詳解word2vec
【NLP-NER】什么是命名實體識別?
【NLP-NER】命名實體識別中最常用的兩種深度學習模型
【NLP-NER】如何使用BERT來做命名實體識別
【NLP-ChatBot】我們熟悉的聊天機器人都有哪幾類?
【NLP-ChatBot】搜索引擎的最終形態之問答系統(FAQ)詳述
【NLP-ChatBot】能干活的聊天機器人-對話系統概述
【知識圖譜】人工智能技術最重要基礎設施之一,知識圖譜你該學習的東西
【知識圖譜】知識表示:知識圖譜如何表示結構化的知識?
【知識圖譜】如何構建知識體系:知識圖譜搭建的第一步
【知識圖譜】獲取到知識后,如何進行存儲和便捷的檢索?
【知識圖譜】知識抽取是什么,怎么做?
【知識圖譜】知識推理,知識圖譜里最“人工智能”的一段
2.分享了數個NLP實踐項目,通過這些項目,基本能夠掌握如何處理NLP的基本問題。
【NLP實戰】tensorflow詞向量訓練實戰
【NLP實戰系列】樸素貝葉斯文本分類實戰
【NLP實戰系列】Tensorflow命名實體識別實戰
【NLP實戰】如何基于Tensorflow搭建一個聊天機器人
【NLP實戰】基于ALBERT的文本相似度計算
3.開辦了有三AI NLP知識星球,涵蓋了NLP的大部分內容。目前,知識星球已經有了200+的同學加入,筆者最近打算改版,這個后面再說。
當然,筆者個人能力和精力都有限,很多問題我們都還沒有進行細致的討論,推薦系統這個大板塊我們也還沒有開始做。
這個是我們后續需要改進和做的,對提升自己并分享給大家感興趣的同學,可以聯系我或者有三,有三AI可以支持大家寫作并獲得一定的收益。
未來這一年
回望初心,未來這一年我們還是希望能夠給大家系統的分享一些有用的知識,未來這一年,有三AI在NLP方面計劃做下面的事情:
1.介紹NLP領域的新成果和更細致地介紹NLP中基礎的技術。
2.基于NLP領域的推薦系統,是目前NLP技術應用的另外一個方向,計劃在合適的節點推出推薦系統相關的文章。
3.推出“從深度學習入門自然語言處理”系統課程,后續會詳細的介紹,敬請關注。
4.知識星球改版,基于知識星球APP的特點,借鑒有三AI CV的知識星球,推出“NLP1000問”,“NLP面試必備”等新的欄目。
這是變革的年代,即將到來的2020年,或許會是一個里程碑式的節點。5G會在這一年正式迎來商業化和爆發,AI和5G的融合,勢必會對各行各業在各個方面帶來極大的影響。各位AI領域的從業者,這是最壞的時代,也是最好的時代,所有的一切,都取決于你的付出和選擇。
轉載文章請后臺聯系
侵權必究
往期精選
【雜談】有三AI專欄作者邀請,在這里寫文章能獲得什么,有什么不同?
【通知】2019年言有三最后一月一對一師徒指導季劃報名,送書+知識星球+“神秘禮物”
【每周NLP論文推薦】從預訓練模型掌握NLP的基本發展脈絡
【每周NLP論文推薦】 NLP中命名實體識別從機器學習到深度學習的代表性研究
【每周NLP論文推薦】 介紹語義匹配中的經典文章
【每周NLP論文推薦】 對話管理中的標志性論文介紹
【每周NLP論文推薦】 開發聊天機器人必讀的重要論文
【每周NLP論文推薦】 掌握實體關系抽取必讀的文章
【每周NLP論文推薦】 生成式聊天機器人論文介紹
【每周NLP論文推薦】 知識圖譜重要論文介紹
總結
以上是生活随笔為你收集整理的【年终总结】2019年有三AI NLP做了什么,明年要做什么?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【知识图谱】知识推理,知识图谱里最“人工
- 下一篇: 【杂谈】当前知识蒸馏与迁移学习有哪些可用