一口气11项发布 一文看懂百度大脑的NLP布局
8月25日,百度CTO王海峰在百度大腦語言與知識技術峰會上,首次對外全面完整的闡述了百度的NLP布局,還推出了一攬子11項新發(fā)布。
自然語言理解(NLP)的名詞解釋是這樣的,自然語言是人類智慧的結晶,是人工智能中最為困難的問題之一,而對自然語言處理的研究也是充滿魅力和挑戰(zhàn)的。
那么,百度是如何理解這項挑戰(zhàn)的?他們?yōu)榇俗隽四男┭芯亢筒季郑覀円惶骄烤埂?/p>
知識圖譜是機器認知世界的基礎
王海峰表示,在百度語言與知識技術的布局和發(fā)展中,始終在注意把握兩個趨勢,即技術發(fā)展趨勢和產(chǎn)業(yè)發(fā)展趨勢,并力爭引領趨勢。
對此,2010年,他們就成立了自然語言處理部,“縱覽百度語言與知識技術發(fā)展歷程,從研究方法、研究對象、研究方向、產(chǎn)業(yè)應用等各個層面,布局完整,始終與應用的發(fā)展趨勢、需求一脈相承,與產(chǎn)業(yè)接軌。”
一手是技術探索,一手是應用落地,王海峰認為缺一不可。
他指出,知識圖譜是機器認知世界的重要基礎,百度的大規(guī)模知識圖譜有超50億實體和5500億事實,并在不斷演進和更新,“目前每天的調用次數(shù)超過400億次。”
另外,百度不斷在語言理解能力方面進行攻關,此前就提出了知識增強的語義理解框架ERNIE,在深度學習的基礎上融入知識,同時具備持續(xù)學習能力,據(jù)介紹,基于知識圖譜和語義表示,突破了閱讀理解、對話理解以及跨模態(tài)深度語義理解等技術。
還有一點至關重要是語言生成,語言生成是語言與知識技術中的重要組成部分,百度提出基于多流機制的語言生成預訓練技術,兼顧詞、短語等不同粒度的語義信息。與此同時,還提出了知識圖譜驅動的對話控制技術,以及基于隱空間的大規(guī)模開放域對話模型PLATO等,實現(xiàn)規(guī)模化應用。
據(jù)披露,百度翻譯目前可支持200多種語言,每天響應超過千億字符的翻譯請求。
讓語言與知識技術在應用中產(chǎn)生價值
王海峰談到要抓住技術發(fā)展趨勢和產(chǎn)業(yè)發(fā)展趨勢,那在產(chǎn)業(yè)發(fā)展方面百度有何布局?
百度集團副總裁吳甜給出了答案,她連續(xù)發(fā)布了語義理解技術與平臺文心、智能文檔分析平臺TextMind和AI同傳會議解決方案3大新品,同時發(fā)布了6項升級,包括智能創(chuàng)作平臺的3個場景方案、以及智能對話定制與服務平臺UNIT的3項全新升級。
吳甜在講解中表示,我們希望讓語言與知識技術凝聚成一系列技術平臺和產(chǎn)品,在應用中產(chǎn)生大量價值。
具體來說,此次推出的語義理解技術與平臺文心,基于深度學習平臺飛槳,依托語義理解核心技術,集成預訓練模型、NLP算法集、端到端開發(fā)套件和平臺,提供一站式NLP開發(fā)與服務。“具備工業(yè)級落地實能力”吳甜談到。
而在智能文檔分析平臺TextMind方面,基于OCR、NLP技術,以文檔解析為核心,支持文檔對比與文檔審核,希望促進企業(yè)辦公智能升級。
百度大腦智能創(chuàng)作平臺則針對媒體應用場景升級,推出智能策劃、智能采編、智能審校三大媒體場景方案。還有AI同傳會議解決方案,吳甜現(xiàn)場展示了如何只用一臺電腦和一部手機搭建一套同傳服務。
總結
以上是生活随笔為你收集整理的一口气11项发布 一文看懂百度大脑的NLP布局的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: qq个性女生超拽签名
- 下一篇: 下列属于静态会计等式的是()O(下列属于