百度吴华:AIGC正让个体创作者成为真正的“独立”制作人
1月5日消息,百度技術委員會主席吳華表示,熟練地掌握AIGC,創作者將能夠更加輕松、高效、快樂地創作,甚至一個人就可以完成編劇、美術創作及后期剪輯等內容創作全流程工作,成為天才創作者。
據吳華介紹,通過使用百度文心ERNIE 3.0 Zeus,創作者只需輸入一個題目,就可以瞬間結合語境寫出上百篇不同體裁、風格的作品,甚至是完成劇本創作。此外,通過百度文心ERNIE-ViLG 2.0,創作者還可以根據一句話或一段描述文本生成畫作;如果再通過百度專門的視頻內容生成與編輯技術對該畫作或者視頻進行處理,就可以得到全新或更精美的視頻。
據吳華透露,在1月10日即將召開的2022百度Create大會上,百度還將推出更多的AIGC工具產品并對相關技術進行講解。
“大模型的進步,讓我們在文字、圖像、視頻等創作領域全面感受到了AI技術的魅力。如果你掌握了這項內容創作能力,那你幾乎可以完成一部影片的許多重要工作,成為天才鬼才創作者。再配上自己設計的虛擬人演員,那你就可以成為一個真正的‘獨立’制作人、真正的‘獨立導演’?!眳侨A表示。
此前,百度創始人、董事長兼首席執行官李彥宏曾指出,“過去一年間,人工智能無論是在技術層面還是在商業應用層面,都有了巨大的進展,有些甚至是方向性的改變?!倍谥T多被提及的方向性改變中,AIGC成為了被重點提及的對象。
2022年5月,百度發布了融合任務相關知識的千億大模型ERNIE 3.0 Zeus。該模型能夠從豐富多樣的無標注數據中學習,同時在學習過程中融入知識圖譜指導模型學習世界知識和語言知識,進而提升學習的效率。此外,該模型還能從摘要、對聯、翻譯、分類、閱讀理解等百余種不同形式的任務中學習知識,能夠做到多種語言理解和生成任務。
吳華指出,文心ERNIE 3.0系列模型已經在幾十類自然語言理解和生成公開權威任務,以及零樣本、小樣本學習任務上處于世界領先水平。此外,它還發布了業界首個開放的千億參數中文生成API,供各行各業開發者到文心大模型官網上調用、學習。
2022年10月,百度發布了業界首個知識增強的AI作畫大模型ERNIE-ViLG 2.0。它能根據一句話或者一段描述文本,生成一幅精美的畫作。吳華介紹,為提高文本生成圖像的準確性,百度在AI預訓練學習過程中創新性地提出了知識增強的擴散模型,實現了精準的細粒度語義控制;同時通過引入混合降噪專家網絡,對圖像生成不同階段對模型、計算性能要求的不同,使用不同網絡進行了針對性地建模和優化,進而提升了圖像生成的質量。
據吳華介紹,在視覺內容生成方面,百度在文生圖擴散模型的基礎上加入時序建模,使得模型能根據文本或者圖像生成新的視頻。創作者可以根據用戶提供的一段描述文本,或者一幅圖像,自動地生成高清、流暢的視頻。
此外,通過百度研發的VIMER-TCIR多任務大模型,還可以實現對生成視頻的修復和編輯,通過畫質提升、邊緣銳化等方式增強視頻的清晰度,達到全方位提升視頻編輯效率和觀感體驗。
目前,VIMER-TCIR多任務大模型也已經在老電影修復等場景實現落地,每天單機可修復視頻28.5萬幀,解決了絕大部分畫面的修復問題。(一橙)
總結
以上是生活随笔為你收集整理的百度吴华:AIGC正让个体创作者成为真正的“独立”制作人的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 长安汽车:阿维塔 2022 年已如期完成
- 下一篇: 提出全新数据安全治理理念 《数据安全治理