达摩院最新AI技术助力天猫双11,提供接近真人的语音交互体验
11月8日,記者了解到,阿里巴巴達摩院機器智能實驗室最新研究成果——KAN-TTS將首次大規模應用于今年天貓雙11,基于該技術,菜鳥熱線機器人、語音機器人小蜜以及天貓精靈將為全球消費者提供接近真人的語音交互體驗。
讓機器開口說話是人工智能的基礎技術之一,最早可追溯到1960年TTS(Text To Speech)技術的誕生,但要讓機器發出生動逼真的聲音一直都是業界的難題,據了解,傳統語音合成技術需要海量文本和音頻信息,合成的語音與原始音頻的接近程度僅為85%到90%之間。
今年7月,達摩院發布新一代語音合成技術KAN-TTS,首次將該數字提高到97%以上。這被認為是入選MIT Technology Review 2019年“全球十大突破性技術”后,阿里巴巴語音技術實力的又一次跨越式提升。
基于遷移學習以及多種新型算法模型,KAN-TTS可根據特定發音人的風格快速生成高度相似的語音,并且大幅降低語音合成的門檻,手機錄音十分鐘,機器即可通過算法完成聲音的模仿。
過去數月,KAN-TTS技術已實現了主流場景風格聲音的全覆蓋,可針對通用場景、客服場景、童聲場景、英文場景和方言場景,提供 41種高品質的聲音,例如溫柔、甜蜜、嚴厲等風格。據達摩院專家透露,團隊還計劃用該技術來幫助視障和語言障礙人士實現無障礙溝通。
達摩院成立兩年以來,阿里巴巴在視覺、語音以及自然語言處理等領域已創下了多項世界紀錄,并且躍升為中國最大的人工智能公司。今年的杭州云棲大會上,阿里巴巴表示,阿里AI每天調用超1萬億次,服務全球10億人,日處理圖像10億張、視頻120萬小時、語音55萬小時及自然語言5千億句。
原文鏈接
本文為云棲社區原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的达摩院最新AI技术助力天猫双11,提供接近真人的语音交互体验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阿里云数据库四位小伙伴聚齐!共同开启生态
- 下一篇: 一文读懂架构整洁之道(附知识脉络图)