“通义千问”首发体验:响应速度出色 多轮对话有优势
繼3月份百度公布文心一言之后,國內的另外一家人工智能公司——阿里云,在4月7日宣布自研大模型“通義千問”開始邀請用戶測試體驗。據悉,該模型目前主要是定向邀請企業級用戶進行體驗測試,可通過官網申請,符合條件的用戶可參與體驗。
通義千問
據CNMO了解,阿里的達摩院早已在該領域布局多年,并在2019年啟動了大模型研發,于2022年9月發布了“通義”大模型系列。
關于“通義千問”這個名稱,從字面上就能夠看出其自身的定位——通曉各類知識,回答千種問題。當然,這個只是筆者的個人理解,因此筆者直接將此問題詢問了“通義千問”,其回答表示“通義”意味著該模型具有廣泛的知識和普適性,可以理解和回答各種領域的問題。“千問”代表了模型可以回答各種問題,包括常見的、復雜的甚至是少見的問題。就如同其所具備的功能一樣,回答問題、創作文字,表達觀點以及撰寫代碼等。
通義千問首頁布局
在該模型的體驗界面上,羅列著一些建議指令,比如“寫一段電影腳本,講一個北漂草根創業逆襲的故事”、“作為手機斗地主游戲的產品經理,該如何做成國內爆款”、“團隊開發了一個對話機器人,給老板寫郵件介紹”等等。而與百度的文心一言不同的是,最下方則是有一個可以體驗更多小應用的百寶袋。
百寶袋頁面
點進這個百寶袋后,我們可以看到該頁面主要將其內置的小應用分為了三個大類,分別是效率類,生活類以及娛樂類。效率類中提供了“寫提綱”、“SWOT分析”和“商品描述生成”這三個功能,因此很明顯此類功能是用以解決辦公需求的,尤其是其中的商品描述生成,就與阿里旗下TOB、TOC的電商業務相匹配。
百寶袋頁面
另外的生活類和娛樂類則是分別包括“會放飛的菜譜”、“小學生作文”、以及“然后呢”和“彩虹屁專家”、“寫情書”和“為你寫詩”。其中最讓筆者感興趣的是“然后呢”這個功能,個人認為該功能適合放在娛樂類里,而不是生活類。其介紹是為“寫一個句子作為開頭,然后看發生了什么”。筆者嘗試輸入了“在一個月亮變成紅色的夜晚”,結果是生成了一篇短小的兒童故事,相信這項功能十分適合孩子處于學齡前時期的父母們,不必再擔心沒有足夠的故事去哄孩子們睡覺。
“然后呢”小應用生成結果
為了分辨在功能區內輸入與在常規問答中輸入的區別,我又將剛才的“紅月”輸入到了常規界面,最終通義千問給出了十分科學的回答,解釋了月亮變紅的原因。由此可見,百寶袋中的各項小應用應該是加了更多的限制指令,從而實現了不同種類的功能呈現。
常規界面生成的結果
在實際體驗后,筆者發現通義千問在語言的理解能力上表現得可圈可點,基本沒有出現一些所問非所答的情況,并且在生成結果時的響應速度方面也表現得較為出色,但在內容的呈現較為粗略。
通義千問生成結果
筆者嘗試與百度的文心一言做了對比,同時輸入了“請以科幻小說的方式為神雕俠侶敘寫結尾”的指令。雖然在響應速度以及結果輸出的過程中,通義千問表現得十分快速且順暢,但在最終的內容質量上,個人覺得文心一言的內容更好。因為通義千問所生成的內容更偏向一個內容梗概,而文心一言所處生成的內容細節則更加豐富。
文心一言生成結果
其他方面,筆者在嘗試讓其生成一份詳細的旅游攻略時,所呈現出的結果曾出現排版錯誤的情況,但再后續的多次嘗試中又恢復了正常。造成這個問題的原因可能是多方面的,比如開啟內測后突然涌入了太多用戶,又或者是其已經自動修復了此項問題。此外,通義千問對待一些較新、或者較為專業的信息的抓取與理解上略有不足。筆者曾讓其生成一份魅族20手機(2023.3.30發布)的宣傳視頻腳本。暫且不論其腳本的完成度與可行性,其中關于手機的參數方面就出現了錯誤,如圖中紅框圈出的內容都是錯誤的呈現。
通義千問出現的錯誤信息
這種情況其實是可以理解,因為在筆者詢問了通義千問是否是基于中文來理解的,其表示否認,并表示是“基于自然語言處理的技術實現的,可以理解中文,但我的主要語言是英文”。筆者還注意到,相較于國外的ChatGPT和國內的文心一言,阿里云的這款通義千問目前僅提供了文本交互的單一模態,并未支持語音、圖片等其他方式的多模態功能。
通義千問對于理解語言的回答
總的來說,阿里云作為國內深耕AI領域的科技大廠,其推出的“通義千問”目前是國內第二個、世界第三個正式推出的AI大模型??梢哉f是已經走在了AI這條通向未來之路的前列。
其實國內很多的企業都像阿里這樣,很早就投入了關于AI大模型的研發之中,但估計是沒有想到國外的ChatGPT能夠在一個可用度很高的基礎上迅速上線。而在國內廠商之中,能夠快速跟上并且正式推出相關產品的企業一定也是準備得較為倉促。因此通義千問雖然還存在著一定的問題,卻是可以理解的,并且通義千問作為一個改進工作與生活的AI工具、AI助手,其功能的完善與升級就是需要在用戶的使用過程中不斷地學習與進化。
目前,大語言模型已經成為了互聯網和科技相關企業加速布局的熱門賽道。在這場“馬拉松賽跑”中,起步越早,所能獲取的“進化”資源就會越多。同時多款產品的落地,也會促進該類產業的升級與發展。相信在未來,其他互聯網巨頭也會紛紛開啟類似產品的內測。所以,這場有關AI大模型“戰爭”的“硝煙”才剛剛升起。
總結
以上是生活随笔為你收集整理的“通义千问”首发体验:响应速度出色 多轮对话有优势的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 单卡 30 秒预测未来 10 天全球天气
- 下一篇: SAP CRM呼叫中心end按钮的实现逻