深言科技联合清华大学开源 LingoWhale-8B 模型:免费商用,号称性能超 GPT-3.5 Turbo
11 月 3 日消息,據深言科技官方公眾號消息,由深言科技與清華大學 NLP 實驗室共同研發的語鯨 LingoWhale-8B 模型目前已面向社會開源,對學術研究完全開放,允許免費商用。
經過查詢得知,LingoWhale-8B 模型是擁有約 80 億參數的中英雙語大語言模型,在 C-Eval、MMLU、CMMLU 等多個權威的公開評測基準上,在 10B 以下開源模型據稱“達到領先效果”。
不過官方同時聲稱,受模型參數量影響,大模型固有的幻覺問題、數學計算能力相對較弱、生成內容有無法預見性等問題在 LingoWhale-8B 模型中仍然存在。
在性能方面,截至 10 月 24 日,在中文領域權威評測 C-Eval 中,LingoWhale-8B 模型的性能僅次于 GPT-4。在 C-Eval、CMMLU、GAOKAO 測評中,性能超過 GPT-3.5Turbo,在 10B 以下尺寸模型中性能處于領先位置。
官方給予了一些典型示例,以介紹 LingoWhale-8B 模型的特點。
官方據此表示,LingoWhale-8B 模型具有一定數學運算能力。
在以上示例中,LingoWhale-8B 模型能夠根據上文正確地列式并進行運算,包括函數求導、函數值計算、切線方程計算等操作,并最終得到結果。
而在代碼聲稱方面,官方也同時提供了一些演示:
LingoWhale-8B 具有強大的代碼理解與生成能力,能夠更好地生成代碼并解決具體的問題。在本示例中,LingoWhale-8B 模型生成了詳細的 python 代碼以及注釋信息,幫助用戶更好地理解并使用生成的代碼。
在邏輯方面,官方也同樣進行了舉例:
LingoWhale-8B 模型具有解決復雜邏輯推理任務的能力。在以上的例子中,LingoWhale-8B 將復雜的邏輯問題進行拆解,按步驟進行分析并解決問題。
上下文對話
樣例:
在以上示例中,LingoWhale-8B 模型表現出了較強的角色扮演、方案設計、長文本理解以及多輪對話能力,能夠根據用戶需求制定方案并組織結構化的輸出,應對更加復雜的任務場景。
知識百科
樣例 1:
官方表示,在上面兩個例子中,相較于 GPT-3.5,LingoWhale-8B 模型生成的結果更加準確詳實。
經過在大規模高質量語料上的預訓練,LingoWhale-8B 模型掌握了多個領域的知識,包括科學、歷史、文學、藝術等,能夠理解并回答各種知識相關問題,提供準確詳細的答案。
的小伙伴們可以在官方 GitHub 頁面中獲取更多詳細信息:點此訪問
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的深言科技联合清华大学开源 LingoWhale-8B 模型:免费商用,号称性能超 GPT-3.5 Turbo的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: X(推特)推出基于 AI 的“查看类似”
- 下一篇: 微软 AI 服务施加容量限制:用户若过度