Stability AI 推出 StableCode,一款用于写代码的大型语言模型
8 月 9 日消息,Stability AI 以其 Stable Diffusion 文本生成圖像模型而聞名,但這并不是其感興趣的唯一領域,該公司現在也開始涉足代碼生成領域。今天,Stability AI 發布了其新的開放大型語言模型(LLM)StableCode ,該模型旨在幫助用戶生成編程語言代碼,基于 transformer 神經網絡打造。
StableCode 將提供三個不同級別:一個基礎模型用于一般用途,一個指令模型,以及一個能夠支持多達 16,000 個詞元(token)的長上下文窗口模型。
StableCode 模型受益于開源 BigCode 項目的初始編程語言數據集,同時還經過了 Stability AI 的額外過濾和微調,StableCode 將首先支持 Python、Go、Java、JavaScript、C、markdown 和 C++ 等編程語言的開發。
訓練任何 LLM 都依賴于數據,StableCode 的數據來自 BigCode 項目。注意到,HuggingFace 和 ServiceNow 在 5 月份也曾推出了基于 BigCode 的開放 StarCoder LLM。Stability AI 的首席研究科學家 Nathan Cooper 稱,StableCode 的訓練涉及了對 BigCode 數據進行大量的過濾和清理。
StableCode 的長上下文窗口版本具有 16,000 個詞元的上下文窗口,Stability AI 聲稱比任何其他模型都要大,更長的上下文窗口使得可以使用更專業和復雜的代碼生成提示,還意味著用戶可以讓 StableCode 查看一個包含多個文件的中等大小的代碼庫,以幫助理解和生成新代碼。
StableCode 目前還處于早期階段,現在官方的目標是看看開發者會如何接受和使用該模型。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的Stability AI 推出 StableCode,一款用于写代码的大型语言模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三星S24 Ultra相机规格曝光 配备
- 下一篇: # 字符串从右往左查找_字符串匹配(搜索