成本降低90%,OpenAI正式开放ChαtGΡΤ
今天凌晨,OpenAI官方發(fā)布ChαtGΡΤ和Whisper的接囗,開發(fā)人員現(xiàn)在可以通過API使用最新的文本生成和語音轉(zhuǎn)文本功能。OpenAI稱:通過一系列系統(tǒng)級優(yōu)化,自去年12月以來,ChαtGΡΤ的成本降低了90%;現(xiàn)在OpenAI用這些節(jié)省下來的成本造福廣大開發(fā)者。開發(fā)人員現(xiàn)在通過API使用Whisper v2大模型,從而獲得更快的速度和更經(jīng)濟成本。ChαtGΡΤ模型會不斷得到升級改進,并提供專用容量來對模型進行更深入的控制。
文章目錄
- ChαtGΡΤ接囗
- 模型
- 接口
- 最佳實踐
- Whisper接囗
- transcribe
- translate
ChαtGΡΤ接囗
模型
OpenAI發(fā)布的ChαtGΡΤ模型名稱為gpt-3.5-turbo,它與ChαtGΡΤ產(chǎn)品中使用的模型相同。價格0.002美元/1000 token,比之前的text-davinci-003便宜10倍。gpt-3.5-turbo在聊天場景下表現(xiàn)經(jīng)驗,許多非聊天場景應(yīng)用也可以表現(xiàn)優(yōu)秀,開發(fā)者只需要極少調(diào)整就可以將模型由text-davinci-003切換到gpt-3.5-turbo。
OpenAI會不斷改進 ChαtGΡΤ 模型,因此gpt-3.5-turbo模型會不斷更新(4月會升級到最新穩(wěn)定版本),OpenAI也推薦大家使用gpt-3.5-turbo模型。為了滿足開發(fā)者對特定模型版本的需求,OpenAI還提供了特定快照版。目前提供的特定快照版為gpt-3.5-turbo-0301,該版本在接下來的三個月內(nèi)不更新,有效期到2023年6月1日。
| gpt-3.5-turbo | 功能最強大的 GPT-3.5 模型,并針對聊天場景進行了專門優(yōu)化,成本僅為 text-davinci-003 的 1/10。 會不斷迭代更新。 | 4,096 tokens | 截至2021年6月 |
| gpt-3.5-turbo-0301 | gpt-3.5-turbo的2023年3月1日快照版本。此模型在加下來3個月內(nèi)不會更新,有效期截止2023年6月1日。 | 4,096 tokens | 截至2019年10月 |
接口
由于gpt-3.5-turbo為聊天而場景設(shè)計,所以接口設(shè)計上發(fā)生了一點變化。在GPT-3接口中,問題是通過prompt字段傳入的,gpt-3.5-turbo沒有prompt字段,取而代之的是messages數(shù)組。下面是一個典型的接口調(diào)用例子:
import openaicompletion = openai.ChatCompletion.create(model="gpt-3.5-turbo",messages=[{"role": "system", "content": "你是一個聰明的助理"},{"role": "user", "content": "哪支球隊贏得了2018世界杯?"},{"role": "assistant", "content": "法國國家男子足球隊獲得2018年俄羅斯世界杯。"},{"role": "user", "content": "決賽對手是誰?"}] ) print(completion)上面示例代碼中,我們將多輪對話封裝到messages數(shù)組中,每條消息都有role和content。role的可選值為system, user, assistant,content是消息內(nèi)容。
通常,對話的格式首先是system消息,然后是交替的user消息和assistant消息。
system消息有助于設(shè)置模型的行為。在上面的例子中,模型被告知“你是一個聰明的助理”,模型就會扮演一個助理角色,輸出的內(nèi)容會盡可能像一個助理一樣簡潔清晰。
user消息有助于指導(dǎo)模型。它即可以是用戶的問題(通常是最后一條),也可以是開發(fā)人員的指令設(shè)置或上下文提示。
assistant消息有助于存儲上下文。它即可以是模型之前的輸出,也可以由開發(fā)人員編寫,用于給出所需行為的示例。
由于模型沒有過去請求的記憶,所以必須通過對話提供所有相關(guān)信息。因此包含歷史回話有助于模型更好理解問題。上面實例中,如果沒有中間的user消息和assistant消息,單獨問模型"決賽對手是誰?"模型是很難給出正確回答的。
gpt-3.5-turbo的返回數(shù)據(jù)格式也稍有變化。GPT-3接口的輸出封裝在text字段中,gpt-3.5-turbo的輸出封裝在message字段中,并且同樣由role和content構(gòu)成。我們可以簡單地通過completion['choices'][0]['message']['content']獲取輸出。
最佳實踐
由于gpt-3.5-turbo的表現(xiàn)與text-davinci-003類似,但價格是text-davinci-003的1/10,因此官方建議在大多數(shù)使用情況下使用gpt-3.5-turbo。
對于開發(fā)者來說,需要改動的地方很少,只需要將prompt改為messages格式即可。
"prompt": "哪支球隊贏得了2018世界杯?"改為:
messages: [{"role": "system", "content": "你是一個聰明的助理"},{"role": "user", "content": "哪支球隊贏得了2018世界杯?"} ]或者更簡單地改為:
messages: [{"role": "user", "content": "哪支球隊贏得了2018世界杯?"} ]?注意:gpt-3.5-turbo和gpt-3.5-turbo-0301不支持微調(diào)。
Whisper接囗
Whisper是OpenAI于2022年9月開源的語音轉(zhuǎn)文本模型,推出后獲得開發(fā)者社區(qū)的極大贊譽?,F(xiàn)在我們可以通過API調(diào)用Whisper v2模型,價格為0.006美元/分鐘。與其他服務(wù)相比,高度優(yōu)化的服務(wù)堆棧可確保Whisper具有更快的性能。
Whisper API提供transcribe 和 translate接口,支持多種音頻格式(m4a、mp3、mp4、mpeg、mpga、wav、webm)。
transcribe
import openaiaudio_file= open("/path/to/file/audio.mp3", "rb") transcript = openai.Audio.transcribe("whisper-1", audio_file)translate
import openaiaudio_file= open("/path/to/file/audio.mp3", "rb") transcript = openai.Audio.translate("whisper-1", audio_file)Whisper目前支持南非荷蘭語、阿拉伯語、亞美尼亞語、阿塞拜疆語、白俄羅斯語、波斯尼亞語、保加利亞語、加泰羅尼亞語、中文、克羅地亞語、捷克語、丹麥語、荷蘭語、英語、愛沙尼亞語、芬蘭語、法語、加利西亞語、德語、希臘語、希伯來語、印地語、匈牙利語、冰島語、印度尼西亞語、 意大利語、日語、卡納達語、哈薩克語、韓語、拉脫維亞語、立陶宛語、馬其頓語、馬來語、馬拉地語、毛利語、尼泊爾語、挪威語、波斯語、波蘭語、葡萄牙語、羅馬尼亞語、俄語、塞爾維亞語、斯洛伐克語、斯洛文尼亞語、西班牙語、斯瓦希里語、瑞典語、他加祿語、 泰米爾語、泰語、土耳其語、烏克蘭語、烏爾都語、越南語和威爾士語。
支持中文!支持中文!支持中文!
總結(jié)
以上是生活随笔為你收集整理的成本降低90%,OpenAI正式开放ChαtGΡΤ的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 讨嫌
- 下一篇: Hutool工具类之ExcelUtil