谷歌发言人承认:Gemini AI 演示视频内容和语音提示均非实时录制
12 月 9 日消息,據彭博社、Tom's Hardware 等外媒當地時間周五報道,谷歌發言人在采訪中承認,前段時間谷歌發布的大語言模型 Gemini 演示視頻并非實時錄制。
乍看之下,這個一鏡到底的視頻中,Gemini 模型可發現藏在指定塑料杯內的紙團,或者看出一張“連點成線”的圖片畫的是螃蟹。但是,谷歌發言人告訴彭博社,這段演示視頻是利用鏡頭中的靜止圖像幀和文字提示“拼湊”而成的,Gemini 只能對輸入的提示和靜態圖像做出反應。同樣,視頻中用戶與 Gemini 的語音互動也由后期配音完成。
至于視頻中的人物說話、繪畫、展示物品乃至魔術,似乎也只是為了演示視頻而特意安排的。在谷歌官方 YouTube 頻道中,谷歌也添加了描述稱“為了演示的目的,延遲已經減少,Gemini 的輸出也縮短了,以求簡潔”。這意味著 Gemini 每次響應所需的時間實際上要長于視頻的演示。
此外,谷歌 DeepMind 研究副總裁兼深度學習負責人 Oriol Vinyals 也對這段視頻做進一步解釋:這段視頻展示的是使用 Gemini 構建的多模態用戶體驗“可能的樣子”,是為了激發開發人員的靈感。其稱,視頻中的所有用戶提示和輸出都是真實的,為簡潔起見進行了縮短。而且,視頻中展示的模型為 Gemini Ultra。
據此前報道,谷歌曾聲稱 Gemini Ultra 的性能在 32 個廣泛使用的學術基準測試中有 30 個都表現出了超越當前時代的“先進結果”,而這些基準測試也是當前 LLM 領域最常用、最泛用的測試。
其中,它以 90.0% 的得分成為第一個在 MMLU(大規模多任務語言理解)上超越人類專家的模型(該測試結合了數學、物理、歷史、法律、醫學和倫理等 57 個學科)。
Gemini Ultra 還在新的 MMMU 基準測試上表現出了 59.4% 的領先級性能,該測試涵蓋了“需要深思熟慮的”不同領域的多模態任務。
明年初,谷歌還將推出全新升級的 Bard Advanced,讓用戶可以更好地體驗到其最好的模型和功能,也就是 Gemini Ultra。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的谷歌发言人承认:Gemini AI 演示视频内容和语音提示均非实时录制的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎么收拾小三(怎么收拾小三不让老公知道)
- 下一篇: 癌细胞如何检测(血液检测能查出癌细胞吗)