Kernel Memory 入门系列: RAG 简介
Kernel Memory 入門系列: RAG 簡介
開一個新坑,Semantic Kernel系列會在 Release 1.0 之后陸續更新。
當我們有了一定的產品資料或者知識內容之后,自然想著提供一個更加方便的方式讓用戶能夠快速地找到自己想要的信息,或者得到一個更加智能的答案。
以往的時候可能需要通過一些搜索引擎或者問答系統來實現,但是這些系統往往需要極高的維護成本,而且對于用戶來說也不是很友好。很多時候仍然需要用戶自己去思考問題的表達方式,然后再去搜索或者提問,可以說是費事費力。
如今有了大語言模型,我們就可以考慮通過它來實現一個更加智能的問答系統,為用戶提供一個更加友好的交互方式。
從對話開始
當我們直接接入大語言的模型的時候,往往會遇到一個很常見的問題,就是它對于我們私有的數據,小眾領域的信息或者較新的知識并不知道。
這源自于大語言模型的訓練數據集的限制,它的數據往往來自于大眾的語料庫,所以對于公開的信息了解的就比較多,但是對于私有的數據,小眾領域的信息都不在它的知識范圍內,而且由于訓練成本和時間的限制,它也不可能實時地去更新模型本身的知識。
這個時候得到“不知道”的答案反而是一個好事兒,起碼看得出來這個模型是有一定的智能的,它知道自己不知道,而不是隨便瞎猜。畢竟處理大模型的幻覺也是很大的一個問題。
補充上下文
那么這個時候如果想要讓模型能夠為我們所用的,就需要上一點技術手段了。
最簡單的方法就是在與大模型溝通的時候,增加一些上下文的信息。
那這里的上下文就是我們所能夠提供給模型的,用于回答用戶問題的信息了。
那么接下來的問題就是,這個上下文信息是怎么來的?
RAG
我們需要從整個流程來回溯一下:
- 首先用戶提出問題,這個問題從始至終不會發生變化
- 然后我們需要理解用戶的問題,知道用戶提問的意圖和方向
- 接下來就是我們需要根據用戶的問題,去檢索我們的知識庫,找到與用戶問題相關的信息,查找出與之相關的的文檔或者文本內容
- 最后我們需要將這些文檔或者文本內容進行整合,組成一個完整的提示詞,提供給大語言模型用于生成
- 最后通過大語言模型生成相對精確的答案,返回給用戶
這個過程就被稱為 RAG(Retrieval Augmented Generation),也就是檢索增強生成。
參考資料
- 檢索增強生成 (RAG)
總結
以上是生活随笔為你收集整理的Kernel Memory 入门系列: RAG 简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 心情不好唯美短句子169个
- 下一篇: 果粉必看!各个平台观看苹果秋季发布会攻略