Prompt入门
Prompt的范式大抵是兩種:
- 續寫Prefix:用在GPT2-3那種單向LM預訓練模型上,輸入「好好學習,翻譯成英文:」,輸出「good good study」
- 完形填空:用在BERT那種MLM式預訓練模型上,比如情感分類任務可以輸入「這個餅不錯,太X了」,輸出「棒」
Prompt主要難在3個方面:
輸入端:
輸出端:
訓練:
舉例:
輸入端
4個不同的Prompt:
Prompt與輸入a的結合:
輸出端:Answer的映射
Answer的映射是標簽詞表的映射:
對于輸出1,2,3,4,5依次對應terrible、bad、okay、good、great。
訓練
以往模型只要對P(l|x)建模就好了(l是label),但現在我們加入了Prompt P以及標簽映射v,所以這個問題就可以更新為:
sps_psp?是模型M的輸出logits。再通過softmax,就可以得到概率:
訓練過程如下所示:
總結
- 上一篇: Anaconda的conda promp
- 下一篇: anaconda prompt 常用命令