在人們印象中,使用大語言模型是極其簡單的操作——只需輸入一個(gè)問題,立刻就能得到回答。但實(shí)際上,要想“用好”大語言模型,也是需要技巧的。
如何有效地與這些人工智能模型互動,發(fā)揮出它們的最大潛力?中國科學(xué)技術(shù)大學(xué)心理學(xué)系特任研究員林志成在最近發(fā)表于《自然-人類行為》的評論文章中,提供了一系列策略和指導(dǎo),以此幫助人們更好地理解和“用好”這些先進(jìn)工具,生成更精準(zhǔn)的回答。
“從本質(zhì)上看,大語言模型是一個(gè)數(shù)學(xué)模型,缺乏對語義的理解。它只能‘預(yù)測下一個(gè)文字’出現(xiàn)的概率,而不能生成‘真理’?!痹诮邮堋吨袊茖W(xué)報(bào)》采訪時(shí),林志成建議在輸入指令時(shí)可以使用8個(gè)小技巧。
拆分復(fù)雜任務(wù)
由于缺乏對語義的理解,想要大語言模型“舉一反三”是很難的。但是,它有海量的數(shù)據(jù)、珍貴的“記憶”,可以從中提取信息。
因此,用好大語言模型,林志成給出的第一個(gè)小技巧是拆分復(fù)雜任務(wù)。
比如,不要直接給出“將文本翻譯成中文”這樣寬泛的指令,而是將指令拆解成兩步——首先按字面意思翻譯,保持含義不變;然后意譯,讓文本符合中文的語言習(xí)慣。
再比如,讓大語言模型寫出一篇1000字的論文,可以嘗試把任務(wù)分解成子任務(wù),用具體的指令分別生成概述、結(jié)論和中心論點(diǎn)。
林志成說:“清晰、逐步的指令會降低模糊性和不確定性,從而生成更準(zhǔn)確的答案。”
添加相關(guān)語境
大語言模型比人類的“短期記憶”多太多。因此,想要讓它提供精準(zhǔn)且符合問題語境的回復(fù),在輸入指令時(shí)添加相關(guān)語境就很重要。這是第二個(gè)小技巧。
林志成說,一個(gè)限定語境的問題應(yīng)當(dāng)包含具體內(nèi)容和細(xì)節(jié),從而引導(dǎo)大語言模型產(chǎn)生更準(zhǔn)確的理解力,生成有洞察力、更精細(xì)的回復(fù)。
例如,讓大語言模型起草一份求職簡歷,事先要把企業(yè)發(fā)布的具體職位需求、個(gè)人基本情況等內(nèi)容一并提供給它,如此一來,輸出的簡歷就更具有針對性。
明確的指令
當(dāng)你走進(jìn)一間咖啡廳,想要點(diǎn)一杯喜歡的咖啡,應(yīng)該不會說“請來杯咖啡”,而是會說“來杯摩卡或拿鐵”。同樣,你也不要期待大語言模型能讀懂你的心。
林志成指出,要想降低大語言模型預(yù)測時(shí)的不確定性,就要給出明確的指令。這是第三個(gè)小技巧。
例如,想讓大語言模型修改文章,不要說“潤色這篇文章”,而是具體到修改成什么風(fēng)格、文章的目標(biāo)受眾是誰……
林志成說,一段更具體的指令甚至可以是“像頂級期刊的頂級編輯那樣,潤色這篇文章,讓它更為清晰流暢”。
提供多種選項(xiàng)
大語言模型還擁有超強(qiáng)的“長期記憶”和生產(chǎn)能力。因此,它可以提供多個(gè)版本,而不是一個(gè)。
“很多時(shí)候,人們潛意識里認(rèn)為,大語言模型給出的答案是最優(yōu)的。但就文本寫作而言,帶有很多主觀色彩,并不是一個(gè)簡單量化的東西。因此很難判斷大語言模型第一次給出的就是最優(yōu)答案。”林志成說,此時(shí),可以讓大語言模型提供多種選項(xiàng),再從中選出符合個(gè)人需求的答案。這是第四個(gè)小技巧。
此外,林志成建議,還可以考慮重復(fù)用同樣的指令多次生成回復(fù)。
設(shè)定角色
大語言模型特有的“長期記憶”意味著它能夠模擬各種角色,提供專業(yè)的反饋或獨(dú)特的視角解讀。因此,設(shè)定角色是第五個(gè)小技巧。
例如,輸入指令時(shí),可以讓它模仿典型讀者提供寫作上的反饋,也可以讓它扮演一名寫作教師幫助修訂文稿,甚至可以讓它扮演一頭擅長人類生理學(xué)的西藏牦牛,以其獨(dú)特的視角解釋高海拔對心肺功能的影響。
“讓大語言模型扮演不同角色,不僅能獲得更多有針對性和符合語境的回復(fù),還能在整個(gè)過程中獲得更多樂趣。”林志成說。
提供具體例子
大語言模型擅長小樣本學(xué)習(xí)?!耙粋€(gè)特別有效的手段就是使用具體例子豐富大模型的想法。就像你去理發(fā)店,對理發(fā)師描述想要的發(fā)型,最好的方法是給他看照片?!绷种境烧f,提供具體例子是第六個(gè)小技巧。
比如,輸入指令時(shí),不要模糊地說“以這些數(shù)據(jù)制圖”,而是提供一個(gè)例子,如“為這些數(shù)據(jù)畫個(gè)條形圖,類似附件論文中的圖”。再比如,當(dāng)你讓大語言模型根據(jù)文稿生成摘要時(shí),可以提供幾份期刊中的摘要樣例,大語言模型就可以參考這些例子生成符合期刊風(fēng)格的摘要。
“這些具體的例子就像路線圖一樣,指導(dǎo)大語言模型朝著你期望的方向生成內(nèi)容。”林志成說。
聲明回復(fù)格式
林志成說,大語言模型經(jīng)?!皬U話太多”。例如,讓它修改一篇文章,它可能會把修改的細(xì)節(jié)一并反饋,但其實(shí)你只需要最后的成稿。
此時(shí),可以要求大語言模型僅輸出修改后的內(nèi)容。比如,可以指定回復(fù)格式,包括列表格式、閱讀水平和語言等。用列表格式和通俗的語言能夠提升回復(fù)的可讀性;限制回復(fù)的長度可以使內(nèi)容更加簡潔;設(shè)定閱讀水平則有助于更好地理解。這是第七個(gè)小技巧。
例如,與其讓大語言模型“總結(jié)關(guān)鍵發(fā)現(xiàn)”,不如聲明回復(fù)格式,“用列表形式總結(jié)關(guān)鍵發(fā)現(xiàn),并使用高中生能夠理解的語言”。
實(shí)驗(yàn)、實(shí)驗(yàn)再實(shí)驗(yàn)
“需要指出的是,如何使指令更有效,尚無確切答案。有時(shí)稍微調(diào)整一下,可能就會收獲意外驚喜。”林志成說,實(shí)驗(yàn)、實(shí)驗(yàn)再實(shí)驗(yàn),是最好的辦法。這也是第八個(gè)小技巧。
例如,在一系列推理問題中,在指令中簡單加入“一步一步思考”就可以讓大語言模型表現(xiàn)得更好。
有意思的是,大語言模型還能回應(yīng)“情緒性的信息”。假如你讓它修改一篇未經(jīng)同行審議的論文,可以在指令中加入一些短語,比如“深呼吸一下,這事對我的職業(yè)生涯很重要”。
林志成說,這些例子證明大語言模型對指令非常敏感。不過,并非所有嘗試都會成功,但每次嘗試都會有新的收獲,并在一定程度上提升工作效率、增加樂趣。
來源:《中國科學(xué)報(bào)》