萬知“股東大會”
wanzhi's shareholders meeting
Chief Experience Officer
萬知首席體驗(yàn)官
李開復(fù)
轉(zhuǎn)眼過了一周,作為萬知的C"E"O(Chief Experience Officer,首席體驗(yàn)官)的我又來向各位萬知的“精神股東”匯報本周工作啦。
本周伊始,我們就收到了一個令人振奮的消息。在 LMSYS 盲測競技場最新排名中,零一萬物的最新千億參數(shù)模型 Yi-Large 總榜排名世界模型第 7,中國大模型中第一,已經(jīng)超過 Llama-3-70B、Claude 3 Sonnet;在中文分榜更是與 GPT-4o 并列世界第一。
由于 LMSYS Chatbot Arena 采用了號召千萬真實(shí)用戶盲測評分的形式,已經(jīng)成為業(yè)內(nèi)公認(rèn)最客觀公正、最接近用戶實(shí)際應(yīng)用場景的大模型評測平臺。
目前,LMSYS 已經(jīng)是 OpenAI、Google、Anthropic 等海外大廠旗艦?zāi)P汀褒垹幓⒍贰钡漠?dāng)紅擂臺,像是 OpenAI CEO Sam Altman,Google DeepMind 首席科學(xué)家 Jeff Dean 都曾經(jīng)引用 LMSYS 給出的排名成績來佐證自家模型能力。
(向上滑動啟閱)
致各位:
在模型能力之外,我們也注意到大家反饋的新需求,在萬知的功能上也做了針對性的升級調(diào)整:
Case 1:我們關(guān)注到,通過輸入完美提示詞得到優(yōu)質(zhì)回答后,大家都會有分享出去的欲望;又或者在工作場景中,將生成的內(nèi)容分享給同事伙伴,更高效地完成合作。
Action:我們在小程序端新增了回答分享功能,只要長按萬知的回答消息,工具欄里就出現(xiàn)分享按鈕,點(diǎn)擊分享就可以把這輪問答轉(zhuǎn)發(fā)給微信好友啦。
Case 2:大家對于識別圖片內(nèi)容的功能需求我們也有注意到。我們的多模態(tài)模型 Yi-VL-Plus 在視覺模型盲測平臺Vision Arena上的評測成績始終保持全球領(lǐng)先?;诙嗄B(tài)能力我們也在萬知網(wǎng)頁版的讀文檔界面中配置了截圖問答的功能。
Action:萬知微信小程序端的上傳圖片、識圖聊天等功能已經(jīng)準(zhǔn)備就緒,預(yù)計稍晚些時候就會和大家見面。
提示詞魔法大揭密
結(jié)合大家的反饋,我們了解到,與萬知對話來獲取各方面的知識是大多數(shù)人的訴求。與搜索引擎相比,毫無疑問,大模型能做到的事要多得多。它具備更自然的交互方式,能提供比搜索引擎更人性化的交互體驗(yàn);同時得益于深度學(xué)習(xí)和語義理解,大模型也能夠輸出更準(zhǔn)確、相關(guān)性更高的結(jié)果。
面對通識類問題,具備聯(lián)網(wǎng)功能的萬知都能對答如流。即便是諸如“iPad Pro比前作好嗎?”這類極度口語化的問題,萬知也能夠理解“iPad Pro”是指“2024年款iPad Pro”、前作是“2023年款iPad Pro”,并且給出芯片、圖形顯示技術(shù)、內(nèi)存等核心信息。
但是,如果能在提示詞上做些優(yōu)化,萬知就會反饋給你更加詳細(xì)、更具參考價值的答案。
在向大模型提問時,應(yīng)當(dāng)盡量避免使用模糊不清的詞匯,比如“好”、“壞”、“怎么樣”等,“請”、“麻煩你”這類禮貌用語也可以省略。盡可能使用目的明確的詞匯,可以多次重復(fù)關(guān)鍵詞“iPad Pro”。這樣可以減少提問中的噪音,突出重點(diǎn),便于萬知理解你的真實(shí)意圖。
如上述原問題中“比前作好嗎?”就可以改為“我想了解iPad Pro產(chǎn)品的用戶評價,與2023年款iPad Pro做個比較”。
同時,我們可以試著將復(fù)雜問題拆解為更簡單的提示,分步驟提問,一步步引導(dǎo)萬知理解你的問題。比如,在原問題的結(jié)尾加入“從性能、顯示效果、價格、電池續(xù)航等角度分析”。
結(jié)合上面的小技巧,原問題就被改寫為“我想了解iPad Pro產(chǎn)品的用戶評價,與2023年款iPad Pro做個比較,可以從性能、顯示效果、價格、電池續(xù)航等角度分析”。得出的內(nèi)容與原回答也大不相同,不僅內(nèi)容更加詳實(shí)了,與2023年款iPad Pro的對比結(jié)果也更加明確了。
總結(jié):
1、明確問題,盡量避免使用模糊不清的詞匯,避免使用復(fù)雜的句式或過多的修飾語;
2、將復(fù)雜查詢?nèi)蝿?wù)拆解為多步驟、更簡單的提示,一步一步來;
3、在一個提示中可以多次重復(fù)重點(diǎn)單詞或短語。
我們內(nèi)部篩選出了一個badcase案例,結(jié)合上面的幾點(diǎn),讓我們試試,一起把這個badcase轉(zhuǎn)變成goodcase。
由于上述問題沒有進(jìn)行任何拆解,只是一個籠統(tǒng)的請求,萬知所給出的回答內(nèi)容也僅限于表面。同時,問題中沒有重復(fù)任何關(guān)鍵詞,沒有突出重點(diǎn),讓人難以抓住問題的核心。
對比來看,這次萬知的回答就細(xì)致深入了很多。修改之后的問題,直接指向了“最近流行的AI技術(shù)”,避免了模糊不清的詞匯;同時籠統(tǒng)的問題也被拆解為三個更簡單的小問題,分別是技術(shù)特點(diǎn)、應(yīng)用場景和社會影響,便于萬知逐一回答;在問題中多次使用“AI技術(shù)”這個詞,強(qiáng)調(diào)了問題的重點(diǎn)。
答疑時間 ?
如何寫好萬知提示詞?
大模型在訓(xùn)練過程中學(xué)習(xí)了大量的文本數(shù)據(jù),這些數(shù)據(jù)中包含了各種詞匯和表達(dá)方式。
你可以將大模型視作在知識的海洋里暢游的一只書蟲。當(dāng)你給到大模型一個清晰的詞匯時,就像是給了它一個清晰的航標(biāo),它能迅速地在記憶的海洋中找到正確的航道,準(zhǔn)確地吐出你想要的答案。但如果給它一個模糊的詞匯,就像是給它一個謎語,它可能會陷入深思,甚至開始胡思亂想,給出的答案可能就像是一首抽象派的詩,讓人摸不著頭腦。
為了讓它不至于在知識的海洋里暈頭轉(zhuǎn)向,我們得用重點(diǎn)詞匯給它指明方向。在自然語言處理中,詞匯的出現(xiàn)頻率可以被視為一種信號。多次強(qiáng)調(diào)重點(diǎn)詞匯增強(qiáng)了這些詞匯的信號強(qiáng)度,使得模型更容易注意到它們,并將其視為重要的線索來理解問題。
換言之,這些重點(diǎn)詞匯對于大模型而言就是知識海洋中的燈塔,告訴它“這里要重點(diǎn)關(guān)注!”這樣一來,它就能更快地捕捉到關(guān)鍵信息,避免在理解時出現(xiàn)誤會。
至于為什么要將復(fù)雜任務(wù)拆分為多步驟,則是因?yàn)椋谥鸩教幚砗唵稳蝿?wù)的過程中,模型的每一步的輸出都可以作為下一步的輸入,從而形成一個連貫的上下文鏈,這有助于模型更好地理解整個任務(wù)的上下文和目標(biāo)。
另一方面,在處理復(fù)雜任務(wù)時,模型的錯誤可能會在生成過程中累積,導(dǎo)致最終輸出偏離預(yù)期。通過將任務(wù)拆解為多個簡單的步驟,模型可以在每一步都進(jìn)行校正,從而減少錯誤的累積,提高最終輸出的準(zhǔn)確性。
微故事征集大賽
很多人都把萬知當(dāng)作搜索引擎,但是其實(shí)它可以很多有趣也很專業(yè)的事兒,它更可以當(dāng)你的“AI特助”。前幾天,我試著讓萬知用30個字寫一個故事,要求寫出驚悚的細(xì)節(jié)和完全想象不到的結(jié)局。結(jié)果它展現(xiàn)出的天馬行空的想象力超出了我的預(yù)料。
我們的提示詞課程也已經(jīng)進(jìn)行了兩周,相信大家都總結(jié)出了自己的小技巧。所以,我決定向大家發(fā)出挑戰(zhàn)書——30字微故事征集大賽!看看誰的故事更精彩!
登陸萬知網(wǎng)頁端(wanzhi.com)或進(jìn)入“萬知AI”微信小程序,編寫專屬于你的提示詞,與萬知一起創(chuàng)作出30字以內(nèi)的精彩微故事。寫出滿意的微故事后,將你的微故事以視頻評論、公眾號評論及留言的形式發(fā)給我,就有機(jī)會獲得簽名版《AI未來進(jìn)行式》及零一萬物一周年限量版周邊一份。
我們將選出十個優(yōu)秀獲獎選手,送出精美禮品,并于5月30日(下周四)《首席體驗(yàn)官周報》中展示獲獎作品,期待你的參與!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.