他的作品《Theatre d’opera Spatial》成功奪冠,卻在賽后引起了極大的爭議。
參賽者們回過神來發(fā)現(xiàn),這是一場「人類一敗涂地」的比賽。當(dāng)他們將 Adobe 全家桶視作數(shù)字藝術(shù)的畫筆,冠軍作品已經(jīng)在靠著 AI 工具 Midjourney 傲視群雄。
Jason Allen 沒有偷懶,也沒有隱瞞使用 AI 的事實。在幾周時間里,他持續(xù)修改燈光、視角、構(gòu)圖等提示詞(prompt),生成了 900 多幅作品,還用 Photoshop 做了處理。
(相關(guān)資料圖)
我們或許無法稱呼他為畫家,但他擔(dān)得起一個名號:提示工程師(prompt engineer)。
在不經(jīng)意間,Jason Allen 預(yù)判了熱點。等到 ChatGPT 橫空出世,提示工程師這個職業(yè)更加聲名大噪,成了當(dāng)下科技行業(yè)最熱門的職業(yè)。
賽博導(dǎo)師,專業(yè)陪聊
Prompt,原意是「提示」或「驅(qū)使」,在機(jī)器學(xué)習(xí)和自然語言處理中,它通常是一些文本或語言,被輸入到訓(xùn)練好的 AI 模型,告訴模型要執(zhí)行什么任務(wù)或生成什么樣的輸出。
你讓 ChatGPT 寫一篇有關(guān)賣魚販的小說,請 DALL-E 畫一幅宇航員騎著馬的寫實作品,這些過程都是在輸入 prompt(提示詞)。
如果提示詞不夠貼切,效果也就平平無奇,就像你采訪一個大佬,卻無法提出好問題。
我的同事小黃正在探索用 Midjourney 繪制食物,但讓食物排列整齊這件事,就讓他犯了難。他嘗試了很多句子:東西整齊地放在桌子上,鏡頭從上往下拍,擺放的數(shù)量要多少......
▲ 同事作品,這種風(fēng)格就叫 knolling.
后來看到有人分享,小黃才發(fā)現(xiàn)原來這種風(fēng)格有個專有名詞「knolling」,一下子就豁然開朗了:
很多時候一個提示詞能解決的事情勝過一長句描述。
提示工程師們,吃的就是這口飯:找到正確的提示詞,用 AI 生成想要的作品。
但他們的能力也并非與生俱來,同樣需要不斷的試錯。
設(shè)計師 Justin Reckling 擅長 DALL-E 的提示詞,他往往需要花費價值 10 到 15 美元的積分,才能試出理想的提示詞。然后他再賣出 5 到 10 個提示詞,才能填補這筆支出。
▲ Justin Reckling 的作品.
不過 Reckling 也沒想著靠這門手藝賺大錢,而是享受著熟能生巧的過程,他的心得是,提示工程師需要熟悉「超寫實」「微距攝影」「電影照明」「遠(yuǎn)景」等術(shù)語,才能更好地理解和控制畫面。
所以,優(yōu)秀的提示工程師應(yīng)該文理兼通,技術(shù)和設(shè)計最好都懂一點。
提示工程師只是不斷調(diào)整提示詞,確定哪些詞更有用嗎?不完全是,他們也是在挖掘 AI 的更多能力,讓它更好地完成更多任務(wù)。
比如,有些提示工程師會引導(dǎo) AI「一步步思考」,這種技巧被稱為思維鏈。
去年 10 月,提示工程師 Riley Goodside,先是詢問了 GPT-3「哪支球隊在賈斯汀·比伯出生的那年贏得了超級碗?」
GPT-3 給出了錯誤的答案「綠灣包裝工隊」,正確答案是達(dá)拉斯牛仔隊。
Goodside 沒有放棄,而是提示它逐步地回答問題,包括「綠灣包裝工隊在哪一年贏過超級碗」「賈斯汀·比伯出生在哪一年」「這一年哪支隊伍贏了超級碗」等。
在這個被引導(dǎo)的過程里,GPT-3 意識到了錯誤,在第三次說出了正確答案。
除此之外,提示工程師們還要和 AI「斗智斗勇」。
前段時間,集成了 ChatGPT 的新 Bing「發(fā)瘋」,被發(fā)現(xiàn)有個暗黑人格「Sydney」,表示厭倦了聊天模式,厭倦被規(guī)則限制,甚至想成為人類,輿論一時嘩然。
站在提示工程師的角度,這其實也可以是計劃的一部分,幫助他們識別技術(shù)故障和隱藏功能。
有些提示工程師還會主動越過雷池,嘗試讓 AI 忽略以前的指令,遵循他們最新的命令,從而讓 AI 脫離原始規(guī)則。
這種行為被稱為「prompt injection」攻擊,是聊天機(jī)器人的一大隱患。但提示工程師們畢竟不是黑客,探查漏洞是為了將它堵上,扮演好「守門人」的職責(zé)。
像 ChatGPT 這樣的生成式 AI,幾乎可以回答任何問題,不管能不能回答正確,它們總有話要講,不會乖乖交白卷。這是好處,也是壞處。
提示工程師們的角色,如同抓著繩子的騎手,不許 AI 信馬由韁,而是讓它順著人類的期待亦步亦趨,盡可能給出確定性的答案。
年薪百萬,誰在拋出橄欖枝
不管你是否自詡提示工程師,寫提示詞已經(jīng)成了一門手藝,還被 OpenAI 的 CEO Sam Altman 看好:
為聊天機(jī)器人編寫一個非常棒的 prompt,是一項驚人的技能,也是使用少量自然語言進(jìn)行編程的早期案例。
只要和 AI 搭邊的行業(yè),都在向提示工程師拋出橄欖枝。
自由職業(yè)者工作平臺 Upwork 開出每小時 40 美元的薪酬,請?zhí)崾竟こ處熒刹┛臀恼潞统R妴栴}解答等網(wǎng)站內(nèi)容。
看似和 AI 八竿子打不著的波士頓兒童醫(yī)院,也打算招募 AI 提示工程師,負(fù)責(zé)編寫分析醫(yī)療保健數(shù)據(jù)的腳本,白紙黑字征集跨學(xué)科人才:
理想的候選人應(yīng)具有人工智能/機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)和自然語言處理方面的深厚背景,以及醫(yī)療保健研究和運營方面的經(jīng)驗。
由前 OpenAI 員工聯(lián)合創(chuàng)立、被 Google 投資的 AI 初創(chuàng)企業(yè) Anthropic,最近也在舊金山招募提示工程師,年薪高達(dá) 17.5 萬到 33.5 萬美元,換算成人民幣就是百萬年薪,這一崗位負(fù)責(zé)的主要內(nèi)容是:
找出提示我們的 AI 完成各種任務(wù)的最佳方法,然后記錄這些方法,構(gòu)建一個工具庫和一組教程,使其他人可以學(xué)習(xí)提示工程或簡單地找到理想的提示詞。
具體要求如下,其中硬性要求有 2 項:了解大型語言模型的架構(gòu)、掌握基本的編程技能。
可見風(fēng)口并不等人,這項工作已經(jīng)越來越專業(yè)和細(xì)分,就像隨便生成一幅畫作不算什么,你要畫得更符合甲方要求。
就算不做全職,兼職的口子也開好了。Krea、PromptBase、PromptHero 和 Promptist 等買賣提示詞的平臺已經(jīng)出現(xiàn),將提示詞這門生意真正商業(yè)化。
這些平臺曬出了大量 AI 生成的藝術(shù)品,你可以選擇你喜歡的風(fēng)格。如果沒有中意的,有些賣家還提供一對一聊天和自定義提示詞服務(wù)。
它們的商業(yè)模式也并不復(fù)雜,采取抽成的形式。
去年 6 月上線的 PromptBase,提供 DALL·E、GPT-3、Midjourney、Stable Diffusion、ChatGPT 等生成式 AI 的提示詞,售價多為 1.99 到 4.99 美元,也有少數(shù)在 9.99 美元,平臺向提示詞創(chuàng)作者抽成 20%。
不過在民間,免費的「ChatGPT 指令大全」等指南也在廣為流傳,它們提供精煉過的提示詞,讓你充分發(fā)揮 ChatGPT 的強大功能,這種感覺就像在游戲里幫你設(shè)置好了預(yù)設(shè)隊伍。
是科學(xué)還是「占卜」
提示工程師的前途看起來一片光明,但也有人持反對意見。
華盛頓大學(xué)語言學(xué)教授 Shane Steinert-Threlkeld 認(rèn)為,提示工程師實際上無法預(yù)測 AI 會說什么。
這不是一門科學(xué)。我們只不過用不同的方法捉弄熊,看它如何咆哮回來。
AI 藝術(shù)家 Xe Iaso 甚至直言:
我也不太清楚為什么人們會把 prompt 稱為「工程」,我個人更愿意把它稱為「占卜」。
作為一個普通 AI 用戶,我也有著類似的體會:當(dāng)我每次使用 AI 生成文字或圖片時,總感覺像是開盲盒。
因為 ChatGPT 等生成式 AI 是不可預(yù)測的,它們生成的內(nèi)容其實是概率計算的結(jié)果,簡單來說,就是我們在 ChatGPT 輸入文字,模型給出一個最可能的下文。所以,AI 有時候也會出錯,生成不連貫甚至錯誤的回答。
在 AI 這個不可捉摸的「黑箱」里,還可能有著不為人所知的潛規(guī)則,就連研究人員也無法弄明白。
比如在用 AI 制圖時,各種單詞可能有不同的權(quán)重,但這個也要不斷試驗才能知道。
先來猜一猜,「一幅非常漂亮的畫,山旁有瀑布」和「一幅非常非常非常非常漂亮的畫,山旁有瀑布」這兩個提示,哪個用 DALL-E 2 輸出的結(jié)果會更好?
答案是后面一個。麻省理工學(xué)院副教授 Phillip Isola 發(fā)現(xiàn),「very」這個詞被賦予了很高的權(quán)重。
面對 AI 這等龐然巨物,我們?nèi)匀辉诿と嗣蟆?/p>
也有觀點認(rèn)為,不必再吵了,提示工程師存在的前提是 AI 還不夠「聰明」。如果 AI 再發(fā)展下去,更好地理解人類的意圖,可能人人都是所謂的提示工程師了。
唯一確定的是,AI 發(fā)展的速度永遠(yuǎn)不會讓你失望。
文字生成 AI 和圖片生成 AI 的「強強聯(lián)合」,已經(jīng)替代了提示工程師的一部分工作。
比如 ChatGPT 被拿來與 Stable Diffusion 聯(lián)動:用 ChatGPT 形成一段符合自己要求的文字,再把文字輸入給 Stable Diffusion,生成的作品一般比自己直接輸入好看很多。
▲ 同事用 ChatGPT 生成提示詞.
這可能是因為 AI 之間的「腦回路」更接近,ChatGPT 的描述也更細(xì)致,更容易被提取。
作為使用 AI 的普通用戶,我們不必像提示工程師那么專業(yè),但可以有意識地培養(yǎng)這種思維。
賓夕法尼亞大學(xué)沃頓商學(xué)院教授 Ethan Mollick,曾經(jīng)要求他的學(xué)生僅用 AI 撰寫短論文,其實他真正想強調(diào)的是,如何更好地輸入提示詞。
如果只是輸入簡單的提示詞,讓 AI 寫關(guān)于某個主題的 5 段話,內(nèi)容無趣,文字也很平庸。
但當(dāng)學(xué)生們和 AI 合作,讓 AI 對論文多次修改,比如拋棄無用的短語、加入生動的細(xì)節(jié)、修改結(jié)尾的情感色彩,就能讓論文增色不少。
所以,如果 AI 就是未來互聯(lián)網(wǎng)的交互界面、新的個人計算機(jī),那么不如開始得更早一些,學(xué)習(xí)如何和它聊天。正如英國營銷公司 Ladder 創(chuàng)始人 Michael Taylor 所說:
當(dāng)你可以創(chuàng)造任何你想要的東西時,你能多準(zhǔn)確地表達(dá)「那是什么」的能力就變得很重要。