作者:神譯局譯者:boxi來(lái)源:36氪旗下編譯團(tuán)隊(duì)「神譯局」我不敢說(shuō)這份用戶指南已經(jīng)很全,但為了解人工智能的當(dāng)前狀態(tài)提供一些指導(dǎo)還是可以的。我每隔幾個(gè)月就會(huì)為我的學(xué)生(以及感興趣的讀者)編寫一份人工智能入門指南,而且每次都需要做出重大修改。但過(guò)去幾個(gè)月尤其瘋狂。這份指南是基于我的經(jīng)驗(yàn),純屬個(gè)人之見(jiàn),重點(diǎn)是如何選擇正確的工具來(lái)完成任務(wù)。01主要的大語(yǔ)言模型現(xiàn)在,當(dāng)我們說(shuō)起人工智能時(shí),我們通常指的是大型語(yǔ)言模型(LLM)。大多數(shù)人工智能應(yīng)用都是由 LLM 提供支持,而 LLM 當(dāng)中其實(shí)基礎(chǔ)模型就那么幾個(gè),是由少數(shù)幾家組織建立的。每家公司都可以通過(guò)聊天機(jī)器人(Chatbot)直接訪問(wèn)他們的模型:OpenAI 做出了 GPT-3.5 與 GPT-4, ChatGPT 以及微軟的 Bing(通過(guò) Edge 瀏覽器訪問(wèn))背后用的就是這些模型。谷歌的 Bard 品牌旗下也有多款模型。Anthropic 則建立了 Claude 與 Claude 2 模型。還有其他一些 LLM,但本文不會(huì)詳細(xì)討論。第一個(gè)是 Pi,這是由 Inflection 構(gòu)建的聊天機(jī)器人。Pi 針對(duì)對(duì)話進(jìn)行了優(yōu)化,并且確實(shí)非常想成為你的朋友(說(shuō)真的,不妨嘗試一下,試過(guò)你才知道我是什么意思)。除了聊天之外,它不喜歡做太多事情,想讓它替你工作會(huì)是一次令人沮喪的練習(xí)。我們也不會(huì)介紹任何人都可以使用和修改的各種開(kāi)源模型。這些通常無(wú)法訪問(wèn),或者對(duì)于今天那些只是想隨便用用的用戶來(lái)說(shuō)沒(méi)有什么用,但其實(shí)那些模型確實(shí)很有前景。未來(lái)的指南可能把它們納入進(jìn)去。下面是一份快速參考圖表,總結(jié)了 LLM 的現(xiàn)狀:前四個(gè)(包括 Bing 在內(nèi))都是 OpenAI 的系統(tǒng)。目前 OpenAI 的人工智能主要就這兩種:3.5 和 4。GPT 3.5 在去年 11 月掀起了一股人工智能熱潮,GPT 4 在今年春季首次亮相,功能更加強(qiáng)大。新的派生版利用通過(guò)插件介入互聯(lián)網(wǎng)及其他應(yīng)用。插件有很多,但大多數(shù)不是很有用,不過(guò)應(yīng)該根據(jù)需要自己去探索一下。Code Interpreter 是 ChatGPT 的一個(gè)極其強(qiáng)大的版本,可以運(yùn)行 Python 程序。如果你從未給 OpenAI 付過(guò)費(fèi),那么你就只用過(guò) 3.5。除了插件版以及暫時(shí)停止瀏覽的 GPT-4 版以外,這些模型都沒(méi)有連接到互聯(lián)網(wǎng)。微軟的 Bing 混合使用了 4 和 3.5,并且通常是 GPT-4 家族當(dāng)中第一個(gè)推出新功能的模型。比方說(shuō),Bing 既可以創(chuàng)建和識(shí)別圖像,也可以在 web 瀏覽器中讀取文檔。它已經(jīng)接入了互聯(lián)網(wǎng)。Bing 用起來(lái)有點(diǎn)奇怪,但功能強(qiáng)大。谷歌一直在測(cè)試自己的供消費(fèi)者使用的人工智能,也就是所謂的 Bard,但其實(shí) Brad 背后由各種基礎(chǔ)模型提供支持,其中最近的一個(gè)叫做 PaLM 2。LLM 技術(shù)就是由谷歌開(kāi)發(fā)出來(lái)的,但他們的產(chǎn)品非常令人失望,不過(guò)昨天公布的改進(jìn)表明他們?nèi)栽谥铝τ谘芯康讓蛹夹g(shù),所以我對(duì)他們?nèi)员S邢Mrad 已經(jīng)獲得了跑有限代碼與解釋圖像的能力,但我現(xiàn)在一般會(huì)避免使用 Bard。最后一家公司是 Anthropic ,他們發(fā)布了 Claude 2。Claude 最值得注意的是它的上下文窗口非常大——即便上算是 LLM 的內(nèi)存了。Claude 的內(nèi)存幾乎可以容納整本書(shū)或許多個(gè) PDF。與其他大型語(yǔ)言模型相比,其惡意行為的可能性更小,這意味著,它可能只會(huì)訓(xùn)斥你一下。接下來(lái),我們講講怎么用:02寫東西最佳免費(fèi)選項(xiàng):Bing 與 Claude 2付費(fèi)選項(xiàng):ChatGPT 4.0 / 帶插件的 ChatGPT目前,GPT-4 仍然是最強(qiáng)大的人工智能寫作工具,你可以通過(guò) Bing 免費(fèi)訪問(wèn)(選擇“創(chuàng)意模式”),也可以通過(guò)每月花 20 美元訂閱 ChatGPT 來(lái)訪問(wèn)。不過(guò),第二名的 Claude 差距并不大,而且有免費(fèi)選項(xiàng),盡管存在限制。這些工具也已被直接集成到常見(jiàn)的辦公應(yīng)用之中。Microsoft Office 將納入由 GPT 提供支持的copilot,Google Docs 將集成 Bard 的建議。這些創(chuàng)新對(duì)寫作的影響會(huì)相當(dāng)深遠(yuǎn)。以下是利用人工智能幫助你寫作的部分方法。1. 寫草稿,任何東西的草稿。博客文章、論文、宣傳材料、演講、講座、選擇你自己的冒險(xiǎn)、腳本、短篇故事——只要你能想得到,人工智能都能做到,而且做得很好。你所要做的就是給它提示。提示制作并不神奇,但基本的提示會(huì)導(dǎo)致寫出來(lái)的東西很無(wú)聊,不過(guò)提高提示的水平并不難,只需與系統(tǒng)交互即可。只要稍加練習(xí),你就會(huì)發(fā)現(xiàn)人工智能系統(tǒng)當(dāng)作家的能力要強(qiáng)得多。2. 讓你寫得更好。把你的文本粘貼給人工智能。讓人工智能改進(jìn)內(nèi)容,或者讓人工智能給出建議,看看怎么更好地適合特定受眾。讓它寫出 10 份風(fēng)格截然不同的草稿。要求人工智能把文字變得更生動(dòng),或者添加例子。用它來(lái)激發(fā)靈感,讓你寫更好。3. 幫助你完成任務(wù)。人工智能可以做你沒(méi)有時(shí)間做的事情。像實(shí)習(xí)生一樣使用人工智能,讓它撰寫電子郵件、創(chuàng)建銷售模板、為你提供商業(yè)計(jì)劃的后續(xù)步驟等等。比方說(shuō)我曾在人工智能的幫助下在 30 分鐘內(nèi)完成了產(chǎn)品發(fā)布的各種支持工作。4. 解鎖你自己。面對(duì)挑戰(zhàn)艱巨的任務(wù)很容易讓人分心。人工智能是為你提供動(dòng)力的手段之一。不同模型生成效果對(duì)比需要擔(dān)心的一些事情:為了響應(yīng)你的請(qǐng)求,人工智能很容易會(huì)產(chǎn)生“幻覺(jué)”并生成看似合理的事實(shí)。它可以生成完全虛假且看似完全令人信服的內(nèi)容。我要強(qiáng)調(diào)的是:人工智能經(jīng)常撒謊。它告訴你的每一個(gè)事實(shí)或信息都有可能是不對(duì)的。你需要檢查一切。讓人工智能(指未連接到互聯(lián)網(wǎng)的模型)提供參考文獻(xiàn)、引言、引用以及互聯(lián)網(wǎng)信息尤其危險(xiǎn)。與其他模型相比,Bing 產(chǎn)生幻覺(jué)的情況往往要少一些,因?yàn)?GPT-4 生成的東西通常有事實(shí)依據(jù),而 Bing 接入互聯(lián)網(wǎng)意味著實(shí)際上它可以獲取事實(shí)。但幻覺(jué)不可能完全消除。另外要注意的是,人工智能沒(méi)法解釋自己,它只會(huì)讓你認(rèn)為它可以做出解釋。如果你要求它解釋為什么寫出了這樣的東西,它會(huì)給你一個(gè)看似合理但卻是完全虛構(gòu)的答案。當(dāng)你詢問(wèn)它的思維過(guò)程時(shí),它并不是去詢問(wèn)自己的行為,那只是在生成看上去像是它正在這樣做的文本。這使得理解系統(tǒng)存在的偏見(jiàn)變得非常具有挑戰(zhàn)性,盡管這些偏見(jiàn)幾乎肯定是存在的。它還可能被人不道德地用于操縱或欺騙。你要對(duì)這些工具的輸出負(fù)責(zé)。03圖像制作最透明的選項(xiàng):Adobe Firefly開(kāi)源選項(xiàng):Stable Diffusion最佳免費(fèi)選項(xiàng):Bing 或 Bing Image Creator(使用 DALL-E)、 Playgound (可使用多個(gè)模型)圖像質(zhì)量最佳的選項(xiàng):Midjourney可供大多數(shù)人使用的大型圖像生成器有四種:1. Stable Diffusion,這個(gè)工具是開(kāi)源的,任何一款高端的計(jì)算機(jī)都能跑。開(kāi)始要付出一些努力,因?yàn)槟愕脤W(xué)會(huì)正確地寫出提示,但一旦你能寫出好的提示,就會(huì)生成很好的結(jié)果。這個(gè)特別適合將人工智能與其他來(lái)源的圖像相結(jié)合。如果你選擇 Stable Diffusion,這里有一份很好的指南(請(qǐng)務(wù)必閱讀第 1 部分和第 2 部分:https://www.jonstokes.com/p/stable-diffusion-20-and-21-an-overview)。2. DALL-E,來(lái)自 OpenAI,Bing(必須是在創(chuàng)意模式下)以及 Bing Image Creator已經(jīng)植入了DALL-E。這個(gè)系統(tǒng)很可靠,但比 Midjourney 要差一些。3. 截止 2023 年中,Midjourney 是表現(xiàn)最好的系統(tǒng)。它的學(xué)習(xí)曲線在所有系統(tǒng)當(dāng)中是最低的:只需輸入“thing-you-want-to-see —v 5.2”(最后的 —v 5.2 很重要,這會(huì)提示人工智能采用最新的模型),你就會(huì)得到一個(gè)很好的結(jié)果。Midjourney 需要通過(guò) Discord 使用。這里是 Discord 的使用指南。4. Adobe Firefly,已內(nèi)置到多款 Adobe 產(chǎn)品之中,但在質(zhì)量方面落后于 DALL-E 和 Midjourney 。不過(guò),其他那兩個(gè)模型并未交代清楚用于訓(xùn)練人工智能的圖像來(lái)源,但 Adobe 已聲明自己僅使用其有權(quán)使用的圖像。以下是這幾款工具的對(duì)比(每個(gè)圖像都標(biāo)記了用什么模型):提示:“Fashion photoshoot of sneakers inspired by Van Gogh”——每個(gè)模型創(chuàng)作的第一張照片需要擔(dān)心的一些事情:這些系統(tǒng)是圍繞著模型構(gòu)建出來(lái)的,但這些模型會(huì)存在偏見(jiàn),因?yàn)橛脕?lái)訓(xùn)練模型的互聯(lián)網(wǎng)數(shù)據(jù)存在偏見(jiàn)(比方說(shuō),如果你讓它創(chuàng)建企業(yè)家的圖片,你可能會(huì)看到更多以男性而不是女性為主角的圖片,除非你指定要?jiǎng)?chuàng)建“女性企業(yè)家”)。用這個(gè)瀏覽器:https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer,可以看看實(shí)際存在哪些偏見(jiàn)。這些系統(tǒng)還使用了互聯(lián)網(wǎng)上的藝術(shù)來(lái)進(jìn)行訓(xùn)練,但卻是以不透明且可能在法律和道德上存在問(wèn)題的方式進(jìn)行訓(xùn)練的。盡管從技術(shù)上而言,你擁有所創(chuàng)建圖像的版權(quán),但法律規(guī)定仍然模糊。另外,目前這些模型是不創(chuàng)建文本的,只是創(chuàng)建了一堆看起來(lái)像文本的東西。但 Midjourney 已經(jīng)成功了。04提出想法最佳免費(fèi)選擇:Bing付費(fèi)選項(xiàng):ChatGPT 4.0,但由于有互聯(lián)網(wǎng)連接,Bing 可能更好。盡管(或者事實(shí)上,由于)人工智能存在諸多限制和怪異之處,但仍然非常適合生成點(diǎn)子。你經(jīng)常需要有很多想法才能想出好想法,而人工智能擅長(zhǎng)以量取勝。通過(guò)提供正確的提示,你還可以迫使它變得非常有創(chuàng)意。在創(chuàng)意模式下要求 Bing 找出你最喜歡的,不同尋常的創(chuàng)意生成技術(shù),比方說(shuō) Brian Eno 的間接策略(oblique strategies)或馬歇爾·麥克盧漢(Mashall McLuhan) 的四分法,并應(yīng)用它們。或者要求提供一點(diǎn)很奇怪的東西,比如隨便拿個(gè)專利來(lái)獲得靈感,或者你最喜歡的超級(jí)英雄……05制作視頻最佳動(dòng)畫工具:D- iD ,用于為視頻里面的臉部制作動(dòng)畫。Runway v2 可用于文本生成視頻。最佳聲音克?。?/strong> ElevenLabs現(xiàn)在,生成這樣一段視頻已經(jīng)是小事一樁:包含完全由人工智能生成的角色、去讀完全由人工智能編寫的腳本、用人工智能制作的聲音說(shuō)話、由人工智能制作動(dòng)畫,這些通通沒(méi)問(wèn)題。它還可以對(duì)人進(jìn)行深度偽造。第一個(gè)商用的文本生成視頻工具最近也發(fā)布了,也就是 Runway v2。它可以創(chuàng)建 4 秒的短片,所以這更多的是對(duì)未來(lái)的可能性的一種演示,但如果你想了解這個(gè)領(lǐng)域?qū)?lái)會(huì)如何發(fā)展的話,值得一看。需要擔(dān)心的一些事情:深度偽造是一個(gè)大問(wèn)題,這些系統(tǒng)需要以合乎道德的方式去使用。06處理文檔和數(shù)據(jù)對(duì)于數(shù)據(jù)(以及對(duì)代碼有任何奇怪想法):Code Interpreter文檔處理: 大型文檔或同時(shí)處理多個(gè)文檔可用 Claude 2,Bing 側(cè)邊欄可用于小一點(diǎn)的文檔和網(wǎng)頁(yè)(側(cè)邊欄屬于 Edge 瀏覽器的一部分,可以“查看”瀏覽器里面的內(nèi)容,讓 Bing 處理相關(guān)信息,不過(guò)其上下文窗口的大小有限)。我上周寫了一篇關(guān)于 Code Interpreter 的文章。它是 GPT-4 的其中一種模式,在這種模式下,你可以上傳文件給該人工智能,去編寫和運(yùn)行代碼,還可以下載該人工智能提供的結(jié)果。它可以用來(lái)執(zhí)行程序、進(jìn)行數(shù)據(jù)分析(盡管你需要對(duì)統(tǒng)計(jì)數(shù)據(jù)和數(shù)據(jù)有足夠了解才能檢查它做得好不好)以及創(chuàng)建各種文件、網(wǎng)頁(yè)甚至游戲。盡管自發(fā)布以來(lái),關(guān)于未經(jīng)訓(xùn)練的人用它進(jìn)行分析的相關(guān)風(fēng)險(xiǎn)存在很多爭(zhēng)論,但許多測(cè)試過(guò) Code Interpreter 的專家都對(duì)它的能力印象深刻,以至于一篇論文聲稱這個(gè)東西會(huì)要求我們改變培訓(xùn)數(shù)據(jù)科學(xué)家的方式。我還編寫了初始提示來(lái)設(shè)置 Code Interpreter,好做出有用的數(shù)據(jù)可視化。初始提示給出了良好圖表設(shè)計(jì)的一些基本原則,并提醒它可以輸出多種文件。鏈接參見(jiàn)此處:https://t.co/m4yAdKROiJ至于文本處理,尤其是 PDF 的處理,Claude 2 到目前為止表現(xiàn)非常出色。我試過(guò)將整本書(shū)粘貼到以前版本的 Claude 里,效果令人印象深刻,而且新模型更加強(qiáng)大。我還喂給它大量復(fù)雜的學(xué)術(shù)文章并要求它給出結(jié)果摘要,它做得很好!甚至更好的是,你還可以提出后續(xù)問(wèn)題,比方說(shuō):這個(gè)方法的證據(jù)是什么?作者得出了什么結(jié)論?等等…需要擔(dān)心的一些事情:這些系統(tǒng)仍然會(huì)產(chǎn)生幻覺(jué),盡管是以更為受限的方式出現(xiàn)。如果你想確保準(zhǔn)確性,就得檢查生成的結(jié)果。07獲取信息及學(xué)習(xí)東西最佳免費(fèi)選擇:Bing付費(fèi)選項(xiàng):通常 Bing 是最好的。如果是兒童的話,可汗學(xué)院的 Khanmigo 提供了由 GPT-4 支持的人工智能學(xué)習(xí)輔導(dǎo),效果不錯(cuò)。如果你打算把人工智能當(dāng)作搜索引擎的話,我的建議是也許不要這樣做。產(chǎn)生幻覺(jué)的風(fēng)險(xiǎn)很高,而且大多數(shù)人工智能都沒(méi)有連接到互聯(lián)網(wǎng)(這就是為什么我建議你用 Bing。谷歌的人工智能 Bard 產(chǎn)生的幻覺(jué)更多)。不過(guò),根據(jù)最近的一項(xiàng)試點(diǎn)研究,有部分證據(jù)表明,如果謹(jǐn)慎使用的話,相對(duì)于搜索,人工智能往往能提供更有用的答案。特別是在搜索引擎表現(xiàn)不太好的情況下,比方說(shuō)技術(shù)支持、決定去哪里吃飯或獲取建議,以 Bing 作為起點(diǎn)往往要比用谷歌好。這是一個(gè)正在迅速發(fā)展的領(lǐng)域,但你現(xiàn)在應(yīng)該小心使用。畢竟你不想惹上麻煩吧。但更令人興奮的是利用人工智能來(lái)輔助教育的可能性,包括幫助我們自己學(xué)習(xí)。我已經(jīng)寫過(guò)關(guān)于如何將人工智能用于教學(xué)并讓教師的生活變得更輕松、課程變得更有效的文章,但人工智能也可以用于自主學(xué)習(xí)。你可以讓人工智能解釋概念,一般可以獲得非常好的結(jié)果。鑒于我們知道人工智能可能會(huì)產(chǎn)生幻覺(jué),所以明智的做法是(小心?。?duì)照其他來(lái)源,仔細(xì)檢查任何的關(guān)鍵數(shù)據(jù)。08還有嗎?正如過(guò)去幾個(gè)月的發(fā)展所表明的那樣,由于技術(shù)的快速發(fā)展,現(xiàn)在介紹的這些將來(lái)可能會(huì)變成你用過(guò)的最糟糕的人工智能工具。我毫不懷疑自己很快就需要制作一本新的指南。但關(guān)于人工智能,請(qǐng)記住這兩個(gè)關(guān)鍵點(diǎn)仍然是正確的:1. 人工智能是一種工具,但未必總是合適的工具。鑒于人工智能存在弱點(diǎn),請(qǐng)仔細(xì)考慮它是否適合你計(jì)劃應(yīng)用它的目的。2. 有很多道德問(wèn)題需要注意。人工智能可能會(huì)被用來(lái)侵犯版權(quán)、作弊、竊取他人的作品或進(jìn)行操縱。特定人工智能模型的開(kāi)發(fā)方式以及誰(shuí)從對(duì)它的使用中受益往往是個(gè)很復(fù)雜的問(wèn)題,現(xiàn)階段還不是特別清楚。最終,你有責(zé)任以合乎道德的方式去使用這些工具。