前不久瑞士達(dá)沃斯年會(huì)上,谷歌的創(chuàng)始人謝爾蓋布林說(shuō):他和其他的90年代計(jì)算科學(xué)家一樣,曾不相信AI能真的實(shí)現(xiàn)。所以當(dāng)初Google在人工智能方面的工作幾乎完全被他忽略了,完全沒(méi)有想到若干年后的現(xiàn)在,這個(gè)被稱作Google Brain的AI項(xiàng)目滲透到了搜索、圖片、廣告投放等幾乎全部的Google核心業(yè)務(wù)的基礎(chǔ)設(shè)施中。以至于他現(xiàn)在都很難想象AI應(yīng)用范圍的邊界和極限在哪里,覺(jué)得若干年前的自己就像是一個(gè)勒德分子(Luddite)。
真正震撼世界的是Alpha Go,這個(gè)人工智能控制的圍棋大腦在擊敗李世石之后又在2017年年初的野狐網(wǎng)絡(luò)快棋賽中化名Master連續(xù)60場(chǎng)橫掃當(dāng)今人類圍棋領(lǐng)域的頂尖高手,其中包括聶衛(wèi)平、古力和柯潔。
很短的時(shí)間內(nèi),AI激發(fā)了很多非計(jì)算機(jī)專業(yè)領(lǐng)域的熱情,這里面包括狂熱逐利的資本,大家投入了前所未有的激情和興趣探討智能交易的可行性,并紛紛投入其中想要拔得頭籌。
從事量化交易基礎(chǔ)設(shè)施開(kāi)發(fā)的Fintech公司們想必突然有種和謝爾蓋布林說(shuō)的那位叫Jeff Dean的人工智能專家一樣的感覺(jué),早年跟老板說(shuō)AI畫(huà)了一幅貓的圖畫(huà),老板無(wú)動(dòng)于衷,而今忽如一夜春風(fēng)來(lái),從無(wú)人關(guān)注到成為大紅大紫的網(wǎng)紅竟然在如此短暫的時(shí)間里發(fā)生了。
同樣是人類編寫(xiě)的計(jì)算機(jī)程序,在做數(shù)碼相片除紅眼和做錄音背景噪聲消除的時(shí)候,程序的實(shí)現(xiàn)方法和思路是完全不一樣的。但你可能很難相信,不論是下圍棋還是下象棋、甚至是做期貨,深度學(xué)習(xí)用到的程序核心算法是類似的標(biāo)準(zhǔn)算法,差異體現(xiàn)在數(shù)據(jù)整理能力、知識(shí)來(lái)源、知識(shí)挖掘的效率上。
深度學(xué)習(xí)AI的本質(zhì)是用計(jì)算機(jī)對(duì)人類大腦的模擬,人類大腦的思考力是日積月累經(jīng)過(guò)很多事件的沖刷洗禮之后沉淀下來(lái)的,涉及到對(duì)原始信息的記錄,以及針對(duì)原始信息的規(guī)律發(fā)現(xiàn)和推演,記錄->推理->再記錄,這就是一個(gè)學(xué)習(xí)的簡(jiǎn)單過(guò)程。
從計(jì)算機(jī)問(wèn)世到現(xiàn)在幾十年的絕大多數(shù)時(shí)間里,計(jì)算機(jī)只是做好了對(duì)原始信息的記錄(文字、圖片、聲音)和查找(搜索引擎就是干這個(gè)的)。至于其中的知識(shí)如何被表達(dá)、提取,那是近幾年的事情,也就是人類能掌握的計(jì)算能力、存儲(chǔ)能力突破某個(gè)閾值之后計(jì)算機(jī)才有條件記錄足夠多的原始信息并在可以接受的時(shí)間內(nèi)完成學(xué)習(xí)。
知識(shí)挖掘過(guò)程在深度學(xué)習(xí)中被稱作“訓(xùn)練”。AI跟人類比起來(lái),并不具備適應(yīng)性極強(qiáng)的輸入輸出設(shè)備(或者說(shuō)這種輸入輸出的AI還沒(méi)有達(dá)到可以廣泛應(yīng)用的程度),例如AI現(xiàn)在還沒(méi)法順暢地理解自然語(yǔ)言,所以沒(méi)有辦法通過(guò)讀書(shū)來(lái)完成對(duì)人類過(guò)往文明中蘊(yùn)含的知識(shí)的挖掘。
因此,訓(xùn)練過(guò)程中用到的數(shù)據(jù)一般都是被整理過(guò)的、高度結(jié)構(gòu)化數(shù)據(jù)。例如,我們通過(guò)一篇關(guān)于地緣政治的新聞判斷這篇新聞作者想要表達(dá)對(duì)油價(jià)多空的情緒就是這篇新聞中蘊(yùn)含的知識(shí),這篇新聞就是一種非結(jié)構(gòu)化的數(shù)據(jù),計(jì)算機(jī)想要挖掘出新聞中的知識(shí),就需要對(duì)新聞進(jìn)行預(yù)處理(例如分詞、詞頻統(tǒng)計(jì)、語(yǔ)法標(biāo)注),把預(yù)處理的結(jié)果作為計(jì)算機(jī)能消化得了的原始數(shù)據(jù)進(jìn)行喂食,然后使用通用的算法對(duì)這些數(shù)據(jù)進(jìn)行記錄和推理。
這一點(diǎn)決定了當(dāng)下的AI僅類似于計(jì)算機(jī)問(wèn)世初期的專用大型機(jī),只能學(xué)一種技能,是一種初級(jí)人工生命,很難具備人類大腦知識(shí)的廣泛性。更甚,這個(gè)階段的AI只是一種軟件而不是帶有耳朵、眼睛、四肢、軀干的完整個(gè)體,僅僅相當(dāng)于是一個(gè)大腦,大腦能針對(duì)外部條件變化發(fā)出一些決策指令,隨著學(xué)習(xí)的展開(kāi),這些指令的準(zhǔn)確性和實(shí)用價(jià)值會(huì)越來(lái)越高。
深度學(xué)習(xí)之于人腦的革命性在于訓(xùn)練時(shí)能挖掘到的知識(shí)量以及學(xué)習(xí)速度將會(huì)有質(zhì)的飛越,Alpha Go毫無(wú)疑問(wèn)地學(xué)習(xí)過(guò)人類有史以來(lái)的絕大多數(shù)棋局和棋譜,在此基礎(chǔ)上,它還在人類大腦所難以企及的深度進(jìn)行了推演和擴(kuò)展。
從純粹的主觀交易到AI交易之間的路比想象中崎嶇很多,如果把主觀交易比作冷兵器時(shí)代,那么包含學(xué)習(xí)、決策、執(zhí)行、風(fēng)控的全過(guò)程的AI交易差不多已經(jīng)進(jìn)入了核武器時(shí)代。在主觀交易和AI交易之間,隔著一個(gè)叫做量化交易的時(shí)代,有點(diǎn)像熱兵器時(shí)代,目前金融世界還停留在這里。
市場(chǎng)有一種神奇的自我修復(fù)能力,任何規(guī)律只要被發(fā)現(xiàn),并用以牟利,那么這種機(jī)會(huì)就會(huì)變得越來(lái)越難賺到錢(qián),直到規(guī)律失效,此間市場(chǎng)給規(guī)律發(fā)現(xiàn)者的利潤(rùn)就是市場(chǎng)支付的漏洞修復(fù)成本。時(shí)間足夠長(zhǎng),市場(chǎng)一定會(huì)消化掉某種可以牟利的規(guī)律,這一點(diǎn)叫市場(chǎng)消化效應(yīng)。
另一方面,當(dāng)模型的決策指令發(fā)出來(lái)的時(shí)候,你并沒(méi)有辦法保證這個(gè)指令能按照理想的價(jià)格和成本完成執(zhí)行,所以你不能保證實(shí)盤(pán)中某種策略的利潤(rùn)和理論測(cè)試中的一致(通常都會(huì)比理論測(cè)試的利潤(rùn)要低很多),這一點(diǎn)叫執(zhí)行成本效應(yīng)。
上述兩方面,是量化交易和AI交易同時(shí)需要面對(duì)的問(wèn)題。當(dāng)下的量化交易基金、投行解決這個(gè)問(wèn)題的方法是:建設(shè)強(qiáng)大的執(zhí)行和風(fēng)控信息化基礎(chǔ)設(shè)施,選擇多種策略,分散資金的風(fēng)險(xiǎn),依賴人類定期剔除無(wú)效的策略。
AI交易是量化交易的升級(jí)版,優(yōu)秀的量化交易系統(tǒng)加上模型發(fā)現(xiàn)引擎就能構(gòu)成AI交易的系統(tǒng)。
主觀交易的方法論是:找到能賺錢(qián)的人,管好他們帶來(lái)的風(fēng)險(xiǎn)。
量化交易的方法論是:人來(lái)發(fā)現(xiàn)知識(shí)、生成模型,軟件系統(tǒng)負(fù)責(zé)根據(jù)模型完成計(jì)算,發(fā)出指令、執(zhí)行指令、按照人類編寫(xiě)的條件和算法對(duì)盤(pán)位進(jìn)行風(fēng)控。
AI交易的方法論是:持續(xù)不斷地找到足夠多的原始數(shù)據(jù),用足夠有效的數(shù)據(jù)清洗和結(jié)構(gòu)化的方法,讓存儲(chǔ)能力足夠強(qiáng)大、運(yùn)算能力足夠強(qiáng)大的專業(yè)軟件系統(tǒng)學(xué)習(xí)其中的知識(shí),不斷重復(fù)這個(gè)過(guò)程?;谶@些知識(shí),有數(shù)以萬(wàn)計(jì)的交易模型被持續(xù)迭代地生成?;陬愃频闹R(shí),獨(dú)立于交易模型的生成,有數(shù)以萬(wàn)計(jì)的風(fēng)控模型被持續(xù)迭代地生成。交易模型和風(fēng)控模型的發(fā)現(xiàn)引擎對(duì)接量化交易系統(tǒng),就能構(gòu)成AI交易系統(tǒng)。AI交易完全依賴這套系統(tǒng)完成發(fā)現(xiàn)模型、產(chǎn)生指令、執(zhí)行指令、用風(fēng)控模型進(jìn)行風(fēng)控,自動(dòng)淘汰被市場(chǎng)消化的模型。
主觀交易時(shí)代,人的能力將會(huì)決定交易成??;量化交易時(shí)代,人的能力和系統(tǒng)的功能對(duì)交易成敗的影響各占一半;而AI交易時(shí)代,幾乎全部依賴系統(tǒng)的軟實(shí)力決定交易成敗。
這張圖帶給我們的信息是:隨著訓(xùn)練數(shù)據(jù)集的擴(kuò)大,深度學(xué)習(xí)AI的進(jìn)步幾乎是沒(méi)有天花板的,傳統(tǒng)的機(jī)器學(xué)習(xí)算法在數(shù)據(jù)量較小的時(shí)候訓(xùn)練出來(lái)的AI決策力高于深度學(xué)習(xí)AI。
其實(shí)在數(shù)據(jù)量比較小的時(shí)候,不論是傳統(tǒng)機(jī)器學(xué)習(xí)算法還是深度學(xué)習(xí)算法,都是打不過(guò)人類的。所以搜索空間較小的五子棋、象棋程序很早之前就能達(dá)到戰(zhàn)勝人類的水平,可偏偏圍棋不行。這其中的奧妙在于,圍棋的搜索空間太大了,計(jì)算機(jī)沒(méi)有能力在有限的時(shí)間里枚舉圍棋棋局后面所有的情況(五子棋和象棋可以),進(jìn)而做出最有利于自己的決策。Alpha Go也沒(méi)有能力枚舉所有的情況,但他另辟蹊徑,從大量的對(duì)弈和棋譜數(shù)據(jù)中學(xué)到了很多可能很難用人類語(yǔ)言描述的復(fù)雜規(guī)律,并用這些規(guī)律戰(zhàn)勝了人類。
圍棋尚且如此,更何況雜亂無(wú)章乃至于混沌的金融交易領(lǐng)域?
換句話說(shuō),玩深度學(xué)習(xí),數(shù)據(jù)量小了、學(xué)習(xí)的淺了沒(méi)有意義,這樣是戰(zhàn)勝不了人類的。所以,數(shù)據(jù)量的大小、計(jì)算能力的強(qiáng)弱決定了AI交易是否有意義。為什么Alpha Go能被Google發(fā)明而不是被微軟或者亞馬遜發(fā)明,核心的原因在于Google擁有這個(gè)星球最強(qiáng)大的云計(jì)算和大數(shù)據(jù)軟件平臺(tái)。云計(jì)算 大數(shù)據(jù)構(gòu)成的軟件平臺(tái)是策略發(fā)現(xiàn)的核心,持續(xù)不斷的擴(kuò)充訓(xùn)練數(shù)據(jù)集、改善計(jì)算和學(xué)習(xí)的軟環(huán)境是保持AI交易盈利能力的核心、核心、核心(重要的事說(shuō)三遍)。
好有一比:云計(jì)算是土壤、大數(shù)據(jù)是種子、AI是盛放的花朵。
道理好說(shuō),但這星球這么多年來(lái),也就出了一家谷歌。同樣是干搜索,百度搜出來(lái)的結(jié)果就沒(méi)法和谷歌比,這很難說(shuō)是百度工程師智商不如谷歌工程師造成的,這種差異折射出來(lái)的是一種長(zhǎng)期的優(yōu)勢(shì):系統(tǒng)的先進(jìn)性帶來(lái)的差異。
交易持續(xù)盈利,依賴的一定是長(zhǎng)期優(yōu)勢(shì)。舉個(gè)最簡(jiǎn)單的例子,所謂長(zhǎng)期優(yōu)勢(shì)中最好理解的就是規(guī)模優(yōu)勢(shì),簡(jiǎn)單粗暴但非常有效:你的對(duì)手扛不住深幅波動(dòng),爆倉(cāng)了,你錢(qián)多扛下來(lái)了,就成了最大的贏家。
谷歌和百度的對(duì)比已經(jīng)很明白了,信息時(shí)代的長(zhǎng)期優(yōu)勢(shì)不是意識(shí)形態(tài)、不是行政壁壘、而是系統(tǒng)的先進(jìn)性。規(guī)模優(yōu)勢(shì)、人才優(yōu)勢(shì)都建立在一開(kāi)始的系統(tǒng)先進(jìn)性基礎(chǔ)之上。這大概是先發(fā)優(yōu)勢(shì)轉(zhuǎn)化為長(zhǎng)期優(yōu)勢(shì)的典型例子吧。
AI交易時(shí)代更是如此,針對(duì)軟件系統(tǒng)持續(xù)不斷的、持續(xù)不斷的、持續(xù)不斷的(重要的事情說(shuō)三遍)投入換來(lái)的系統(tǒng)先進(jìn)性將構(gòu)成長(zhǎng)期優(yōu)勢(shì)中90%或者更多的內(nèi)容。
聯(lián)系客服