作者丨田曉旭
相信很多人對(duì)于 Hadoop 領(lǐng)域近期發(fā)生的事件都有所耳聞,先是曾估值 10 億美元的 MapR 向加州就業(yè)發(fā)展局提交文件,稱如果找不到新的投資人,公司將裁員 122 人,并關(guān)閉位于硅谷的總部公司,再是 Cloudera 在 6 月 6 日美股開(kāi)盤(pán)之后,股價(jià)暴跌 43%,公司估值從 41 億美元縮水為 14 億美元。
從 2006 年 1 月誕生以來(lái),Hadoop 就以黑馬之姿一路開(kāi)掛成為了火爆整個(gè)技術(shù)圈的“明星”技術(shù),為什么現(xiàn)在 Hadoop 領(lǐng)頭羊商業(yè)公司突然都不同程度的遭遇到了挫折?這是否意味著 Hadoop 發(fā)行版已經(jīng)幾近無(wú)路可走?Hadoop 商業(yè)公司的頹勢(shì)是否能夠反映 Hadoop 技術(shù)、生態(tài)的發(fā)展情況?Hadoop 的競(jìng)爭(zhēng)對(duì)手到底是誰(shuí)?…為了回答上述問(wèn)題,我們和星環(huán)科技研發(fā)總監(jiān)劉汪根進(jìn)行了長(zhǎng)達(dá)一小時(shí)的對(duì)話。
Hadoop 是 ASF 旗下的分布式系統(tǒng)基礎(chǔ)架構(gòu),我們現(xiàn)在看到的 Hadoop 生態(tài)有很多組件,但在劉汪根看來(lái),大部分組件產(chǎn)品化程度不夠,真正有技術(shù)生命力的組件只有兩個(gè) HDFS 和 Zookeeper。并且,這種技術(shù)生命力是長(zhǎng)久的,至少在如今的科技類企業(yè)和互聯(lián)網(wǎng)公司中,HDFS 和 Zookeeper 等已經(jīng)成為了標(biāo)配。
Hadoop 是個(gè)開(kāi)源軟件,那么圍繞 Hadoop 的商業(yè)公司都是如何盈利的呢?Cloudera 主要是依靠發(fā)布 Hadoop 商業(yè)版和商用工具、商業(yè)組件,同時(shí)提供企業(yè)生產(chǎn)環(huán)境中必需的運(yùn)維功能;Hortonworks 采用 100% 完全開(kāi)源的策略,盈利方式是技術(shù)服務(wù)支持;MapR 的盈利主要是通過(guò)用戶購(gòu)買軟件許可。
雖然三家公司實(shí)現(xiàn)盈利的方式有所出入,但是本質(zhì)上都是靠提供 Hadoop 相關(guān)的服務(wù)來(lái)盈利。而服務(wù)模式本身就存在很多問(wèn)題,一是它需要依賴人員的擴(kuò)張,二是其價(jià)值一定要高,能夠刺激企業(yè)不斷基于 Hadoop 產(chǎn)品開(kāi)發(fā)新的應(yīng)用。
服務(wù)帶動(dòng)產(chǎn)品的銷售模式必然要面臨成本和投入產(chǎn)出的問(wèn)題,劉汪根認(rèn)為:“這三家公司存在的最大問(wèn)題不是單子不夠多,而是單子太多,但每個(gè)單子都不掙錢,拖累整個(gè)業(yè)績(jī)不好?!本唧w來(lái)講,就是它們產(chǎn)品的標(biāo)準(zhǔn)化不足,其提供了各種組件的底層 API 給開(kāi)發(fā)者,缺少一個(gè)統(tǒng)一的開(kāi)發(fā)標(biāo)準(zhǔn),導(dǎo)致很難形成標(biāo)準(zhǔn)的開(kāi)發(fā)體驗(yàn)。社區(qū)的狀態(tài)很松散,想要達(dá)成某個(gè)標(biāo)準(zhǔn)化的事情往往需要很長(zhǎng)的時(shí)間,以大數(shù)據(jù)產(chǎn)品的安全為例,這在標(biāo)準(zhǔn)化產(chǎn)品中應(yīng)該是標(biāo)配,而在社區(qū)中可能花費(fèi)一個(gè)月的時(shí)間都搞不起來(lái),這就導(dǎo)致了這個(gè)產(chǎn)品是不可持續(xù)的,對(duì)于用戶來(lái)說(shuō),持續(xù)產(chǎn)品的價(jià)值太少,導(dǎo)致用戶不愿意繼續(xù)追加投資。
產(chǎn)品化程度低又會(huì)連鎖反應(yīng)導(dǎo)致銷售成本的增高,因?yàn)槿鄙俪晒Φ捻?xiàng)目和持續(xù)的收入來(lái)源,所以企業(yè)只能加大銷售力度,招聘非常多的銷售和售前工程師,在有些公司中這些人員甚至?xí)^(guò)總員工數(shù)的一半。
產(chǎn)品化程度低不只是 Hadoop 商業(yè)公司面臨的問(wèn)題,也是所有基于開(kāi)源軟件的商業(yè)公司面臨的問(wèn)題。不過(guò)也有一些開(kāi)源軟件的商業(yè)公司在產(chǎn)品化方面做得不錯(cuò),例如 Spark 商業(yè)公司 Databricks 的銷售人員占比沒(méi)那么高。這是因?yàn)?Databricks 商業(yè)化的思路不同,第一是它做了云化,第二是它很簡(jiǎn)單,并且做了兩個(gè)件事情讓 Spark 變得更加簡(jiǎn)單,一是 SparkSQL,這使得所有會(huì)寫(xiě) SQL 的人都可以使用,二是通過(guò) DataFrame 接口和 Python 讓數(shù)據(jù)分析人員可以更好的編程。
“成功的商業(yè)模式一定是可復(fù)制的!”
眾所周知,Cloudera、Hortonworks 和 MapR 這三家公司都是 Hadoop 發(fā)行版公司,但是大家可能不知道星環(huán)科技最早在國(guó)內(nèi)也是做 Hadoop 發(fā)行版,當(dāng)時(shí)的技術(shù)架構(gòu)組成為 HDFS+HBase+YARN+Spark,主要的客戶群體是運(yùn)營(yíng)商,但是在做的過(guò)程中就發(fā)現(xiàn)項(xiàng)目同質(zhì)化太嚴(yán)重了,客戶項(xiàng)目開(kāi)發(fā)的成本比較高,因此競(jìng)爭(zhēng)非常激烈。
2014 年,星環(huán)不得不開(kāi)始思考一個(gè)現(xiàn)實(shí)的問(wèn)題:“如何才能活下去?”創(chuàng)始人孫元浩先生最終下定決心,星環(huán)科技的產(chǎn)品必須要解決企業(yè)的痛點(diǎn)問(wèn)題才能更好的成長(zhǎng)。當(dāng)時(shí)數(shù)據(jù)倉(cāng)庫(kù)是個(gè)痛點(diǎn)問(wèn)題,但原來(lái)的數(shù)據(jù)庫(kù)都是單機(jī)的,所以星環(huán)科技就開(kāi)始琢磨利用分布式、內(nèi)存計(jì)算等技術(shù)打造一個(gè)分布式數(shù)據(jù)庫(kù)來(lái)解決數(shù)據(jù)倉(cāng)庫(kù)的問(wèn)題。這個(gè)數(shù)據(jù)庫(kù)就是后來(lái)我們熟知的國(guó)際上首個(gè)通過(guò)了 TPC-DS 基準(zhǔn)測(cè)試的 Inceptor 數(shù)據(jù)庫(kù)。
后來(lái),劉汪根在演講中回憶這段經(jīng)歷時(shí),也感嘆到:“如果星環(huán)科技只是將技術(shù)打包,推出 Hadoop 發(fā)行版,就失去了創(chuàng)新性和獨(dú)特性。”
Cloudera、Hortonworks 和 MapR 面臨窘境,星環(huán)科技從 Hadoop 發(fā)行版公司轉(zhuǎn)型成為了大數(shù)據(jù)與人工智能基礎(chǔ)軟件的公司,這是否意味著 Hadoop 發(fā)行版已經(jīng)失去了價(jià)值,沒(méi)有發(fā)展前景了?
對(duì)此,劉汪根表示:“這個(gè)問(wèn)題現(xiàn)在還很難講,但是我目前看到的情況,數(shù)據(jù)在公有云中的滲透率遠(yuǎn)沒(méi)有大家想象的那么高,所有人都覺(jué)得私有化環(huán)境或私有云里面的數(shù)據(jù)更安全,所以都愿意把數(shù)據(jù)掌握在自己的服務(wù)器上。對(duì)象存儲(chǔ)之所以在公有云中獲得了比較好的發(fā)展有兩個(gè)原因,一是因?yàn)槠渲写蟛糠謹(jǐn)?shù)據(jù)都是冷數(shù)據(jù)或者非結(jié)構(gòu)化數(shù)據(jù),真正重要的、結(jié)構(gòu)化的數(shù)據(jù)還是存儲(chǔ)在私有云中。這種情況在中國(guó)比例極高,在美國(guó)也不會(huì)低。第二個(gè)原因是成本,HDFS 和對(duì)象存儲(chǔ)各有特點(diǎn),對(duì)象存儲(chǔ)天生是 1.4 倍副本,而 HDFS 是 3 倍副本,光是這一項(xiàng)就有至少 2 倍的成本差異,所以公有云上對(duì)象存儲(chǔ)相對(duì)于 HDFS 有很好的競(jìng)爭(zhēng)力。但是私有云不一樣,私有云的場(chǎng)景下更加業(yè)務(wù)價(jià)值導(dǎo)向,追求速度和性能,想向私有云滲透的云產(chǎn)品往往都會(huì)需要補(bǔ)充技術(shù)實(shí)力,所以 Hadoop 技術(shù)對(duì)于私有云來(lái)說(shuō)還是非常有必要的,也是非常有用的?!?/p>
毫無(wú)疑問(wèn),Hadoop 三大商業(yè)公司與之前相比,已經(jīng)走了“下坡路”,那么 Hadoop 技術(shù)、Hadoop 社區(qū)的發(fā)展如何呢?劉汪根坦言:“原來(lái) Hadoop 社區(qū)的大佬很多都轉(zhuǎn)向其他項(xiàng)目了,整個(gè)社區(qū)的創(chuàng)新速度減緩了,對(duì)于大數(shù)據(jù)用戶來(lái)說(shuō),可能 Hadoop 社區(qū)的創(chuàng)新速度已經(jīng)無(wú)法滿足需求了。”
上圖是星環(huán)科技大數(shù)據(jù)技術(shù)架構(gòu)的演變歷程,其完成了從 Hadoop 平臺(tái)初期的“純藍(lán)”軟件棧到現(xiàn)在基本“全綠”軟件棧的轉(zhuǎn)變,即完成了自研產(chǎn)品和軟件對(duì)開(kāi)源軟件的替代。為什么要做這種轉(zhuǎn)變呢?首先,是因?yàn)?HDFS 和 YARN 等核心組件在實(shí)際應(yīng)用中存在痛點(diǎn),例如 HDFS 天生在海量小文件存儲(chǔ)方面就存在缺陷,YARN 只能用來(lái)調(diào)用長(zhǎng)生命周期的任務(wù)(如批處理任務(wù))。二是因?yàn)?Hadoop 社區(qū)的創(chuàng)新能力有點(diǎn)后勁不足,所以星環(huán)科技基于自己的思路進(jìn)行了重新設(shè)計(jì)。以 HDFS 為例,星環(huán)科技正在實(shí)現(xiàn)自己的存儲(chǔ)系統(tǒng) TDFS,在原有的分布式管理系統(tǒng)基礎(chǔ)上做了一套通用的 HDFS。
在劉汪根看來(lái)這一系列改造、替換的操作都是因?yàn)樾枨?,“HDFS 在設(shè)計(jì)之初主要解決了兩個(gè)問(wèn)題,一是相對(duì)廉價(jià)的分布式解決了存儲(chǔ)可擴(kuò)展性的問(wèn)題,二是分析性能比較均衡,支持用戶在此基礎(chǔ)上做很多創(chuàng)新來(lái)解決性能問(wèn)題。這兩件事情保證了 HDFS 技術(shù)能夠維持其生命力,”
從圖中我們可以看到,在整個(gè)星環(huán)科技技術(shù)架構(gòu)的演化過(guò)程中,其對(duì) Hadoop 核心組件 HDFS、YARN 等都做了一定程度的技術(shù)改造,在我們?cè)儐?wèn)是否有將這些改變貢獻(xiàn)給 Hadoop 社區(qū)時(shí),劉汪根無(wú)奈表示:“早期我們也嘗試過(guò)貢獻(xiàn)給社區(qū),但由于當(dāng)時(shí)星環(huán)科技的精力有限,并沒(méi)有完成。后續(xù)會(huì)根據(jù)公司自身的情況來(lái)決定?!?/p>
其實(shí),媒體很早就在接受這樣一個(gè)觀念,那就是“Hadoop 不代表大數(shù)據(jù)”。時(shí)至今日,Hadoop 在大數(shù)據(jù)領(lǐng)域到底扮演著什么樣的角色呢?劉汪根認(rèn)為:“Hadoop 不代表大數(shù)據(jù), 它是大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的一個(gè)分支,且這個(gè)分支中有部分技術(shù)變成了通用的技術(shù),成為大數(shù)據(jù)技術(shù)的標(biāo)配。但是,大數(shù)據(jù)技術(shù)還有很多其它分支,它們最終會(huì)演化成為新的大數(shù)據(jù)實(shí)現(xiàn)方式。”
早在 2013 年,Gartner 研究總監(jiān) Svetlana Sicular 就曾發(fā)文稱 Hadoop 過(guò)時(shí)了,在《2017 年數(shù)據(jù)管理技術(shù)成熟度曲線》報(bào)告中,Gartner 更是用極其顯眼的紅色標(biāo)識(shí)出 Hadoop 在到達(dá)“生產(chǎn)成熟期”之前即被淘汰。當(dāng)然,其它唱衰 Hadoop 的聲音也不在少數(shù),但是劉汪根認(rèn)為 Hadoop 技術(shù)是有長(zhǎng)久生命力的,很多技術(shù)已經(jīng)成為了大數(shù)據(jù)領(lǐng)域教科書(shū)般的存在,例如 2003 年 Google 連續(xù)發(fā)表的三篇論文奠定了大數(shù)據(jù)的框架基礎(chǔ),并基于此理論形成了 Hadoop 原始的“3+1”式軟件棧:即分布式文件系統(tǒng) HDFS、分布式計(jì)算 MapReduce、Hbase NoSQL 數(shù)據(jù)庫(kù),以及 YARN 資源調(diào)度。
當(dāng) Hadoop 不能再成為大數(shù)據(jù)的代名詞,下一代大數(shù)據(jù)技術(shù)將如何發(fā)展呢?通常來(lái)講,大數(shù)據(jù)技術(shù)棧總共包含有四層,分別是資源調(diào)度層、統(tǒng)一的分布式塊存儲(chǔ)管理層、統(tǒng)一的計(jì)算引擎層和統(tǒng)一的接口層,所以下一代的大數(shù)據(jù)技術(shù)一定是基于這四層進(jìn)行改造,以適應(yīng)新的應(yīng)用場(chǎng)景和需求。
資源調(diào)度層的改造:為了解決上層應(yīng)用對(duì)資源調(diào)度管理的問(wèn)題,出現(xiàn)了很多新的技術(shù),例如很多企業(yè)開(kāi)始研究利用容器編排技術(shù)來(lái)代替 YARN 進(jìn)行資源管理;
統(tǒng)一的分布式塊存儲(chǔ)管理層:過(guò)去的觀點(diǎn)認(rèn)為 HDFS 具有較好的通用性并在此之上搭載了各種引擎,實(shí)踐證明 HDFS 無(wú)法實(shí)現(xiàn)高效的數(shù)據(jù)庫(kù),新一代的大數(shù)據(jù)體系需要一個(gè)統(tǒng)一的分布式塊存儲(chǔ)管理層,以支持不同的數(shù)據(jù)庫(kù)類型。
統(tǒng)一的計(jì)算引擎層:過(guò)去常見(jiàn)的觀點(diǎn)是數(shù)據(jù)量小的時(shí)候可以采用混合架構(gòu),數(shù)據(jù)量大的時(shí)候采用 Hadoop,但是這種選擇存在效率低下的問(wèn)題,所以我們需要一個(gè)統(tǒng)一的計(jì)算引擎層來(lái)應(yīng)對(duì)數(shù)據(jù)倉(cāng)庫(kù)、OLTP 數(shù)據(jù)庫(kù)、搜索引擎、實(shí)時(shí)計(jì)算、圖數(shù)據(jù)庫(kù)等多種需求。
統(tǒng)一的接口層:多年前,通過(guò)統(tǒng)一的 SQL 接口層來(lái)降低大數(shù)據(jù)技術(shù)的使用門(mén)檻,就已經(jīng)達(dá)成了共識(shí)。如今,SQL 的支持度在不斷提升。
有關(guān)最近 Hadoop 事件的解讀,國(guó)內(nèi)外媒體都已經(jīng)做了不少的報(bào)道(我們也基于此做了一個(gè)合集,感興趣的小伙伴可以點(diǎn)擊查看)。如果總結(jié)一下大家的觀點(diǎn),不難發(fā)現(xiàn)大家普遍認(rèn)為 Hadoop 的“競(jìng)爭(zhēng)對(duì)手”主要有兩個(gè),一是 MongoDB、Elasticsearch 等其它開(kāi)源大數(shù)據(jù)相關(guān)產(chǎn)品,二是公有云。下面,我們就分別來(lái)談?wù)勥@兩個(gè)“Hadoop”的競(jìng)爭(zhēng)對(duì)手。
之所以得出了 MongoDB 、 Elasticsearch 等技術(shù)挑戰(zhàn)了 Hadoop 技術(shù)及相關(guān)產(chǎn)品的結(jié)論,是因?yàn)橥饷接^察到這樣一個(gè)情況:在 Hadoop 三大商業(yè)公司遭遇挫折的時(shí)候,MongoDB 數(shù)據(jù)庫(kù)產(chǎn)品受歡迎程度一直在增長(zhǎng),現(xiàn)在的受歡迎指數(shù)大約是 Oracle 和 MySQL 的三分之一,而五年前只有十分之一。這種受歡迎程度反過(guò)來(lái)良性地推動(dòng) MongoDB 公司的收入增長(zhǎng),最近收入已經(jīng)躍升了 78%。同樣的,Elasticsearch 分布式搜索和分析引擎背后的公司 Elastic 在去年員工數(shù)量翻了一番,最近一個(gè)季度的收入增長(zhǎng)了 70%。許多公司已經(jīng)轉(zhuǎn)用 Elastic 的產(chǎn)品進(jìn)行傳統(tǒng)的文本搜索和其他更多的搜索,比如英國(guó)倫敦的 Stansted 機(jī)場(chǎng)就使用 Elastic 工具來(lái)追蹤和可視化機(jī)場(chǎng)內(nèi)的人員和行李流量,并提供實(shí)時(shí)分析。
Hadoop 與 MongoDB、Elasticsearch 是否存在外媒描述的此消彼長(zhǎng)的情況呢?劉汪根表示這種情況是存在的,但是比例不會(huì)很高。大數(shù)據(jù)應(yīng)該包括分析數(shù)據(jù)庫(kù)、交易數(shù)據(jù)庫(kù)以及 NoSQL 四大類數(shù)據(jù),剛剛提到的 MongoDB 屬于文檔數(shù)據(jù)庫(kù),Elasticsearch 屬于檢索數(shù)據(jù)庫(kù),而 HBase 屬于列存數(shù)據(jù)庫(kù),它們是按照業(yè)務(wù)場(chǎng)景劃分的,本來(lái)是平行的,但是每個(gè)東西之間都有一定的邊界,HBase 和 Elasticsearch 之間場(chǎng)景非常明確,但是 HBase 和 MongoDB 是有一定沖突的,HBase 并發(fā)度高,但是很多人也用它來(lái)處理 JSON 的數(shù)據(jù),而 MongoDB 也在處理非結(jié)構(gòu)化的 JSON 數(shù)據(jù)。HBase 的優(yōu)勢(shì)在于存儲(chǔ),而 MongoDB 的優(yōu)勢(shì)在于可以修改 JSON 中的字段。但是重合的點(diǎn)真的非常少,僅限于處理 JSON 數(shù)據(jù)。
但是 HDFS 就比較尷尬了,HDFS 強(qiáng)調(diào)通用性,沒(méi)有比較突出的優(yōu)勢(shì),所有方向都是均衡的,所以市場(chǎng)份額很容易被其它大數(shù)據(jù)產(chǎn)品蠶食。例如,企業(yè)歷史數(shù)據(jù)既可以存在 MongoDB 中,也可以存在 HDFS 中。雖然,HDFS 的存儲(chǔ)成本會(huì)比較低,但如果企業(yè)一直是使用 MongoDB,且不太在乎成本差異,那么就會(huì)一直使用 MongoDB。不僅限于 MongoDB 和 Elasticsearch,如果企業(yè)有比較明確的數(shù)據(jù)處理需求,其它數(shù)據(jù)庫(kù)也會(huì)切掉 HDFS 的市場(chǎng)份額。當(dāng)然,如果出現(xiàn)了一個(gè)統(tǒng)一的分布式塊存儲(chǔ)管理層能夠解決各種類型的存儲(chǔ)需求管理,那么它將覆蓋 HDFS 原有的市場(chǎng),以及 MongoDB 和 Elasticsearch 的市場(chǎng)。
MongoDB 和 Elasticsearch 是否挑戰(zhàn)了 Hadoop 的地位?這個(gè)結(jié)論現(xiàn)在還不好確定,但是從營(yíng)收狀況來(lái)看,MongoDB 和 Elastic 兩家公司的營(yíng)收之和僅相當(dāng)于合并之前的 Cloudera 單家公司營(yíng)收,這說(shuō)明 MongoDB 和 Elasticsearch 還只是大數(shù)據(jù)生態(tài)里的一小部分。
為什么很多人都把公有云看作是 Hadoop 的競(jìng)爭(zhēng)對(duì)手?Hadoop 的主要應(yīng)用場(chǎng)景是廉價(jià)的存儲(chǔ),而有了云之后,存儲(chǔ)變得更加廉價(jià),AWS、微軟 Azure 和谷歌云打造的一站式云原生服務(wù)提供了完全集成的產(chǎn)品系列,獲取成本更低,擴(kuò)容更便宜。
但其實(shí) Hadoop 與公有云并不是天生對(duì)手,只是大家使用 Hadoop 的方式基本只有三種,要么找這三大商業(yè)公司,要么自己搭建,要么找公有云廠商。如果這已經(jīng)是飽和市場(chǎng),那么大家都是在切同一塊蛋糕,公有云難免會(huì)切到 Hadoop 商業(yè)公司原有的部分。不過(guò),從目前的情況來(lái)看,類似于 AWS 這樣的公司,其 Hadoop 的收入占比是非常小的。
在劉汪根看來(lái),相比于競(jìng)爭(zhēng)關(guān)系,公有云廠商和 Hadoop 商業(yè)公司更多的是合作關(guān)系。以 AWS 為例,其 Hadoop 研發(fā)團(tuán)隊(duì)的規(guī)模非常小,當(dāng)出現(xiàn)搞不定的問(wèn)題時(shí),就必須要去找 Hadoop 商業(yè)公司來(lái)解決。AWS 相當(dāng)于是個(gè)大渠道,擁有更強(qiáng)的溢價(jià)能力,但渠道的溢價(jià)能力再?gòu)?qiáng),最終還是需要背后公司的支持。而這對(duì)于 Hadoop 商業(yè)公司來(lái)說(shuō),不是壞事,反而是好事,因?yàn)楣性粕系哪J绞强蓮?fù)制的,可以幫助 Hadoop 商業(yè)公司觸探到更多用戶,Databricks 就是一個(gè)很好的例子。
關(guān)于 Hadoop 及其商業(yè)公司最近的發(fā)展頹勢(shì),我們已經(jīng)進(jìn)行了多方面、深層次的探索。總體來(lái)看,公有云、其它大數(shù)據(jù)產(chǎn)品與 Hadoop 競(jìng)爭(zhēng)的外因固然存在,但是 Hadoop 自身存在的問(wèn)題、社區(qū)創(chuàng)新能力不足以及其商業(yè)公司的盈利模式才是更主要的原因。
Hadoop 的技術(shù)偏底層,使用場(chǎng)景需要比較專業(yè)的技術(shù)基礎(chǔ),因此雖然是很好的技術(shù),但只能定位給有比較強(qiáng)技術(shù)能力的企業(yè)來(lái)使用,缺乏我們常說(shuō)的應(yīng)用創(chuàng)新或者模式創(chuàng)新。如果將其更好的產(chǎn)品化,譬如通過(guò) SQL on Hadoop 的技術(shù)打造完整的數(shù)據(jù)庫(kù)的體驗(yàn),那么其開(kāi)發(fā)者群體和視野將大大拓寬,技術(shù)的盤(pán)子就可以做得更大一點(diǎn),現(xiàn)階段的對(duì)手都會(huì)變盟友。
點(diǎn)個(gè)在看少個(gè) bug ??
聯(lián)系客服