【編者按】:Node.js從2009年誕生至今,已經(jīng)發(fā)展了兩年有余,其成長的速度有目共睹。從在github的訪問量超過Rails,到去年底Node.jsS創(chuàng)始人Ryan Dalh加盟Joyent獲得企業(yè)資助,再到今年發(fā)布Windows移植版本,Node.js的前景獲得了技術(shù)社區(qū)的肯定。InfoQ一直在關(guān)注Node.js的發(fā)展,在今年的兩次Qcon大會(北京站和杭州站)都有專門的講座。為了更好地促進Node.js在國內(nèi)的技術(shù)推廣,我們決定開設(shè)“深入淺出Node.js”專欄,邀請來自Node.js領(lǐng)域的布道師、開發(fā)人員、技術(shù)專家來講述Node.js的各方面內(nèi)容,讓讀者對Node.js有更深入的了解,并且能夠積極投入到新技術(shù)的討論和實踐中。
專欄的第一篇文章《什么是Node.js》嘗試從各個角度來闡述Node.js的基本概念、發(fā)展歷史、優(yōu)勢等,對該領(lǐng)域不熟悉的開發(fā)人員可以通過本文了解Node.js的一些基礎(chǔ)知識。
有關(guān)Node.js的技術(shù)報道越來越多,Node.js的寫法也是五花八門,有寫成NodeJS的,有寫成Nodejs的,到底哪一種寫法最標準呢,我們不妨遵循官方的說法。在Node.js的官方網(wǎng)站上,一直將其項目稱之為”Node“或者”Node.js“,沒有發(fā)現(xiàn)其他的說法,”Node“用的最多,考慮到Node這個單詞的意思和用途太廣泛,容易讓開發(fā)人員誤解,我們采用了第二種稱呼——”Node.js“,js的后綴點出了Node項目的本意,其他的名稱五花八門,沒有確切的出處,我們不推薦使用。
看到Node.js這個名字,初學(xué)者可能會誤以為這是一個Javascript應(yīng)用,事實上,Node.js采用C++語言編寫而成,是一個Javascript的運行環(huán)境。為什么采用C++語言呢?據(jù)Node.js創(chuàng)始人Ryan Dahl回憶,他最初希望采用Ruby來寫Node.js,但是后來發(fā)現(xiàn)Ruby虛擬機的性能不能滿足他的要求,后來他嘗試采用V8引擎,所以選擇了C++語言。既然不是Javascript應(yīng)用,為何叫.js呢?因為Node.js是一個Javascript的運行環(huán)境。提到Javascript,大家首先想到的是日常使用的瀏覽器,現(xiàn)代瀏覽器包含了各種組件,包括渲染引擎、Javascript引擎等,其中Javascript引擎負責(zé)解釋執(zhí)行網(wǎng)頁中的Javascript代碼。作為Web前端最重要的語言之一,Javascript一直是前端工程師的專利。不過,Node.js是一個后端的Javascript運行環(huán)境(支持的系統(tǒng)包括*nux、Windows),這意味著你可以編寫系統(tǒng)級或者服務(wù)器端的Javascript代碼,交給Node.js來解釋執(zhí)行,簡單的命令類似于:
#node helloworld.js
Node.js采用了Google Chrome瀏覽器的V8引擎,性能很好,同時還提供了很多系統(tǒng)級的API,如文件操作、網(wǎng)絡(luò)編程等。瀏覽器端的Javascript代碼在運行時會受到各種安全性的限制,對客戶系統(tǒng)的操作有限。相比之下,Node.js則是一個全面的后臺運行時,為Javascript提供了其他語言能夠?qū)崿F(xiàn)的許多功能。
事件驅(qū)動這個詞并不陌生,在某些傳統(tǒng)語言的網(wǎng)絡(luò)編程中,我們會用到回調(diào)函數(shù),比如當(dāng)socket資源達到某種狀態(tài)時,注冊的回調(diào)函數(shù)就會執(zhí)行。Node.js的設(shè)計思想中以事件驅(qū)動為核心,它提供的絕大多數(shù)API都是基于事件的、異步的風(fēng)格。以Net模塊為例,其中的net.Socket對象就有以下事件:connect、data、end、timeout、drain、error、close等,使用Node.js的開發(fā)人員需要根據(jù)自己的業(yè)務(wù)邏輯注冊相應(yīng)的回調(diào)函數(shù)。這些回調(diào)函數(shù)都是異步執(zhí)行的,這意味著雖然在代碼結(jié)構(gòu)中,這些函數(shù)看似是依次注冊的,但是它們并不依賴于自身出現(xiàn)的順序,而是等待相應(yīng)的事件觸發(fā)。事件驅(qū)動、異步編程的設(shè)計(感興趣的讀者可以查閱筆者的另一篇文章《Node.js的異步編程風(fēng)格》),重要的優(yōu)勢在于,充分利用了系統(tǒng)資源,執(zhí)行代碼無須阻塞等待某種操作完成,有限的資源可以用于其他的任務(wù)。此類設(shè)計非常適合于后端的網(wǎng)絡(luò)服務(wù)編程,Node.js的目標也在于此。在服務(wù)器開發(fā)中,并發(fā)的請求處理是個大問題,阻塞式的函數(shù)會導(dǎo)致資源浪費和時間延遲。通過事件注冊、異步函數(shù),開發(fā)人員可以提高資源的利用率,性能也會改善。
從Node.js提供的支持模塊中,我們可以看到包括文件操作在內(nèi)的許多函數(shù)都是異步執(zhí)行的,這和傳統(tǒng)語言存在區(qū)別,而且為了方便服務(wù)器開發(fā),Node.js的網(wǎng)絡(luò)模塊特別多,包括HTTP、DNS、NET、UDP、HTTPS、TLS等,開發(fā)人員可以在此基礎(chǔ)上快速構(gòu)建Web服務(wù)器。以簡單的helloworld.js為例:
var http = require('http');http.createServer(function (req, res) { res.writeHead(200, {'Content-Type': 'text/plain'}); res.end('Hello World\n');}).listen(80, "127.0.0.1");
上面的代碼搭建了一個簡單的http服務(wù)器(運行示例部署在http://helloworld.cnodejs.net 下面我們來說說Node.js的特點。事件驅(qū)動、異步編程的特點剛才已經(jīng)詳細說過了,這里不再重復(fù)。 Node.js的性能不錯。按照創(chuàng)始人Ryan Dahl的說法,性能是Node.js考慮的重要因素,選擇C++和V8而不是Ruby或者其他的虛擬機也是基于性能的目的。Node.js在設(shè)計上也是比較大膽,它以單進程、單線程模式運行(很吃驚,對吧?這和Javascript的運行方式一致),事件驅(qū)動機制是Node.js通過內(nèi)部單線程高效率地維護事件循環(huán)隊列來實現(xiàn)的,沒有多線程的資源占用和上下文切換,這意味著面對大規(guī)模的http請求,Node.js憑借事件驅(qū)動搞定一切,習(xí)慣了傳統(tǒng)語言的網(wǎng)絡(luò)服務(wù)開發(fā)人員可能對多線程并發(fā)和協(xié)作非常熟悉,但是面對Node.js,我們需要接受和理解它的特點。由此我們是否可以推測出這樣的設(shè)計會導(dǎo)致負載的壓力集中在CPU(事件循環(huán)處理?)而不是內(nèi)存(還記得Java虛擬機拋出OutOfMemory異常的日子嗎?),眼見為實,不如來看看淘寶共享數(shù)據(jù)平臺團隊對Node.js的性能測試: 從上面的結(jié)果,我們可以看到在這樣的測試場景下,qps能夠達到16700次,內(nèi)存僅占用30M(其中V8堆占用22M),CPU則達到95%,可能成為瓶頸。此外,還有不少實踐者對Node.js做了性能分析,總的來說,它的性能讓人信服,也是受歡迎的重要原因。既然Node.js采用單進程、單線程模式,那么在如今多核硬件流行的環(huán)境中,單核性能出色的Node.js如何利用多核CPU呢?創(chuàng)始人Ryan Dahl建議,運行多個Node.js進程,利用某些通信機制來協(xié)調(diào)各項任務(wù)。目前,已經(jīng)有不少第三方的Node.js多進程支持模塊發(fā)布,專欄后面的文章會詳細講述Node.js在多核CPU下的編程。 Node.js的另一個特點是它支持的編程語言是Javascript。關(guān)于動態(tài)語言和靜態(tài)語言的優(yōu)缺點比較在這里不再展開討論。只說三點: 在上面的代碼中,我們需要在end事件中處理responseHTML變量,由于Javascript的閉包特性,我們可以在兩個回調(diào)函數(shù)之外定義responseHTML變量,然后在data事件對應(yīng)的回調(diào)函數(shù)中不斷修改其值,并最終在end事件中訪問處理。 2009年2月,Ryan Dahl在博客上宣布準備基于V8創(chuàng)建一個輕量級的Web服務(wù)器并提供一套庫。 2009年5月,Ryan Dahl在GitHub上發(fā)布了最初版本的部分Node.js包,隨后幾個月里,有人開始使用Node.js開發(fā)應(yīng)用。 2009年11月和2010年4月,兩屆JSConf大會都安排了Node.js的講座。 2010年年底,Node.js獲得云計算服務(wù)商Joyent資助,創(chuàng)始人Ryan Dahl加入Joyent全職負責(zé)Node.js的發(fā)展。 2011年7月,Node.js在微軟的支持下發(fā)布Windows版本。 雖然Node.js誕生剛剛兩年多,但是其發(fā)展勢頭逐漸趕超Ruby/Rails,我們在這里列舉了部分企業(yè)應(yīng)用Node.js的案例,聽聽來自客戶的聲音。 在社交網(wǎng)站LinkedIn最新發(fā)布的移動應(yīng)用中,NodeJS是該移動應(yīng)用的后臺基礎(chǔ)。LinkedIn移動開發(fā)主管Kiran Prasad對媒體表示,其整個移動軟件平臺都由NodeJS構(gòu)建而成: LinkedIn內(nèi)部使用了大量的技術(shù),但是在移動服務(wù)器這一塊,我們完全基于Node。 (使用它的原因)第一,是因為其靈活性。第二,如果你了解Node,就會發(fā)現(xiàn)它最擅長的事情是與其他服務(wù)通信。移動應(yīng)用必須與我們的平臺API和數(shù)據(jù)庫交互。我們沒有做太多數(shù)據(jù)分析。相比之前采用的Ruby on Rails技術(shù),開發(fā)團隊發(fā)現(xiàn)Node在性能方面提高很多。他們在每臺物理機上跑了15個虛擬服務(wù)器(15個實例),其中4個實例即可處理雙倍流量。容量評估基于負載測試的結(jié)果。 企業(yè)社會化服務(wù)網(wǎng)站Yammer則利用Node創(chuàng)建了針對其自身平臺的跨域代理服務(wù)器,第三方的開發(fā)人員可以通過該服務(wù)器實現(xiàn)從自身域托管的Javascript代碼與Yammer平臺API的AJAX通信。Yammer平臺技術(shù)主管Jim Patterson對Node的優(yōu)點和缺點提出了自己的看法: (優(yōu)點)因為Node是基于事件驅(qū)動和無阻塞的,所以非常適合處理并發(fā)請求,因此構(gòu)建在Node上的代理服務(wù)器相比其他技術(shù)實現(xiàn)(如Ruby)的服務(wù)器表現(xiàn)要好得多。此外,與Node代理服務(wù)器交互的客戶端代碼是由javascript語言編寫的,因此客戶端和服務(wù)器端都用同一種語言編寫,這是非常美妙的事情。 (缺點)Node是一個相對新的開源項目,所以不太穩(wěn)定,它總是一直在變,而且缺少足夠多的第三方庫支持??雌饋?,就像是Ruby/Rails當(dāng)年的樣子。 知名項目托管網(wǎng)站GitHub也嘗試了Node應(yīng)用。該Node應(yīng)用稱為NodeLoad,是一個存檔下載服務(wù)器(每當(dāng)你下載某個存儲分支的tarball或者zip文件時就會用到它)。GitHub之前的存檔下載服務(wù)器采用Ruby編寫。在舊系統(tǒng)中,下載存檔的請求會創(chuàng)建一個Resque任務(wù)。該任務(wù)實際上在存檔服務(wù)器上運行一個git archive命令,從某個文件服務(wù)器中取出數(shù)據(jù)。然后,初始的請求分配給你一個小型Ruby Sinatra應(yīng)用等待該任務(wù)。它其實只是在檢查memcache flag是否存在,然后再重定向到最終的下載地址上。舊系統(tǒng)運行大約3個Sinatra實例和3個Resque worker。GitHub的開發(fā)人員覺得這是Node應(yīng)用的好機會。Node基于事件驅(qū)動,相比Ruby的阻塞模型,Node能夠更好地處理git存檔。在編寫新下載服務(wù)器過程中,開發(fā)人員覺得Node非常適合該功能,此外,他們還里利用了Node庫socket.io來監(jiān)控下載狀態(tài)。 不僅在國外,Node的優(yōu)點也同樣吸引了國內(nèi)開發(fā)人員的注意,淘寶就實際應(yīng)用了Node技術(shù): MyFOX 是一個數(shù)據(jù)處理中間件,負責(zé)從一個MySQL集群中提取數(shù)據(jù)、計算并輸出統(tǒng)計結(jié)果。用戶提交一段SQL語句,MyFOX根據(jù)該SQL命令的語義,生成各個數(shù)據(jù)庫分片所需要執(zhí)行的查詢語句,并發(fā)送至各個分片,再將結(jié)果進行匯總和計算。 MyFOX的特點是CPU密集,無文件IO,并只處理只讀數(shù)據(jù)。起初MyFOX使用PHP編寫,但遇到許多問題。例如PHP是單線程的,MySQL又需要阻塞查詢,因此很難并發(fā)請求數(shù)據(jù),后來的解決方案是使用nginx和dirzzle,并基于HTTP協(xié)議實現(xiàn)接口,并通過curl_multi_get命 令進行請求。不過MyFOX項目組最終還是決定使用Node.js來實現(xiàn)MyFOX。 選擇Node.js有許多方面的原因,比如考慮了興趣及社區(qū)發(fā)展,同時也希望可以提高并發(fā)能力,榨干CPU。例如,頻繁地打開和關(guān)閉連接會讓大量端口處于等待狀態(tài),當(dāng)并發(fā)數(shù)量上去之后,時常會因為端口不夠用(處于TIME_WAIT狀態(tài))而導(dǎo)致連接失敗。之前往往是通過修改系統(tǒng)設(shè)置來減少等待時間以繞開這個錯誤,然而使用連接池便可以很好地解決這個問題。此外,以前MyFOX會在某些緩存失效的情況下出現(xiàn)十分密集的訪問壓力,使用 Node.js便可以共享查詢狀態(tài),讓某些請求“等待片刻”,以便系統(tǒng)重新填充緩存內(nèi)容。 本文簡要介紹了Node.js的基本知識,包括概念、特點、歷史、案例等等。作為一個僅僅2歲的平臺,Node.js的發(fā)展勢頭有目共睹,越來越多的企業(yè)開始關(guān)注并嘗試Node.js,前后端開發(fā)人員應(yīng)該了解相關(guān)的內(nèi)容。 [2] http://beakkon.com/geek/node.js/why-node.js-single-thread-event-loop-javascript [3] http://www.tbdata.org/archives/1285 [4] http://www.infoq.com/interviews/node-ryan-dahl [5] http://www.infoq.com/cn/news/2011/08/enterprise-nodejs [6] http://www.infoq.com/cn/news/2010/11/nodejs-joyent [7] http://www.infoq.com/cn/news/2011/06/node-exe [8] http://nodenode.com/post/1176414531/node-js-a-short-history [9] http://www.infoq.com/cn/news/2011/05/nodeparty-hangzhou 【編者按】:本專欄歡迎有志于宣傳和推廣Node.js的布道師、開發(fā)人員和技術(shù)專家投稿,有意者請通過郵件與本專欄主持人崔康(cuikang[at]infoq.com)聯(lián)系。Node.js的特點
var hostRequest = http.request(requestOptions,function(response) { var responseHTML =''; response.on('data', function (chunk) { responseHTML = responseHTML + chunk; }); response.on('end',function(){ console.log(responseHTML); // do something useful });});
Node.js發(fā)展簡史
Node.js應(yīng)用案例
小結(jié)
參考文獻
聯(lián)系客服