本文已發(fā)表于網(wǎng)絡(luò)世界《奔跑吧,閃存!》,由于篇幅所限有刪節(jié),在這里發(fā)布的是完整的版本。
PCIe閃存相對SAS、SATA SSD的優(yōu)勢
當我們在十幾年前開始使用U盤時,只看到它的便攜與易用,估計很少有人還意識到閃存蘊藏著巨大的性能潛力。
今天,包括PCIe SSD在內(nèi)的閃存存儲在企業(yè)級應(yīng)用中的普及,歸根結(jié)底要歸功于半導(dǎo)體技術(shù)的發(fā)展。一方面,CPU性能越來越快,而發(fā)展緩慢的硬盤越發(fā)顯得跟不上;另一方面,以NAND閃存為代表的半導(dǎo)體存儲容量密度增大,而且越來越便宜。當那個拐點的時間到來,人們發(fā)現(xiàn)用小小的SSD能頂上幾十甚至上百塊硬盤的性能。
在企業(yè)級SSD發(fā)展初期,更多的應(yīng)用形式是安裝在EMC等存儲系統(tǒng)廠商的陣列中,替代磁盤的SAS SDD;或者服務(wù)器里面使用的SATA SSD。它們能夠與傳統(tǒng)硬盤控制器良好兼容,但當時主流的SATA和SAS接口帶寬只有3Gb/s或者6Gb/s(300-600MB/s),如今12Gb/s SAS還沒有普及,而x8 PCIe 2.0的理論帶寬已經(jīng)達到4GB/s,PCIe 3.0更是翻了一倍。
此外,針對傳統(tǒng)硬盤設(shè)計的SAS控制器自身也存在性能瓶頸,那么“有路何須搭橋”?直接將閃存做到PCIe卡上顯然速度和延時都會更好,服務(wù)器的存儲架構(gòu)也變得更加簡單,甚至實際量產(chǎn)的成本都會降低。
這就是今天PCIe SSD越發(fā)流行的原因。
產(chǎn)品架構(gòu)之間的PK
PCIe SSD從架構(gòu)設(shè)計方面來區(qū)分,包括FPGA/ASIC原生控制器方案和SAS IOC轉(zhuǎn)接SAS/SATA SSD模塊幾種方式。
SAS轉(zhuǎn)接方案:盡管筆者一直不看好SAS轉(zhuǎn)接方案的長遠發(fā)展,但兼容性好和成熟的架構(gòu)是它最大的優(yōu)勢。產(chǎn)品形態(tài)就是把SAS控制器連接的多個SSD盤RAID 0做在一張PCIe卡上,因此他們的Firmware(固件)和主機端驅(qū)動與SAS HBA基本通用,兼容絕大多數(shù)的服務(wù)器、各種操作系統(tǒng)版本都沒有問題。
SAS轉(zhuǎn)接方案的PCIe SSD現(xiàn)在很少宣傳其性能,畢竟這方面對比原生PCIe閃存控制器沒有優(yōu)勢。不過,如今幾乎所有PCIe閃存卡的性能對企業(yè)級客戶都不是問題(這也是我們把兼容性和可靠性放在前面講的原因),因此目前市面上Oracle Exadata數(shù)據(jù)庫一體機就用的SAS轉(zhuǎn)接PCIe SSD,最近還有國內(nèi)云和恩墨用EMC ScaleIO分布式SAN軟件搭建的Oracle預(yù)集成系統(tǒng)。
總的來說,SAS轉(zhuǎn)接PCIe SSD的多芯片控制方案從效率、成本上都不占優(yōu)。因此我們幾乎只看到LSI這一家先天有利的廠商(該部門如今已賣給希捷)在該領(lǐng)域表現(xiàn)尚可,Intel搞了一段過渡的SSD 910今年也推出自有ASIC控制器的NVMe產(chǎn)品了。
FPGA/ASIC原生方案:FPGA(現(xiàn)場可編程門陣列)的特點是設(shè)計靈活性強,在現(xiàn)有的芯片上通過不同的軟件(Firmware)就可以定義出差異化的閃存卡(盤),并且易于升級。這種低門檻方案非常適合中小規(guī)模的廠商。FPGA芯片的缺點是封裝尺寸和發(fā)熱量比ASIC較大,數(shù)量達到一定規(guī)模后成本不如ASIC。代表廠商是PCIe閃存卡領(lǐng)域的先行者,被SanDisk收購的Fusion-io,被HGST收購的Virident,以及國內(nèi)的Memblaze和Shannon寶存科技等。
圖1:曾經(jīng)是PCIe SSD單卡容量之冠的Fusion-io ioScale 3.2TB。當年它從Facebook走出,帶有為互聯(lián)網(wǎng)行業(yè)定制,高性價比的特點。令人可喜的是,今年全球率先達到單卡6.4TB容量的寶存科技是一家國內(nèi)廠商。
當PCIe閃存卡向著的容量越來越大、性能越來越高的方向發(fā)展,單卡的功耗就容易超過普通PCIe插槽的25W限制。像SFF-8639尺寸的2.5英寸驅(qū)動器形式,插在服務(wù)器的前端密度更大,還要注意散熱的問題。這時功能相對固定,但功耗較低的ASIC就體現(xiàn)出價值了。但設(shè)計出一顆優(yōu)秀的ASIC,僅僅是流片成功都要付出巨大的成本。目前比較多見的原生PCIe SSD ASIC有被芯片廠商PMC收購的IDT產(chǎn)品線,曾用于美光(Micron)的卡和盤;再有就是Intel和三星這樣的巨頭;我差點忘了Marvell和SandForce(幾經(jīng)轉(zhuǎn)手被希捷收購),盡管后者的原生PCIe SSD控制器應(yīng)該還不能量產(chǎn)出貨,但價格和對技術(shù)門檻要求低向來是他們的優(yōu)勢。
NVMe橫空出世
NVM Express(NVMe)是一種為企業(yè)級、客戶端系統(tǒng)所用的PCI Express SSD而專門設(shè)計的高性能、可擴展主機控制接口。它由Intel等十幾個發(fā)起成員公司領(lǐng)導(dǎo),以及數(shù)十個成員組成的行業(yè)聯(lián)盟共同開發(fā)。
NVMe主要解決的問題,或者說好處主要包括以下幾點
(1)
(2)
(3)
更多背景資料參見:
NVMe:PCIe SSD標準不斷完善,直指Fusion-io
除了性能考慮、驅(qū)動層面對熱插拔更好的支持之外,如果各家的PCIe SSD都同樣使用操作系統(tǒng)自帶的驅(qū)動,無疑對用戶是個好事情——至少能減少許多測試和驗證工作。但另一方面,SSD個性化的增強功能,目前主要是狀態(tài)監(jiān)控,乃至于進一步增值的緩存軟件、RAID支持等都可能要依賴廠商專門的驅(qū)動。如果是帶來同質(zhì)化的結(jié)果,最后拼供應(yīng)鏈和成本,這個市場剩下的估計只有三星、美光等NAND閃存廠商和Intel這樣的業(yè)界巨頭。
NVMe最初是在Fusion-io一家獨大的情況下出現(xiàn)。到了如今PCIe SSD百花齊放的時代,NVMe產(chǎn)品也接近成熟,但由于各家廠商的利益不一致,對NVMe支持的力度也不盡相同。
有幾位業(yè)內(nèi)朋友的觀點可以作為參考:“美國人和國內(nèi)對于NVMe的態(tài)度、普及時間上有些差距。美國人覺得NVMe沒有那么快成熟,而且熱插拔沒有行業(yè)標準,暫時還不可靠,產(chǎn)品之間不兼容。感覺國內(nèi)幾大家都已經(jīng)要撲上去了?!?/span>
“注意各家的驅(qū)動不兼容。都不是用的原始驅(qū)動,因為性能不夠。而且目前價格可真不便宜。
“某國外服務(wù)器廠商對NVMe的支持,推遲到2015年下半年,可能仍會延期。因性價比還不如任何一家‘非標準’的PCIe SSD?!?/span>
聯(lián)系客服