圖1:最好用的Python庫(根據(jù)GitHub的Star值與Contributor值繪制而成,圖標(biāo)大小與commit值成正比)
以下是2018年排名前15的Python庫(數(shù)據(jù)截止于2018年12月16日):
1.TensorFlow (Contributors – 1757, Commits – 25756, Stars – 116765)
TensorFlow是一款利用數(shù)據(jù)流圖來進(jìn)行數(shù)值計(jì)算的開源軟件庫。圖形節(jié)點(diǎn)代表數(shù)學(xué)運(yùn)算,圖形的邊代表在節(jié)點(diǎn)之間流動的多維數(shù)據(jù)數(shù)組(張量)。這種靈活的架構(gòu)使用戶無需重寫代碼便可在桌面、服務(wù)器或移動設(shè)備中的一個(gè)或多個(gè)CPU/GPU中進(jìn)行計(jì)算。
2.pandas (Contributors – 1360, Commits – 18441, Stars – 17388)
Pandas是一款Python包,能夠提供快速靈活且富有表現(xiàn)力的數(shù)據(jù)結(jié)構(gòu),使“關(guān)系”數(shù)據(jù)或“標(biāo)記”數(shù)據(jù)的使用既簡單又直觀。Pandas旨在成為運(yùn)用Python進(jìn)行實(shí)際、真實(shí)的數(shù)據(jù)分析的基礎(chǔ)性高級構(gòu)建塊(building block)。
3.scikit-learn (Contributors – 1218, Commits – 23509, Stars – 32326)
Scikit-learn是一款基于NumPy、SciPy與matplotlib的機(jī)器學(xué)習(xí)Python模塊,能夠?yàn)閿?shù)據(jù)挖掘(data mining)與數(shù)據(jù)分析提供簡單有效的工具。SKLearn面向所有人,并可在多種情況下重復(fù)使用。
4.PyTorch (Contributors – 861, Commits – 15362, Stars – 22763)
PyTorch是一款Python包,具有以下兩種高級功能:
· 利用強(qiáng)大的GPU加速實(shí)現(xiàn)張量計(jì)算(類似NumPy)
· 深度神經(jīng)網(wǎng)絡(luò)(以基于磁帶的autograd系統(tǒng)為基礎(chǔ))
你們還可以重復(fù)使用自己最喜歡的Python包,如NumPy、SciPy與Cython,以便在需要時(shí)擴(kuò)展PyTorch。
5.Matplotlib (Contributors – 778, Commits – 28094, Stars – 8362)
Matplotlib是一款Python 2D繪圖庫,能夠在跨平臺交互式環(huán)境中,以多種硬拷貝的格式生成高質(zhì)量圖形。 Matplotlib可用于Python腳本,Python和IPython shell(如MATLAB或Mathematica),Web應(yīng)用程序服務(wù)器和各種圖形用戶界面工具包。
6.Keras (Contributors – 856, Commits – 4936, Stars – 36450)
Keras 是一款用 Python 編寫的高級神經(jīng)網(wǎng)絡(luò) API,能夠以 TensorFlow, CNTK, 或Theano 為后端運(yùn)行。Keras 的開發(fā)重點(diǎn)是實(shí)現(xiàn)快速實(shí)驗(yàn)。做好研究的關(guān)鍵就是盡快將想法轉(zhuǎn)換為結(jié)果。
7.NumPy (Contributors – 714, Commits – 19399, Stars – 9010)
NumPy是用Python實(shí)現(xiàn)科學(xué)計(jì)算所需的基礎(chǔ)包,能夠提供強(qiáng)大的N維數(shù)組對象、復(fù)雜的(廣播)功能、集成C/C++和Fortran代碼的工具以及實(shí)用的線性代數(shù)、傅里葉變換和隨機(jī)數(shù)生成功能。
8.SciPy (Contributors – 676, Commits – 20180, Stars – 5188)
SciPy(發(fā)音為“Sigh Pie”)是數(shù)學(xué)、科學(xué)與工程方向的開源軟件,包含了諸多模塊:統(tǒng)計(jì)、優(yōu)化、集成、線性代數(shù)、傅里葉變換、信號和圖像處理、ODE求解器等。
9.Apache MXNet (Contributors – 653, Commits – 9060, Stars – 15812)
Apache MXNet(孵化)是一個(gè)深度學(xué)習(xí)框架,旨在提高效率與靈活度,能夠混合符號和命令式編程以實(shí)現(xiàn)效率和生產(chǎn)率的最大化。MXNet的核心是一個(gè)動態(tài)的依賴調(diào)度程序,可以自動并行符號和命令操作。
10.Theano (Contributors – 333, Commits – 28060, Stars – 8614)
Theano這款Python庫能讓用戶有效地定義、優(yōu)化與評估涉及多維數(shù)組的數(shù)學(xué)表達(dá)式,并且可以使用GPU,實(shí)現(xiàn)有效的符號區(qū)分。
11.Bokeh (Contributors - 334, Commits - 17395, Stars - 8649)
Bokeh是一款交互式可視化Python庫,能夠在現(xiàn)代Web瀏覽器中實(shí)現(xiàn)美觀且有意義的數(shù)據(jù)視覺呈現(xiàn)。有了Bokeh,你就可以輕松快速地創(chuàng)建交互式圖表、儀表板與數(shù)據(jù)應(yīng)用程序了。
12.XGBoost (Contributors – 335, Commits – 3557, Stars – 14389)
XGBoost 是一款優(yōu)化的分布式梯度提升庫(gradient boosting library),以高效、靈活與便攜為目標(biāo)。XGBoost在梯度提升框架下運(yùn)行機(jī)器學(xué)習(xí)算法,為用戶提供了梯度提升決策樹(也被稱為 GBDT、GBM),可以快速精準(zhǔn)地解決許多數(shù)據(jù)科學(xué)的問題。 相同的代碼可在主要的分布式環(huán)境中運(yùn)行(Hadoop、SGE與MPI),還可解決數(shù)十億案例之外的其他問題。
13.Gensim (Contributors - 301, Commits - 3687, Stars - 8295)
Gensim 是一款用于主題建模、文檔索引與大型語料庫相似性檢索的 Python 庫,其目標(biāo)受眾為自然語言處理(NLP)和信息檢索(IR)領(lǐng)域的群體。
14.Scrapy (Contributors – 297, Commits – 6808, Stars – 30507)
Scrapy 是一個(gè)快速、高級的 Web 爬取和抓取框架,用于爬取網(wǎng)站并從其頁面中提取結(jié)構(gòu)化數(shù)據(jù)。Scrapy廣泛應(yīng)用于數(shù)據(jù)挖掘、監(jiān)控與自動化測試等領(lǐng)域。
15.Caffe (Contributors – 270, Commits – 4152, Stars – 26531)
Caffe 是一個(gè)以表達(dá)、速度和模塊化為基礎(chǔ)的深度學(xué)習(xí)框架,由伯克利人工智能研究(BAIR)/ 伯克利視覺與學(xué)習(xí)中心(BVLC)和社區(qū)貢獻(xiàn)者共同開發(fā)。
聯(lián)系客服