出處丨AI前線
近日,數(shù)據科學網站 KDnuggets 評選出了頂級 Python 庫 Top15,領域橫跨數(shù)據科學、數(shù)據可視化、深度學習和機器學習。和往常一樣,我們需要你們的意見,如果你覺得項目沒有上榜單是不公平的,或者對我們的選擇有異議,請在評論求留言讓我們知道。
圖 1:根據 GitHub star 和貢獻評選出的 2018 頂級 Python 庫。形狀大小與貢獻者數(shù)量成正比。
以下為 2018 年排名前 15 的 Python 庫(數(shù)據截止 2018 年 12 月 16 日):
1 TensorFlow(貢獻者:1757,貢獻:25756,Stars:116765)
“TensorFlow 是一個使用數(shù)據流圖進行數(shù)值計算的開源軟件庫。圖形節(jié)點表示數(shù)學運算,而圖形邊緣表示在它們之間流動的多維數(shù)據陣列(張量)。這種靈活的體系結構使用戶可以將計算部署到桌面、服務器或移動設備中的一個或多個 CPU/GPU,而無需重寫代碼。 ”
GitHub 地址:https://github.com/tensorflow/tensorflow
2 pandas(貢獻者:1360,貢獻:18441,Stars :17388)
“pandas 是一個 Python 包,、供快速,靈活和富有表現(xiàn)力的數(shù)據結構,旨在讓”關系“或”標記“數(shù)據使用既簡單又直觀。它的目標是成為用 Python 進行實際,真實數(shù)據分析的基礎高級構建塊?!?/p>
GitHub 地址:https://github.com/pandas-dev/pandas
3 scikit-learn(貢獻者:1218,貢獻者:23509,Stars :32326)
“scikit-learn 是一個基于 NumPy,SciPy 和 matplotlib 的機器學習 Python 模塊。它為數(shù)據挖掘和數(shù)據分析提供了簡單而有效的工具。SKLearn 所有人都可用,并可在各種環(huán)境中重復使用。
GitHub 地址:https://github.com/scikit-learn/scikit-learn
4 PyTorch(貢獻者:861,貢獻:15362,Stars:22763)
“PyTorch 是一個 Python 包,提供兩個高級功能:
你可以重復使用自己喜歡的 Python 軟件包,如 NumPy,SciPy 和 Cython,以便在需要時擴展 PyTorch?!?/p>
GitHub 地址:https://github.com/pytorch/pytorch
5 Matplotlib(貢獻者:778,貢獻:28094,Stars :8362)
“Matplotlib 是一個 Python 2D 繪圖庫,可以生成各種可用于出版品質的硬拷貝格式和跨平臺交互式環(huán)境數(shù)據。Matplotlib 可用于 Python 腳本,Python 和 IPython shell(例如 MATLAB 或 Mathematica),Web 應用程序服務器和各種圖形用戶界面工具包。”
GitHub 地址:https://github.com/matplotlib/matplotlib
6 Keras(貢獻者:856,貢者:4936,Stars :36450)
“Keras 是一個高級神經網絡 API,用 Python 編寫,能夠在 TensorFlow,CNTK 或 Theano 之上運行。它旨在實現(xiàn)快速實驗,能夠以最小的延遲把想法變成結果,這是進行研究的關鍵。”
GitHub 地址:https://github.com/keras-team/keras
7 NumPy(貢獻者:714,貢獻:19399,Stars:9010)
“NumPy 是使用 Python 進行科學計算所需的基礎包。它提供了強大的 N 維數(shù)組對象,復雜的(廣播)功能,集成 C / C ++ 和 Fortran 代碼的工具以及有用的線性代數(shù),傅里葉變換和隨機數(shù)功能。
GitHub 地址:https://github.com/numpy/numpy
8 SciPy(貢獻者:676,貢獻:20180,Stars:5188)
“SciPy(發(fā)音為”Sigh Pie“)是數(shù)學、科學和工程方向的開源軟件,包含統(tǒng)計、優(yōu)化、集成、線性代數(shù)、傅立葉變換、信號和圖像處理、ODE 求解器等模塊?!?/p>
GitHub 地址:https://github.com/scipy/scipy
9 Apache MXNet(貢獻者:653,貢獻:9060,Stars:15812)
“Apache MXNet(孵化)是一個深度學習框架,旨在提高效率和靈活性,讓你可以混合符號和命令式編程,以最大限度地提高效率和生產力。 MXNet 的核心是一個動態(tài)依賴調度程序,可以動態(tài)地自動并行化符號和命令操作。”
GitHub 地址:https://github.com/apache/incubator-mxnet
10 Theano(貢獻者:333,貢獻:28060,Stars :8614)
“Theano 是一個 Python 庫,讓你可以有效地定義、優(yōu)化和評估涉及多維數(shù)組的數(shù)學表達式。它可以使用 GPU 并實現(xiàn)有效的符號區(qū)分?!?/p>
GitHub 地址:https://github.com/Theano/Theano
11 Bokeh(貢獻者:334,貢獻:17395,Stars :8649)
“Bokeh 是一個用于 Python 的交互式可視化庫,可以在現(xiàn)代 Web 瀏覽器中實現(xiàn)美觀且有意義的數(shù)據視覺呈現(xiàn)。使用 Bokeh,你可以快速輕松地創(chuàng)建交互式圖表、儀表板和數(shù)據應用程序。”
GitHub 地址:https://github.com/bokeh/bokeh
12 XGBoost(貢獻者:335,貢獻:3557,Stars:14389)
“XGBoost 是一個優(yōu)化的分布式梯度增強庫,旨在變得高效、強大、靈活和便攜。它在 Gradient Boosting 框架下實現(xiàn)機器學習算法。XGBoost 提供了梯度提升決策樹(也稱為 GBDT,GBM),可以快速準確地解決許多數(shù)據科學問題,可以在主要的分布式環(huán)境(Hadoop,SGE,MPI)上運行相同的代碼,并可以解決數(shù)十億個示例之外的問題?!?/p>
GitHub 地址:https://github.com/dmlc/xgboost
13 Gensim(貢獻者:301,貢獻:3687,Stars :8295)
“Gensim 是一個用于主題建模、文檔索引和大型語料庫相似性檢索的 Python 庫,目標受眾是自然語言處理(NLP)和信息檢索(IR)社區(qū)?!?/p>
GitHub 地址:https://github.com/RaRe-Technologies/gensim
14 Scrapy(貢獻者:297,貢獻:6808,Stars :30507)
“Scrapy 是一種快速的高級 Web 爬行和 Web 抓取框架,用于抓取網站并從其頁面中提取結構化數(shù)據。它可用于從數(shù)據挖掘到監(jiān)控和自動化測試的各種用途?!?/p>
GitHub 地址:https://github.com/scrapy/scrapy
15 Caffe(貢獻者:270,貢獻:4152,Stars :26531)
“Caffe 是一個以表達、速度和模塊化為基礎的深度學習框架,由伯克利人工智能研究(BAIR)/ 伯克利視覺與學習中心(BVLC)和社區(qū)貢獻者開發(fā)?!?/p>
GitHub 地址:https://github.com/BVLC/caffe
參考鏈接:
https://www.kdnuggets.com/2018/12/top-python-libraries-2018.html
聯(lián)系客服