本文為大家列舉了八大主流數(shù)據(jù)集來(lái)源,不僅包含大量的數(shù)據(jù)集信息,而且包含了描述、用法以及一些實(shí)施案例等。
1、Kaggle數(shù)據(jù)集
Kaggle數(shù)據(jù)集地址
https://www.kaggle.com/datasets
這是我最喜歡的數(shù)據(jù)集之一,每個(gè)數(shù)據(jù)集都對(duì)應(yīng)于一個(gè)小型社區(qū),你可以在其中討論數(shù)據(jù)、查找公共代碼,或者在其中創(chuàng)建自己的項(xiàng)目。這里包含了大量不同類型、不同結(jié)構(gòu)的數(shù)據(jù)集內(nèi)容。同時(shí),還可以在其中獲取到與每個(gè)數(shù)據(jù)集關(guān)聯(lián)的資料,其中包含了許多數(shù)據(jù)科學(xué)家們提供的數(shù)據(jù)集分析筆記等。
2、Amazon數(shù)據(jù)集
AWS開放數(shù)據(jù)地址
https://registry.opendata.aws/
這個(gè)數(shù)據(jù)集中包含了不同領(lǐng)域的數(shù)據(jù)內(nèi)容,例如:公共交通、生態(tài)資源、衛(wèi)星圖像等。同時(shí)提供了搜索功能,以幫助用戶找到所需的數(shù)據(jù)集,還有各種數(shù)據(jù)集的描述信息以及用例,非常易于使用。
數(shù)據(jù)集存儲(chǔ)在Amazon Web Services(AWS)資源中,對(duì)于使用AWS構(gòu)建自己機(jī)器學(xué)習(xí)實(shí)驗(yàn)的用戶來(lái)說(shuō),傳輸速度將非常塊。
3、UCI機(jī)器學(xué)習(xí)數(shù)據(jù)集
UCI數(shù)據(jù)集地址:
https://archive.ics.uci.edu/ml/datasets.html
這個(gè)數(shù)據(jù)集來(lái)自于加州大學(xué)信息與計(jì)算機(jī)科學(xué)學(xué)院,其中包含了100多個(gè)數(shù)據(jù)集。根據(jù)機(jī)器學(xué)習(xí)問(wèn)題的類型對(duì)數(shù)據(jù)集進(jìn)行分類,可找到單變量或多變量時(shí)間序列數(shù)據(jù)集,以及分類、回歸或推薦系統(tǒng)的數(shù)據(jù)集。
4、Google數(shù)據(jù)集搜索引擎
Google數(shù)據(jù)集搜索引擎
https://toolbox.google.com/datasetsearch
在2018年末,Google推出了數(shù)據(jù)集搜索服務(wù)。這是一個(gè)可以按名稱搜索數(shù)據(jù)集的搜索引擎,目標(biāo)是為數(shù)萬(wàn)個(gè)不同數(shù)據(jù)集存儲(chǔ)庫(kù)提供統(tǒng)一搜索入口,非常好用。
5、微軟數(shù)據(jù)集
在2018年7月,微軟與外界研究社區(qū)一起,發(fā)布了微軟研究開發(fā)數(shù)據(jù)。
微軟數(shù)據(jù)集地址:
https://msropendata.com/
它包含了云服務(wù)器中的數(shù)據(jù)存儲(chǔ)庫(kù),致力于促進(jìn)全球研究社區(qū)的協(xié)作,并在其中提供了一系列用于已發(fā)表研究的數(shù)據(jù)集內(nèi)容。
6、Awesome開放數(shù)據(jù)集收藏列表
Awesom Public Datasets
https://github.com/awesomedata/awesome-public-datasets
本數(shù)據(jù)集列表中,按主題整理了大量的數(shù)據(jù)集內(nèi)容,例如:生物學(xué)、經(jīng)濟(jì)學(xué)、教育等。其中列出的大多數(shù)數(shù)據(jù)集都是免費(fèi)的,但在使用任何數(shù)據(jù)集之前,均需檢查數(shù)據(jù)集的許可要求。
7、政府?dāng)?shù)據(jù)集
許多國(guó)家均在網(wǎng)絡(luò)上提供了多種公眾可用的政府?dāng)?shù)據(jù)集內(nèi)容,例如:
歐洲政府?dāng)?shù)據(jù)集
https://data.europa.eu/euodp/data/dataset
美國(guó)政府?dāng)?shù)據(jù)集
https://www.data.gov/
新西蘭政府?dāng)?shù)據(jù)集
https://catalogue.data.govt.nz/dataset
印度政府?dāng)?shù)據(jù)集
https://data.gov.in/
北愛(ài)爾蘭公共數(shù)據(jù)集
https://www.opendatani.gov.uk/
8、VisualData數(shù)據(jù)集
VisualData數(shù)據(jù)集
https://www.visualdata.io/
視覺(jué)數(shù)據(jù)包含了一些用于構(gòu)建計(jì)算機(jī)視覺(jué)模型的優(yōu)秀數(shù)據(jù)集,用戶可通過(guò)某個(gè)CV主題查詢,例如語(yǔ)義分割、圖像標(biāo)題、圖像生成、自動(dòng)駕駛汽車等內(nèi)容。
聯(lián)系客服