Dataset之RentListingInquries:RentListingInquries(Kaggle競(jìng)賽)數(shù)據(jù)集的簡(jiǎn)介、下載、案例應(yīng)用之詳細(xì)攻略
競(jìng)賽官網(wǎng):?https://www.kaggle.com/c/two-sigma-connect-rental-listing-inquiries/overview
? ? ? ? RentListingInquries比賽的描述。找到一個(gè)完美的地方打電話(huà)給你的新家應(yīng)該比瀏覽無(wú)窮無(wú)盡的清單。RentHop通過(guò)使用數(shù)據(jù)對(duì)租賃清單的質(zhì)量進(jìn)行排序,使公寓搜索更加智能。但是,盡管尋找完美的公寓已經(jīng)夠困難的了,但通過(guò)編程來(lái)組織和理解所有可用的房地產(chǎn)數(shù)據(jù)就更難了。二西格瑪和二西格瑪風(fēng)投的投資組合公司RentHop,邀請(qǐng)Kagglers在這場(chǎng)獨(dú)特的招聘競(jìng)爭(zhēng)中,釋放他們的創(chuàng)意引擎,發(fā)掘商業(yè)價(jià)值。
? ? ? Two Sigma邀請(qǐng)您在本次招聘競(jìng)賽中發(fā)揮您的才能。Kagglers將根據(jù)列表的創(chuàng)建日期和其他特性預(yù)測(cè)新列表收到的查詢(xún)數(shù)量。這樣做將有助于RentHop更好地處理欺詐控制,識(shí)別潛在的上市質(zhì)量問(wèn)題,并讓業(yè)主和代理商更好地了解租戶(hù)的需求和偏好。
? ? ? ?Two Sigma一直處于將技術(shù)和數(shù)據(jù)科學(xué)應(yīng)用于財(cái)務(wù)預(yù)測(cè)的前沿。盡管他們?cè)诮鹑陬I(lǐng)域的大數(shù)據(jù)、人工智能和機(jī)器學(xué)習(xí)方面取得的開(kāi)創(chuàng)性進(jìn)展,一直在推動(dòng)該行業(yè)向前發(fā)展,就像所有其他科學(xué)進(jìn)步一樣,他們也受到不斷進(jìn)步的驅(qū)動(dòng)。這一挑戰(zhàn)為競(jìng)爭(zhēng)對(duì)手提供了一個(gè)先睹為奇的機(jī)會(huì),使他們得以在金融領(lǐng)域之外搶先了解二西格瑪?shù)臄?shù)據(jù)科學(xué)工作。
? ? ? ?這是Kaggle2017年舉辦的Two Sigma Connect: Rental Listing Inquiries競(jìng)賽。在這個(gè)競(jìng)賽中,你將根據(jù)列表內(nèi)容,如文字描述、照片、臥室數(shù)量、價(jià)格等,來(lái)預(yù)測(cè)一個(gè)公寓租賃清單的受歡迎程度。數(shù)據(jù)來(lái)自renthop.com,一個(gè)公寓上市網(wǎng)站。這些公寓位于紐約市。目標(biāo)變量interest_level由清單在網(wǎng)站上運(yùn)行期間的查詢(xún)次數(shù)定義。
1、數(shù)據(jù)集介紹
(1)、File descriptions
train.json - the training set
test.json - the test set
sample_submission.csv - a sample submission file in the correct format
images_sample.zip - listing images organized by listing_id (a sample of 100 listings)
Kaggle-renthop.7z - (optional) listing images organized by listing_id. Total size: 78.5GB compressed. Distributed by BitTorrent (Kaggle-renthop.torrent).?
(2)、Data fields
? ? ? ? 根據(jù)公寓的listing 內(nèi)容,預(yù)測(cè)紐約市某公寓租賃listing的受歡迎程度。
標(biāo)簽: interest_level,該listing被咨詢(xún)的次數(shù)。
Listing內(nèi)容:
2、比賽排行榜
如有需要,可留言索取
ML之FE:利用FE特征工程對(duì)RentListingInquries(Kaggle競(jìng)賽)數(shù)據(jù)集實(shí)現(xiàn)房屋感興趣程度的多分類(lèi)預(yù)測(cè)
ML之FE:基于FE特征工程對(duì)RentListingInquries數(shù)據(jù)集進(jìn)行預(yù)處理并導(dǎo)出為三種格式文件(csv格式/txt格式/libsvm稀疏txt格式)
聯(lián)系客服