九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
大數(shù)據(jù)理論課(-----pandas對DataFrame表格的切割、合并、去重)

一、表格創(chuàng)建的幾種方法

import pandas as pdimport numpy as np#1.pd.read_csv方法data=pd.read_csv(r"G:\大數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)庫\3.大數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)\meal_order_info.csv",encoding="GBK")#2.pd.read_sql_table方法import sqlalchemyconn=sqlalchemy.create_engine(r"sqlite:///G:\大數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)庫\0.engine數(shù)據(jù)庫\tesss.db")pd.read_sql_table("meal_order_detail1",conn)#3.pd.DataFrame方法t3=pd.DataFrame([],columns=["a","b","c"],index=[1,2,3])for i in t3.columns:    for j in t3.index:        t3.loc[j,i]=0print(t3)

二、表格合并的幾種方法

1.concat方法

import pandas as pdimport numpy as nptx=pd.DataFrame([],columns=list("ABCD"),index=range(1,5))for i in tx.columns:    for j in tx.index:        tx.loc[j,i]=i+str(j)ty=pd.DataFrame([],columns=list("BDF"),index=[2,4,6,8])for i in ty.columns:    for j in ty.index:        ty.loc[j,i]=i+str(j)#1.axis=0  表格上下連接  inner交集  outer并集t1=pd.concat([tx,ty],axis=0,join="inner",sort=True)  t2=pd.concat([tx,ty],axis=0,join="outer",sort=True)  #2.axis=1  表格左右連接  t3=pd.concat([tx,ty],axis=1,join="inner",sort=True)  t4=pd.concat([tx,ty],axis=1,join="outer",sort=True)  



2.append方法(上下連接)

import pandas as pdimport numpy as nppx1=tx.iloc[:,2:]px2=pd.DataFrame([],columns=["A","B"],index=[5])px1.append(px2)

3.merge方法(相同關(guān)鍵字合并)

import pandas as pdimport numpy as np#1.關(guān)鍵字不在同一行合并tx=pd.DataFrame([],columns=["A","B","Key"],index=range(1,5))for i in tx.columns:    for j in tx.index:        tx.loc[j,i]=i+str(j)tx2=pd.DataFrame([],columns=["C","D","Key"],index=range(1,5))for i in tx2.columns:    for j in tx2.index:        tx2.loc[j,i]=i+str(j)pd.merge(tx,tx2,left_on="Key",right_on="Key")#pd.merge(tx2,tx,left_on="Key",right_on="Key")

4.combine方法(數(shù)據(jù)補(bǔ)充)

t8=pd.DataFrame([[3,5],[4.6,np.nan]],columns=[0,1],index=[0,1])t9=pd.DataFrame([[np.nan,np.nan],[3,4.0]],columns=[0,1],index=[0,1])t10=t8.combine_first(t9)print(t8)print("**************")print(t9)print("**************")print(t10)

三、loc和iloc的區(qū)別

import pandas as pdimport numpy as npdata=pd.read_csv(r"G:\大數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)庫\3.大數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)\meal_order_info.csv",encoding="GBK")#1.loc用行列的名稱表示表格數(shù)據(jù)data.loc[3,"info_id"]data.loc[3:5,["info_id","emp_id"]]#2.用(x,y)純數(shù)字表示表格數(shù)據(jù)data.iloc[1,1]data.iloc[:,:2]

四、去重

import pandas as pdimport numpy as npdata=pd.read_csv(r"G:\大數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)庫\3.大數(shù)據(jù)實(shí)驗(yàn)數(shù)據(jù)\meal_order_info.csv",encoding="GBK")print(len(data["info_id"]))#1.drop_duplicates去重print(len(data["info_id"].drop_duplicates()))#2.set去重(數(shù)據(jù)的順序會改變)print(len(set(data["info_id"]))) #3.多列去重print(len(data.drop_duplicates(subset=["info_id","emp_id"])))

補(bǔ)充:fillna方法(當(dāng)里面沒有數(shù),默認(rèn)填寫)

tx=pd.DataFrame([],columns=list("ABCD"),index=range(1,5))tx.fillna(99)

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
用python做數(shù)據(jù)分析4|pandas庫介紹之DataFrame基本操作
Pandas 數(shù)據(jù)框增、刪、改、查、去重、抽樣基本操作
Python數(shù)據(jù)結(jié)構(gòu):數(shù)據(jù)框
Python 數(shù)據(jù)操作教程,如何從 PANDAS DATAFRAME 中刪除一列或多列
簡約而不簡單|值得收藏的Pandas基本操作指南
<font style="vertical-align: inherit;"><font style="vertical-align: inherit;
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服