本文目錄
這是我Python數(shù)據(jù)分析系列文章的第一篇,主要介紹Python基礎(chǔ)部分,Python知識(shí)面比較廣,本文主要是介紹平時(shí)使用比較多的知識(shí)點(diǎn),更多的問題,大家可以后臺(tái)私信我。
1、第一個(gè)Python代碼
2、Python不區(qū)分大小寫,嚴(yán)格縮進(jìn)。
3、單行注釋以#開頭,多行注釋以''' '''(三引號(hào),可以是單引或者雙引)開始結(jié)尾。
數(shù)據(jù)類型是每一種編程語言的必有的知識(shí),Python也有其對(duì)應(yīng)的基本數(shù)據(jù)類型,本節(jié)主要介紹其四種基本類型:整形、浮點(diǎn)型、布爾型。
#賦值操作=,==表示等于int_value = 520type(int_value) #<class 'int'> float_value = 19.9type(float_value) #<class 'float'> boolean_value = Truetype(boolean_value) #<class 'bool'>
可以通過dir()或者h(yuǎn)elp()查看其對(duì)應(yīng)的屬性和方法,比如查看整形:
其中帶雙劃線的就是整形的可用方法,其他就是整形的屬性。
Python基本的數(shù)據(jù)結(jié)構(gòu)主要包括字符串、列表、元組、字典、集合等
字符串
1、基本方法
string_value = 'python' type(string_value) #<class 'str'>
字符串的內(nèi)置方法可以通過dir()查詢。
str1 = 'hello world'str1.split() #['hello','world']str1.find('hello') #0str1.replace('hello','Hello') #'Hello world'str1.capitalize() #'Hello world''_'.join(str1) #'h_e_l_l_0_ _w_o_r_l_d'
2、切片
tips:
列表
1、創(chuàng)建列表
l1 = []l2 = [1,2,3] #中括號(hào),以逗號(hào)間隔type(l1) #<class 'list'>
2、方法
列表是一種Python基本數(shù)據(jù)結(jié)構(gòu),是可變類型,支持刪減查等操作,相對(duì)來說遍歷查找效率較低,不過使用方面。
3、切片
與字符串類似,具體操作如下
l = [1,2,3,4,5,6,7,8]l[0] #[1],索引從0開始l[-1] [8]支持正負(fù)縮影,-1表示列表最后一個(gè)元素l[2:4] #[3,4] 注意左閉右開l[:] #[1,2,3,4,5,6,7,8],相當(dāng)于淺拷貝,在深淺拷貝知識(shí)點(diǎn)會(huì)講到l[::2] #[1,3,5,7],step為2l[::-1] #相當(dāng)于列表翻轉(zhuǎn)l l[:3] #[1,2,3,4,5,6,7,8,1,2,3][0]*5 #列表生成[0,0,0,0,0]
4、遍歷
元組
Python基本數(shù)據(jù)結(jié)構(gòu),不可變類型,不支持刪查等操作
t = tuple() #空元組,小括號(hào)t1 = (1,2,[3,4]) #注意嵌套t1[0] = 0 #TypeErrort1[2].remove(3) #(1,2,[4]) 注意列表可以刪減操作
1、方法
2、賦值
a,b = (1,2) #a=1,b=2a,*b1 = (1,2,3,4) #a=1,b=(2,3,4),注意*操作,函數(shù)參數(shù)有應(yīng)用
元組創(chuàng)建和遍歷優(yōu)于列表。
字典
用{}包含,以鍵值對(duì)的形式存在,劍指不可重復(fù),可變類型,支持基本操作。
1、方法
#基本方法cmp(d1, d2) #比較兩個(gè)字典元素。len(d1) #計(jì)算字典元素個(gè)數(shù),即鍵的總數(shù)。str(d1) #輸出字典可打印的字符串表示。type(d1) #返回輸入的變量類型,如果變量是字典就返回字典類型。# 訪問字典中的值d1['name'] # 查找不到會(huì)出錯(cuò)d1.get('name') # 查找不到,返回None,查找效率更高#1.get('name','not find') # 查找不到,返回not findd1.keys() #獲取字典所有的鍵的列表d1.values() #獲取字典所有的值的列表d1.items() #獲取字典的鍵值對(duì)#字典的修改d1['key'] = value #key存在即修改,key不存在即新增d1.setdefault('key',value) #新增鍵值對(duì),存在會(huì)出錯(cuò)d1.pop('key') #必須要傳值,因?yàn)樽值涫菬o序的d1.popitem() #隨機(jī)刪除一個(gè)del d1['key'] #刪除元素d1.clear() #清空字典d1.update(d2) #將d2更新到d1,如果key存在則修改,不存在則添加#字典的fromkeys方法創(chuàng)建字典,所有元素有一個(gè)默認(rèn)值{}.fromkeys(['key1', 'key2', 'key3'], 'value')d1.has_key('key')#判斷d1中是否有ke
集合
用大括號(hào)表示,或者用set(),集合里面的元素唯一、無序。
1、方法
#基本方法s1.add(5) #向集合中添加元素s1.remove(5) #從集合中刪除元素,當(dāng)刪除的元素不存在時(shí),返回TypeErrors1.discard(6) #從集合中刪除元素,當(dāng)刪除的元素不存在時(shí)不出錯(cuò)s1.pop() #任意刪除一個(gè)值,如果集合為空,返回KeyErrors1.clear() #清除集合中的值#對(duì)集合進(jìn)行排序sorted(s1,reverse=True)list(set(l1)) #刪除l1列表中的重復(fù)項(xiàng)#并交補(bǔ)s1.union(s2) #兩個(gè)集合取并集s1|s2 #等價(jià)上式s1.intersection(s2) #兩個(gè)集合取交集s1&s2 #等價(jià)上式s1.difference(s2) #兩個(gè)集合取差集,在s1中,不在s2中s1-s2 #等價(jià)上式s2.issubset(s1) #判斷s2是不是s1的子集
集合不能存儲(chǔ)可變對(duì)象,也能去判斷重復(fù)的對(duì)象。
語句可以稱之為代碼結(jié)構(gòu),在任何編程語言中都是基礎(chǔ)和重點(diǎn),不同代碼編寫,我們需要使用不同的語句。本節(jié)主要介紹Python語言的條件語句和循環(huán)語句。
條件語句
條件語句主要包括三種:
循環(huán)語句
循環(huán)語句主要包括for循環(huán)和white循環(huán)
#for循環(huán)for i in range(10): print(i)#在for循環(huán)中,有一個(gè)常用的內(nèi)置函數(shù)enumerate(),使用它比range()高效for index,value in enumerate([1,2,3,4,5]): print(index,value) #white循環(huán)n = 0while n<5: n = 1 print(n)
Python內(nèi)置函數(shù)和匿名函數(shù)
1、內(nèi)置函數(shù)
函數(shù)是是任何一門語言中最主要的部分之一,在介紹Python之前先了解一下,Python內(nèi)置的一些函數(shù)(所謂Python內(nèi)置函數(shù)是指Python里面已經(jīng)封裝好的,不需要人為去編寫,可以直接拿來使用的),下面是一些常用的Python內(nèi)置函數(shù)。
大部分內(nèi)置函數(shù)在Python前面部分已經(jīng)有所介紹,本節(jié)主要介紹三個(gè)內(nèi)置函數(shù)map(),filter(),reduce()(注:Python3中reduce不在是一個(gè)內(nèi)置函數(shù))以及和Python匿名函數(shù)的使用。
2、匿名函數(shù)
用 lambda 關(guān)鍵字來創(chuàng)建一個(gè)小的匿名函數(shù)。這個(gè)函數(shù)返回兩個(gè)參數(shù)的和:lambda a, b: a b 。lambda函數(shù)可以在需要函數(shù)對(duì)象的任何地方使用。它們?cè)谡Z法上限于單個(gè)表達(dá)式。從語義上來說,它們只是正常函數(shù)定義的語法糖。與嵌套函數(shù)定義一樣,lambda函數(shù)可以引用包含范圍的變量:
def make_incrementor(n): #和一個(gè)普通函數(shù)一樣 return lambda x: x nf = make_incrementor(42)f(0) #42f(1) #43#在一些如字典的排序中常用到pairs = [(1, 'one'), (2, 'two'), (3, 'three'), (4, 'four')]pairs.sort(key=lambda pair: pair[1])pairs #[(4, 'four'), (1, 'one'), (3, 'three'), (2, 'two')]
Python函數(shù)
1、Python函數(shù)定義
關(guān)鍵字 def 引入一個(gè)函數(shù)定義。它必須后跟函數(shù)名稱和帶括號(hào)的形式參數(shù)列表。構(gòu)成函數(shù)體的語句從下一行開始,并且必須縮進(jìn)。
2、函數(shù)參數(shù)形式
函數(shù)定義主要包括四種形式。
(1)必需參數(shù)
必需參數(shù)須以正確的順序傳入函數(shù)。調(diào)用時(shí)的數(shù)量必須和聲明時(shí)的一樣,不然函數(shù)運(yùn)行會(huì)出錯(cuò)。
def get_age(age): return 'he is {}'.format(age)get_age(28) #'he is 28'
(2)關(guān)鍵字參數(shù)
關(guān)鍵字參數(shù)和函數(shù)調(diào)用關(guān)系緊密,函數(shù)調(diào)用使用關(guān)鍵字參數(shù)來確定傳入的參數(shù)值。使用關(guān)鍵字參數(shù)允許函數(shù)調(diào)用時(shí)參數(shù)的順序與聲明時(shí)不一致,因?yàn)?Python 解釋器能夠用參數(shù)名匹配參數(shù)值。
注意:在函數(shù)調(diào)用中,關(guān)鍵字參數(shù)必須跟隨在位置參數(shù)的后面。傳遞的所有關(guān)鍵字參數(shù)必須與函數(shù)接受的其中一個(gè)參數(shù)匹配(比如 actor 不是函數(shù) parrot 的有效參數(shù)),它們的順序并不重要。這也包括非可選參數(shù),
(3)默認(rèn)參數(shù)
調(diào)用函數(shù)時(shí),如果沒有傳遞參數(shù),則會(huì)使用默認(rèn)參數(shù)。以下實(shí)例中如果沒有傳入 age 參數(shù),則使用默認(rèn)值。
def printinfo( name, age=35 ): print ('名字: ', name) print ('年齡: ', age) return #注意默認(rèn)參數(shù)的使用def add_end(L=[]): L.append('END') return L#連續(xù)運(yùn)行兩次,結(jié)果不一致add_end() #['END']add_end() #['END', 'END']#注:Python函數(shù)在定義的時(shí)候,默認(rèn)參數(shù)L的值就被計(jì)算出來了,即[],因?yàn)槟J(rèn)參數(shù)L也是一個(gè)變量,它指向?qū)ο骩],每次調(diào)用該函數(shù),如果改變了L的內(nèi)容,則下次調(diào)用時(shí),默認(rèn)參數(shù)的內(nèi)容就變了,不再是函數(shù)定義時(shí)的[]了。#正確寫法def add_end(L=None): if L is None: L = [] L.append('END') return L#兩次調(diào)用結(jié)果一致add_end() #['END']add_end() #['END']
(4)不定長(zhǎng)參數(shù)
不定長(zhǎng)參數(shù)以*或者**的形式存在。
迭代器和生成器
1、迭代器
迭代器的使用并使得 Python 成為一個(gè)統(tǒng)一的整體。 比如使用for 語句時(shí)會(huì)調(diào)用容器對(duì)象中的 iter()。 該函數(shù)返回一個(gè)定義了 __next__() 方法的迭代器對(duì)象,該方法將逐一訪問容器中的元素。 當(dāng)元素用盡時(shí),__next__() 將引發(fā) StopIteration 異常來通知終止 for 循環(huán)。 你可以使用 next() 內(nèi)置函數(shù)來調(diào)用 __next__() 方法:
s = 'abc'it = iter(s)it #<iterator object at 0x00A1DB50>>>> next(it)'a'>>> next(it)'b'>>> next(it)'c'>>> next(it)Traceback (most recent call last): File '<stdin>', line 1, in <module> next(it)StopIteration
看過迭代器協(xié)議的幕后機(jī)制,給你的類添加迭代器行為就很容易了。 定義一個(gè) __iter__() 方法來返回一個(gè)帶有 __next__() 方法的對(duì)象。 如果類已定義了 __next__(),則 __iter__() 可以簡(jiǎn)單地返回 self:
2、生成器
Generator 是一個(gè)用于創(chuàng)建迭代器的簡(jiǎn)單而強(qiáng)大的工具。 它們的寫法類似標(biāo)準(zhǔn)的函數(shù),但當(dāng)它們要返回?cái)?shù)據(jù)時(shí)會(huì)使用 yield 語句。 每次對(duì)生成器調(diào)用 next() 時(shí),它會(huì)從上次離開位置恢復(fù)執(zhí)行(它會(huì)記住上次執(zhí)行語句時(shí)的所有數(shù)據(jù)值)。 顯示如何非常容易地創(chuàng)建生成器的示例如下:
def reverse(data): for index in range(len(data)-1, -1, -1): yield data[index] for char in reverse('golf'): print(char)flog
可以用生成器來完成的操作同樣可以用迭代器來完成。 但生成器的寫法更為緊湊,因?yàn)樗鼤?huì)自動(dòng)創(chuàng)建 __iter__() 和 __next__() 方法。另一個(gè)關(guān)鍵特性在于局部變量和執(zhí)行狀態(tài)會(huì)在每次調(diào)用之間自動(dòng)保存。 這使得該函數(shù)相比使用 self.index 和 self.data 這種實(shí)例變量的方式更易編寫且更為清晰。除了會(huì)自動(dòng)創(chuàng)建方法和保存程序狀態(tài),當(dāng)生成器終結(jié)時(shí),它們還會(huì)自動(dòng)引發(fā) StopIteration。 這些特性結(jié)合在一起,使得創(chuàng)建迭代器能與編寫常規(guī)函數(shù)一樣容易。
類提供了一種組合數(shù)據(jù)和功能的方法。創(chuàng)建一個(gè)新類意味著創(chuàng)建一個(gè)新 類型 的對(duì)象,從而允許創(chuàng)建一個(gè)該類型的新 實(shí)例 。每個(gè)類的實(shí)例可以擁有保存自己狀態(tài)的屬性。一個(gè)類的實(shí)例也可以有改變自己狀態(tài)的(定義在類中的)方法。
類的定義
類定義內(nèi)的語句通常都是函數(shù)定義,但也允許有其他語句。
類對(duì)象
類對(duì)象支持兩種操作:屬性引用和實(shí)例化。
屬性引用 使用 Python 中所有屬性引用所使用的標(biāo)準(zhǔn)語法: obj.name。 有效的屬性名稱是類對(duì)象被創(chuàng)建時(shí)存在于類命名空間中的所有名稱。 因此,如果類定義是這樣的:
class MyClass: '''A simple example class''' i = 12345 def f(self): return 'hello world'
那么 MyClass.i 和 MyClass.f 就是有效的屬性引用,將分別返回一個(gè)整數(shù)和一個(gè)函數(shù)對(duì)象。 類屬性也可以被賦值,因此可以通過賦值來更改 MyClass.i 的值。 __doc__ 也是一個(gè)有效的屬性,將返回所屬類的文檔字符串: 'Asimple example class'。
類的 實(shí)例化 是使用函數(shù)表示法。 可以相像類對(duì)象就是會(huì)返回一個(gè)新的類實(shí)例的不帶參數(shù)的函數(shù)。 舉例來說(假設(shè)使用上述的類):
創(chuàng)建類的新實(shí)例 并將此對(duì)象分配給局部變量 x。
實(shí)例化操作會(huì)創(chuàng)建一個(gè)空對(duì)象。 許多類喜歡創(chuàng)建帶有特定初始狀態(tài)的自定義實(shí)例。 因此類定義可能包含一個(gè)名為 __init__() 的特殊方法,比如:
def __init__(self): self.data = []
當(dāng)一個(gè)類定義了 __init__() 方法時(shí),類的實(shí)例化操作會(huì)自動(dòng)為新創(chuàng)建的類實(shí)例發(fā)起調(diào)用 __init__()。而且__init__() 方法還可以有額外參數(shù)以實(shí)現(xiàn)更高靈活性。 在這種情況下,提供給類實(shí)例化運(yùn)算符的參數(shù)將被傳遞給 __init__()。 例如:
類和實(shí)例變量
實(shí)例變量用于每個(gè)實(shí)例的唯一數(shù)據(jù),而類變量用于類的所有實(shí)例共享的屬性和方法:
class Dog: def __init__(self, name): self.name = name self.tricks = [] def add_trick(self, trick): self.tricks.append(trick)d = Dog('Fido')e = Dog('Buddy')d.add_trick('roll over')e.add_trick('play dead')d.tricks#['roll over']e.tricks#['play dead'
類的繼承
一般情況下子類會(huì)繼承一些父類的方法,并切可能會(huì)對(duì)父類的一些方法進(jìn)行重寫。
Python有兩個(gè)內(nèi)置函數(shù)可被用于繼承機(jī)制:
從學(xué)習(xí)python的那一刻起,你就已經(jīng)準(zhǔn)備好了寫更長(zhǎng),更復(fù)雜的Python代碼了,這時(shí)候有必要討論一下代碼風(fēng)格。對(duì)于Python,PEP 8 已經(jīng)成為大多數(shù)項(xiàng)目所遵循的風(fēng)格指南;它促進(jìn)了一種非常易讀且令人賞心悅目的編碼風(fēng)格。每個(gè)Python開發(fā)人員都應(yīng)該在某個(gè)時(shí)候閱讀它。以下是為你提取的最重要的幾個(gè)要點(diǎn):
本文是Python數(shù)據(jù)分析系列文章的第一篇,簡(jiǎn)單的介紹一些Python語言特性,下一篇將帶來numpy庫的使用介紹。
聯(lián)系客服