您的位置:首頁技術文章
文章詳情頁

python-pandas創建Series數據類型的操作

瀏覽:2日期:2022-06-21 13:35:03
1.什么是pandas

python-pandas創建Series數據類型的操作

2.查看pandas版本信息

print(pd.__version__)

輸出:

0.24.13.常見數據類型

常見的數據類型:

- 一維: Series

- 二維: DataFrame

- 三維: Panel …

- 四維: Panel4D …

- N維: PanelND …

4.pandas創建Series數據類型對象1). 通過列表創建Series對象

array = ['粉條', '粉絲', '粉帶']# 如果不指定索引, 默認從0開始;s1 = pd.Series(data=array)print(s1)# 如果不指定索引, 默認從0開始;ss1 = pd.Series(data=array, index=[’A’, ’B’, ’C’])print(ss1)

輸出:

0 粉條1 粉絲2 粉帶dtype: objectA 粉條B 粉絲C 粉帶dtype: object2). 通過numpy的對象Ndarray創建Series;

n = np.random.randn(5) # 隨機創建一個ndarray對象;s2 = pd.Series(data=n)print(s2)# 修改元素的數據類型;ss2 = s2.astype(np.int)print(ss2)

輸出:

0 -1.6497551 0.6074792 0.9431363 -1.7940604 1.569035dtype: float640 -11 02 03 -14 1dtype: int643). 通過字典創建Series對象;

dict = {string.ascii_lowercase[i]:i for i in range(10)}s3 = pd.Series(dict)print(s3)

輸出:

a 0b 1c 2d 3e 4f 5g 6h 7i 8j 9dtype: int645.Series基本操作

共同部分:

import pandas as pdimport numpy as npimport stringarray = ['粉條', '粉絲', '粉帶']s1 = pd.Series(data=array)print(s1)

輸出:

0 粉條1 粉絲2 粉帶dtype: object1). 修改Series索引.index

print(s1.index) #輸出:RangeIndex(start=0, stop=3, step=1)s1.index = [’A’, ’B’, ’C’]print(s1)

輸出:

A 粉條B 粉絲C 粉帶dtype: object2). Series縱向拼接.append

s1.index = [’A’, ’B’, ’C’]array = ['粉條', '粉絲', '粉帶']# 如果不指定索引, 默認從0開始;s2 = pd.Series(data=array)s3 = s1.append(s2)print(s3)

輸出:

A 粉條B 粉絲C 粉帶0 粉條1 粉絲2 粉帶dtype: object3). 刪除指定索引對應的元素.drop(‘index’)

s3 = s3.drop(’C’) # 刪除索引為‘C’對應的值;print(s3)

輸出:

A 粉條B 粉絲0 粉條1 粉絲2 粉帶dtype: object4). 根據指定的索引查找元素

print(s3[’B’]) #粉絲s3[’B’] = np.nan #索引B處的值替換為缺失值print(s3)

輸出:

A 粉條B NaN0 粉條1 粉絲2 粉帶dtype: object5). 切片操作 — 同列表

print(s3[:2]) #顯示前兩個元素print(s3[::-1]) #逆序print(s3[-2:]) # 顯示最后兩個元素

輸出:

A 粉條B NaNdtype: object-------------------------2 粉帶1 粉絲0 粉條B NaNA 粉條dtype: object-------------------------1 粉絲2 粉帶dtype: object6.Series運算

先設置兩個Series對象:

import pandas as pdimport numpy as npimport strings1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))s2 = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8]))print(s1)print(s2)

python-pandas創建Series數據類型的操作

按照對應的索引進行計算, 如果索引不同,則填充為Nan;

1).加法add

print(s1 + s2)print(s1.add(s2))

輸出:

a NaNb NaNc 4.0d 6.0e 8.0f NaNg NaNh NaNdtype: float642).減法sub

print(s1 - s2)print(s1.sub(s2))

輸出:

a NaNb NaNc 0.0d 0.0e 0.0f NaNg NaNh NaNdtype: float643).乘法mul

print(s1 * s2)print(s1.mul(s2))

輸出:

a NaNb NaNc 4.0d 9.0e 16.0f NaNg NaNh NaNdtype: float644).除法div

print(s1 / s2)print(s1.div(s2))

輸出:

a NaNb NaNc 1.0d 1.0e 1.0f NaNg NaNh NaNdtype: float645).求中位數median

print(s1.median())

輸出:

2.06).求和sum

print(s1.sum())

輸出:

107).最大值max

print(s1.max())

輸出:

48).最小值min

print(s1.min())

輸出:

07.特殊的where方法

series中的where方法運行結果和numpy中完全不同

import pandas as pdimport numpy as npimport strings1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))print(s1)

輸出:

a 0b 1c 2d 3e 4dtype: int64

print(s1.where(s1 > 3))

大于3的顯示,不大于3的為NaN

python-pandas創建Series數據類型的操作

# 對象中小于3的元素賦值為10;print(s1.where(s1 > 3, 10))

python-pandas創建Series數據類型的操作

# 對象中大于3的元素賦值為10;print(s1.mask(s1 > 3, 10))

python-pandas創建Series數據類型的操作

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方,望不吝賜教。

標簽: Python 編程
相關文章:
国产综合久久一区二区三区