简单学Pythonpanads库13dataframe提取区域数据

前面我们学习了提取dataframe中的一行或多行数据,今天我们学习提取dataframe中的区域数据,即从一个表格中选取一块儿长方形的小区域。

首先,还是用之前的表格:

df=pro.index_daily(trade_date="20231123",fields="ts_code,trade_date,pre_close,close,change,pct_chg")
df=df[:5].round(2)#保留两位小数
df

结果:

ts_code

trade_date

pre_close

close

change

pct_chg

0

000001.SH

20231123

3043.61

3061.86

18.25

0.60

1

000001CNY01.SH

20231123

3286.83

3306.53

19.70

0.60

2

000002.SH

20231123

3191.03

3210.15

19.11

0.60

3

000003.SH

20231123

231.39

232.48

1.10

0.47

4

000004.SH

20231123

2764.03

2785.42

21.39

0.77

1、用iloc方法选择区域(iloc中的参数是位置序号)

df.iloc[:4,:2]#提取前4行和前2列

返回:

ts_code

trade_date

0

000001.SH

20231123

1

000001CNY01.SH

20231123

2

000002.SH

20231123

3

000003.SH

20231123

再来一个数据不连续的:

df.iloc[[0,2,4],[3,5]] #提取第024行,35

返回:

close

pct_chg

0

3061.86

0.60

2

3210.15

0.60

4

2785.42

0.77

2、用loc方法选择区域(loc中的参数是行索引或列名称)

df.loc[:3,'trade_date':'close']#提取0-3行、trade_date-close

返回:

trade_date

pre_close

close

0

20231123

3043.61

3061.86

1

20231123

3286.83

3306.53

2

20231123

3191.03

3210.15

3

20231123

231.39

232.48

再来一个数据不连续的:

df.loc[[0,2,4],['trade_date','close']]

返回:

trade_date

close

0

20231123

3061.86

2

20231123

3210.15

4

20231123

2785.42

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/75049
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 2024 年 7 月 11 日
下一篇 2024 年 7 月 11 日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注