简单学Pythonpanads库13dataframe提取区域数据

股市刺客 • 2024 年 7 月 11 日下午2:48 • 量化 • 阅读 1

前面我们学习了提取dataframe中的一行或多行数据，今天我们学习提取dataframe中的区域数据，即从一个表格中选取一块儿长方形的小区域。

首先，还是用之前的表格：

df=pro.index_daily(trade_date="20231123",fields="ts_code,trade_date,pre_close,close,change,pct_chg")
df=df[:5].round(2)#保留两位小数
df

结果：

	ts_code	trade_date	pre_close	close	change	pct_chg
0	000001.SH	20231123	3043.61	3061.86	18.25	0.60
1	000001CNY01.SH	20231123	3286.83	3306.53	19.70	0.60
2	000002.SH	20231123	3191.03	3210.15	19.11	0.60
3	000003.SH	20231123	231.39	232.48	1.10	0.47
4	000004.SH	20231123	2764.03	2785.42	21.39	0.77

1、用iloc方法选择区域（iloc中的参数是位置序号）

df.iloc[:4,:2]#提取前4行和前2列

返回：

	ts_code	trade_date
0	000001.SH	20231123
1	000001CNY01.SH	20231123
2	000002.SH	20231123
3	000003.SH	20231123

再来一个数据不连续的：

df.iloc[[0,2,4],[3,5]] #提取第0、2、4行，3、5列

返回：

	close	pct_chg
0	3061.86	0.60
2	3210.15	0.60
4	2785.42	0.77

2、用loc方法选择区域（loc中的参数是行索引或列名称）

df.loc[:3,'trade_date':'close']#提取0-3行、trade_date-close列

返回：

	trade_date	pre_close	close
0	20231123	3043.61	3061.86
1	20231123	3286.83	3306.53
2	20231123	3191.03	3210.15
3	20231123	231.39	232.48

再来一个数据不连续的：

df.loc[[0,2,4],['trade_date','close']]

返回：

	trade_date	close
0	20231123	3061.86
2	20231123	3210.15
4	20231123	2785.42

发布者：股市刺客，转载请注明出处：https://www.95sca.cn/archives/75049
站内所有文章皆来自网络转载或读者投稿，请勿用于商业用途。如有侵权、不妥之处，请联系站长并出示版权证明以便删除。敬请谅解！

赞 (0)

0 0

简单学Pythonmatplotlib库安装和简单作图

上一篇 2024 年 7 月 11 日

简单学量化开始在ptrade中研究1获取所有A股代码

下一篇 2024 年 7 月 11 日

发表回复