前面我们学习了提取dataframe中的一行或多行数据,今天我们学习提取dataframe中的区域数据,即从一个表格中选取一块儿长方形的小区域。
首先,还是用之前的表格:
df=pro.index_daily(trade_date="20231123",fields="ts_code,trade_date,pre_close,close,change,pct_chg")
df=df[:5].round(2)#保留两位小数
df
结果:
ts_code |
trade_date |
pre_close |
close |
change |
pct_chg |
|
0 |
000001.SH |
20231123 |
3043.61 |
3061.86 |
18.25 |
0.60 |
1 |
000001CNY01.SH |
20231123 |
3286.83 |
3306.53 |
19.70 |
0.60 |
2 |
000002.SH |
20231123 |
3191.03 |
3210.15 |
19.11 |
0.60 |
3 |
000003.SH |
20231123 |
231.39 |
232.48 |
1.10 |
0.47 |
4 |
000004.SH |
20231123 |
2764.03 |
2785.42 |
21.39 |
0.77 |
1、用iloc方法选择区域(iloc中的参数是位置序号)
df.iloc[:4,:2]#提取前4行和前2列
返回:
ts_code |
trade_date |
|
0 |
000001.SH |
20231123 |
1 |
000001CNY01.SH |
20231123 |
2 |
000002.SH |
20231123 |
3 |
000003.SH |
20231123 |
再来一个数据不连续的:
df.iloc[[0,2,4],[3,5]] #提取第0、2、4行,3、5列
返回:
close |
pct_chg |
|
0 |
3061.86 |
0.60 |
2 |
3210.15 |
0.60 |
4 |
2785.42 |
0.77 |
2、用loc方法选择区域(loc中的参数是行索引或列名称)
df.loc[:3,'trade_date':'close']#提取0-3行、trade_date-close列
返回:
trade_date |
pre_close |
close |
|
0 |
20231123 |
3043.61 |
3061.86 |
1 |
20231123 |
3286.83 |
3306.53 |
2 |
20231123 |
3191.03 |
3210.15 |
3 |
20231123 |
231.39 |
232.48 |
再来一个数据不连续的:
df.loc[[0,2,4],['trade_date','close']]
返回:
trade_date |
close |
|
0 |
20231123 |
3061.86 |
2 |
20231123 |
3210.15 |
4 |
20231123 |
2785.42 |
发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/75049
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!