简单学PythonHDF5数据文件1创建和追加数据

有的时候,我们需要离线数据,原因可能是本来免费的数据要收费了、免费的数据获取时间有限制、数据总是要转换格式才能使用等等。离线数据最常用的方式有两种:CSV和数据库。

CSV存放形式是文本,打开形式像表格,数据量少的时候,用CSV格式挺方便,但数据量大的时候,CSV占用空间大,存取时间慢。

数据库比较常用的如mysql,存取数据都比较专业,但是使用门槛比较高,要想用的顺,SQL语言得懂一些。还有一个不便之外是,如果建立数据库的时候没有合理规划,后期改动也比较麻烦。所以,数据库存放也不太适合新手。

有没有一种长的像CSV那样简单,用起来像数据库那样专业一些的东西呢。这个还真有,HDF5 数据文件就是一种。HDF5 数据文件就是一个单文件,里面不但可以存放数据,还可以存放图片等文件,不但存取数据快,还带压缩功能,使得即使数据量暴增,也暂时没有增加硬盘的忧虑。

下面我们就用简单的代码实现HDF5存取每日股票价格的功能:

首先,获取一些免费数据,并新建HDF5文件保存。

#导入pandas库,因为要用pandas操作HDF5
import pandas as pd
t='20231129'#要获取数据是日期
data=pro.daily(trade_date=t)#从tushare获取指定日期的股票价格
#将股票价格表格保存到HDF5中。如果HDF5是一个书架,那参数key就是书名。
#mode='a'表示保存的时候为追加,而不是覆盖。
#append=True, format='table',这两个是为了可追加数据才设置的参数。
data.to_hdf('price.h5', key='price_day', mode='a',append=True, format='table' )

读取的时候用这句:

pd.read_hdf('price.h5',key='price_day')

读取出来的是数据是dataframe格式,方便我们后期使用,展示如下:

简单学PythonHDF5数据文件1创建和追加数据

这是我保存了两天的数据

图片里是我保存了两天的数据。如果想保存更天的数据,稍微修改一下代码,加个循环即可。

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/75032
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 2024 年 7 月 11 日
下一篇 2024 年 7 月 11 日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注