对于这个相当笼统的问题,很难给你一个好的答案。 不清楚如何使用(读取)hdf5文件-是否有条件地选择数据(使用 where 参数)? 打开存储对象所需的全部功能:
store = pd.HDFStore('/path/to/filename.h5')
现在您可以写入(或附加)到存储(我在这里使用 blosc 压缩-这是相当快和有效的),除此之外,我将使用 data_columns 参数以指定必须索引的列(以便您可以在中使用这些列) where 参数(稍后读取hdf5文件时):
for f in files:
#read or process each file in/into a separate `df`
store.append('df_identifier_AKA_key', df, data_columns=[list_of_indexed_cols], complevel=5, complib='blosc')
store.close()
1条答案
按热度按时间mjqavswn1#
对于这个相当笼统的问题,很难给你一个好的答案。
不清楚如何使用(读取)hdf5文件-是否有条件地选择数据(使用
where
参数)?打开存储对象所需的全部功能:
现在您可以写入(或附加)到存储(我在这里使用
blosc
压缩-这是相当快和有效的),除此之外,我将使用data_columns
参数以指定必须索引的列(以便您可以在中使用这些列)where
参数(稍后读取hdf5文件时):