我正在学习python pandas。我看到一个教程,其中显示了两种方法来保存一个pandas框架。
pd.to_csv('sub.csv')
和打开pd.read_csv('sub.csv')
pd.to_pickle('sub.pkl')
和打开pd.read_pickle('sub.pkl')
教程说to_pickle
是保存到磁盘的框架。我对此感到困惑。因为当我使用to_csv
时,我确实看到文件夹中出现了一个csv文件,我假设这也是保存到磁盘对吗?
一般来说,为什么我们要保存一个使用to_pickle
的框架,而不是保存到csv或txt或其他格式?
2条答案
按热度按时间xghobddn1#
csv
* 泡菜 *
还可以看看 parquet 格式(
to_parquet
,read_parquet
)zi8p0yeb2#
Pickle是一种存储Pandas框架的序列化方式。基本上,您将框架的确切表示写入磁盘。这意味着列的类型和索引是相同的。如果您只是将文件保存为
csv
,则您只是将其存储为逗号分隔的列表。根据您的数据集,当您加载它时,某些信息将丢失。你可以在python中阅读更多关于pickle库的信息,here。