将pandas的文件保存到pickle和保存到csv有什么区别?

ylamdve6  于 5个月前  发布在  其他
关注(0)|答案(2)|浏览(74)

我正在学习python pandas。我看到一个教程,其中显示了两种方法来保存一个pandas框架。

  1. pd.to_csv('sub.csv')和打开pd.read_csv('sub.csv')
  2. pd.to_pickle('sub.pkl')和打开pd.read_pickle('sub.pkl')
    教程说to_pickle是保存到磁盘的框架。我对此感到困惑。因为当我使用to_csv时,我确实看到文件夹中出现了一个csv文件,我假设这也是保存到磁盘对吗?
    一般来说,为什么我们要保存一个使用to_pickle的框架,而不是保存到csv或txt或其他格式?
xghobddn

xghobddn1#

csv

  • 人机可读
  • 十字形月台
  • 慢一点
  • 增加磁盘空间
  • 在某些情况下,XML不保留类型

* 泡菜 *

  • 快速保存/加载
  • 无磁盘空间
  • 非人类可读
  • 仅限Python
  • 对版本更改不敏感

还可以看看 parquet 格式(to_parquetread_parquet

  • 快速保存/加载
  • 磁盘空间小于 pickle
  • 支持多种平台的浏览器
  • 非人类可读
zi8p0yeb

zi8p0yeb2#

Pickle是一种存储Pandas框架的序列化方式。基本上,您将框架的确切表示写入磁盘。这意味着列的类型和索引是相同的。如果您只是将文件保存为csv,则您只是将其存储为逗号分隔的列表。根据您的数据集,当您加载它时,某些信息将丢失。
你可以在python中阅读更多关于pickle库的信息,here

相关问题