我有一个数据集,其结构如下
date1 header1 date2 header2 date3 header3 ...
11.12.23 100 11.12.23 90 08.12.23 95 ...
11.12.23 100 08.12.23 89 08.12.23 95 ...
08.12.23 95 08.12.23 89 07.12.23 93 ...
字符串
我想删除每个时间序列的重复值([date 1,header 1]; [date 2,header 2]等)。然后,我想按日期合并不同的时间序列作为索引。结果数据集应具有以下结构
date header1 header2 header3 ...
11.12.23 100 90 NA ...
08.12.23 95 89 95 ...
07.12.23 NA NA 93 ...
型
你有任何想法如何使用python/pandas实现这一点吗?谢谢。
编辑:我刚刚发现header 3的值中有一个错误,现在已经纠正了。
2条答案
按热度按时间mbskvtky1#
另一种可能的解决方案,使用
list comprehension
,drop_duplicates
和pandas.concat
:字符串
输出量:
型
kuhbmx9i2#
可以使用
wide_to_long
、drop_duplicates
和unstack
:字符串
如果你想删除基于日期/标题/值的重复项:
型
输出量:
型