假设我正在处理一个数据集:#虚拟数据集
import pandas as pd
data = pd.DataFrame({"Name_id" : ["John","Deep","Julia","John","Sandy",'Deep'],
"Month_id" : ["December","March","May","April","May","July"],
"Colour_id" : ["Red",'Purple','Green','Black','Yellow','Orange']})
data
如何将此数据框转换为如下形式:
其中A_id是唯一的,并根据值和其他列的存在/不存在(按出现顺序)形成新列?我曾尝试使用透视,但我注意到它更多地用于数字数据,而不是分类数据。
1条答案
按热度按时间lfapxunr1#
也许你应该试试
pivot
其给出了