我有一个看起来像这样的数据框:
ID | TEXT | LABEL|
5 | blab | 0
5 | blub | 0
5 | gray | 0
4 | rose | 1
4 | work | 1
4 | app | 1
3 | car | 0
3 | ink | 0
1 | pink | 0
我正在努力将其转换为如下所示:
ID | TEXT | TEXT| TEXT | LABEL|
5 | blab | blub| gray | 0
4 | rose | work| app | 1
3 | car | | | 0
1 | pink | | | 0
我现在已经尝试了 df.T
和 df.pivot()
但我似乎无法正确处理 - 任何帮助表示赞赏。
最佳答案
尝试
out = df.groupby(['ID','LABEL']).TEXT.agg(list).apply(pd.Series).reset_index()
Out[491]:
ID LABEL 0 1 2
0 1 0 pink NaN NaN
1 3 0 car ink NaN
2 4 1 rose work app
3 5 0 blab blub gray
https://stackoverflow.com/questions/66802411/