Pandas分类级联关系分析
2023-08-12 17:19 作者:yangmqglobe | 我要投稿


这是我的做法,主要的思路是把每一行的各个层级分割出来,这样想怎么统计,都可以。
首先要把各个层级抽提出来,使用str下的extractall利用正则表达式提取各个层级(不是箭头的字符子串)。得到的长数据使用unstack堆叠起来。这里有个小问题,因为返回的dataframe有双层列名,所以抛弃第一层。
经过以上步骤,每一行的每个层级就被分开了,这样就可以做自己想要的统计啦,比如UP这里的这种统计。