全,
我尝试将我的数据分成3个存储桶,分别为40%、40%和20%。我怎么才能用熊猫做到这一点呢?例如,你得到最低的40%,中间的40%和最高的20%:
pd.cut(df['count'], 5,labels = ['1','2','3','4','5'],retbins=True)
上面分成5个五分位数,但我想定义为40:40:20个百分位数。
有什么想法吗?
转载请注明出处:http://www.jubohx.com/article/20230503/2205831.html
全,
我尝试将我的数据分成3个存储桶,分别为40%、40%和20%。我怎么才能用熊猫做到这一点呢?例如,你得到最低的40%,中间的40%和最高的20%:
pd.cut(df['count'], 5,labels = ['1','2','3','4','5'],retbins=True)
上面分成5个五分位数,但我想定义为40:40:20个百分位数。
有什么想法吗?
转载请注明出处:http://www.jubohx.com/article/20230503/2205831.html