【Python】DataFrame的列标准化

系统 194 0

这里分享DataFrame的列标准化以及对DataFrame分组之后列标准化。

  1. DataFrame的列标准化
            
              import pandas as pd
import numpy as np
df = pd.DataFrame(data={
    'A':[1,1,2,2,2],
    'B':[2,3,4,6,5],
    'C':[3,8,5,12,6]
})
df

            
          

【Python】DataFrame的列标准化_第1张图片

            
              df.apply(lambda x : (x-np.min(x))/(np.max(x)-np.min(x)))

            
          

【Python】DataFrame的列标准化_第2张图片
3. DataFrame分组之后列标准化
eg:将df按照A列分组,然后对每组进行标准化

            
              df.groupby('A').apply(lambda x: (x - np.min(x)) / (np.max(x) - np.min(x)))

            
          

【Python】DataFrame的列标准化_第3张图片
可以看到分组标准化之后第一列都是NaN,这时如果想要加上第一列,可以用concat函数:

            
              pd.concat([df['A'],(df.groupby('A').apply(lambda x: (x - np.min(x)) / (np.max(x) - np.min(x))))[['B','C']]],axis=1)

            
          

【Python】DataFrame的列标准化_第4张图片

欢迎添加个人微信号:liu2536036458。
想进入交流群的,备注: 数据分析交流群


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请请扫描上面二维码支持博主1元、2元、5元等您想捐的金额吧,狠狠点击下面给点支持吧

发表我的评论
最新评论 总共0条评论