백엔드/데이터

파이썬 groupby 분류하기

silvering0 2021. 4. 2. 13:37
import pandas as pd

df1=pd.DataFrame({'Month':[1,2,3,4,5,6,7,8,9,10,11,12],'20val':[13,15,18,45,65,89,45,13,57,85,11,14]})
df2=pd.DataFrame({'Month':[1,2,3,4,5,6,7,8,9,10,11,12],'21val':[46,65,78,45,12,78,56,48,12,48,45,12]})

df=pd.concat([df1,df2])

df3=df.groupby('Month').sum()
df4=df.groupby('Month').mean()

df3

SQL 의 groupby 함수를 파이썬에서도 실행할 수 있습니다.

지정한 칼럼에 따라 묶고,

합계 혹은 평균 등을 구할 수 있습니다.

우선 예시로 사용할 데이터프레임을 두개 만들어 주었습니다.

df1, df2

concat 으로 두가지를 합쳐 하나의 df DataFrame 으로 만들어 주고,

groupby 함수를 사용해 줍니다.

 

현재는 데이터 프레임이 한 행밖에 없지만,,

각 달의 자료가 10개, 20개 정도 이렇게 늘려가면

sum, mean 함수가 적용된 모습을 볼 수 있습니다.