관리 메뉴

ComputerVision Jack

[판다스 Chapter11] 본문

Data Processing/Pandas Lib

[판다스 Chapter11]

JackYoon 2020. 2. 12. 15:10
반응형

[11-1 데이터 집계]

groupby 메소드를 통해 데이터 집계

 

분할-반영-결합 과정

groupby메소드에 열 인자를 전달하면 먼저 열 데이터를 나누는 과정이 진행된다.

이러한 과정을 '분할' 이라고 한다.

다음 각 열데이터 별로 데이터를 추출하는 작업이 시작된다.

그리고 그 과정에서 groupby연산을 실행하면 '반영' 작업이 된다.

마지막으로 개별로 계산한 데이터에 대해 하나의 데이터 프레임으로 합치면

'결합' 작업이 된다.

 

groupby() 메소드

데이터를 집계하기 위해 사용되는 그룹화 메소드.

groupby 메소드와 다양한 집계 메소드를 사용하여 데이터를 처리할 수 있디.

 

agg() 메소드

사용자 함수와 groupby메서드를 조합하기 위해 사용되는 메소드

 

이러한 집계 메소드는 리스트, 딕셔너리에 담아 전달할 수 있다.

[11-2 데이터 변환]

표준 점수

통계 분야에서 데이터의 평균과 표준 편차의 차이

 

transform() 메소드

스칼라 값이나 같은 크기를 갖는 배열을 반환하는 함수

groupby메소드를 사용한후, 표준 점수 구하는 함수를 적용하기 위해 transform()메소드를 사용

 

누락값 평균으로 처리하기

열에 대해 평균을 구하고 평균으로 fillna하는 함수를 제작한다.

transform()함수에 만든 함수를 인자로 연결하여 NaN값 데이터에 대하여 평균 값으로 대처한다.

[11-3 데이터 필터링]

그룹화한 데이터에 대해 원하는 데이터를 걸러내고 싶은 경우

데이터 필터링을 사용한다.

 

filter() 메소드

filter() 메소드에 인자로 lambda 식을 적용하여 값에 대해 필터링을 적용할 수 있다.

[11-4 그룹 오브젝트]

groupby() 메소드를 사용하여 처리한 데이터 프레임은 그룹오브젝트로 자료형이 바뀐다.

DataFrameGroupBy object

 

그룹오브젝트.groups 속성

그룹 오브젝트에 포함된 그룹 속성을 볼 수 있다.

 

그룹 오브젝트에 집계 메서드를 사용할 경우, 처리 가능한 열만 알아서 자동으로 처리한다.

그룹 오브젝트 데이터도 마찬가지로 데이터를 추출하고, 연산이 가능하다.

 

Chapter11-1 데이터 집계.ipynb
0.01MB
Chapter11-2 데이터 변환.ipynb
0.01MB
Chapter11-3 데이터 필터링.ipynb
0.00MB
Chapter11-4 그룹 오브젝트.ipynb
0.01MB

반응형

'Data Processing > Pandas Lib' 카테고리의 다른 글

[판다스 Chapter12]  (0) 2020.02.17
[판다스 Chapter10]  (0) 2020.02.11
[판다스 Chapter9]  (0) 2020.02.10
[판다스 Chapter8]  (0) 2020.02.07
[판다스 Chapter7]  (0) 2020.02.05
Comments