관리 메뉴

ComputerVision Jack

[판다스 Chapter7] 본문

Data Processing/Pandas Lib

[판다스 Chapter7]

JackYoon 2020. 2. 5. 22:06
반응형

[7-1 열과 피벗]

데이터 프레임 열 = 파이썬 변수와 비슷하다.

 

melt()메소드

  • id_vars : 위치 그대로 유지할 열 이름 지정
  • value_vars : 행으로 위치 변경할 열 이름 지정
  • var_name : value_vars로 위치를 변경할 열의 이름 지정
  • value_name : var_name으로 위치를 변경한 열의 데이터를 저장한 열의 이름 지정

melt메소드를 이용하여 id_vars인잣값 열을 고정하여 피벗했다.

[7-2 열 이름 관리하기]

하나의 열이 여러 의미를 갖고 있는 경우

 

split()메소드

열 이름을 분리하는 메소드. 원래 기본적으로 공백을 기준으로 문자열을 자른다.

[7-3 여러 열을 하나로 정리하기]

pivot_table()메소드

행과 열의 위치를 다시 바꾸어 정리한다.

pivot_table(

    index = ['속성1', '속성2', '속성3'],

    columns = '속성',

    values = '속성'

)

index는 그래도 유지할 열 이름 지정 columns에 피벗할 열 이름 지정

values에 새로운 열의 데이터가 될 열 이름 지정.

[7-4 중복 데이터 처리]

drop_duplicates()메소드

데이터 프레임의 중복 데이터 제거

 

데이터를 따로 분리하여 duplicates메소드를 적용하여 중복을 배제한후,

원래의 데이터와 merge하여 중복이 없는 데이터 프레임을 만든다.

 

Chapter7-1 열과 피벗.ipynb
0.01MB
Chapter7-2 열 이름 관리하기.ipynb
0.01MB
Chapter7-3 여러 열을 하나로 정리하기.ipynb
0.01MB
Chapter7-4 중복데이터 처리.ipynb
0.01MB

반응형

'Data Processing > Pandas Lib' 카테고리의 다른 글

[판다스 Chapter9]  (0) 2020.02.10
[판다스 Chapter8]  (0) 2020.02.07
[판다스 Chapter6]  (0) 2020.02.04
[판다스 Chapter5]  (0) 2020.02.03
[판다스 Chapter4]  (0) 2020.02.01
Comments