Data Processing/Pandas Lib
[판다스 Chapter7]
JackYoon
2020. 2. 5. 22:06
반응형
[7-1 열과 피벗]
데이터 프레임 열 = 파이썬 변수와 비슷하다.
melt()메소드
- id_vars : 위치 그대로 유지할 열 이름 지정
- value_vars : 행으로 위치 변경할 열 이름 지정
- var_name : value_vars로 위치를 변경할 열의 이름 지정
- value_name : var_name으로 위치를 변경한 열의 데이터를 저장한 열의 이름 지정
melt메소드를 이용하여 id_vars인잣값 열을 고정하여 피벗했다.
[7-2 열 이름 관리하기]
하나의 열이 여러 의미를 갖고 있는 경우
split()메소드
열 이름을 분리하는 메소드. 원래 기본적으로 공백을 기준으로 문자열을 자른다.
[7-3 여러 열을 하나로 정리하기]
pivot_table()메소드
행과 열의 위치를 다시 바꾸어 정리한다.
pivot_table(
index = ['속성1', '속성2', '속성3'],
columns = '속성',
values = '속성'
)
index는 그래도 유지할 열 이름 지정 columns에 피벗할 열 이름 지정
values에 새로운 열의 데이터가 될 열 이름 지정.
[7-4 중복 데이터 처리]
drop_duplicates()메소드
데이터 프레임의 중복 데이터 제거
데이터를 따로 분리하여 duplicates메소드를 적용하여 중복을 배제한후,
원래의 데이터와 merge하여 중복이 없는 데이터 프레임을 만든다.
Chapter7-1 열과 피벗.ipynb
0.01MB
Chapter7-2 열 이름 관리하기.ipynb
0.01MB
Chapter7-3 여러 열을 하나로 정리하기.ipynb
0.01MB
Chapter7-4 중복데이터 처리.ipynb
0.01MB
반응형