Data Processing/Pandas Lib
[판다스 Chapter8]
JackYoon
2020. 2. 7. 17:17
반응형
[8-1 자료형 다루기]
자료형 변환하기
데이터 분석 과정에서 반드시 필요하다.
카테고리는 문자열로 변환해야 데이터 분석에 더 이점이 생긴다.
atype() 메소드 : 자료형을 변환하는 메소드
데이터 프레임['속성'].astype(변환 자료형)
잘못 입력한 데이터 처리
정수가 있어야 하는 곳에 문자열이 입력되는 상황과 같은 문제 발생시 해결하는 방법
to_numeric()메소드
to_numeric메소드를 사용해도 문자열을 실수로 변환할 순 없다.
하지만 errors 인자를 변환하여 오류 상황에 대해 어느정도 대처 할 수 있다.
pd.to_numeric(데이터 프레임['속성'], errors = 'errors값')
erros인자 값
- raise : 숫자로 변환할 수 없는 값이 있으면 오류 발생
- coerce : 숫자로 변환할 수 없는 값을 누락값으로 지정
- ignore : 아무 작업도 하지 않음
[8-2 카테고리 자료형]
카테고리 자료형
판다스 라이브러리의 유한한 범위의 값만 가질 수 있는 특수한 자료형
범위 자료형이다. 용량과 속도면에서 문자열 자료형 보다 장점이 있다.
카테고리 자료형 장점과 특징
- 용량과 속도면에서 매우 효율적이다.
- 주로 동일한 문자열이 반복되어 데이터를 구성하는 경우에 사용
astype()메소드를 사용하여 문자열 데이터를 카테고리 자료형으로 변환
astype('category')
Chapter8-1 자료형 다루기.ipynb
0.01MB
Chapter8-2 카테고리 자료형.ipynb
0.00MB
반응형