관리 메뉴

ComputerVision Jack

[판다스 Chapter8] 본문

Data Processing/Pandas Lib

[판다스 Chapter8]

JackYoon 2020. 2. 7. 17:17
반응형

[8-1 자료형 다루기]

자료형 변환하기

데이터 분석 과정에서 반드시 필요하다.

카테고리는 문자열로 변환해야 데이터 분석에 더 이점이 생긴다.

 

atype() 메소드 : 자료형을 변환하는 메소드

데이터 프레임['속성'].astype(변환 자료형)

 

잘못 입력한 데이터 처리

정수가 있어야 하는 곳에 문자열이 입력되는 상황과 같은 문제 발생시 해결하는 방법

 

to_numeric()메소드

to_numeric메소드를 사용해도 문자열을 실수로 변환할 순 없다.

하지만 errors 인자를 변환하여 오류 상황에 대해 어느정도 대처 할 수 있다.

pd.to_numeric(데이터 프레임['속성'], errors = 'errors값')

erros인자 값

  • raise : 숫자로 변환할 수 없는 값이 있으면 오류 발생
  • coerce : 숫자로 변환할 수 없는 값을 누락값으로 지정
  • ignore : 아무 작업도 하지 않음

[8-2 카테고리 자료형]

카테고리 자료형

판다스 라이브러리의 유한한 범위의 값만 가질 수 있는 특수한 자료형

범위 자료형이다. 용량과 속도면에서 문자열 자료형 보다 장점이 있다.

 

카테고리 자료형 장점과 특징

  • 용량과 속도면에서 매우 효율적이다.
  • 주로 동일한 문자열이 반복되어 데이터를 구성하는 경우에 사용

astype()메소드를 사용하여 문자열 데이터를 카테고리 자료형으로 변환

astype('category')

 

Chapter8-1 자료형 다루기.ipynb
0.01MB
Chapter8-2 카테고리 자료형.ipynb
0.00MB

 

반응형

'Data Processing > Pandas Lib' 카테고리의 다른 글

[판다스 Chapter10]  (0) 2020.02.11
[판다스 Chapter9]  (0) 2020.02.10
[판다스 Chapter7]  (0) 2020.02.05
[판다스 Chapter6]  (0) 2020.02.04
[판다스 Chapter5]  (0) 2020.02.03
Comments