일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- c언어
- c언어 정리
- matlab 영상처리
- 영상처리
- 골빈해커
- 파이토치 김성훈 교수님 강의 정리
- 딥러닝
- 파이토치
- 파이토치 강의 정리
- 모두의 딥러닝 예제
- pytorch
- 팀프로젝트
- 모두의 딥러닝
- c++공부
- 컴퓨터 비전
- tensorflow 예제
- 미디언 필터링
- TensorFlow
- 딥러닝 스터디
- pytorch zero to all
- c++
- MFC 프로그래밍
- 가우시안 필터링
- 김성훈 교수님 PyTorch
- Pytorch Lecture
- 해리스 코너 검출
- 케라스 정리
- object detection
- 딥러닝 공부
- C언어 공부
Archives
- Today
- Total
ComputerVision Jack
[판다스 Chapter8] 본문
반응형
[8-1 자료형 다루기]
자료형 변환하기
데이터 분석 과정에서 반드시 필요하다.
카테고리는 문자열로 변환해야 데이터 분석에 더 이점이 생긴다.
atype() 메소드 : 자료형을 변환하는 메소드
데이터 프레임['속성'].astype(변환 자료형)
잘못 입력한 데이터 처리
정수가 있어야 하는 곳에 문자열이 입력되는 상황과 같은 문제 발생시 해결하는 방법
to_numeric()메소드
to_numeric메소드를 사용해도 문자열을 실수로 변환할 순 없다.
하지만 errors 인자를 변환하여 오류 상황에 대해 어느정도 대처 할 수 있다.
pd.to_numeric(데이터 프레임['속성'], errors = 'errors값')
erros인자 값
- raise : 숫자로 변환할 수 없는 값이 있으면 오류 발생
- coerce : 숫자로 변환할 수 없는 값을 누락값으로 지정
- ignore : 아무 작업도 하지 않음
[8-2 카테고리 자료형]
카테고리 자료형
판다스 라이브러리의 유한한 범위의 값만 가질 수 있는 특수한 자료형
범위 자료형이다. 용량과 속도면에서 문자열 자료형 보다 장점이 있다.
카테고리 자료형 장점과 특징
- 용량과 속도면에서 매우 효율적이다.
- 주로 동일한 문자열이 반복되어 데이터를 구성하는 경우에 사용
astype()메소드를 사용하여 문자열 데이터를 카테고리 자료형으로 변환
astype('category')
반응형
'Data Processing > Pandas Lib' 카테고리의 다른 글
[판다스 Chapter10] (0) | 2020.02.11 |
---|---|
[판다스 Chapter9] (0) | 2020.02.10 |
[판다스 Chapter7] (0) | 2020.02.05 |
[판다스 Chapter6] (0) | 2020.02.04 |
[판다스 Chapter5] (0) | 2020.02.03 |
Comments