관리 메뉴

ComputerVision Jack

[판다스 Chapter5] 본문

Data Processing/Pandas Lib

[판다스 Chapter5]

JackYoon 2020. 2. 3. 14:25
반응형

[5-1 분석하기 좋은 데이터]

좋은 데이터

데이터 집합을 분석하기 좋은 상태로 만들어 놓은 것.

  • 데이터 분석 목적에 맞는 데이터를 모아 새로운 표 만들어야 한다.
  • 측정한 값 행 구성
  • 변수는 열 구성

[5-2 데이터 연결 기초]

데이터 연결하기

 

concat() 메소드

데이터 연결하는 메소드

데이터 프레임을 리스트에 담아 전달하면 데이터 프레임을 연결시킨다.

pd.concat([frame1, frame2])

 

데이터 프레임과 시리즈를 연결할 때 concat()을 사용하면

시리즈는 새로운 열로 추가가된다. 

하지만 연결 과정에 있어서 index가 다를경우 누락값 nan값이 발생한다.

 

데이터 프레임으로 연결하기

행이 1개라도 반드시 데이터 프레임으로 연결해야 한다.

concat()은 2개 이상의 데이터 프레임을 연결할 때, 사용된다.

1개의 데이터 프레임 연결은 append()메소드를 사용하여 연결한다.

 

ignore_index 인자

ignore_index 인자를 True로 설정하면 인덱스를 새롭게 0부터 다시 초기화 한다.

 

열방향으로 데이터 연결

concat()메소드에 axis 인자 1로지정.

pd.concat([frame, frame], axis = 1)

 

누락값 없이 데이터 연결

join 속성으로 'inner'를 사용하면 된다.

pd.concat([frame, frame], join = 'inner')

 

조인

내부 조인 : 둘 이상의 데이터 프레임에서 맞는 행을 연결

외부 조인 : 기준 프레임에 오른쪽 왼쪽으로 나뉘며 완전 외부 조인은 데이터를 모두 포함하여 연결한다.

[5-3 데이터 연결 마무리]

merge메소드 사용하기

 

merge() 메소드

#기본적으로 내부 조인을 실행한다.

메소드 사용한 데이터 프레임을 왼쪽으로 정의하고 첫 번째 인자 데이터 프레임을 오른쪽으로 지정한다.

left right인자값 기준으로 데이터를 연결한다.

frame1.merge(frame2, left_on = '속성', right_on = '속성')

 

Chapter5-1_2 좋은 데이터_데이터 연결.ipynb
0.02MB
Chapter5-3 데이터 연결 마무리.ipynb
0.01MB

반응형

'Data Processing > Pandas Lib' 카테고리의 다른 글

[판다스 Chapter7]  (0) 2020.02.05
[판다스 Chapter6]  (0) 2020.02.04
[판다스 Chapter4]  (0) 2020.02.01
[판다스 Chapter3]  (0) 2020.01.30
[판다스 Chapter2]  (0) 2020.01.29
Comments