관리 메뉴

ComputerVision Jack

[스터디 - Logistic Regression 예제] 본문

DeepLearning Study/모두의 딥러닝 예제

[스터디 - Logistic Regression 예제]

JackYoon 2020. 5. 6. 21:16
반응형

저번 스터디에선 dataProcess 과정을 거쳐 새롭게 바뀐 csv 파일을 추출하였는데.

data = df.values 과정을 통해서 데이터 프레임을 numpy array로 바꿀 수 있어서 따로 Process과정을 제외하고 바로 처리하였습니다.

[Simple Logistic Dataset]

Simple Logistic Dataset

다음 SimpleDataset은 Purchased 예측하는 데이터셋입니다.

UserId와 를 drop() 메소드를 이용하여 제외하고 Gender를 0과 1 이진으로 바꿔준 후에 구현하였습니다.

Simplelogitstic.ipynb
0.01MB
simple logistc dataset.csv
0.01MB

[Heart Disease Dataset]

Heart Disease Dataset

다음 데이터는 TenYearCHD를 예측하는 데이터셋입니다.

데이터 중간에 N/A 값이 발생하여 fillna() 메소드를 사용하여 공백값을 처리했습니다.

<코드>

df = df.fillna(df.mean())

다음은 min_max_scalar() 함수를 통하여 전체적인 데이터의 분포 값을 설정합니다.

def min_max_scalar(data):

  numerator = data - np.min(data, 0)

  denominator = np.max(data, 0) - np.min(data, 0)

  return numerator / (denominator + 1e-7)

heartDisease.ipynb
0.01MB
heart disease dataset.csv
0.19MB

[Titanic Dataset]

Titanic Dataset

다음은 Survived를 예측하는 csv파일 입니다.

제시된 데이터에 0값이 너무 많은 관계로

df = df.drop(['Passengerid','Embarked','zero', 'zero.1', 'zero.2', 'zero.3', 'zero.4', 'zero.4', 'zero.5', 'zero.6', 'zero.7',

              'zero.8','zero.9', 'zero.10', 'zero.11', 'zero.12', 'zero.13', 'zero.14', 'zero.15',

              'zero.16', 'zero.17', 'zero.18'], axis = 1)

과정을 통해서 필요한 데이터만 사용하였습니다.

TitanicData.ipynb
0.02MB
Titanic dataset.csv
0.08MB

반응형

'DeepLearning Study > 모두의 딥러닝 예제' 카테고리의 다른 글

[스터디 - RNN 예제]  (0) 2020.05.25
[스터디 CNN 예제]  (0) 2020.05.12
[스터디 - SoftMax 예제]  (0) 2020.05.07
[스터디 - Linear Regression 예제]  (0) 2020.05.06
Comments