딥러닝(20)
-
8강 - 특성 공학과 규제 알아보기
8강 - 특성 공학과 규제 알아보기 지난 시간에... 다중 회귀 multiple regression multinomial regression multinomial이 다항으로 해석되기도 하지만 의미는 다중 회귀임. 특성공학 - 새로운 특성 추가, 변경하는 것 판다스로 데이터 준비 import pandas as pd df = pd.read_csv('https://bit.ly/perch_csv') perch_full = df.to_numpy() print(perch_full) #//[[8.42.111.41] # [13.73.532.] # [15.3.822.43] # ... # [43.512.68.14] # [44.12.497.6]] Pandas 핵심 구조 - 데이터프레임(DataFrame) : 여러 종류의 데..
2021.06.17 -
7강 - 사이킷런으로 선형 회귀 모델 만들어 보기
7강 - 사이킷런으로 선형 회귀 모델 만들어 보기 지난 시간에... 아주 큰 농어 왜 예측과 달랐을까? 50cm 농어의 이웃 # 50cm 농어의 이웃을 구합니다 distances, indexes = knr.kneighbors([[50]]) # 훈련 세트의 산점도를 그립니다 plt.scatter(train_input, train_target) # 훈련 세트 중에서 이웃 샘플만 다시 그립니다 plt.scatter(train_input[indexes], train_target[indexes], marker='D') # 50cm 농어 데이터 plt.scatter(50, 1033, marker='^') plt.show() 길이가 늘어나면 무게도 늘어나야 하는데 최근접이웃은 가장 가까이에 있는 샘플만 이웃 샘플이 ..
2021.06.17 -
6강 - 회귀 문제를 이해하고 k-최근접 이웃 알고리즘으로 풀어 보기
6강 - 회귀 문제를 이해하고 k-최근접 이웃 알고리즘으로 풀어 보기 지난 시간에... 농어의 무게를 예측하라 이진 분류 타깃 0,1 회귀(regression) 타깃 임의의 숫자 회귀 골턴 - 19세기 통계학자 k-최근접 이웃 회귀(knn) 회귀와 분류의 차이 농어의 길이만 사용 import matplotlib.pyplot as plt plt.scatter(perch_length, perch_weight)//weight 타깃 plt.xlabel('length') plt.ylabel('weight') plt.show() 훈련 세트 준비 from sklearn.model_selection import train_test_split train_input, test_input, train_target, test..
2021.06.17 -
5강 - 정교한 결과 도출을 위한 데이터 전처리 알아보기
5강 - 정교한 결과 도출을 위한 데이터 전처리 알아보기 지난 시간에 나는 누구인가? 넘파이로 데이터 준비 fish_data = np.column_stack((fish_length, fish_weight)) fist_target = np.concatenate((np.ones(35), np.zeros(14)) 넘파이를 통해서 간단히 데이터 준비 가능! 사이킷런으로 데이터 나누기 데이터 분류 작업은 사이킷런으로! 훈련 세트와 테스트 세트 분류 stratify - 분류 문제에서 타겟값이 골고루 섞이도록 함. 수상한 도미 from sklearn.neighbors import KNeighborsClassifier kn = KNeighborsClassifier() kn.fit(train_input, train_ta..
2021.06.17 -
4강 - 훈련 세트와 테스트 세트로 나누어 사용하기
4강 - 훈련 세트와 테스트 세트로 나누어 사용하기 지난 시간 복습 완벽한 보고서 도미와 빙어를 완벽하게 맞췄다고 하지만 의문점이 남음. 단순히 훈련 데이터를 저장해서 그 데이터 그대로 테스트하는 거면 누구라도 다 맞출 수 있는 것 아닌가? 연습문제와 동일한 시험문제 출제 시 답만 외우면 되는 경우와 유사 올바른 평가가 아니라는 의문점. 테스트용 데이터 따로 만들어야 함. 지도 학습과 비지도 학습 타깃 데이터가 없고 입력만 있을 때는 특성의 개수를 줄이거나 비슷한 샘플을 모아 작업 수행 가능. 이럴 때 사용하는 것이 비지도 학습 강화학습 - 모델이 행동 수행한 뒤에 피드백을 받아 계속 강화해 나가는 것. 알파고 지도하기 때문에 타깃 데이터가 필요하고 훈련 후 평가 시에는 다른 데이터가 필요함. 훈련 세트..
2021.05.27 -
3강 - 마켓과 머신러닝
3강 - 마켓과 머신러닝 첫 번째 머신러닝 프로그램 프로그램을 만들어 머신러닝이 무엇인지 쉽게 파악. 한빛 마켓 - 생선 판매. 생선 구분 필요. 도미 크기 - 30~40cm 전통적인 프로그램 기준이나 규칙을 정하고 프로그램 작업함. 미리 규칙을 정하기 어려울 때가 있을 수 있음. 미리 30cm 보다 크면 도미라고 알고 있다면 프로그램을 작성할 수 있지만, 실제로는 길이가 30cm 보다 크면 무조건 도미라고 정할 수 없음. 머신러닝이 생선을 보고 도미인지 아닌지 판단해야 함. 따라서 머신러닝 프로그램과 전통적인 프로그램의 차이점은 규칙을 스스로 찾느냐 아니냐임. 어디서 규칙을 찾을 수 있을까? - 데이터 데이터가 먼저 준비되어야 함. 도미 vs 빙어 2개의 클래스(class) 분류(classificati..
2021.05.27