본문 바로가기

AIMLAB/혼.공.ML&DL

#1-1. 훈련 세트와 테스트 세트

*inflearn의 [혼자 공부하는 머신러닝+딥러닝]을 통해 학습하였습니다.

 

[무료] 혼자 공부하는 머신러닝+딥러닝 - 인프런 | 강의

한빛미디어 혼공시리즈로 1:1 과외하듯이 배우는 초절정 머신러닝, 딥러닝 자습서, 수백 개의 손그림으로 이해하고 구글 코랩(Colab)을 통해 브라우저만 있으면 바로 실습 가능, - 강의 소개 | 인프

www.inflearn.com


 

 

주어진 데이터로 학습 -> 테스트를 하면 성공율 100%라는 당연한 결과가 나온다.

답을 외우고 시험치는 꼴.

 

 

 

찾고자하는 타겟이 있을때 

훈련 데이터가 있고

그 데이터에 맞게 지도하여 학습시킨다

 

numpy 사용하기

#차원 #배열 #행렬 #벡터

Q. array, matrix, tensor의 차이는 무엇인가요?
A. 머신/딥러닝에서는 array와 tensor를 동의어처럼 사용합니다!

*머신러닝 라이브러리(scikit-learn) => array,배열
  딥러닝 라이브러리(tensorflow, pytorch) => tensor...이라고 주로 사용

**예) 1차원 배열 == 1차원 tensor, scalar == 0차원 tensor

 

 

샘플링 편향을 방지하기 위해 데이터를 섞는데

input, 특성 데이터와 target 데이터가 뒤죽박죽 섞여버리면

학습이 원활히 진행되지 않는다

 

따라서!

index를 활용하여(arange) 매칭된 상태로 random mix(shuffle)

 

 

scatter 활용하여 분산 시각화

 

train 데이터와 test 데이터가 모두 절적히 분배된 것을 확인할 수 있다

 

 

 

'AIMLAB > 혼.공.ML&DL' 카테고리의 다른 글

추가작성필요)#1-2. 데이터 전처리  (0) 2022.07.29
#0-3. 마켓과 머신러닝  (0) 2022.07.28