반응형 Data Science/Machine Learning6 머신러닝 (Machine Learning) 머신러닝이란? 컴퓨터가 데이터를 학습하는 알고리즘과 기술을 통칭 컴퓨터과학과 수학, 통계가 모두 필요한 학문 현상을 설명하거나 미래를 예측하는 용도로 활용 예) 머신러닝 기반 스팸 필터링 기존에 축적된 메일들을 데이터 공간에 표현한 후, 스팸과 스팸이 아닌 메일을 분류하는 경계를 학습 데이터를 학습하여 생성된 모델을 이용하여 새로운 메일/문자의 스팸 여부를 예측 머신러닝 기반 스팸 필터링 장점 - 사람이 직접 스팸 분류하는 것에 비해 덜 지치고 더 빠르게 분류할 수 있다. - 규칙 기반의 모델에 비해, 여러 인자를 동시에 고려하며 더 많은 유형을 분류할 것으로 기대된다. 머신러닝 유형 1. 지도학습 (Supervised Learning) 2. 비지도학습 (Unsupervised Learning) 3. 강.. 2023. 5. 21. [3주차] 오버피팅 (Overfitting) If there exists a model with estimated parameters w' such that 1) training error (w.hat) true error (w') trainint set에는 매우 잘 맞는데 don't generalize well Training/Test Split Training Set / Test Set에 각각 얼마나 분배할 것인가? 1) Training set에 너무 적게 넣는다면 -> W 잘 안 나옴 2) Test set에 너무 적게 넣는다면 -> 일반화 잘 안 됨 완벽한 공식은 없다. 일반화하기 위한 적당한 양의 데이터를 test set에 넣.. 2021. 5. 27. [2주차] Multiple Regression Seasonality : 계절적 영향 집값 모델링할 때 여름이 성수기, 겨울이 비수기 sine 함수 도입 (매년 리셋, 패턴 반복) 2021. 5. 27. [1주차] Coursera Machine Learning : Regression x : input y : output y can be predicted from x model : how we assume the world works f(x) : expected relationship between x and y Regression model : yi = f(xi) + ei E(ei) = 0 ㄴexpected value ㄴequally likely that error is positive or negative ㄴyi is equally likely to be above or below f(xi) "Essentially all models are wrong, but some are useful." -George Box, 1987 Task1 - which model f(x)? Task2 .. 2021. 5. 27. 이전 1 2 다음 반응형