본문 바로가기
반응형

전체 글46

코세라 머신러닝 수강중 :: 너무 어렵다 코세라에서 제공중인 강의 중 워싱턴 대학의 머신러닝 강좌를 듣고 있다. Machine Learning : Regression 수학적인 개념부터 다져나가는 중인데 매우매우 어렵다. 개념 이해는 그렇다 쳐도 실습을 하려는데 제약이 아주 많다. 기본적으로 TuriCreate라는 걸 다운로드 받아야 하는데, 정확히는 모르겠지만 이게 맥 용 어플인 것 같다. 그래서 윈도우에는 바로 못받고 리눅스 on Window를 받아서 뭐 가상계정?을 통해 받는다 어쩐다 하는데!! 설치하다가 홧병나게 생겼다. 결국 포기.... ㅠㅠ Turicreate 받으면 SFrame이라는 걸 활용해 데이터도 바로 다운받고 여러가지 기능을 사용할 수 있다고 하는데, 그냥 판다스로 해보는 중이다. 가이드 되어있는 주피터 노트북을 다운받아서, .. 2021. 2. 17.
주피터 노트북으로 파이썬 버전 확인하기 (Check Python Version in Jupyter Notebook) 주피터 노트북에서 파이썬 버전을 확인하는 간단한 방법 import platform print(platform.python_version()) 이렇게 하면 파이썬 버전이 나타난다. 내껀 확인 결과 3.7.7 버전이었음! 2021. 2. 16.
데이터 분석의 순서 데이터 분석의 순서 목표 정의 -> 전처리 -> 알고리즘 선택 및 분석 실행 -> 검증 1. 목적을 구체적으로 정의 2. 데이터의 기본적인 특징과 문제점 파악 데이터에 대한 기본적인 이해 없이 그래프만 그리는 것은 의미 없다. 빅데이터와 머신 러닝 빅데이터 = 엄청나게 많은 데이터 구체적인 방법론 중 하나 -> 머신러닝 (수단, 목적x) 데이터 분석 고수의 스킬 1. 통계 2. 수학 : 선형대수, 미분 3. 도구 : 데이터분석 프로그램 데이터를 어떻게 모으지? 모집단과 랜덤샘플링 질이 좋은 데이터? 요구 조건이 결정 (어떤 결과를 어떻게 얻고 싶은데?) 모집단 (population) = 모든 데이터 일부 데이터로 유추 = 표집 (sampling) 표본 (sample) 어떻게 뽑았냐에 따라 샘플의 특징이 .. 2021. 2. 1.
Scikit-Learn을 이용한 머신러닝 sklearn.datasets 더미 데이터 : make_ ~~ 연습용 데이터 : load_ ~~ (소규모), fetch_ ~~ (대규모) 함수 : 이름에 '_' (언더바) 존재 -> 이름/인자 객체 : 이름에 대문자 존재 (단어의 첫글자가 대문자) - 이름().함수() (. 사용) sklearn의 연습용 데이터는 공통의 키를 가짐 'data' -> X ->2D array 'target' -> Y -> 1D array -> 정수(범주형), 실수(연속형) 'target_names' -> 분류 데이터에만 존재하는 키 (0->악성, 1->양성) 'DESCR' -> 데이터 설명문 (print 함수를 이용) 'feature_names' -> 'data의 컬럼명 Scikit-Learn을 이용한 머신러닝 순서 1. X.. 2020. 10. 21.
반응형