본문 바로가기
반응형

전체 글46

[Pandas] 누락데이터 처리 : isna, dropna, fillna 결측치 처리 순서 데이터 프레임 준비 생성, 파일 읽기 등 데이터 프레임 결측치 확인 isna(), isna().sum() 데이터 프레임 결측치 제거 1 (행 또는 열이 모두 NA인 경우) dropna(how='all', axis=1), dropna(how='all', axis=0) 데이터 프레임 결측치 제거 2 (특정 기준으로 제거) 예) NA 비율이 80% 이상인 컬럼, 행 등 데이터 프레임 결측치 대체 fillna() isna( ) 또는 notna( ) 함수 이용 isna() # 값이 NA이면 True, 아니면 False notna() # 값이 NA가 아니라면 True, 맞으면 False isna()를 이용하여 결측치 유무 확인 가능하지만, 눈에 안 들어온다. df.isna().sum() # 행별(.. 2020. 10. 21.
[Numpy] 인덱싱 슬라이싱 - 불리언 인덱싱 불리언 인덱싱 (Boolean Indexing) 조건을 2개 사용 조건이 둘 다 만족해야 하면 & 사용 조건이 둘 중 하나만 만족해야 하면 | 사용 (shift+\) np_array = np.arange(12).reshape(4,3) array([[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11]]) np_array[(np_array %2 ==0) & (np_array >=5)] # 짝수이고 5 이상인 값 array([ 6, 8, 10]) np_array[(np_array %2 ==0) | (np_array >=5)] # 짝수이거나 5이상인 값 array([ 0, 2, 4, 5, 6, 7, 8, 9, 10, 11]) 2020. 10. 21.
[파이썬] Numpy Array 인덱스, 범위생성, shape reshape, type Numpy Array의 인덱스 Python list, tuple 0행 0열 -> [행인덱스][열인덱스] array[0][0] Numpy Array 0행 0열 -> [행 인덱스, 열 인덱스] np_array[0, 0] Numpy Array를 이용한 범위 생성 python -> range -> 정수만 가능 numpy -> arange -> 실수도 가능 np.arange(0, 1, 0.1) #0이상 1미만 0.1단위 증가 array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]) .shape과 .reshape reshape() -> array의 차원을 변경한다 변경 전 데이터 개수와 변경 후 데이터 개수가 같아야 한다. 변경 전 데이터 32개 -> 4행 8열 (4*.. 2020. 10. 21.
[파이썬] 함수 정의하기, 호출하기(사용) 함수 특정 작업을 수행하는 명령문의 그룹 프로그램이 복잡해지고 커질 때, 함수를 사용하면 보다 체계적이고 관리하기 쉬워진다. 코드의 반복을 피할 수 있고, 재사용이 가능하다. 함수의 기본 정의 def 함수명: 코드 함수의 구성요소 키워드 def는 함수의 시작을 표시 함수명은 고유 식별 가능해야 하고, 식별자 작성 규칙을 따름 함수 헤더의 끝은 colon(:)으로 표시 함수 본문은 하나 이상의 파이썬문(statement)으로 이루어지고, 동일한 들여쓰기가 적용 함수에 값을 전달하는 입력 매개변수(argument)는 선택사항 함수에서 값을 반환하는 return문은 선택사항 예제: def ADD(n1,n2): n = n1+n2 return n 함수 호출 함수를 정의해두면, 다른 함수, 프로그램 등에서 사용할 .. 2020. 10. 21.
반응형