[Pandas] 누락데이터 처리 : isna, dropna, fillna
결측치 처리 순서 데이터 프레임 준비 생성, 파일 읽기 등 데이터 프레임 결측치 확인 isna(), isna().sum() 데이터 프레임 결측치 제거 1 (행 또는 열이 모두 NA인 경우) dropna(how='all', axis=1), dropna(how='all', axis=0) 데이터 프레임 결측치 제거 2 (특정 기준으로 제거) 예) NA 비율이 80% 이상인 컬럼, 행 등 데이터 프레임 결측치 대체 fillna() isna( ) 또는 notna( ) 함수 이용 isna() # 값이 NA이면 True, 아니면 False notna() # 값이 NA가 아니라면 True, 맞으면 False isna()를 이용하여 결측치 유무 확인 가능하지만, 눈에 안 들어온다. df.isna().sum() # 행별(..
2020. 10. 21.
[Numpy] 인덱싱 슬라이싱 - 불리언 인덱싱
불리언 인덱싱 (Boolean Indexing) 조건을 2개 사용 조건이 둘 다 만족해야 하면 & 사용 조건이 둘 중 하나만 만족해야 하면 | 사용 (shift+\) np_array = np.arange(12).reshape(4,3) array([[ 0, 1, 2], [ 3, 4, 5], [ 6, 7, 8], [ 9, 10, 11]]) np_array[(np_array %2 ==0) & (np_array >=5)] # 짝수이고 5 이상인 값 array([ 6, 8, 10]) np_array[(np_array %2 ==0) | (np_array >=5)] # 짝수이거나 5이상인 값 array([ 0, 2, 4, 5, 6, 7, 8, 9, 10, 11])
2020. 10. 21.
[파이썬] Numpy Array 인덱스, 범위생성, shape reshape, type
Numpy Array의 인덱스 Python list, tuple 0행 0열 -> [행인덱스][열인덱스] array[0][0] Numpy Array 0행 0열 -> [행 인덱스, 열 인덱스] np_array[0, 0] Numpy Array를 이용한 범위 생성 python -> range -> 정수만 가능 numpy -> arange -> 실수도 가능 np.arange(0, 1, 0.1) #0이상 1미만 0.1단위 증가 array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]) .shape과 .reshape reshape() -> array의 차원을 변경한다 변경 전 데이터 개수와 변경 후 데이터 개수가 같아야 한다. 변경 전 데이터 32개 -> 4행 8열 (4*..
2020. 10. 21.