- file_path : 파일 지정(위치 포함) - header : 컬럼명으로 사용할 행의 위치 (default 0) - skipfooter : 가장 밑에서부터 포함하지 않을 행의 갯수 (default 0) - usecols : 가지고 올 열의 범위 (default 전체)
데이터 조회
전체 데이터 조회
sample1
Series 타입 열(컬럼) 데이터 조회
sample1["국적코드"]
DataFrame
= 행렬을 저장 관리하는 타입
DataFrame 타입 다수열(컬럼) 데이터 조회
sample1[["국적코드","성별"]]
성별 중에 여성인 데이터만 추출
sample1[(sample1["성별"] == "여성") == True]
상단 데이터 조회
sample1.head()
=> 상단 데이터 5개 출력
하단 데이터 조회
sample1.tail()
=> 하단 데이터 5개 출력
데이터의 결측치 데이터 확인
sample1.info()
=>데이터의 결측치(nan, null) 데이터 확인 가능
기초 통계 데이터 조회
sample1.describe()
count
데이터 행의 갯수
mean
데이터 평균
std
표준편차
min
최소값
max
최대값
25%, 50%, 75% : 4분위수 데이터 -> 4분위수 데이터를 이용해서 이상치(이상한) 데이터 확인합니다.