즐거운프로그래밍

[pandas] pandas 파일 읽어온 뒤 데이터 처리하기(describe, head, tail, info)

수수께끼 고양이 2023. 11. 15. 13:27
728x90
반응형

pandas 파일 읽어온 뒤 데이터 처리하기

구글 코랩에서 구글 드라이브 사용시 
1. 왼쪽 폴더 모양 클릭 
2. 상단 구글 폴더 클릭
3. 계정 연동 시 아래의 명령 실행


4. 연동 후 파일 경로를 복사하여 읽어오기


csv (Comma Separated Values) 파일을 읽는 방법, pd.read_csv('파일 경로') 명령으로 실행

csv 외에도 다양한 파일 연동이 가능함 

df = pd.read_csv('/content/drive/MyDrive/Notebooks/data/1234.csv')
df

df.shape # 데이터 갯수
df.isna().sum() # NaN 데이터 갯수

 

 


기본적인 통계 데이터를 보여주는 함수

df.describe() # 각 항의 데이터 정보를 보여줌(평균, 최대값, 최소값, 표준편차 등)

 

df.head() # 해당 데이터의 상위 5개만 보여줌

 

df.head(3) # 해당 데이터의 상위 3개만 보여줌(설정한 갯수)

 

df.tail() # 해당 데이터의 하위 5개만 보여줌

 

df.info() # 컬럼에 대한 정보(Dtype = data type)

 


데이터 뽑아보기

상한가의 기초 통계 정보를 보여주세요

df['High'].describe()

 

시작가와 종가에 대한 기초 통계 데이터를 보여주세요

df[['Open','Close']].describe()

 

상한가의 최대값은?

df['High'].max()

 

 

 

728x90
반응형