카테고리 없음

[pandas] pandas 실습 예제

수수께끼 고양이 2023. 11. 15. 13:14
728x90
반응형

 

import pandas as pd
import numpy as np

books = pd.Series(data = ['Great Expectations', 'Of Mice and Men', 'Romeo and Juliet', 'The Time Machine', 'Alice in Wonderland' ])
authors = pd.Series(data = ['Charles Dickens', 'John Steinbeck', 'William Shakespeare', ' H. G. Wells', 'Lewis Carroll' ])

user_1 = pd.Series(data = [3.2, np.nan ,2.5])
user_2 = pd.Series(data = [5., 1.3, 4.0, 3.8])
user_3 = pd.Series(data = [2.0, 2.3, np.nan, 4])
user_4 = pd.Series(data = [4, 3.5, 4, 5, 4.2])

 

책 제목과 작가, 그리고 유저별 별점 데이터가 있다.
np.nan values 는 해당 유저가 해당 책에는 아직 별점 주지 않은것이다.
labels: 'Author', 'Book Title', 'User 1', 'User 2', 'User 3', 'User 4'.

1. 딕셔너리를 만들고 

my_data = {'Book Title': books,'Authors': authors, 'User 1' : user_1, 'User 2': user_2, 'User 3' : user_3, 'User 4' : user_4}


2. 데이터프레임으로 만든 후  

df = pd.DataFrame(data=my_data)
df


3. nan을  평균값으로 채운다.

df.mean(numeric_only=True)

# NaN 처리하는 방식
# df.isna() # 비어 있니
# df.dropna() # 비어있는 항이 있으면 삭제
# df.fillna() # 비어있는 항이 있으면 괄호안에 내용으로 채움

df.fillna(df.mean(numeric_only=True))

 

 

 

 

728x90
반응형