빅데이터 분석기사/작업 유형 1 문제 풀이

결측치 칼럼 제거 ~ isnull(), iloc.인덱싱

유방울 2023. 6. 15. 21:50

 

# f1컬럼 결측치 제거
# temp[(temp['city']=='경기') & (temp['f2']==0)]['f1'] 완전 아님!!!!
# df['f1'] = df[~df['f1'].isnull()] 이거 아님 -
df = df[~df['f1'].isnull()]
print(df.isna().sum())

 city가 경기, f2가 0임 

 

temp = df.groupby(['city','f2']).sum()

print(temp)

           age     f1          f5
city f2                          
경기   0   720.4  833.0  943.944823
     1   696.0  670.0  657.241212
     2   239.0  311.0  362.300060
대구   0   387.0  527.0  183.199568
     1   217.6  235.0  241.333824
     2   140.0  211.0   79.667919
부산   0   331.0  389.0  284.371097
     1   188.7  315.0  299.270973
     2   -13.5   47.0   67.886373
서울   0   145.0  278.0  218.528577
     1   315.3  534.0  438.485010
     2    68.3  207.0  126.661135

인덱스가 0이면 바로 조건 만족!!

-> 열은 f1으로 인덱싱 하면 됨

#index가 0이고 칼럼은 f1임 -> 
# temp.iloc[0,:]아님 열을 f1으로 인덱싱해주면 됨
temp2 = temp.iloc[0]['f1']
print(temp2)
833.0