빅데이터 분석기사/작업 유형 1 (pd)
여러개 파일 합치기
유방울
2023. 5. 12. 22:58
way 1 파일 4개 합치기
# way 1
# [3-5] df2016, df2017, df2018, df2019를 합쳐 한 개의 DataFrame으로 만들어 df라는 이름을 지정합니다.
dfList = [df2016, df2017, df2018, df2019]
df = pd.concat(dfList,axis=0)
# df의 shape을 출력하여 전체 행, 열의 수를 확인합니다.
df.shape
way 2 glob 묘듈의 glob 함수
# way 2
# 날짜가 쪼개져 있을 때도 있ㅇㅡㅁ
# 글로브 모듈의 글로브 함수 사용
import glob
glob.glob('data_01/data_day_*.xlsx')
정렬을 원하면 sorted()
#[TIP] 만일 파일이름을 정렬하고 싶다면 sorted() 함수를 사용합니다.
# (-.- 강의에서는 언급을 몬했어요 ㅎ)
sorted(glob.glob('data_01/data_day_*.xlsx'))
way 3 파일의 개수가 많다면? for문과 glob
# 코드를 줄일 수 있음
# 데이터도 4개가 아님 100개도 가능
import glob
dfList = []
for x in glob.glob('data_01/data_day_*.xlsx'):
temp = pd.read_excel(x)
dfList.append(temp)
df = pd.concat(dfList, axis = 0)
df.shape