유방울 2023. 5. 12. 22:58

way 1 파일 4개 합치기

# way 1
# [3-5] df2016, df2017, df2018, df2019를 합쳐 한 개의 DataFrame으로 만들어 df라는 이름을 지정합니다.
dfList = [df2016, df2017, df2018, df2019]
df = pd.concat(dfList,axis=0)

# df의 shape을 출력하여 전체 행, 열의 수를 확인합니다.
df.shape

way 2 glob 묘듈의 glob 함수

# way 2
# 날짜가 쪼개져 있을 때도 있ㅇㅡㅁ 
# 글로브 모듈의 글로브 함수 사용
import glob
glob.glob('data_01/data_day_*.xlsx')

정렬을 원하면 sorted()

#[TIP] 만일 파일이름을 정렬하고 싶다면 sorted() 함수를 사용합니다. 
# (-.- 강의에서는 언급을 몬했어요 ㅎ)
sorted(glob.glob('data_01/data_day_*.xlsx'))

way 3 파일의 개수가 많다면?  for문과 glob

# 코드를 줄일 수 있음
# 데이터도 4개가 아님 100개도 가능
import glob
dfList = []
for x in glob.glob('data_01/data_day_*.xlsx'):
    temp = pd.read_excel(x)
    dfList.append(temp)

df = pd.concat(dfList, axis = 0)
df.shape