문자열 엑세서 str 사용해 split() 메서드 사용
str.split()
bread['소재지전체주소'].str.split()
0 [광주광역시, 서구, 치평동, 1177-2번지, (106,107호)]
1 [광주광역시, 서구, 유촌동, 868-1번지, (102호)]
2 [광주광역시, 서구, 화정동, 1611번지, 101호102호103호, 상가2동]
3 [광주광역시, 북구, 운암동, 110-5번지]
4 [광주광역시, 북구, 오치동, 578-4번지, 1층]
str.split().str[0] : 문자 분리하고 첫번째 인덱스 추출
# [4-8] bread 의 '소재지전체주소' 중 시/도에 대한 정보(목록)를 추출합니다.
# 광주광역시 부분만 필요함
# split은 그냥 사용 x -> str 엑세서와 함께 사용함
bread['소재지전체주소'].str.split().str[0]
0 광주광역시
1 광주광역시
2 광주광역시
3 광주광역시
4 광주광역시
조건 복잡할 경우 새로운 시리즈 만들기
시리즈 & 시리즈 : 괄호 생략 가능
(조건) & (조건) : 괄호 필수
# [4-9] bread에서 소재지전체주소의 처음이 '서울특별시'이면서,
# '업태구분명'이 '제과점영업'인 것만 추출합니다
con1 = bread['소재지전체주소'].str.split().str[0] == '서울특별시'
con2 = bread['업태구분명'] == '제과점영업'
bread = bread[con1 & con2]
bread.head(2)
문자열 분리 -> 첫번째 인덱스 추출 -> 이를 bread의 구명 칼럼 등록
# [4-11] bread의 '소재지전체주소'에서 '구명', '동명'을 추출하여
# bread에 새로운 컬럼으로 등록합니다.
# way 1
bread['구명'] = bread['소재지전체주소'].str.split().str[1]
bread['동명'] = bread['소재지전체주소'].str.split().str[2]
여러개 뽑을 거면 분리해서 만들기
#way2 여러개 뽑을거면 더 추천!!
temp = bread['소재지전체주소'].str.split()
bread['구명'] = temp.str[1]
bread['동명'] = temp.str[2]
칼럼 확인
# bread의 컬럼명을 출력해 '구명', '동명'이 추가되었는지 확인함
bread.columns
Index(['인허가일자', '상세영업상태코드', '폐업일자', '소재지전체주소', '사업장명', '업태구분명', '구명', '동명'], dtype='object')
'빅데이터 분석기사 > 작업 유형 1 (pd)' 카테고리의 다른 글
결측치 확인/채우기, rename으로 컬럼명 변경 (0) | 2023.05.17 |
---|---|
데이터 전처리를 위한 str Accessor (0) | 2023.05.17 |
행/열이 많은 csv 읽고 구조 확인하기 (0) | 2023.05.17 |
5/16 그룹별 통계 심화 학습 (groupby, pivot_table) (0) | 2023.05.16 |
평균을 사용한 결측치 대체 (0) | 2023.05.16 |