빅데이터 분석기사/작업 유형 1 (pd)

isin(), str accessor

유방울 2023. 4. 26. 22:04

st.conatins('')

KBS 포함된 채널명

리스트 형

# [1-44] title에 'KBS'가 포함된 채널 명 목록을 만들어 봅니다.
df[df['title'].str.contains('KBS')]['title'].to_list()

['KBS World',
 'KBS Kpop',
 'KBS Entertain',
 'KBS Drama',
 'KBS 한국방송',
 'KBS Drama Classic',
 'KBS HUMAN: 뭉클티비',
 'KBS News',
 'KBS CoolFM',
 'KBS N',
 'KBS KONG',
 'KBS Documentary [KBS 다큐]',
 'KBS 교양']

넘파이 형식

df.loc[df['title'].str.contains('KBS'), 'title'].to_numpy()

array(['KBS World', 'KBS Kpop', 'KBS Entertain', 'KBS Drama', 'KBS 한국방송',
       'KBS Drama Classic', 'KBS HUMAN: 뭉클티비', 'KBS News', 'KBS CoolFM',
       'KBS N', 'KBS KONG', 'KBS Documentary [KBS 다큐]', 'KBS 교양'],
      dtype=object)

주의 : str.upper().str.contains('')

str 두 번 사용

# 대소문자 구분 없이 검색 하려면?
# str.contain() 
df.loc[df['title'].str.upper().str.contains('KBS'), 'title'].to_numpy()

'빅데이터 분석기사 > 작업 유형 1 (pd)' 카테고리의 다른 글

4/27 csv 파일 가져오기  (0) 2023.04.27
series의 통계값  (0) 2023.04.26
데이터 검색, boolean indexing  (0) 2023.04.26
데이터 정렬  (0) 2023.04.26
데이터 형식 변경 2/2  (1) 2023.04.26