Python 5

7주차 군집화 공부

1. #열에서 등장한 횟수를 내림차순해서 상위 10개 retail_df['Country'].value_counts()[:10] 2. # 고유한 값 반환 retail_df['Country'].unique() 3. 행, 열 갯수 retail_df.shape 4. #새로운 sale_amount 열 생성 #CustomerID 정수형 변환 retail_df['sale_amount'] = retail_df['Quantity'] * retail_df['UnitPrice'] retail_df['CustomerID'] = retail_df['CustomerID'].astype(int) 5. RFM 마케팅 기법 중 하나 RFM은 Recency(최근 구매일), Frequency(구매 빈도), Monetary(구매 금액)의 ..

Python/IBA 2023.05.12

회귀모델링

# 독립변수로 설정할 train_x에서는 종속변수를 제거합니다. X_train = train.drop(['price'], axis = 1) # train_y 변수를 종속변수로 사용하기 위해 price 데이터를 지정하였습니다. y_train = train['price'] # train_x와 달리 분석에 활용하지 않는 ID 데이터를 제거합니다. X_test = test.drop('id', axis = 1) # 학습 데이터와 테스트 데이터로 분할 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X_train, y_train, test_size=0.3, random_stat..

Python/IBA 2023.05.08

원핫인코딩 pandas의 get_dummies() vs sklearn의 OneHotEncoder

pandas의 get_dummies() 함수 간단하게 사용할 수 있어서 코드를 직관적으로 이해하기 쉽습니다. 텍스트 데이터를 바로 변환할 수 있기 때문에, 전처리 과정이 단순화됩니다. 범주형 변수의 각 카테고리를 독립적인 새로운 특성으로 인코딩합니다. 범주형 변수에 대해 원핫인코딩을 적용하면 새로운 열이 추가되기 때문에, 데이터프레임의 컬럼 수가 늘어납니다. 누락된 값(결측치)을 처리하는 dummy_na 매개변수를 제공합니다. sklearn의 OneHotEncoder 희소행렬을 반환하므로, 메모리 사용량이 줄어듭니다. 범주형 변수의 각 카테고리를 독립적인 새로운 특성으로 인코딩합니다. get_dummies() 함수와는 달리, 범주형 변수의 각 카테고리를 문자열로 인코딩할 수 없으므로, 사전에 정수 인코딩..

Python/IBA 2023.05.07

[Chat GPT] No module named 'google.colab' 주피터 오류

Q) No module named 'google.colab' 라고 주피터에서 오류가 생겼는데 어떻게 해결해야 돼? A) 이 오류는 Google Colab 라이브러리가 설치되어 있지 않아서 발생하는 것입니다. Google Colab은 Google이 제공하는 무료 클라우드 기반 Jupyter 노트북 환경이며, 주로 머신러닝과 딥러닝 모델 개발을 위해 사용됩니다. 설치 확인 !pip freeze | grep google-colab 설치 !pip install google-colab 설치 후 모듈 불러오기 import google.colab

Python/IBA 2023.03.20

공부공부

Jupyter 에서 markdown 표시 #표시하면 제목처럼 크게 표현할 수 있다. 좀 더 구체적으로 알고 싶으면 아래를 참고하면 좋을 거 같다! https://azanewta.tistory.com/9 [파이썬] 마크다운을 이용한 주피터 노트북 정리하는 방법~! Jupyter notebook 및 최근 Jupyter lab은 Machine learning 및 Data science 쪽에서 주로 사용하고 있습니다. 오늘은 여기서 간과하기 쉬운 Mark down 작성법에 대해서 같이 알아보겠습니다. 자 준비되셧나요? notebook azanewta.tistory.com https://m.blog.naver.com/ciy981118/222175309877 [파이썬] 주피터 노트북 사용법 / 주석만들기 / 마크다..

Python/IBA 2023.03.06