빅데이터 분석기사/작업 유형 3 (stats) 5

대립가설 기준, loc 인덱싱

후에서 전을 빼는 것을 잘 기억하기 대응, 쌍체 -> 두 개라는 의미기 때문에 두 개가 관계가 있다!는 것은 rel ttest_1samp, ttest_ind import scipy.stats from ttest_rel # 후 - 전 # a(after) - b(before) mean = (df['bp_post'] - df['bp_pre']).mean() print(round(mean,2)) st, pv = ttest_rel(df['bp_post'], df['bp_pre'], alternative = 'less') print(round(st,4)) print(round(pv,4)) print('기각'if pv alternative = 'greater' 75로 수치가 정해짐 -> ttest_1samp 사실 어..

사후검정 이론 및 실습 - 시험 안나올 가능성 높음

사후검정? ANOVA분석의 문제 : 다르다는 것은 알지만 어떤 집단간의 차이가 있는지 알 수 없음 사후검정을 통해 어떤 것에 차이가 있는지 알 수 있음 모수 통계 사후 검정의 종류 Tukey Duncan : 통계적 유의성 도출하기 쉬움 - 1종 오류 발생확률 통제 안 함 scheffe : 가장 보수적, 엄격한 사후검정 방식, 통계적 유의한 차이 도출 쉽지 않음 fisher : 가장 엄격하지 않은 사후 검정 방법, 최근 연구에서 선호되지 않음 - 1종 통제 x games howell :이분산, 동일하지 않은 표본의 크기, 표본수 6개 미만시 1종오류 발생률 높음 15개 이상 권장 민감도로 구분 엄격하지 않아서 유의성을 도출하기 쉬움 : 세페 < 터키 < 던칸,피셔 던칸 : 작은 차이에도 차이가 난다 but..

ANOVA 이론 및 실습

anova 독립변수 - 범주형 종속변수 - 연속형 으로 하는 3개 이상의 집단 평균을 비교 2개는 t검정 집단간분산/분단내분산 기반의 f분포를 이용해 가설 검정을 함 -> 정규성, 등분산성, 독립성을 가정 집단 간 분산, 집단 내 분산을 이용 -> 분산분석 귀무가설 기각 시 구체적인 차이를 파악하기 위해 사후검정(post hoc test)이 필요함 등분산,동일크기 표본 -> tukey검정 등분산, 다른 크기 표본 -> scheffe 검정, fisher's lsd 검정 분산 분석은 , 의 분산을 분석함!! 일원분산분석 one-way anova 범주형 독립 변수가 한 개인 경우 사용 계절별 아이스크림 판매량 평균이 동일하다 귀무 : 모든 집단의 평균이 같다. 대립 : 하나 이상의 집단의 평균이 다르다 이원산..

t-test 실습, 분류모델에서 t-test 활용 함수

t-test 실시전에 정규성 및 등분산성이 만족되어야 함 One sample t-test 20대 평균 수면시간에 대한 one samle t-test 유의수준 0.05 사용 숫자 소수점 아래 4번째 자리까지 표시 one sample이기 때문에 등분산성 검정 생략 가능 # 정규성 검정 from scipy.stats import shapiro statistic, pvalue = shapiro(pd['stime20s']) print(round(statistic, 4), round(pvalue, 4)) print('기각' if pvalue 같다. 채택 -> 같다. 가설 3 alternative='greater' 귀무 : 20대는 평균 수면시간이 작거나 같다. 대립 : 크다 기각 -> 작거나 같다. 채택 -> 크다..

T-test 이론

t-test 스튜던트 t-테스트(Student's t-test)라고 함 귀무가설 하에서 t-분포를 따르는 통계적 가설 검정 표본을 사용한 모평균 3종류 one sample t-test 표본을 사용ㅇ한 모평균 검정방법 귀무가설 : s사의 usb 평균 수명은 20000 시간이다. paired t-test 대응표본 t검정 동일 개체에 어떤 처리를 하긴 전, 후의 자료를 얻을 때 차이 값에 대한 평균 검정을 위한 방법 매일 1시간 한달 걸으면 2kg이 빠진다.(걷기 수행 전/ 수행 후 ) 가능한 동일한 특성을 갖는 두 그룹에 서로 다른 처리를 해서 그 처리의 효과를 비교하는 방법 x질병 환자들을 두 집단으로 나눠 a, b 약을 투약해 약의 효과 비교 two sample t-test 독립표본 t-검정 서로 다른 ..