일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 디지털트레이닝
- 빅데이터
- 국비지원교육
- RA
- 부트캠프
- t-test
- 맥킨지
- 주성분분석
- 기계학습
- 데이터사이언스
- 웹스크래핑
- 파이썬
- 코랩
- 컴퓨터공학
- Ai
- 캐글
- 인공지능
- 로지스틱회귀분석
- BCG
- PCA
- K-Digital Training
- 코드스테이츠
- AI부트캠프
- 선형대수학
- 비전공자
- 웜업
- 데이터시각화
- 컨설팅
- 컨설팅펌
- 다중회귀분석
- Today
- Total
목록전체 글 (60)
94년생 스피노자

이전에는 t-test를 다루었다. t-test를 통해 우리는 다음 2가지 경우를 연구할 수 있다. 1개 그룹의 평균이 특정 수와 같은지 2개 그룹의 평균이 서로 같은지 오늘 소개할 ANOVA는 2개 이상의 그룹의 평균이 서로 같은지를 검정한다. 0. ANOVA의 필요성 왜 ANOVA를 써야하는 것일까? 집단이 늘어나면 t-test를 여러번하면 되지 않나 싶다. 예를 들어 집단이 3개가 있다고 하자. 그러면 다음과 같은 조합으로 t-test가 가능하다. 집단 1 & 집단 2 집단 1 & 집단 3 집단 2 & 집단 3 이렇게 하면 모든 집단 간에 t-test가 이루어진다. 그럼 ANOVA는 필요 없지 않은가. 우리는 신뢰수준에 대해 명심해야 한다. 여러번의 t-test는 각각 95%의 신뢰수준으로 진행되었다..

t-test, ANOVA 등 다양한 통계 분석에는 표본의 평균이 쓰인다. 이번 노트에서는 그 이유에 대해서 설명하고자 한다. 아래 표를 보면 모든 것이 설명된다. 모집단의 분포가 어떻든 표본집단의 평균의 분포는 정규분포가 된다. 물론 표본집단의 크기가 어느정도 커야 한다. 학술적으로는 하나의 표본집단이 30개의 샘플을 가져야 한다고 본다. 제멋대로였던 분포가 평균을 활용하며 정규분포가 되는 것은 매우 중요하다. 정규성이 보장되어야 활용할 수 있는 t-test와 같은 도구를 쓸 수 있기 때문이다. 모두 행복하길 -끝-

t-test와 chi-test를 통해 샘플 값들을 서로 비교하는 법을 익혔다. 오늘은 그러한 검정들을 가능하게 해주는 신뢰구간에 대해 배울 것이다. 1. Central Limit Theorem https://youtu.be/YAlJCEDH2uY 2. Confidence Interval https://youtu.be/yDEvXB6ApWc 3. 신뢰구간의 의미 (포스텍) https://youtu.be/ae_WojQhNvs 가뭄에 단비 같은 한국어 강의다. 소중히 듣자. 4. if(Kakao)2020 : 개인화 컨텐츠 푸시 고도화 https://tv.kakao.com/v/413991950 모두 행복하길 -끝-

t 검정은 샘플 값들의 평균을 기준으로 집단을 평가한다. 종류로는 일원 t 검정(one sample t-test)와 이원 t 검정(two samples t-test)가 있다. 일원 t 검정은 하나의 샘플 집단이 특정 평균값을 갖고있는지 판별한다. 이원 t 검정은 두개의 샘플 집단의 평균값을 서로 비교한다. 0. t-test를 활용하기 위한 조건 t-test는 분명 강력한 도구다. 하지만 아래 3가지 조건을 만족해야 사용가능하다. * 독립성 t-test에서 비교하는 자료는 서로 독립적이어야 한다. 특정 약을 복용하기 전의 환자와 복용한 후의 환자는 독립적이지 않다. 이러한 자료는 서로 종속적이기 때문에 t-test가 불가능하다. * 정규성 t-test에 쓰일 샘플 값들은 정규분포의 형태여야 한다. 다른 분..