일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 로지스틱회귀분석
- RA
- BCG
- 주성분분석
- 코드스테이츠
- PCA
- 데이터사이언스
- 웹스크래핑
- 웜업
- Ai
- 컨설팅펌
- 데이터시각화
- 컨설팅
- 비전공자
- 맥킨지
- 빅데이터
- 선형대수학
- K-Digital Training
- t-test
- 컴퓨터공학
- 인공지능
- AI부트캠프
- 기계학습
- 디지털트레이닝
- 다중회귀분석
- 파이썬
- 코랩
- 캐글
- 국비지원교육
- 부트캠프
- Today
- Total
목록코드스테이츠 AI 부트캠프/ii) 기계학습 (8)
94년생 스피노자

이번 섹션의 3번째 주와 4번째 주는 개인 프로젝트 중심으로 이루어졌다. Warm-up이라 할만한 강의가 없었던 만큼 개인 발표 자료로 갈음한다. Logistic Regression과 Random Forest Classification을 진행한 코드고 첨부한다. 모두 행복하길 -끝-

데이터 모델의 종류는 정말로 다양하다. 모델도 다양하지만 파라미터도 다양하다. 선택지가 많다보니 무엇이 최선인지 알기가 쉽지가 않다. 이번에는 최선의 선택을 알아보는 과정에 대한 이야기다. 1. Machine Learning Fundamentals: Cross Validation https://www.youtube.com/watch?v=fSytzGwwBVw 모두 행복하길 -끝-

이번주는 분류모델을 만들고 있다. 애써 만든 분류모델은 어떻게 평가할 수 있을까. 기본적으로 3가지 지표가 있다. 정확도(Accuracy): 분류를 올바르게 한 비율(True는 True로, False는 False로 판단한 비율) 정밀도(Precision): True로 판단한 것들 중 실제로 True인 비율 재현율(Recall): 실제로 True인 것들 중 True로 판단한 비율 각 평가지표는 목적하는 바가 다르다. 예시로 초기에 암을 진단하기 위해서는 재현율이 중요하다. 재현율이 1이 되는 가장 쉬운 방법은 아무나 암이라고 판정하는 것이다. 하지만 이럴 경우 정밀도는 떨어지게 된다. 밸런스있게 판단하는 모델을 위해 Receiver Operating Characteristic(ROC)이 등장한다. 위 그래..

저번에는 결정 트리에 대해 배웠다. 결정 트리의 문제를 과적합이 심하다는 것이다. 이를 해결하기 위해 Random Forests 기법이 쓰인다. Random Forests에서는 정말 무수히 많은 Tree Model을 만든다. 그리고 수많은 Tree Model들을 갖고 최적의 예측을 한다. 나무가 모여서 숲이 되는 것이다. Tree Model을 엄청 많이 만들 때는 Random하게 만든다. 그래서 Random Forests인 것이고 과적합을 해결할 수 있는 것이다. 1. StatQuest: Random Forests Part 1 - Building, Using and Evaluating https://www.youtube.com/watch?v=J4Wdy0Wc_xQ 모두 행복하길 -끝-