일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 기계학습
- 부트캠프
- BCG
- 빅데이터
- 인공지능
- 주성분분석
- 캐글
- 국비지원교육
- 로지스틱회귀분석
- 데이터사이언스
- 파이썬
- 컴퓨터공학
- K-Digital Training
- 코드스테이츠
- 웹스크래핑
- RA
- 데이터시각화
- 다중회귀분석
- AI부트캠프
- 컨설팅
- 선형대수학
- 컨설팅펌
- 디지털트레이닝
- Ai
- 웜업
- t-test
- 비전공자
- 맥킨지
- PCA
- 코랩
- Today
- Total
목록코드스테이츠 (29)
94년생 스피노자

코드스테이츠에서 각 Section의 마지막 주는 개인프로젝트가 이루어진다. 이번 Section 1의 개인프로젝트로는 비디오 게임 분석이 주어졌다. 상황설정은 게임회사에서 다음 분기에 발매할 게임을 기획하는 것이다. 기본적으로 주어진 과제는 다음과 같다. 지역별로 선호하는 게임장르가 있는지 분석 연도별로 게임 트렌드가 있는지 분석 밀리언셀러 게임 분석 0. 데이터 소개 데이터는 코드스테이츠에서 마련한 자료라 공유할 수 없음을 밝힌다. 데이터에서 주어진 정보는 다음과 같다. 게임 제목 게임 구동기기 e.g. PlayStation 게임 출시년도 게임 장르 게임 배급사 북아메리카 판매량 유럽 판매량 일본 판매량 기타 지역 판매량 1. 분석 결과 Q1. 지역별로 선호하는 게임장르가 있는지 분석 아래서 활용한 발표..

K-평균 군집화는 저번에 올린 주성분 분석과 같이 쓰기가 좋다. K-평균 군집화로 그룹을 분류 주성분 분석으로 차원을 축소해 시각화 0. K-평균 군집화 기초 K-평균 군집화는 전체 데이터를 K개의 그룹으로 나눈다. 주어진 조건이 없다면 K개로 그룹을 나누는 방법은 무한히 많다. 따라서 K-평균 군집화에는 다음과 같은 기준이 주어진다. 각 그룹의 중심과 개별 데이터 간의 거리가 최대한 짧게 하라 위 기준 덕분에 K-평균 군집화의 결과 조밀하게 모여있는 그룹을 얻을 수 있다. 1. 데이터 불러오기 이번 예시에서는 Kaggle에서 데이터를 가져왔다. https://www.kaggle.com/uciml/breast-cancer-wisconsin-data Breast Cancer Wisconsin (Diagno..

저번에는 PCA를 통해 차원축소를 하는 법을 배웠다. 이번에는 Clustering 기법을 배울 것이다. PCA는 데이터를 표현할 때 분산이 크게 표현할 수 있도록 도와줬다. 즉 데이터들이 최대한 멀리 퍼져있도록 해준 것이다. PCA 진행 후 Clustering을 하면 데이터의 그룹을 유추할 수 있다. 즉 데이터의 라벨 없이 분류하고자 할 때 유용하다. 관련 Warm-Up 링크를 아래에 첨부한다. 1. Main Ideas of PCA https://youtu.be/HMOI_lkzW08 2. Scree Plot https://youtu.be/vFUvNICWVz4 3. Hierarchical Clustering https://youtu.be/EUQY3hL38cw 4. if(kakao)2020 - 이상거래탐지를..

이제 슬슬 머리가 매우 아파져온다. 이번에는 차원축소를 하는 방법에 대해 배운다. 0. 차원축소의 필요성 차원은 데이터의 변수를 의미한다. 사람을 설명하기 위해 나이, 키, IQ를 활용한다면 데이터는 3차원이 된다. 물론 3차원 정도에서는 데이터를 분석하는 것에 큰 문제가 되지 않는다. 데이터를 시각화하기도 어렵지 않고 직관적으로 이해할 수 있기 때문이다. 하지만 데이터가 4차원만 되더라도 이해하기가 매우 어려워진다. 변수가 100개라면 상상하다가 미칠지도 모른다. 이런 문제를 해결하기 위해 차원축소가 필요한 것이다. 1. 차원축소 방법 대표적인 차원축소 방법은 Principal Component Analysis(PCA)가 있다. 한국어로는 주성분분석이다. PCA의 핵심은 분산이 가장 큰 분산을 고르는 ..