티스토리 뷰
머신러닝에서 높은 정확도를 위해 필수적으로 거치는 단계는 스케일링이다.
스케일링은 데이터 셋의 단위가 압도적으로 차이가 나(어떤건 1000, 다른건 0.1) 구분이 어려운 경우에 단위를 비슷하게 재조정하는 과정이다.
그런데 알고리즘마다 표준화를 사용한다, 정규화를 사용한다, 스케일링한다. 다르게 표현한다.
세개가 어떻게 다른지 알아본다.
먼저 스케일링이란 통상적으로 단위를 조정할 때 쓰이는 말이다. 정규화를 이용해 스케일링한다, 표준화를 이용해 스케일링한다.
정규화(min-max scailing)
정규화란 데이터 셋의 값들을 0과 1 사이의 범위로 이동하고 재조정하는 스케일링 기법이다.
위 공식을 이용해 구할 수 있다.
표준화
표준편차와 평균을 중심으로 하는 스케일링 기법이다. 평균을 0으로 하고 결과 분포에 단위 표준편차를 사용한다.
사용처
정규화는 KNN,Neural Network처럼 데이터의 분포를 가정하지 않는 알고리즘에서 사용한다.
표준화는 정규분포(=가우스 분포)를 따르는 경우에 사용하면 좋다.
'머신러닝' 카테고리의 다른 글
머신러닝 / 공분산 행렬 PCA - 1 (1) | 2023.05.14 |
---|---|
머신러닝 / HAI Baseline (0) | 2023.03.27 |
머신러닝 / 차원 축소 1편 (0) | 2023.01.14 |
머신러닝 / 로지스틱 회귀 케라스 구현 (0) | 2023.01.13 |
머신러닝 / 로지스틱 회귀 (0) | 2023.01.13 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- porks
- SVM
- 단순선형회귀
- 차량용 이더넷
- 케라스
- 이상탐지
- PCA
- SOME/IP
- cuckoo
- one-to-many
- 크로스 엔트로피
- CAN-FD
- many-to-many
- json2html
- AE
- AVB
- Python
- automotive
- AVTP
- HTML
- problem statement
- automotive ethernet
- Ethernet
- 딥러닝
- 머신러닝
- 논문 잘 쓰는법
- many-to-one
- 회귀
- 로지스틱회귀
- 차량 네트워크
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함