배치 정규화 (Batch Normalization)

Do it! 딥러닝교과서 내용을 공부하며 정리한 내용입니다.

http://www.kyobobook.co.kr/product/detailViewKor.laf?mallGb=KOR&ejkGb=KOR&barcode=9791163032991

Do it! 딥러닝 교과서 - 교보문고

퍼셉트론부터 GAN까지 핵심 이론 총망라! | 퍼셉트론부터 GAN까지 핵심 이론 총망라! 딥러닝 모델이 세상에 나온 배경과 작동 원리를 순서대로, 제대로 알려 주는 책! 순방향 신경망, 콘벌루션 신

www.kyobobook.co.kr

내부 공변량 (Internal covariate shift)

공변량 (covariate) : 독립변수는 통계적 문맥에 따라서 다르게 기술될 수 있다. 공변량은 그 중 하나의 용어이다. wikipedia에서는 아래와 같이 정의한다.

Depending on the context, an independent variable is sometimes called a "predictor variable", regressor, covariate, "manipulated variable", "explanatory variable", exposure variable (see reliability theory), "risk factor" (see medical statistics), "feature" (in machine learning and pattern recognition) or "input variable".[13][14] In econometrics, the term "control variable" is usually used instead of "covariate"

딥러닝에 사용되는 배치 데이터가 왜곡되는 현상을 Internal covariate shift라고 한다. 데이터의 분포가 은닉층을 지나면서 초기의 데이터가 가지는 통계적 특성의 변화폭이 점점 커지게 되고 은닉층이 많아질 수록 shift폭이 커지게 된다.

초기 입력 데이터의 정규화가 수행되더라도 은닉층을 지나면서 특정 데이터만 강화되어 학습 속도가 낮아지고 특정 은닉층이 결과에 대부분의 영향을 미치게되는 문제를 발생시킨다.