열심히 살아서 개같이 벌자

real-rock의 데이터 엔지니어 도전기

확률 2

딥러닝 기초 수학: 정보이론

기계 학습에서는 수학을 많이 사용한다. 특히, 대용량의 벡터 연산을 사용하고 데이터의 불확실성을 다루며 오류를 최소화하는 매개변수를 찾는 일을 모두 수학으로 처리한다. 따라서, 딥러닝을 공부함에 있어서 수학은 필수적으로 공부해야하는 분야이며 딥러닝 기초 수학 포스트에서는 다음 아래의 3가지 내용을 다룬다. 선형대수 확률 및 통계 최적화 이번 포스트에서는 확률과 통계 파트의 정보이론을 간단하게 소개하도록 하겠다. 사실 전공분야가 아니기 때문에 딥한 내용까지 다루지 못하는점 미리 죄송하다. 확률과 통계 파트의 앞쪽 부분인 Likelihood(우도)와 Maximum Likelihood Estimation(최대우도추론)에 대한 내용을 여기에 작성하였으니 궁금하면 이쪽에서 보면 될 것 같다. 이제 정보이론에 대한..

Likelihood란 무엇인가

이번 포스트에서는 "Likelihood(우도)"와 "Probability(확률)"에 대해 알아보도록 하자. 이 글에서는 다음 아래의 개념들을 알고 있다는 전제하에 진행한다. Probability distribution(확률 분포) Probability Density Function(확률밀도함수, PDF) Bayes Fromula(베이즈 정리) $ P(y|x)={P(x|y)P(y)\over P(x)} $ 위의 내용은 통계학의 기본 내용들로 간단한 구글 검색으로도 충분히 익힐 수 있다. 자 그럼 확률은 무엇인가를 예시로 알아보도록 하자. 만약 누군가가 이 세상 모든 고양이의 몸무게를 조사하여 고양이 몸무게 분포를 얻은 상황이라고 가정해보자. 조사를 해보았더니 몸무게는 다음 아래와 같이 평균이 5이고 표준편차..