5-1 . 확률 변수 & 확률 분포
● 확률 변수
측정치에서 얻을 수 있는 값의 총 집합을 표본 공간이라 하는데, 표본 공간의 각 값에 실수를 부여하는 함수를 확률 변수라고 한다.
확률 변수는 여러 확률 값을 사상과 연결할 수 있으며, 그 결과는 확률 분포로 나타난다.
● 확률 분포(probability distribution)
확률 변수가 취할 수 있는 모든 값에 대해 이들 값이 취할 수 있는 확률을 그림이나 표, 함수식으로 나타낸 것이다.
● 이산형 확률 분포(discrete probability distribution)
불량 수나 결점 수와 같이 셀 수 있는 확률 변수의 각 값에 대응되는 확률 분포를 의미한다.
● 연속형 확률 분포(continuous probability distribution)
제품이 중량이나 치수와 같이 셀 수 없는 연속 값을 갖는 확률 분포를 의미한다.
● 확률 분포 함수 (probability distribution function)
확률 변수에 대응되는 확률의 관계를 함수로 나타낸 것
확률 분포 함수는 항상 양값을 가지며, 표본 공간 안에 있는 전체 사상의 확률을 합치면 1이 된다.
즉, 어떤 사상이 각 발생할 경우에 대한 확률 값을 알려준다.
● 누적 분포 함수 (cumlative distribution function)
확률 밀도 함수가 이산형이나 연속형의 특정한 사상에 대한 확률을 나타낸다면 누적 분포 함수는 특정 구간 내의 사상들이 갖는 확률을 누적하여 값을 제시한다.
예를 들어 연속형 확률 분포에서 개별 지점이 확률 밀도 함수의 값(density)에 대응되지만,
연속형 값이어서 개별 상태는 고정된 간격이 아닌 어느 한 순간이 되며, 그러다 보니 그 상태에서의 확률은 0이 된다.
그래서 연속형 확률 분포에서는 특정 구간에 대한 확률을 누적해서 원하는 확률을 구하는 방식을 사용하는데, 바로 특정 구간의 확률 밀도 함수를 적분하여 그 값을 얻는다.