확률의 개념
경험 혹은 실험 결과로 특정한 사건이나 결과가 발생할 가능성
ex) 주사위를 던졌을때 각각의 눈이 나올 수 있는 확률은 모두 1/6 씩 임
확률의 종류
판단의 종류
|
주관적 확률
|
경험과 직관에 의한 주관적인 판단
|
A: 내일 비가 올 확률은?? B: 한 60% 되지 않을까??
A: 내가 내일 아침 지각할 확률은 얼마나 될까??
B: 그 가능성은 100% 야 ㅋㅋㅋ
|
|
객관적 확률
|
사전적 평가(고전적 확률개념)
|
각각의 결과가 나올 확률을 객관적으로 미리 판단할 수 있는 경우
|
A: 룰렛 게임에서 사망할 확률은 얼마지?
B: 6발중 1개니까 1/6 이지
|
|
사후적 평가(장기적 상대도수 확률개념)
|
같은 실험을 수없이 많이 반복했을 때 특정사건이 발생할 수 있는 상대적 가능성
|
A: 동전을 던지는 실험을 반복적으로 무수히 실행할 경우 앞면이 나올 확률은 1/2이라 할 수 있나??
B:물론. 마찬가지로 정육면체인 주사위를 반복적으로 무수히 던질경우 5가 나올 확률은 1/6이다
|
임의실험, 표본공간, 사상(사건)
임의실험(Random
Experiment) : 실험을 실행하기 전까지 결과를 알수 없는 실험
표본 공간(Sample Space) : 실험에서 나올수 있는 결과들의 범위
사상(사건)
주사위의 표본공간은 S ={1,2,3,4,5,6,} 이다.
표본 공간 속에서 홀수가 나오는 사건(사상,Event)은?? E = {1,3,5}
확률의 성질
- 모든 확률은 0과 1사이의 값을 갖는다
- 표본공간의 발생확률은 1이다
- 아무런 사건이 발생하지 않을 확률은 0 이다
- 두 사건이 동시에 발생하지 않는 경우 하나의 사건이나 다른 사건이 발생할 확률은 각 사건이 발생할 확률의 합이다.
확률과 확률변수
확률변수 : 표본공간상의 모든 표본점들에 수치를 부여하는 규칙
예시
- 2개의 동전을 던질 때 나올 수 있는 경우의 수, 즉 표본점은 총 4가지
- 표본공간 : S=[(H,H),(H,T),(T,H),(T,T)]
- 확률 : P = [1/4,/1/4,1/4,1/4]
- 확률변수 X는 동전의 앞면은 1, 뒷면은 0으로 하여 두 개의 동전을 던져 얻은 결과를 합한 값으로 정의
표본공간
|
확률변수(X)의 값
|
x값을 가질 확률
|
(T,T)
|
0
|
1/4
|
(H,T),(T,H)
|
1
|
1/4+1/4=1/2
|
(H,H)
|
2
|
1/4
|
- 모집단에서 추출된 표본의 특성을 나타내는 통계량은 확률변수임
- 확률변수는 확률값과 연동하여 특정한 값을 갖게 되는 변수를 말함
- 하나의 실험결과를 나타내는 표본공간으로 부터 수없이 많은 확률변수(규칙)을 만들 수 있음
확률변수가 가질 수 있는 값들의 수와 명확성
|
변수값이 명확하고 그 수가 한정적임
|
이산 확률 변수
|
정수와 같이 명확한 값을 변수값으로 함
확률변수가 가질 수 있는 값의 수가 한정되어 그 수를 셀 수 있는 변수
|
2개의 동전을 던져서 나오는 앞면의 수
|
실수를 변수값으로 하고 그 수도 무한대에 이름
|
연속 확률 변수
|
변수값이 정수처럼 명확하지 못함
확률변수가 연속량으로 표기되어 가능한 변수값의 개수를 셀 수 없는 변수
|
통계학을 수강하는 학생들의 평균키
|
이산확률분포
X 를 이산확률 변수라 하고, X 가 가질 수 있는 k개의 값을
x1,x2,x3,.....xk 라 하면
P[X= xi] = p(xi) : X가 xi 값을 가질 확률
예제
X : 어느 자동차 대리점이 지난 25일 동안 판매한 자동차 대수
한대도 판매하지 못한날 3일 : P[X=0] = 3/25
1대를 판매한 날 7일 : P[X=1] = 7/25
2대를 판매한 날 9일 : P[X=2] = 9/25
3대를 판매한 날 4일 : P[X=3] = 4/25
4대를 판매한 날 2일 : P[X=4] = 2/25
이산 확률 분포표
x
|
x1
|
x2
|
....
|
xk
|
p(x)
|
p(x1)
|
p(x2)
|
....
|
p(xk)
|
확률 함수의 특성
모든 xi에 대해
p(xi)>= 0 ==> p(x1)+p(x2)+.....+p(xi)=1
기대값과 분산
기대값 : 확률변수의 평균
E(x) = x1*p(x1)+x2*p(x2)+....+xi*p(xi)
분산(variance) :
기대값 간의 거리 흩어짐 정도
표준편차(Standard
Deviation) : 분산의 제곱근
순열과 조합
순열(Factorial)
: n 개의 결과(사물) 들을 정렬하는 방법의 수를 세는 수단
0! = 1 , 1! = 1, 2!= 2*1 = 2 , 3! = 3*2*1 = 6
조합(Combination)
: n개중 k 개를 선책하는 방법의 수를 세는 수단
n! / k!(n-k)!
이항분포
이항분포 : 두 사건만 일어나는 경우
베르누이시행 : 실험결과가 성공 또는 실패의 두 가지 상호배반사건으로 나누어질 수 있으며, 실험의 결과가 성공일 확률이 p 이고, 실패할 확률이 (1-p)인 실험을 베르누이 실험 또는 베르누이 시행이라 한다
베르누이 확률변수 X(실험결과를 나타내는 확률변수)
결과 : 성공 or 1 (X = 1)
실패 or 0 (X =
0)
이항 실험 : 성공의 확률이 p인 베르누이 시행을 n 번 독립적으로 반복하는 실험
이항분포의 평균과 분산
평균 E(x) = np
분산 V(x) =
np(1-p)
표준편차 = 분산의 제곱근
예제
이항분포의 예제 찾아보기..
포아송분포
포아송분포(Poisson
distribution) : 특정 기간에 발생하는 사건의 수
l 주어진 구간에서
사건의 평균 발생 수는 구간의 시작점에는 관계가 없고 구간의 길이에만 영향을 받는다.
l 아주 작은
구간에서 2회 이상의 사건이 발생할 확률은 아주 작아서 무시할 수 있다.
l 한 구간에서
발생하는 사건의 수는 시간이나 공간의 구간별로 독립이다.
포아송분포의 확률분포함수
𝑃(𝑋=𝑥)=𝑝(𝑥)=(𝑒^(−𝜆) 𝜆^𝑥)/𝑥! 단, 𝑥=0, 1, 2, ….
포아송분포의 평균과 분산
평균=𝐸(𝑋)=𝜆
분산=𝑉(𝑋)=𝜆
표준편차 = √분산=√𝜆
포아송분포의 확률계산
예제
자동차를 판매하는 대리점에 1시간당 방문하는 고객의 수는 포아송 확률분포를
이룬다고 가정하자. 그리고 평균적으로 1시간당 두 명의 고객이
방문한다고 가정하자.
l 1시간 동안 방문하는 고객의 수의 평균 및 표준편차를 구하라.
l 1시간 동안 방문하는 고객이 한 명도 없을 확률을 구하라.
l 3명 이상의 고객이 방문할 확률을 구하라.
포아송분포를 적용하는 경우
지난 일주일 동안 복잡한 사거리에서 발생하는 교통사고의 수
회계장부 한 장에 있는 오류의 수
일정한 혈액소에 있는 백혈구의 수
어느 하루에 걸려오는 전화의 수
오전 10시부터 오후 3시
사이에 은행창구를 찾는 고객의 수
댓글
댓글 쓰기