기본 콘텐츠로 건너뛰기

확률의 이해

확률의 개념
경험 혹은 실험 결과로 특정한 사건이나 결과가 발생할 가능성
ex) 주사위를 던졌을때 각각의 눈이 나올 있는 확률은 모두 1/6
확률의 종류
판단의 종류
주관적 확률
경험과 직관에 의한 주관적인 판단
A: 내일 비가 확률은?? B: 60% 되지 않을까??
A: 내가 내일 아침 지각할 확률은 얼마나 될까??
B: 가능성은 100% ㅋㅋㅋ
객관적 확률
사전적 평가(고전적 확률개념)
각각의 결과가 나올 확률을 객관적으로 미리 판단할 있는 경우
A: 룰렛 게임에서 사망할 확률은 얼마지?
B: 6발중 1개니까 1/6 이지
사후적 평가(장기적 상대도수 확률개념)
같은 실험을 수없이 많이 반복했을 특정사건이 발생할 있는 상대적 가능성
A: 동전을 던지는 실험을 반복적으로 무수히 실행할 경우 앞면이 나올 확률은 1/2이라 있나??
B:물론. 마찬가지로 정육면체인 주사위를 반복적으로 무수히 던질경우 5 나올 확률은 1/6이다

임의실험, 표본공간, 사상(사건)
임의실험(Random Experiment) : 실험을 실행하기 전까지 결과를 알수 없는 실험
표본 공간(Sample Space) : 실험에서 나올수 있는 결과들의 범위
사상(사건)
주사위의 표본공간은 S ={1,2,3,4,5,6,} 이다.
표본 공간 속에서 홀수가 나오는 사건(사상,Event)?? E = {1,3,5}
확률의 성질
  • 모든 확률은 0 1사이의 값을 갖는다
  • 표본공간의 발생확률은 1이다
  • 아무런 사건이 발생하지 않을 확률은 0 이다
  • 사건이 동시에 발생하지 않는 경우 하나의 사건이나 다른 사건이 발생할 확률은 사건이 발생할 확률의 합이다.
확률과 확률변수
확률변수 : 표본공간상의 모든 표본점들에 수치를 부여하는 규칙
예시


  • 2개의 동전을 던질 나올 있는 경우의 , 표본점은 4가지
  • 표본공간 : S=[(H,H),(H,T),(T,H),(T,T)]
  • 확률 : P = [1/4,/1/4,1/4,1/4]
  • 확률변수 X 동전의 앞면은 1, 뒷면은 0으로 하여 개의 동전을 던져 얻은 결과를 합한 값으로 정의
표본공간
확률변수(X)
x값을 가질 확률
(T,T)
0
1/4
(H,T),(T,H)
1
1/4+1/4=1/2
(H,H)
2
1/4


  • 모집단에서 추출된 표본의 특성을 나타내는 통계량은 확률변수임
  • 확률변수는 확률값과 연동하여 특정한 값을 갖게 되는 변수를 말함
  • 하나의 실험결과를 나타내는 표본공간으로 부터 수없이 많은 확률변수(규칙) 만들 있음
확률변수가 가질 있는 값들의 수와 명확성
변수값이 명확하고 수가 한정적임
이산 확률 변수
정수와 같이 명확한 값을 변수값으로
확률변수가 가질 있는 값의 수가 한정되어 수를 있는 변수
2개의 동전을 던져서 나오는 앞면의
실수를 변수값으로 하고 수도 무한대에 이름
연속 확률 변수
변수값이 정수처럼 명확하지 못함
확률변수가 연속량으로 표기되어 가능한 변수값의 개수를 없는 변수
통계학을 수강하는 학생들의 평균키

이산확률분포
X 이산확률 변수라 하고, X 가질 있는 k개의 값을 x1,x2,x3,.....xk 하면
P[X= xi] = p(xi) : X xi 값을 가질 확률
예제


X : 어느 자동차 대리점이 지난 25 동안 판매한 자동차 대수
한대도 판매하지 못한날 3  :  P[X=0] = 3/25
1대를 판매한 7  :  P[X=1] = 7/25
2대를 판매한 9  :  P[X=2] = 9/25
3대를 판매한 4  :  P[X=3] = 4/25
4대를 판매한 2  :  P[X=4] = 2/25


이산 확률 분포표
x
x1
x2
....
xk
p(x)
p(x1)
p(x2)
....
p(xk)
확률 함수의 특성
모든 xi 대해 p(xi)>= 0   ==>   p(x1)+p(x2)+.....+p(xi)=1
기대값과 분산
기대값 : 확률변수의 평균
E(x) = x1*p(x1)+x2*p(x2)+....+xi*p(xi)
분산(variance) : 기대값 간의 거리 흩어짐 정도
표준편차(Standard Deviation) : 분산의 제곱근
순열과 조합
순열(Factorial) : n 개의 결과(사물) 들을 정렬하는 방법의 수를 세는 수단
0! = 1 , 1! = 1, 2!= 2*1 = 2 , 3! = 3*2*1 = 6
조합(Combination) : n개중 k 개를 선책하는 방법의 수를 세는 수단
n! / k!(n-k)!
이항분포
이항분포 : 사건만 일어나는 경우
베르누이시행 : 실험결과가 성공 또는 실패의 가지 상호배반사건으로 나누어질 있으며, 실험의 결과가 성공일 확률이 p 이고, 실패할 확률이 (1-p) 실험을 베르누이 실험 또는 베르누이 시행이라 한다
베르누이 확률변수 X(실험결과를 나타내는 확률변수)
결과 : 성공 or 1 (X = 1)
실패 or 0 (X = 0)
이항 실험 : 성공의 확률이 p 베르누이 시행을 n 독립적으로 반복하는 실험
이항분포의 평균과 분산
평균 E(x) = np
분산 V(x) = np(1-p)
표준편차 = 분산의 제곱근
예제


이항분포의 예제 찾아보기..
포아송분포

포아송분포(Poisson distribution) : 특정 기간에 발생하는 사건의
l  주어진 구간에서 사건의 평균 발생 수는 구간의 시작점에는 관계가 없고 구간의 길이에만 영향을 받는다.
l  아주 작은 구간에서 2회 이상의 사건이 발생할 확률은 아주 작아서 무시할 수 있다.
l  한 구간에서 발생하는 사건의 수는 시간이나 공간의 구간별로 독립이다.

포아송분포의 확률분포함수
𝑃(𝑋=𝑥)=𝑝(𝑥)=(𝑒^(𝜆) 𝜆^𝑥)/𝑥!    𝑥=0, 1, 2, ….
포아송분포의 평균과 분산
평균=𝐸(𝑋)=𝜆
분산=𝑉(𝑋)=𝜆
표준편차 = √분산=√𝜆

포아송분포의 확률계산
예제


자동차를 판매하는 대리점에 1시간당 방문하는 고객의 수는 포아송 확률분포를 이룬다고 가정하자. 그리고 평균적으로 1시간당 두 명의 고객이 방문한다고 가정하자.
l  1시간 동안 방문하는 고객의 수의 평균 및 표준편차를 구하라.
l  1시간 동안 방문하는 고객이 한 명도 없을 확률을 구하라.
l  3명 이상의 고객이 방문할 확률을 구하라.
포아송분포를 적용하는 경우
지난 일주일 동안 복잡한 사거리에서 발생하는 교통사고의 수
회계장부 한 장에 있는 오류의 수
일정한 혈액소에 있는 백혈구의 수
어느 하루에 걸려오는 전화의 수

오전 10시부터 오후 3시 사이에 은행창구를 찾는 고객의 수

댓글

이 블로그의 인기 게시물

블록체인 거래소 모니터링시스템 구축이야기(2/?) - 서버 아키텍처

  코인 거래소 모니터링시스템 구축이야기(2/?) 코인 거래소 모니터링 시스템 구축 (가칭 : 김프멈춰) 서버 구성 사용자가 확인할 서비스 페이지, 데이터 저장소에 대한 서버는 NAS 서버로 운영 일일 Data 크롤링 서버는 Cloud 서버 이용하여 운영 - 서비스페이지 및 데이터 저장소 (Nas 서버) : Docker container ubuntu 20.04 - 일일 크롤링 서버 (Cloud at Cost Cloud 서버) : CentOS 7 서버 아키텍처 서버 아키텍처 레퍼런스 빗썸 : https://apidocs.bithumb.com/ 업비트 : https://docs.upbit.com/ 홍콩 Bitfinex : https://docs.bitfinex.com/docs 몽고 DB 설치 : https://coterie.tistory.com/20 1. 개요 :  https://limdh3325.blogspot.com/2021/04/1.html 2. 서버 아키텍처 :  https://limdh3325.blogspot.com/2021/04/2.html 3. MongoDB 설치 :  https://limdh3325.blogspot.com/2021/04/3.html 4. 데이터 모델링 :  https://limdh3325.blogspot.com/2021/05/4.html 5. MongoDB 저장 :  https://limdh3325.blogspot.com/2021/06/5.html