6σ 연계 TPM추진 방법론

SSL보안서버인증필

확률의 개념

1. 확률이란?

통계학은 불확실한 현상을 대상으로 하는 학문이며 불확실한 현상에 대한 분석은 그 현상이 발생할 가능성을 이용한다.

이와 같이 어떤 현상이 일어날 가능성을 측정하는 척도를 확룔(probability)이라고 한다.

가능성을 측정하는 척도인 확률은 0에서 1사이의 값을 갖는다. 즉, 어떤 현상이 틀림없이 발생한다면 그 현상이 발생될 확률은 1이고, 그 현상이 발생될 가능성이 전혀 없다면 그 현상이 발생될 확률은 0이다.

예를 들면 인간이 150살 이상을 살 확률은 0이라고 할 수 있고, 일기예보에서 '내일 비 올 확률은 0.8이다'라고 발표하였다면 현재의 기상조건에 의하여 판단할 때 '내일 비가 올 가능성이 80%이다'라고 이해할 수 있다.

다음의 예를 통해 확률에 대해 구체적으로 이해해 보자.

얼마 전 텔레비전의 한 토크 쇼에 부산의 딸부자집이라고 불리는 부부와 일곱 명의 딸이 출연했는데 사회자가 "어쩌다가 딸만 일곱을 낳게 되었습니까?"라고 물었더니 그 어머니는 이렇게 대답하였다.
"딸을 셋 낳으니까 이웃사람들이 '딸 셋을 잇달아 낳으면 다음 아이는 틀림없이 아들이다'라고 하기에 낳았더니 또 딸이네요. 그런데 딸 다섯을 낳으니까 다음엔 정말로 틀림없이 아들이라고 하기에 또 낳았더니 딸이었다."

이 대답에 방청객들은 큰 웃음을 터뜨렸지만 그 속에는 사람들이 종종 헷갈리는 확률적 오류가 숨어 있다.

어느 경우에나 아들을 낳을 확률은 2분의1이다. 잇달아 딸 다섯을 낳았더라도 다음에 다시 아들을 낳을 확률은 여전히 2분의1이다.

2. 확률의 해석

2.1  확률의 고전적 해석

확률이 고전적 해석은 '우연의 게임(games of chance)'으로부터 유래하는데 이는 각 사건이 일어날 가능성, 즉 활률은 시행하는 게임에서 본질적으로 파악할 수 있다는 것이다.

예를 들면 균형된 동전을 던질 때 나타날 수 있는 면은 앞면(head)과 뒷면(tail)뿐이다.

각 경우가 나타날 가능성은 동일하므로 앞면 또는 뒷면이 나타날 가능성은 각각 1/2 이라는 접근방법이다.

이러한 경우 각각의 사건에 대한 확률은 누구에 의해서도 동일한 값을 갖게 되므로 확률의 고전적 해석을 확률의 객관적 해석이라고도 한다.

예를 들면 '52장으로 된 틀럼프 카드에서 임의로 한 장을 뽑을 때 에이스(ace)가 뽑힐 확률은 4/52 (52장 중에서 에이스가 4장이므로)이다.

이와 같이 누구에 의해서나 동일한 값으로 계산되는 확률계산방법은 고전적 해석이라고 한다.

2.2  확률의 상대도수에 의한 해석

확률은 상대도수에 의한 해석은 확률의 실험적 접근에 의한 방법으로 반복실험에 의하여 나타난 결과의 표현이다.

즉 어떤 실험을 무한히 반복하였을 때 사건 A가 일어난 경우가 30%라면 사건 A가 발생될 확률은 30%라고 할 수 있다.

예를 들면 한 양궁선수가 활을 1,000번 쏘아서 과녁의 원을 900번 맞추었다면 그 선수가 반복할 때 한 사건에 대하여 상대도수에 의하여 계산된 확률은 고전적 의미의 확률에 접근한다고 할 수 있다.

2.3  확률의 주관적 해석

확률의 고전적 해석은 관찰자의 주관이 전혀 없는 객관적 확률을 구하며, 상대도수에 의한 접근방법도 실험을 객관적으로 동일하게 무한히 반복한다면 관찰자의 주관에 의존하지 않는 확률값을 구할 수 있다.

그러나 앞에서 설명한 한 고등학생의 대학교 입학시험에서 합격가능성에 대한 확률은 담임선생님과 본인, 그리고 학부모의 생각이 각각 다를 수 있다.

즉 담임선생님의 합격가능성을 40%정도라고 할 때, 본인은 합격할 가능성이 90%라고 자신을 하며, 학부모는 그래도 합격할 가능성이 60%는 되지 않겠느냐 라고 생각할 수 있다.

이와 같이 관찰자의 주관에 따라서 다르게 측정될 수 있는 확률은 주관적 확률이라고 하고 이러한 접근방법을 확률의 주관적 해석이라고 한다.

위의 세 가지 확률개념은 확률을 구하는 대상에 따라서 적절하게 이용하여야 하는데, 이론적으로 정리될 수 있는 확률개념은 고전적 의미의 확률과 상대도수에 의한 확률로 앞으로 제시되는 모든 과정에 있어서 확률개념은 이 두 가지 정의에 의한 확률을 의미한다.
 

3. 확률을 계산할 때 필요한 것들

3.1  복원추출법과 비복원 추출법

표본을 한 번에 하나씩 추출할 때 한 번 추출된 원소를 다음 표본추출대상에 포함시키는 방법을 복원추출법이라 하고, 한 번 추출된 원소는 다음 표본추출 대상에서 제외시키는 방법을 비복원추출법이라고 한다.

3.2  경우의 수에 의한 확률계산원리

경우의 수에 의한 실험에 있어서 특정조건을 만족하는 사건이 일어날 확률은 다음과 같이 구한다.

3.3  순열

n개의 서로 다른 개체가 있을 때 그 중에서 r개를 선택하여 일렬로 세우는 방법의 수는 로 표현하며 다음과 같이 계산한다.

= n(n-1)(n-2)…(n-r+1)

특히 n개 모두를 일렬로 세우는 방법의 수는 n!로 표현하며 다음과 같이 계산한다.

n!=n(n-1)(n-2)…3ㆍ2ㆍ1

3.4  조합

n개의 서로 다른 개체 중에서 임의로 r개를 뽑는 방법의 수는 또는 ( )로 표현하며 다음과 같이 계산한다.

특히 (), ( )은 모두 1이다.

3.5  중복순열

n개의 개체들 중에서 동일한 것이 각 각 , , …, (단, n= + +…+ )개가 있을 때 n개를 일렬로 세우는 경우의 수는 다음과 같다.


4. 확률의 공리(axioms of probability)

이제 우리는 실험과 표본공간 S가 주어졌을 때, 우리가 관심을 가지게 되는 사건 E의 확률에 관심을 갖기로 한다. 사건 E가 일어나는 함수 P(E)가 확률이 되도록 하기 위하여 확률이 갖는 성질에 근거하여 콜모고로프(Kolmogorov) 는 다음과 같은 세 가지 공리를 제시하였다.

확률시험에서 Ω를 표본공간, E를 사건, φ를 공집합이라고 할 때, 이며, 확률은 항상 다음 조건을 만족한다.

1. 0 ≤ P(E) ≤ 1

2. P(Ω) =1 , p(φ) = 0

3. 모든 i≠j에 대하여 = φ이면, 즉 모든 i≠j, i, j=1,2,…에 대하여 가 상호배반사건이면

이다.

5. 조건부 확률

다음 표는 학생 100명을 대상으로 조사한 성별에 따른 안경의 착용과 미착용을 조사한 것이다.

 

착 용

미 착 용

20

40

60

30

10

40

50

50

100


임의로 한 명을 선택할 때 이 학생이 안경을 끼고 있을 확률은 이다.

그러나 선택된 학생이 남학생이라는 사실을 사전에 알고 있다면 학생이 안경을 끼고 있을 확률은 이라고 하는 것이 타당할 것이다.

조건부 확률이란 이와 같이 실험에서 사전정보를 확률계산에 이용하는 방법이다.


5.1  조건부 확률(conditional probability)

사건 A가 주어졌을 때 사건 B의 조건부 확률은 P(A)≠0이라는 전제하에서 다음과 같이 정의한다.

P(B|A) = 사건 A와 B를 벤다이어 그램으로 그리면

이 되므로

P(B|A) =

는 사건 A의 크기에 대한 곱사건 AB의 크기의 비율이라고 할 수 있다.

즉, P(B|A)는 실험에서 나타나는 결과를 A에 한정할 때 사건 B가 나타날 가능성을 측정하는 것이다.

두 사건이 있을 때, 사건이 다음에 주어진 세 조건중 하나를 만족하면 두 사건은 서로 확률적으로 독립이라고 정의한다.

여기에서 두 사건이 독립이라는 것은 직관적으로 설명할 수 없으며, 단지 주어진 독립성 조건을 만족하면 확률적으로 독립이라고 정의한다.

5.2  독립사상

두 사건 A, B가 다음 조건 중 하나를 만족하면 서로 확률적으로 독립이라고 한다.

1. P(AB) = P(A)ㆍP(B)

2. P(A|B) = P(A)

3. P(B|A) = P(B)

실험에 있어서 두 사건이 정의될 때 두 사건이 서로 확률적으로 독립인가를 판단하기 위하여는 위의 세 조건 중 하나를 만족하는가를 보면 되는데, 위의 세 조건은 사실상 동일한 조건의 다른 표현일 뿐이다.

두 사건이 서로 배반(mutually exclusive)이라는 조건과 두 사건이 서로 독립(mutually independent)이라는 조건은 혼동하기 쉽다.

5.3  배반사상

두 사건 A, B가 서로 배반이라는 조건은 AB = φ을 의미하므로 항상 P(AB) = 0이고, 두 사건 A, B가 독립이라는 조건은 P(AB) = P(A)ㆍP(B)이다.

따라서 P(A) 또는 P(B)가 0이 아닌 한, 두 사건이 상호배반이라는 조건과 두 사건이 상호독립이라는 조건은 동시에 만족할 수 없다.

5.4  베이즈 정리(Bayes' theorem)

표본공간 Ω가 K개의 사건 열 , , …, 에 의하여 분할(partition)된다고 한다.

다른 사건 F가 일어났을 때 이 사건이 에서 일어날 확률은 다음과 같이 계산한다.

여기에서 분할(partition)이란 , , …, 가 상호배반이며, ∪…∪ = Ω임을 의미한다.

, , …, 와 F를 벤다이어그램을 표현하면 다음과 같다.

6. 확률변수(random variable)

실험에서 우리는 여러 가지 특성을 관착하거나 측정한다. 이때 실험의 결과는 표본공간상의 한 점이 선택되어 관찰되었거나 측정된 결과이다. 즉, 실험의 결과는 표본공간에서 정의되고 우리가 자료라 부르는 값이다. 이 때 실험에서 우리가 관심을 갖는 특성을 변수로 표현하고자 하며, 관찰이나 측정을 거쳐 얻어진 간을 변수가 갖는 값으로 대응시키고자 한다. 이를 위해 먼저 표본공간 S의 근원사건들이 어떻게 실수와 대응될 수 있을 지에 대하여 살펴보기로 한다. 알기 쉽게 설명하기 위하며 공정하게 제작된 동전을 두 번 던지는 실험을 고려하기로 하자. 표본공간은

S={(앞면, 앞면), (앞면, 뒷면), (뒷면, 앞면), (뒷면, 뒷면)}

이며, 이 실험에서 관심을 가지는 특징을 앞면의 수라고 하고 이를 변수 X라 하기로 하자. 변수 X는 표본공간 내의 각 근원사건에 대하여 아래와 같은 값을 가지게 될 것이다.

S

(뒷면, 뒷면)

(뒷면, 앞면)

(앞면, 뒷면)

(앞면, 앞면)

X=s

0

1

1

2


이 때 변수는 대문자 X로 표현했고, 변수 X에 대응되는 구체적인 값은 소문자 x로 표현했음에 주의하기 바란다. 예를 들어 앞면이 두 번 나왔다면 x=2이라는 것이다. 이제 이들 결과를 수식으로 표현하면 다음과 같이 쓸 수 있다.

X((뒷면, 뒷면)) = 0
X((뒷면, 앞면)) = 1
X((앞면, 뒷면)) = 1
X((앞면, 앞면)) = 2

이 표현에서 변수 X는 실험에서 얻을 수 있는 모든 관측값에 즉, 표본공간의 각 원소에 실수를 대응시키는 함수임을 알 수 있다. 다시 말해 동전을 두 번 던지는 실험에서의 변수 X는 표본공간이 정의역이고 치역이 {x|x=0, 1, 2)인 함수이다. 이렇듯 실험에서 관심을 갖는 특성이 가질 수 있는 모든 결과에 실수를 부여하는 함수인 X를 통계학에서는 확률변수(random variable)라고 한다.

표본공간 S의 각 사건에 실수를 대응시키는 함수 X를 확률변수라고 한다. 즉, 확률변수는 표본공간을 정의역으로 하고 실수공간을 치역으로 하는 함수이다.

확률변수는 가질 수 있는 값이 동전을 두 번 던지는 실험에서 앞면이 나오는 수에 관심을 가질 때 가질 수 있는 값과 같이 셀 수 있는 경우를
이산확률변수(discrete random variable)라고 한다.
반면에 키, 몸무게, 또는 거리 등의 양을 측정할 때와 같이 확률변수가 가질 수 있는 값이 구간으로 표시되거나 연속적인 값을 취할때 이를
연속확률변수(continuous random variable)라고 한다.

예를 들어 서울을 가로지르며 흐르는 한강에 새로운 다리를 세우기 위하여 한강의 수심을측정하고자 한다. 이 때 한강의 수심을 확률변수 X라하면 X가 가질 수 있는 값은 최저수심에서 최고수심 사이의 모든 값을 가지게 된다.

참고 : sigma6.new21.org/

                          
     6 Sigma 연계 TPM  메인 페이지로              홈페이지 자료실 메인으로


 


KTI 연구소장/운영자 : 공학박사(산업공학)/기술사(품질)/기술지도사  권오운
Copyright (c) Since 2000 February, Korea TPM Institute. All rights reserved.