a.1 From Set Theory to Probability Theory
Set Theory
최성준님의 베이지안 딥러닝 자료를 많이 참고했습니다.
집합론(set theory)은 추상적 대상들의 모임인 집합을 연구하는 수학 이론이다. 기본적인 개념은 위키링크를 달아 두었다.
집합(set): 특정 조건에 맞는 원소들의 모임
원소(element): 집합을 이루는 개체, 원소 가 집합 에 속할 경우 라고 표기한다.
부분 집합(subset): 집합 A의 모든 원소가 다른 집합 B에도 속하는 관계일 경우, A는 B의 "부분 집합"이라고 한다.
전체집합(universal set): 모든 대상(자기 자신도 포함)을 원소로 포함하는 집합
서로소 집합(disjoint set): 공통 원소가 없는 두 집합,
집합의 분할(partition of a set): 집합의 원소들을 비공 부분 집합들에게 나눠주어, 모든 원소가 각자 정확히 하나의 부분 집합에 속하게끔 하는 것
예시:
멱잡합(power set of set A, ): 주어진 집합의 모든 부분 집합들로 구성된 집합(the set of all the subsets)
예시:
집합의 크기(Cardinality): 집합의 "원소 개수"에 대한 척도, 로 표기 한다. 집합의 크기를 표현하는 용어로 finite, infinite, countable, uncountable, denumerable(countably infinite)가 있다.
가산 집합(countable set): 관심있는 집합과 자연수의 집합으로 일대일 함수(one-to-one function)관계가 존재하면, 그 집합은 가산 집합이다. 특히, 자연수, 정수, 유리수와 같이 셀수 있는 무한 집합의 경우, 가산 무한(countable infinite)이나 가부번 집합(denumerable set)이라고 한다.
비가산 집합(uncountable set): 가산 집합이 아닌 집합, 실수는 비가산 집합
Function

함수/사상(function/mapping): 첫 번째 집합의 임의의 한 원소를 두 번째 집합의 오직 한 원소에 대응시키는 이항 관계이다. 입력이 되는 집합 를 정의역(domain), 출력으로 대응되는 집합 를 공역(codomain)이라고 한다.
상(image): domain의 원소(혹은 부분 집합)가 대응하는 codomain의 원소(혹은 집합)
반대로 codomain의 원소에 대응하는 domain의 원소를 역상(inverse image)이라고 한다(원소의 역상은 부분 집합이라는 것을 주의).
치역(range): 함수의 모든 출력값의 집합, 치역은 공역(codomain)의 부분 집합이다.

일대일 함수/단사 함수(one-to-one/injective): domain의 서로 다른 원소를 codimain의 서로 다른 원소로 대응시키는 함수
위로의 함수/전사 함수(onto/surjective): domain과 range가 일치하는 함수
one-to-one 조건과 onto 조건을 모두 만족하면 가역 함수(invertible function)라고 한다.
Measure Theory
측도(measure) 이란 특정 부분 집합에 대해 일종의 "크기"를 부여하며, 그 크기를 가산개로 쪼개어 게산할 수 있게 하는 함수다. 측도가 부여된 집합을 측도 공간(measure space)라고 하며, 이를 연구하는 수학 분야를 측도론(measure theory)라고 한다.
기본적으로 전체집합(universial set) 가 주어졌을 때, 측도(measure)는 의 부분집합(subset)에 비음수인 실수를 할당한다. 우선 명확히 measure를 정의하기 위해서 필요한 것들을 정의해본다.
set function: 집합(set)에 대해 어떤 숫자를 부여하는 함수(ex, cardinality, length, area), 즉 입력을 집합, 출력은 숫자가 되는 함수
-field : 다음과 같은 조건을 만족하는 전체집합 의 부분 집합 모음를 -field 라고 한다(와 같은 말).
, empty set is included
, closed under set complement
, closed under countable union
-field는 measure를 부여할 수 있는 최소 단위가 된다. 만약 어떤 원소가 -field에 존재하지 않는다면, 그 원소는 측정할 수 없다.
-field 특성
, closed under countable intersection
, power set of U 는 가장 단위가 자잘자잘 하게 만든 -field
는 유한하거나 비가산 둘 중 하나다, 가산 무한/가번부(countable infinite/denumerable)가 될 수 없다.
가측 공간(measurable space): 간단히 말해서, 어떤 집합 가 있고 그 집합의 부분집합으로 만들어진 -field에 measure를 부여할 수 있는 공간
측도(measure)를 정의하기 위한 준비는 다 되었다. 정의를 하면 다음과 같다.
measure 는 가측 공간(measureable space)-에서 정의된 set function, 이다.
For disjoint and , countable addivitity
즉, 가측 공간(measurable space)-과 measure 가 하나의 측도 공간(measure space)- 를 구성하게 된다.
Probability Theory

그림 1.2.0.2에서 는 표본 공간(sample space)이라고 한다. 표본 공간에서 정의되는 측도(measure)는 대문자 P로 작성한다. 무슨 뜻인지는 다음을 계속 읽어본다.
확률을 이야가 하기 위해서는 임의적 실험(random experiment)를 잘 정의 해야한다.
결과(outcomes)는 임의적 실험에서 발생하며 더이상 나눌수 없는 모든 가능성 있는 현상들을 일컫는 말이다.
사건(event)은 확률이 부여된 임의적 실험에서 발생한 결과(outcomes)의 집합이며, 표본 공간(sample space)의 부분 집합이다.
표본(sample point) 는 표본 공간(sample space)에서 임의적 실험을 통해 나올 수 있는 결과(outcome)를 말한다.
표본 공간(sample space) 은 모든 sample point 의 집합이다.
예를 들어, 공정한 정육면체 주사위를 랜덤으로 던지는 실험이 있다(random experiment). 결과(outcomes)로 한 면에 1~6까지 숫자가 보인다. 7은 나올 수 없기 때문에 관찰 가능한 결과(outcome)이 아니다.
그림 1.2.0.2의 각 점들로 표현되어 있다. 이 그림은 모든 점들이 표본 공간 내에 정의 되어 있음으로, 모든 점들은 sample point이자 이 임의적 실험의 결과라고 할 수 있다. 마지막으로 "주사위를 굴렸을 때, 보이는 면이 짝수 인 경우", 즉 A로 표기된 의 부분 집합은 사건(event)이다.
이제 확률의 명확한 정의를 내려본다.
확률 는 가측 공간(measureable space)- 에서 정의되는 set function 인데 다음 조건을 만족한다(기호가 약간 다른데, 는 -field, 일반 대문자 는 -field의 부분 집합임으로 잘 구분해야 함).
For disjoint sets and , countable addivitity
사실상 측도의 정의에서 2, 4번 항목이 추가된 것이다. 즉, 확률은 표본 공간에서 정의된 측도(measure) 혹은 set function 이라고 할 수 있겠다.
지금까지 확률은 가측 공간에서 정의된 것이다. 그렇다면 어떤 사건 에 어떻게 확률을 부여할까? 해답은 다음과 같다. 임의적 실험에서 나온 결과로 구성된 표본 공간 가 있고, 그 표본 공간에서 발생한 사건 에 해당하는 확률을 부여한다. 여기서 확률 할당 함수(probability allocation function)이 등장한다.
probability allocation function
probability mass function: 이산(discrete) 표본 공간 일 때, such that and
probability density function: 연속(continuous) 표본 공간 일 때, such that and
확률 기타 부분
조건부 확률(conditional probability)
확률의 연쇄 법칙(chain rule):
전체 확률의 법칙(total probability law):
베이즈 정리(Bayes' rule):
: likelihood
: posterior
: prior
독립 사건(independent events): 만 만족하면 independent한 것이다( disjoint, mutually exclusive)
예시:

Random Variable
확률 변수(Random Variable)는 측정가능한(measureable) 확률 공간(Probability space)-과 보렐 가측 공간(Borel measureable space, 보통 실수들의 집합을 가르킴)-에서 정의되는 함수다.

여기서 랜덤(random)이란 확률 공간의 표본 공간(sample space, )에서 하나를 임의로 뽑는 과정을 가르킨다.
그림 1.2.0.5와 같이 "숫자 4가 관측된다"라는 것을 풀어서 이야기하면 다음과 같다. 확률 공간의 표본 공간에서 임의로 뽑은 표본{4}를 확률 변수()에 입력했을 때, 실수 공간()에 해당하는 숫자값 4를 부여하는 과정이다.이산 확률 변수()
확률 밀도 함수(Probability density function) 상관분석(Correlation analysis)
Last updated
Was this helpful?