集合による場合の数と確率の考え方

【目次】
0.始めに
1.確率とは何か
  1-1.確率の難しさ
  1-2.確率と集合と関数
2.集合と場合の数と確率の関係
  2-1.確率に集合が必要な理由
  2-2.場合の数
    2-2-1.和の法則
    2-2-2.積の法則
      2-2-2-1.集合の組(直積集合)の利用
    2-2-3.同時に起こらないと起こるの違和感
    2-2-4.影響する、関係があるの多義性
  2-3.確率
    2-3-1.試行
    2-3-2.なぜ試行は必要なのか
    2-3-3.理論と応用の峻別(大数の法則は必要条件)
    2-3-4.事象
    2-3-5.確率の定義と同様に確からしい
    2-3-6.和事象、積事象、排反事象
    2-3-7.独立な試行と積の法則
    2-3-8.反復試行と独立な試行
    2-3-9.条件付確率と乗法定理

始めに

数学Aの教科書(数研出版、高校数学の教科書、以下同じ。詳しくは、高校数学マスター基本方針:参考にする教科書を参照ください)では、集合から始まり、場合の数と確率を続けて解説していますが、各概念の繋がりや関係をあまり詳しくは整理していないと感じたので、今回は、集合や場合の数をどう用いて確率を考えれば、確率に対する理解が深まるのかを解説していきたいと思います。

まず、数学以前の話として、確率とは何かを考えてみて、確率の考え方に頭を慣らしてみたいと思います。その上で、重要な用語の定義の復習と解説をしながら、集合と場合の数と確率の関係を整理したいと思います。

それでは、早速、確率とは何かを考えてみましょう。

確率とは何か

世の中には、不確実なことが溢れています。今日の昼食から来年の大学受験の結果まで、確実に定まっている物事というのは、思い付くのが難しいほど少ないものです。例えば、今、この文章を読んでいる読者の心臓が動いていることは確実でしょう。ただ、それと同程度に確実なこととなると、案外に様々な批判が可能で、ほとんどないと言って良いほど少ないものです。

確実か不確実か、さらにどの程度、確実なのか。時間の後先に関わらず、自分が知らないことについて、何かしらの予測を付けることで、人間は行動を決めます。このどの程度、確実なのか、という問いに対して、数値で答えを出そうとする考え方が確率です。

どの程度、確実なのかを数値で出すために、まず何が必要かというと、数値というのは、比較対象が必要です。つまり、たった一つの数値を出されても、それが大きいのか、小さいのかは何も分かりません。少なくとも二つの数値があって初めて、数値というものは意味を持ちます。

それは、二つの線があって初めてその長さを比較できるのと同じで、どの程度、確実なのかを数値で表しても、少なくとも二つの物事の確実性が数値として表わされていなければ、その大小の比較ができないわけです。

さらに、物事の確実性と言いましたが、どの程度、確実なのかを数値で表す対象が明確になっていなければ、比較することも難しく、議論は曖昧に終始してしまいます。

そこで、物事を明確な対象として取り扱う、そのための数学の作法が集合でした(参考:論理とは何か、命題、集合と推論規則について:集合による対象化)。

したがって、数学における確率の方法論としては、結果として生じる可能性のある対象を、集合とその要素として定義することが大切になります。

そして、集合できちんと確率の議論の対象を定義できれば、後は、その集合を定義域、数値を値域とした関数で確率を表すことができるということになります。(後述しますが、正確には集合の部分集合の集合が定義域になります)

確率の難しさ

ただ、ここが確率の難しさとなりますが、確率の議論の対象となるのは、そもそも未だ知らないことなので、すべてを明確に列挙することは完全にはできません

ソクラテスの無知の知をご存知の方は、通常の推論が完全でないことをご理解いただけていることだと思います。つまり、すでに知っていることから、知らないことを推論するためには、根拠や理論が必要であり、少なくとも、根拠や理論には前提が生じて不完全になるということです。(参照:論理とは何か、命題、集合と推論規則について:理論の正しさ

通常の推論の場合、すでに知っていることから、未だ知らない結果を一つ予測します。ただ、その一つが複数の結果の「または(論理和)」や「かつ(論理積)」から成り立っていても良いわけです。

この構造は、確率において、すでに知っていることから、未だ知らない結果のすべてを明確に列挙すること、と同じことです。つまり、推論と列挙は同じことを意味します

したがって、通常の推論に前提が生じて不完全になるのですから、確率においても、すべてを明確に列挙することは完全にはできません。

つまり、確率において、すべてを明確に列挙したことを証明するには、理論が必要であり、理論には前提が生じて不完全になるということです。

しかし、すべてを明確に列挙できたことを前提にしなければ、前述のとおり、確率の数値を比較するための定義域を設定することは難しく、議論も曖昧になってしまいます。

このように確率という考え方には、『不完全な理論』による『列挙(=推論)』を前提としなければならない、という少なくとも二重の前提があることを認識しておくことが、確率に対する漠然とした分かりにくさを解決してくれるのではないかと思います。

通常の推論が、『不完全な理論』を前提とした推論(=列挙)であること、と比べてみてください。通常の推論の場合、推論(=列挙)を議論しますが、確率の場合は、推論(=列挙)を前提とします。

つまり、不完全であったとしても、結果として生じる可能性のある対象のすべてを明確に列挙することに努めることが大切で、さらに、それができたとする前提を置かなければ、確率の理論としての議論は始まらないということを理解することです。

ちなみに、確率の特徴である推論(=列挙)の後の段階の、対象と数値の関数による対応についても、その対応の根拠となる理論を必要とするという点において、理論をきちんと精査しなければならないという同じ指摘をすることができます。

ただ、時には理論構築なしに、経験的なデータをそのまま当てはめて予測するだけの場合もあります。

確率と集合と関数

話を戻せば、すべてを明確に列挙することができたという前提において、その範囲だけを全体として扱うことが確率の議論の出発点となります。

そうすると、すべての予測される結果を全体集合として、各予測される結果たちをその部分集合として、その部分集合を数値と関数で対応させることになります。

ここで、部分集合を数値と対応させるのであって、要素と数値を対応させるとしないのは、前者であれば後者を含めることもできますが、後者だと、結局、様々な物事を表すのに、部分集合を持ち出さざるを得なくなるからです。

例えば、サイコロを具体例に挙げたとしても、各サイコロの目を予測の対象としても良いのですが、他にも偶数の目の出る確率であったり、奇数の目の出る確率であったりも知りたいわけです。そうすると、サイコロの目\(\{1,2,3,4,5,6\}\)を全体集合とした場合に、数値と対応させたいのは、各要素のみではなく、その部分集合になるわけです。

そして、すべての予測される結果を全体集合とした場合に、全体集合に対応させる数値を最大値として固定し、部分集合に対応させる数値をそれ以下の数値に対応させようという発想は、とても自然なことです。

基本的に、確率は全体集合を\(1\)に対応させ、部分集合を\(1\)以下で\(0\)以上の数値に対応させます。

高校数学においては、全体集合の要素数は有限個です。そして、部分集合が含む要素数を全体の要素数で割った割合を、その部分集合の確率として考えて関数で対応させます。

内容を先取りすると、全体集合が全事象\(\Omega\)、部分集合が事象\(A\)とすると、確率を表す関数を\(P\)として、
\[P(A)=\frac{n(A)}{n(\Omega)}\]
と考えるということです。

ただし、このように考えるためには、各要素となる根元事象が「同様に確からしい」必要があります。この「同様に確からしい」というのが、先述した「対象と数値の関数による対応に必要とされる、理論や経験的なデータ」の最も単純な具体例と言えます。

例えば、サイコロの目の出る確実さの程度は「同様に確からしい」と考え、その根拠は、形が均等であったり、経験則であったりするわけです。

逆に、高校数学の範囲では、有限個の根元事象が「同様に確からしく」なるように問題を集合に落とし込む、のが解法のポイントと言えるかもしれません。

詳しくは後述していきますが、だいたい、確率とは何かが少しづつ、分かってきたのではないかと思います。上述した内容と重なるところもありますが、以降では、重要な用語の定義の復習と解説をきちんと押さえながら、集合と場合の数と確率の関係を整理していきたいと思います。

集合と場合の数と確率の関係

確率に集合が必要な理由

繰り返しになりますが、そもそも今日の数学においては、数学で考える対象をすべて集合で表すことがスタンダードになっています。物事の特徴や性質を分析し、分解し、集合という骨組みの上に、その特徴や性質を再構成していきます。(参考:論理とは何か、命題、集合と推論規則について:集合による対象化)。

確率を考える際も例外ではなく、というよりも、やっと400年くらい前に人類が認識しえた確率という分かりにくい概念を明確にするためにはなおさら、きちんと集合という道具を使いこなすことが必要になります。

場合の数

教科書は、見たところ「場合の数」や「場合分け」について、明確な定義を与えていません。

大辞林では、「場合」という言葉の意味は、物事が行われているときの、事情や状況。局面。と説明されています。

「場合」という言葉は、曖昧な単語でもあり、基本的に条件の分岐や類別のために通常は用いられます。

つまり、条件の分岐や類別のための対象を表す言葉で、数学においては、集合の要素として一つ一つの「場合」を捉えなおすことができます。

「場合」が集合の要素なので、「場合の数」は集合の要素の数、と言い換えることができるわけです。

そのため、教科書でも場合の数を学ぶ前に、数Ⅰで学んだ集合を軽く復習しつつ、集合の和集合、共通部分、補集合の要素数について学びを深めています。

つまり、この後の「場合の数」や「確率」を集合を使って考えてください、と暗黙にですが勧めているわけです。

しかしながら、教科書では、場合の数を集合で捉えなおして解説するということを、丁寧には扱っていないようなので、ここではきちんとその関係を押さえておきましょう。

和の法則

場合の数の「和の法則」を教科書では、おおむね、

二つの事柄\(A,B\)が同時に起こらないとすると、\(A\)の場合が\(a\)通り、\(B\)の場合が\(b\)通りであるとすると、\(A\)または\(B\)が起こる場合は、\(a+b\)通りある。

と解説しています。

これを集合で捉えなおすと、\(A\)の場合、\(B\)の場合の一つ一つの場合を要素として含む全体集合\(U\)があり、\(A\)の場合を要素とする集合\(\mathbb{A}\)、\(B\)の場合を要素とする集合\(\mathbb{B}\)を考えるということになります。

そこで、\(\mathbb{A} \cap \mathbb{B} = \varnothing\)ならば、

\[n(\mathbb{A}) + n(\mathbb{B}) = n(\mathbb{A} \cup \mathbb{B})\]

が成り立つ、という主張と同じことになります。

ちなみに、\(n(\mathbb{A})\)とは、\(\mathbb{A}\)の要素数を表します。

ポイントは、「二つの事柄\(A,B\)が同時に起こらない」という場合の数の条件を、集合で捉えなおすと、二つの集合\(\mathbb{A}\)、\(\mathbb{B}\)に共通部分がない、つまり、\(\mathbb{A} \cap \mathbb{B} = \varnothing\)という条件になるということです。

つまり、二つの事柄\(A,B\)の一つ一つの場合は、集合の要素に対応していて、一方で、二つの事柄\(A,B\)自体は、全体集合\(U\)の部分集合\(\mathbb{A}\)、\(\mathbb{B}\)に対応しているという、この二つの対応の違いをきちんと理解することが大切になります。

積の法則

場合の数の「積の法則」を教科書では、おおむね、

事柄\(A\)の起こり方が\(a\)通りあり、その各々の場合について、事柄\(B\)の起こり方が\(b\)通りあるとすると、\(A\)と\(B\)がともに起こる場合は、\(ab\)通りある。

と解説しています。

まず、「和の法則」との違いを確認しましょう。「和の法則」は、事柄\(A,B\)が同時に起こらない場合に成立する法則で、「積の法則」は\(A\)と\(B\)が同時に起こる場合に成立する法則です。つまり、同時に起きていないか、起きているか、まったく逆の場合に成り立つ法則であることに注意をしましょう。

このことを集合で表すと、「和の法則」は\(\mathbb{A} \cap \mathbb{B} = \varnothing\)が成り立ち、「積の法則」は\(\mathbb{A} \cap \mathbb{B} \neq \varnothing\)が成り立つということを意味します。

つまり、集合\(\mathbb{A} \cap \mathbb{B}\)が\(A\)と\(B\)が同時に起こる事柄と対応し、\(\mathbb{A} \cap \mathbb{B}\)の要素が\(A\)と\(B\)が同時に起こる事柄の一つ一つの場合と対応しているわけです。

そこで、問題になるのは、全体集合\(\mathbb{U}\)の要素の取り方です。このページで前述した内容を復習すると、全体集合\(\mathbb{U}\)はすべての予測される結果を要素としていなければなりません。

つまり、全体集合\(\mathbb{U}\)の要素は、一つ一つの場合と対応させる必要があります。より正確に言うと、全体集合\(\mathbb{U}\)の要素が一つ決まれば、何がその一つの場合に起こっているかが明確に定まらなければいけません。

そこで、もしも「和の法則」が成り立つときのように、\(\mathbb{A} \cap \mathbb{B} = \varnothing\)であれば、集合\(\mathbb{A}\)の要素は、その事柄\(A\)を明確に定める情報さえあれば、事柄\(B\)の情報は含まなくても済みます。それは、暗黙的に事柄\(A\)の場合には、事柄\(B\)は起こらないと決まっているからです。逆に、集合\(\mathbb{B}\)の要素についても同様のことが成り立ちます。

しかし、「積の法則」が成り立つときのように、\(\mathbb{A} \cap \mathbb{B} \neq \varnothing\)であるときには、事柄\(A\)の場合であっても、事柄\(B\)は起こらないとは決まりません。何らかの事柄\(B\)が同時に起こっている可能性があるわけです。

つまり、「和の法則」が成り立つときのように、集合\(\mathbb{A}\)の要素が事柄\(A\)の情報だけしか持っていないとすると、要素を一つ決めたとしても何がその場合に起こっているかが明確に定まらないことになってしまいます。

それでは、全体集合\(\mathbb{U}\)はすべての予測される結果を要素としてはいない、ことになり議論が曖昧になってしまうわけです。

そこで、要素が一つ決まれば、何がその場合に起こっているかが明確になるように、全体集合\(\mathbb{U}\)の要素の取り方を工夫する必要が出てくる場合があります。

もちろん、以下で示す工夫をしなくとも、事柄によっては各要素が事柄\(A\)と事柄\(B\)の両方の情報を持つように簡単に表せる場合もあります。ただ、以下のような工夫が必要な場合もあるということです。

集合の組(直積集合)の利用

その集合の取り方の工夫とは、集合の組(直積集合)を取ることです。

事柄\(A\)と事柄\(B\)があるのだから、一つの要素に事柄\(A\)と事柄\(B\)の二つの情報を対応させてしまおうという考え方です。

つまり、事柄\(A\)と事柄\(B\)に対応する集合\(\mathbb{A}\)と集合\(\mathbb{B}\)から、各要素\(a \in \mathbb{A}, b \in \mathbb{B}\)を取り出し、\((a,b)\)を要素とする全体集合\(\mathbb{U}^{‘}\)を考えます。

きちんと書くと、

\[\mathbb{U}^{‘} = \{ (a,b) | a \in \mathbb{A}, b \in \mathbb{B} \}\]

となります。

こうすれば、要素が一つ決まれば、何がその場合に起こっているか、事柄\(A\)と事柄\(B\)について明確にすることができます。

ちなみに、事柄\(A\)ではないときには、\(a = \varnothing\)、事柄\(B\)ではないときには、\(b = \varnothing\)が成り立ち、事柄\(A\)でもない事柄\(B\)でもないときには、\((\varnothing,\varnothing)\)という要素が対応することになります。

このように全体集合\(\mathbb{U}^{‘}\)を取れば、「和の法則」も「積の法則」も統一して考えることができます。

例えば、「和の法則」が成り立つ場合には、全体集合\(\mathbb{U}^{‘}\)における事柄\(A\)を表す集合を\(\mathbb{A}^{‘}\)、事柄\(B\)を表す集合を\(\mathbb{B}^{‘}\)とすると、

\begin{eqnarray}
\mathbb{A}^{‘} & = & \{(a,\varnothing) | a \in \mathbb{A} \land a \neq \varnothing\} \\[12pt]
\mathbb{B}^{‘} & = & \{(\varnothing,b) | b \in \mathbb{B} \land b \neq \varnothing\}
\end{eqnarray}

となるわけです。

本題の「積の法則」が成り立つ場合に話を戻します。

一般に、集合\(\mathbb{A}^{‘}\)とは、事柄\(A\)が起こる場合なので、\(a \neq \varnothing\)が成り立つ要素ということであり、

\[\mathbb{A}^{‘} = \{(a,b) | a \neq \varnothing,\ bはaと同時に起こる場合\} \tag{1}\]

と表されます。ただし、\(b=\varnothing\)を含む場合も、含まない場合もあります。

特に、「積の法則」が成り立つ場合には、「事柄\(A\)の起こり方が\(a\)通りあり、その各々の場合について、事柄\(B\)の起こり方が\(b\)通りある」ので、

それは、つまり、事柄\(A\)が起こる時には、事柄\(B\)が必ず起こり、加えて、事柄\(A\)のどの一つの場合でも事柄\(B\)の同じ\(b\)通りの場合が起こりえるということです。

したがって、事柄\(B\)のその同じ\(b\)通りを集合\(\mathbb{B}\)の部分集合\(\mathbb{C}\)で表すとすると、数式(1)は、「積の法則」が成り立つ場合には、

\[\mathbb{A}^{‘} = \{(a,b) | a \neq \varnothing,\ b \in\mathbb{C} \land b \neq \varnothing\} \tag{2}\]

と表されます。

今、上式より、集合\(\mathbb{A}^{‘}\)のすべての要素が集合\(\mathbb{B}^{‘}\)の要素でもあるので、\(\mathbb{B}^{‘} \supset \mathbb{A}^{‘}\)が成り立ちます。

したがって、\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘} = \mathbb{A}^{‘}\)と一致することが分かります。

そこで、積の法則「事柄\(A\)と\(B\)がともに起こる場合」の場合の数は、数式(2)より\(n(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}) = n(\mathbb{A}^{‘}) = n(\mathbb{A}) \times n(\mathbb{C}) = a \times b\)通りあることが分かりました。

ちなみに、教科書の定義からすると、事柄\(B\)が起こる場合には、必ずしも事柄\(A\)が起こるとは限らないことに注意すると良いと思います。

もしも、事柄\(B\)が起こる場合にも、必ず事柄\(A\)が起こるという条件が、上記の「積の法則」の条件に加わるのであれば、

事柄\(B\)が起こるならば、必ず事柄\(A\)が起こり、必ず事柄\(B\)の同じ\(b\)通りの場合が起こるので、事柄\(B\)には同じ\(b\)通り以外の場合はありえないため、\(\mathbb{B}=\mathbb{C}\)であり、数式(2)に代入すると、

\begin{eqnarray}
\mathbb{A}^{‘} & = & \{(a,b) | a \neq \varnothing,\ b \in\mathbb{B} \land b \neq \varnothing\} \\[12pt]
\Leftrightarrow \mathbb{A}^{‘} & = & \{(a,b) | a \neq \varnothing,\ b \neq \varnothing\} = \mathbb{B}^{‘} \tag{3}
\end{eqnarray}

\(\mathbb{A}^{‘}=\mathbb{B}^{‘}\)ということになります。

それはつまり、一つの事柄を\(A\)という切り口で見るか、\(B\)という切り口で見るかの違いということになります。

前節で述べた通り、このような集合の取り方の工夫をしなくとも、事柄によっては各要素が事柄\(A\)と事柄\(B\)の両方の情報を持つように簡単に表せる場合もあります。

例えば、サイコロの目であれば、偶数の目\(\{2,4,6\}\)と\(3\)の倍数\(\{3,6\}\)には、同時に起こる事柄\(\{6\}\)がありますが、集合の組を用いなくとも、きちんとすべての場合を表せています。

ちなみに、この例は、同時に起こる事柄があっても、積の法則が成立しない具体例にもなっています。それは少なくとも、偶数の目であっても、\(3\)の倍数ではないことがあるからです。

一方で、例えば道順の問題で、地点アから地点イまでの道順を事柄\(A\)、地点イから地点ウまでの道順を事柄\(B\)として、地点アから地点ウまでの道順を考えるならば、これは集合の組を用いると、すべての道順を明確に表すことができます。そして、道順\(A\)の各々の場合に道順\(B\)が同じ通りだけあるので、積の法則が成立します。

ちなみに、逆に分かりにくくなってはしまいますが、サイコロの目の例を集合の組で表すこともできますし、集合の組に数字を改めて振ってしまえば、道順の問題をサイコロの目のように、集合の組を用いずに簡単な集合で表すこともできます。

どちらにせよ、事柄を集合で表す上で大事なことは、集合の各要素を、すべての起こりえる場合を明確に識別できるように設定することであり、それができれば、文字や言葉で表しても、数で表しても、上記のように、それらの組で表しても良く、できるだけ事柄に適した分かりやすく扱いやすい形で表せばよい、と言えるかと思います。

同時に起こらないと起こるの違和感

和の法則と積の法則を集合で考えると、違和感を覚えたり、混乱する場合があります。

つまり、同時に起こらないなら\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\ = \varnothing\)で和の法則、同時に起こるなら\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\ \neq \varnothing\)で積の法則という整理までは分かりやすいと思います。

しかし、同時に起こる場合でも、事柄\(A\)の起こり方が\(a\)通りあり、その各々の場合について、事柄\(B\)の起こり方が\(b\)通りあるときしか、積の法則は成り立たないのです。

その他に、前節のサイコロの目の例のように、同時に起こるけれど、事柄\(A\)の起こり方によって、事柄\(B\)の起こり方が変わる場合もあります。

さらに、厳密には、事柄\(A\)起こらない場合にも、事柄\(B\)の起こり方が\(b\)通りあるとは、定義は主張していないのです。

したがって、事柄\(A\)が起こらない場合にも、事柄\(B\)の起こり方が\(b\)通りあるときもあれば、事柄\(B\)の起こり方が\(b\)通りないときもあるわけです。

特に、事柄\(A\)が起こらない場合にも、事柄\(B\)の起こり方が同じ\(b\)通りあるのであれば、事柄\(A\)と事柄\(B\)は互いにまったく影響し合わないとも言えます。

簡単に整理すると、事柄\(A\)と事柄\(B\)が同時に起こらない場合、事柄\(A\)と事柄\(B\)が同時に起こる場合があり、事柄\(A\)と事柄\(B\)が同時に起こる場合には、事柄\(A\)が起こると事柄\(B\)の起こり方が変わる場合、事柄\(A\)が起きても事柄\(B\)の起こり方が変わらない場合があります。

これらのことも、紹介した集合の組の考え方で一度整理してみれば、見通しがはっきりとします。

そして、後で定義はしっかりと確認しますが少し名称だけを先取りしますと、事柄\(A\)と事柄\(B\)が同時に起こらない場合を排反事柄\(A\)と事柄\(B\)が主に同時に起こる場合で事柄\(A\)が起こると事柄\(B\)の起こり方が変わるときを条件付事柄\(A\)と事柄\(B\)が同時に起こる場合で事柄\(A\)が起きても事柄\(B\)の起こり方が変わらないときを独立、と言ったりします。

影響する、関係があるの多義性

ここで、さらに分かりにくいのが、上記の状況を別の言葉で表現すると、事柄\(A\)と事柄\(B\)が独立の場合には、事柄\(A\)と事柄\(B\)が「影響しない」「関係がない」ということになり、条件付と排反の場合には、「影響する」「関係がある」という表現になることです。

注意すべきなのは「起こり方」は、共通部分\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\)の有無と対応していますが、「影響」や「関係」は共通部分\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\)の有無と対応することもあれば、別のものと対応することもあるということです。

上記の場合には、事柄\(A\)と事柄\(B\)が独立の場合は、事柄\(A\)と事柄\(B\)が「影響しない」「関係がない」のですが、積集合は\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\ \neq \varnothing\)で、「起こり方」があるわけです。

つまり、この文脈では、「影響」や「関係」は共通部分\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\)の有無ではない別のものと対応しています。

それは何かというと、例えば、部分集合\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\)があったときに、その要素が満たしている関係式や数式と対応しています。

部分集合\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\)が満たしている関係式や数式、条件が多ければ多いほど、つまり、事柄\(A\)と事柄\(B\)の「影響」や「関係」が強ければ強いほど、それらを満たす部分集合\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\)の要素数は少なくなり、ついには、満たす要素のない排反になるわけです。これは、方程式と解の間に成立する関係と同じです。

逆に、部分集合\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\)が満たす関係式や数式、条件がまったくない、つまり、事柄\(A\)と事柄\(B\)が「影響しない」や「関係がない」場合には、それらを満たす部分集合\(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}\)は、\(\mathbb{A}\)と\(\mathbb{B}\)が\(\varnothing\)以外のすべての組合せとなり、それが独立を意味します。

このように、事柄同士の「影響」や「関係」を、事柄に対応する集合の要素自体で表現するのか、あるいは、それらが満たすべき関係式や数式、条件で表現するのかによって、「ある」「ない」「多い」「少ない」という言葉や数式の表現が真逆になるので、注意が必要です。

ちなみに、このことは場合の数や確率だけではなく、数学の様々な場面で誤解を生むことの多いポイントです。この誤解を避けるためには、扱う対象が複雑になればなるほど、言葉や数式が示している対象を明確化して、対象間の関係を整理する必要があります。

確率

ここまで、一般に確率とは何かを考え、場合の数や、それを集合で捉え直す方法を考えてきました。

ここからは、高校数学でなされる確率の解説を押さえながら、集合や場合の数が確率とどう関係しているのかについて、理解を深めていきたいと思います。

教科書では、まず、簡単に確率を

ある事柄が起こることが期待される程度を表す数値

と定義しています。

その上で、試行、事象(全事象、空事象、根元事象)、「同様に確からしい」という用語を定義して、改めて、確率を数式(関数)で正確に再定義します。

それでは、この流れを追いながら詳しい解説を行いたいと思います。

試行

前述した「確率とは何か」で説明した通り、確率を考える、つまり、ある事柄が起こることが期待される程度を表す数値を正確に考えるためには、ある事柄を明確に集合で表し、その集合の部分集合と「起こることが期待される程度を表す数値」、つまり、数値を適切な関数でつなげれば良いのでした。

加えて、起こることが期待される、ある事柄を明確に集合で表すためには、根拠や理論による列挙(=推論)を前提としなければならないことも解説しました。

教科書では、試行とは、

同じ状態のもとで繰り返すことができ、その結果が偶然によって決まる実験や観測など

と定義しています。

なぜ試行は必要なのか

なぜ、確率を考えるときに、この試行という概念が必要になるかというと、まず第一には、ある事柄を明確に集合で表すために必要な根拠や理論に、試行がなっているからです。

つまり、「同じ状態のもとで繰り返すことができる実験や観測」であれば、起こることが期待される事柄のすべてを明確に列挙できるだろう、という推論を前提として認めているからです。

さらに、次の段階である、ある事柄を明確にした集合の部分集合と数値との対応においても、「同じ状態のもとで繰り返すことができる実験や観測」であれば、起こることが期待される程度を表す適切な関数を定義することができるだろう、という推論を前提として認めています。

それはつまり、「同じ状態のもとで繰り返すことができる実験や観測」であれば、ある事柄の起こることが期待される程度は一定なはずである、という推論を前提としているということです。

逆に言えば、「同じ状態のもとで繰り返すことができる実験や観測」において、起こる事柄がまったく予想がつかず、その起こる程度もまったく一定しない、ということはあり得ないということを前提としています。

けれど、ある状況についてまったく経験がなければ、起こる事柄を予想することはできず、くわえて、その起こる程度も一定しているかは分からないはずです。

そもそも、同じ状態のもとで繰り返せば、起こる事柄の範囲や程度は一定になるのでしょうか。少なくとも、そうであるという証明を私は知りません。くわえて、同じ状態とは何か、何を基準に判定するのか、という疑問さえ生まれます。

そこまで哲学的な考察は脇に置くとしても、起こる事柄の予想がつき、その起こる程度も一定する、と分かっているということは、少なくとも、すでに厳密な実験や観測を繰り返していなければなりません。その上で、再度、厳密に「同じ状態のもとで繰り返すことができる実験や観測」をした場合にのみ、その二つの要件が満たされるわけです。

したがって、試行というのは、確率を考えるための前提である、起こる事柄の予想がつき、その起こる程度も一定する、という条件を満たすために、かなり綿密な準備をした上で、厳しく限定的な「同じ状態」を整えることを意味しています。

このような現実的な理解を踏まえた上で、その先の数学における確率の理論を考える段階では、ある事柄を試行という枠組みの結果として考えることで、確率を考える上で必要となる根拠や理論は前提として満たしており、改めて考慮する必要はなくなるというわけです。

現実的な検証を行ったか否かはさておき、確率の前提をすべて認めてしまい理論だけを存分に考えよう、というとても便利な言葉だからこそ、確率を現実に応用するときには、現実の実験や観測などが実際に試行としての前提を満たす状態や環境になっているのか、その点に慎重な注意が必要となります。

理論と応用の峻別(大数の法則は必要条件)

さらに、試行を考える際の注意点としては、ある試行があったときに、その試行を繰り返す試行も考えられるということです。(繰り返す試行自体については、後述の反復試行の節できちんと解説し直します。)

そして、繰り返す試行を考える際にとりわけ注意が必要なのは、一つの試行の前提がそれを繰り返す試行の前提にもなっているという点です。

そのため、繰り返す試行の結果がそのもととなる一つの試行の前提を証明することはありえませんが、初めて確率を学ぶ際には、それが証明できるのではないかと混乱する場合があります。

確率の理論と応用の理解のためには重要な点ですが、よく混乱してしまうトピックなので、このことに触れておきたいと思います。

まず、互いに影響を与えずに同じ試行を繰り返すという条件において、繰り返す試行の各結果の平均がもとの試行の平均に近づく、という事実が数学における確率理論の第一の醍醐味です。これを大数の法則と言います。

例えば、コインを投げると、表と裏だけが出ること、その各確率は\(\frac{1}{2}\)であること、を前提として認めた試行があったときに、その試行を\(n\)回繰り返す試行を考えると、繰り返し投げる回数\(n\)が増えるほど、コインの表が出る回数の割合は、\(\frac{1}{2}\)に近づくことになる、ということは数学で証明ができます。

しかし、コインを投げると、表と裏だけが出ること、その各確率は\(\frac{1}{2}\)であること、という前提を数学では証明できないということです。

加えて、実際にコインを繰り返し投げて、コインの表が出る回数の割合が\(\frac{1}{2}\)に近づいても、その二つの十分な証明にはなりません。

それは第一に、すべてのコイン投げを検証することも、コイン投げを無限回繰り返すこともできないからです。

つまり、一般に、この世で行われるすべての同じ実験を検証することも、実験を無限回繰り返すこともできないのです。

もしも、それができるのであれば、試行の前提、つまり、その実験がある事柄に収まり、ある事柄の起こることが期待される程度は一定であること、を証明したり、定義したりすることは容易です。やってみれば済むからです。

しかし、曖昧な定義の上にできないことを仮定しても、多くの矛盾や逆理に悩まされるはずです。

現実には、たとえ実験を繰り返しても有限回なので、実験結果の平均が何らかの数値に収束したように見えても、その一部を検証しただけでは、検証できない未知の結果がいくらでもある限り、試行の前提については何の証明にもなりません。

そして、実験が試行の前提を満たした場合に、試行の平均や確率がその数値であることを検証したことにはなりますが、あくまでもそれは試行の前提の必要条件の検証であり、くわえてやはり、有限回の実験なのでその必要条件でさえ証明できたとは言えません。つまり、その数値も推測の域を出ないわけです。

以上の議論をまとめると、大数の法則の実験的な検証は、実験が試行の前提を満たしていることの必要条件の検証であり、十分条件の検証にはなりえないのです。(参照:必要条件と十分条件について

つまり、ただ実験を繰り返して実験結果の平均が何らかの数値に収束したとしても、それをある事柄の平均や確率としてしまうのは、論理的には穴だらけということになります。

その穴を塞ぐのは、実験が試行であること、つまり、起こる事柄の予想がつき、その起こる程度も一定する、ことを証明するという、実験の集計ではない、何らかの困難な作業にこそあるわけです。

しかし、その作業は困難だからといって近代においては特別なことでもありません。その困難な証明作業を科学では、科学理論として行うのです。つまり、原理を発見し、試行の二つの前提を証明し、試行結果の現象を予測します。

実際に、上記の試行の前提を古く(?)からの科学理論の論理的な枠組みに当てはまれば、一つの事柄が起こることを予想し、その起こる程度が確実である、ことを証明する作業と言い換えられます。

試行の前提と科学理論の違いは、違いと呼べるものではなく、前述した推論と列挙の一致にもとづけば、ある事柄を一つとして捉えるか複数に分解して捉えるかの違いと、起こることが期待される程度を数値で明確化するかしないかの違い、に過ぎないとも言えます。

つまり、実際には単なる実験そのものよりも、その実験の二つの前提を確認するための、事前の綿密な準備、様々な観点からの予備的で厳密な実験や観測や調査、その上での理論的な考察が重要になるということです。

このことは科学や科学的検証を行う際に必要となる基本的な理解と言えると思います。当たり前のことのようですが、しかし、このようにどこに落とし穴があるのかをきちんと押さえておくことが、確率を応用する場面において、慎重に実験や考察をする動機付けになります。

くわえて、理論と応用を峻別して数学の確率理論をより深く理解する上でも重要になると思います。

事象

教科書では、事象とは、

試行の結果起こる事柄

と定義しています。

つまり、事象は、これまでこのページで当たり前のように使ってきた「事柄」であり、「事柄」との違いは、試行の結果としての「事柄」か否かにのみあるということです。

試行が「実験や観測など」であることを考えると、「実験や観測など」の結果としての観察対象となる「事柄」と言い換えられるかと思います。

事象の語義には、このように「実験や観測など」できちんと認識しうる、観察しうる「事柄」という意味があるようです。

確率論では、対象という言葉の代わりに、この事象という言葉を基本用語として用いますが、それ以上の意味があるのか、特別な理解が必要なのかは、私は分かりません。

少なくとも私の場合は、この程度の理解で不便を感じた記憶はありません。それ以上に、確率論に慣れていない方が事象という耳慣れない学術用語に戸惑いや違和感を感じないように、事象とは、実験や観測などの結果としてきちんと認識しうる、観察しうる事柄という程度まで理解を深めておけば十分ではないかと思います。

それよりも大事なことは、数学において事象は、集合によって定式化して捉えられるということです。そのため、事象と集合を同一視して用いる場合も多く、初学者が混乱しがちですので、このページではしばらく事象と集合をきちんと区別して解説を行いたいと思います。

すでに、上述の場合の数の節で、場合の数と集合の関係について、事柄の一つ一つの場合は、集合の要素に対応していて、事柄自体は、全体集合の部分集合に対応していると説明しました。

ここで、事象の定義は、何を対象とするかについては、結局、事柄と同じであることを確認しましたので、事象は部分集合と対応するということが分かります。

そして、教科書の繰り返しになりますが、事象が対応する部分集合が全体集合の場合、その事象を全事象といい、事象が対応する部分集合が空集合の場合、その事象を空事象といい、事象が対応する部分集合が集合の一つの要素の場合、その事象を根元事象と言います。

さらに、高校数学においては、事象は数えられる対象のみを扱いますので、集合の要素は、場合の数における一つ一つの場合と捉えて問題ありません。

そうすると、場合の数における全体の事柄が全事象と対応し、事柄が事象に対応し、一つ一つの場合が根元事象に対応するという、対応関係があります。

このように、集合と場合の数と事象の対応関係をきちんと押さえておくことが、それぞれで学んだ知識を互いに活用するための基礎になります。

確率の定義と同様に確からしい

ここまで、試行とその結果となる事象を集合で表し、その各要素が一つ一つの場合と対応する根元事象となっていることまで確認してきました。

教科書の確率の簡単な定義は、

ある事柄が起こることが期待される程度を表す数値

でした。

このページの冒頭で述べた通り、その「ある事柄が起こることが期待される程度を表す数値」を考えるためには、確率の議論の対象を集合で明確化し、その部分集合である事象に数値を対応させる関数を定義する必要があります。

ここまででその第一の関門である、確率の議論の対象を集合で明確化することはできたということになります。

そこで次は、その部分集合である事象に数値を対応させる関数をどう定義すれば良いかという話になります。

つまり、各事象の大きさをどのように数値で表せば、その起こることが期待される程度を表すことができたと言えるのかを考えなければなりません。

そうすると、事象は部分集合であり、根元事象はその要素であること、に着目すれば、もしも、根元事象の起こることが期待される程度がすべて等しいことさえ分かっているのであれば、根元事象によって構成されている事象の起こることが期待される程度は、その要素の個数の和で表せばよいではないかと思い付きます。

そうすれば、少しややこしいですが正確に述べると、各事象の確率は、全事象である全体集合に含まれる根元事象である要素の個数で、各事象である部分集合に含まれる根元事象である要素の個数を、割った割合で表すことができます。

こうすると確率、つまり、事象の起こることが期待される程度を、割合で表すことができてとてもすっきりする。というわけで、高校数学における確率の定義は、この割合を関数に採用して定義されることになります。

教科書では、改めて確率の関数が、

1つの試行において、ある事象\(A\)の起こることが期待される割合を、事象\(A\)の確率といい、これを\(P(A)\)で表す。

と定義されます。

確率の関数\(P\)は割合なので、\(0\le P(A) \le 1\)を満たします。したがって、関数\(P\)は、全事象である全体集合の事象にあたる部分集合を集めた集合を定義域とし、実数\(0 \le x \le 1\)を値域とする関数ということになります。

ここで、関数\(P\)の定義域が全事象である全体集合ではなく、事象にあたる部分集合を集めた集合となって、ややこしいと感じるかもしれませんが、繰り返しになりますが、それは冒頭で挙げたサイコロの具体例でも説明したように、関数\(P\)が部分集合である事象に数値を対応させた関数であるからです。

具体的には、先述もしましたが、全事象を全体集合\(\Omega\)、事象が部分集合\(A\)で表せるとすると、確率を表す関数を\(P\)として、
\[P(A)=\frac{n(A)}{n(\Omega)} \tag{1}\]
と書けます。

そして、根元事象の起こることが期待される程度がすべて等しいことを、根元事象は、同様に確からしいと言います。

したがって、もしも、根元事象が同様に確からしくないのであれば、数式(1)は利用できないということになります。つまり、確率の関数\(P\)を別の方法で定義する必要が出てきます。

そうなると、少しややこしくなってしまうので、特に有限個の根元事象のみを扱う高校数学においては、根元事象が同様に確からしくなるように、どのように事象を集合で表すのか、ということが解法の一つのポイントになると思います。

つまり、作為的にでも、同様に確からしくなるように根元事象を設定して考える、ということです。そして、集合の要素を場合の数で数え上げて割合を計算するという流れが、高校数学における確率の計算の基礎になります。

和事象、積事象、排反事象

それでは、次に和事象、積事象、排反事象という言葉の確認をしたいと思います。

教科書によると、和事象とは、

事象\(A\)又は事象\(B\)が起こる事象

と定義され、これは、集合で表すと集合\(\mathbb{A}\)と集合\(\mathbb{B}\)の和集合\(\mathbb{A} \cup \mathbb{B}\)となります。

教科書によると、互いに排反、又は排反事象であるとは、

事象\(A\)と事象\(B\)が同時に起こらない事象であること

と定義され、これを集合で表すと\(\mathbb{A} \cap \mathbb{B} \neq \varnothing\)が成り立つことになります。

互いに排反な事象\(A\)と\(B\)には、高校数学においては、先述した場合の数の和の法則が成り立つので、確率の定義と合わせて、その和事象について、

\[P(\mathbb{A} \cup \mathbb{B}) = P(\mathbb{A}) + P(\mathbb{B})\]

が成り立ち、これを確率の加法定理と呼びます。加法定理は、確率の関数\(P\)の本質を表す重要な定理です。

教科書によると、積事象とは、

事象\(A\)と事象\(B\)がともに起こる事象

と定義され、これは、集合で表すと集合\(\mathbb{A}\)と集合\(\mathbb{B}\)の共通集合\(\mathbb{A} \cap \mathbb{B}\)となります。

先述の場合の数の節で考えてきた通り、積事象がない場合には排反であり、内容の先取りになりますが、独立試行、反復試行、条件付確率などは、積事象がある場合として考えられます。

同様に、場合の数の節で考えてきた通り、積事象がある場合は、各事象の集合によって構成される集合の組(直積集合)を用いることに慣れれば、独立試行、反復試行、条件付確率などの違いを明確に理解することができます

それでは、次に積事象がある場合の独立試行、反復試行、条件付確率について、考えていきたいと思います。

独立な試行と積の法則

教科書によると、独立な試行とは、

複数の試行において、どの試行の結果も、他の試行の結果に影響を及ぼさないとき、これらの試行は独立であるという

と定義しています。

それでは、これまで学んだ確率の定義をこの独立試行に当てはめて考えてみましょう。

まず復習をすると、確率を考えるためには、試行の結果である事象を明確化して、その事象を確率の関数で数値と対応させるのでした。

そして、高校数学においては、根元事象を同様に確からしく設定することで、その確率の関数は、事象が含む根元事象の個数を、全事象が含む根元事象の個数で割った割合として考えるのでした。

それでは、複数の独立な試行がある場合には、何を根元事象とし、何を全事象とすれば良いのでしょうか。それを明確に定めなければ、確率を定義に基づいて考えることはできないわけです。

今、独立な試行の定義からすると、試行が複数あることが前提となっています。そうすると、試行の結果である事象も複数あるわけです。

そして、独立な試行において考えている対象は、その中の一つの試行の結果を全事象とした場合の確率ではありません。もし、そうだとすると、それは複数の試行を前提とした確率ではなく、その一つの事象を生んだ一つの試行の確率になってしまうからです。

そうではなく、独立な試行で考えたい確率は、複数の試行の確率です。つまり、複数の試行の結果として表れる複数の事象の確率を考えたいわけです。

つまり、根元事象となるべきなのは、複数の試行の結果として表れるそれぞれの根元事象の組、ということになります。したがって、独立な試行の全事象は、複数の試行の結果として表れる各全事象の組、ということになります。

事象を集合できちんと表すと、積の法則の節で先述した集合の組(直積集合)が当てはまります。つまり、各試行の全事象をそれぞれ集合として表わした上で、その集合たちの直積集合が独立試行の全事象を表す全体集合になります。

ちなみに、独立な試行の場合は、 各試行の全事象の集合から\(\varnothing\)を除いた方が良いでしょう。すべての試行において、何かしらの事象が起こることが前提となっているからです。

そして、各試行の根元事象が同様に確からしいのであれば、独立な試行はどの試行の結果も、他の試行の結果に影響を及ぼさないので、それを組み合わせた独立試行の根元事象も同様に確からしいと考えられます。このことは、試行を一つ、二つ、三つと増やしながら考えると分かりやすいと思います。

そのため、独立試行の確率の関数も、事象が含む根元事象の個数を、全事象が含む根元事象の個数で割った割合として考える、ということはまったく変わらずに確率の計算ができます。

さらに、独立な試行は、どの試行の結果も、他の試行の結果に影響を及ぼさないので、ある事象のどの根元事象に対しても他の事象のすべての根元事象が起こりえるため、互いに積の法則が成立します。

したがって、\(1 \le i \le n\)について、各試行の全事象の集合を\(\Omega_{i}\)、独立試行の全事象の直積集合を\(\Omega^{n}\)、各事象\(A_{i} \)の\(\Omega_{i}\)における部分集合を\(\mathbb{A}_{i}\)、各事象\(A_{i}\)の\(\Omega^{n}\)における部分集合を\(\mathbb{A}^{‘}_{i}\)とすると、

\begin{eqnarray}
P(\mathbb{A}^{‘}_{1} \cap \mathbb{A}^{‘}_{2} \cap \cdots \cap \mathbb{A}^{‘}_{n} ) & = & \frac{n(\mathbb{A}_{1}) \cdot n(\mathbb{A}_{2}) \cdot\ \cdots\ \cdot n(\mathbb{A}_{n}) }{ n(\Omega_{1}) \cdot n(\Omega_{2}) \cdot\ \cdots\ \cdot n(\Omega_{n}) } \\ \\
& = & P(\mathbb{A}_{1}) \cdot P(\mathbb{A}_{2}) \cdot\ \cdots\ \cdot P(\mathbb{A}_{n}) \\ \\
& = & P(\mathbb{A}^{‘}_{1}) \cdot P(\mathbb{A}^{‘}_{2}) \cdot\ \cdots\ \cdot P(\mathbb{A}^{‘}_{n}) \tag{1}
\end{eqnarray}

が成り立ちます。積の法則は、一段目の分子と分母に使われています。

ちなみに、\(\mathbb{A}_{1}\)と\(\mathbb{A}^{‘}_{1}\)の違いについては、積の法則の節で先述した内容を復習してみてください。

上の式で大切なポイントは、独立試行の全事象を直積集合で表すことで、各試行の自然な拡張にもなっていることです。つまり、各試行の確率をそれぞれの試行の全事象で考えなくとも、独立試行の全事象で考えることができるようになります。

つまり、事象\(A_{i}\)の確率は、事象\(A_{i}\)の試行の全事象を全体集合\(\Omega_{i}\)とする確率の関数として、通常、

\[P(\mathbb{A}_{i})=\frac{n(\mathbb{A}_{i})}{n(\Omega_{i})}\]

と考えれるのですが、独立試行の確率として、つまり、独立試行の全事象の全体集合\(\Omega^{n}\)において、その部分集合\(\mathbb{A}^{‘}_{i}\)の確率として、

\[P(\mathbb{A}^{‘}_{i})=\frac{n(\Omega_{1}) \cdot n(\Omega_{2}) \cdot\ \cdots\ \cdot n(\Omega_{i-1}) \cdot n(\mathbb{A}_{i}) \cdot n(\Omega_{i+1}) \cdot\ \cdots\ \cdot n(\Omega_{n}) }{ n(\Omega_{1}) \cdot n(\Omega_{2}) \cdot\ \cdots\ \cdot n(\Omega_{i-1}) \cdot n(\Omega_{i}) \cdot n(\Omega_{i+1}) \cdot\ \cdots\ \cdot n(\Omega_{n}) }= \frac{n(\mathbb{A}_{1})}{n(\Omega_{i})} = P(\mathbb{A}_{i})\]

としても考えられるということです。

以上では、正確な理解ができるように確率の関数\(P\)の引数として集合を明示的に代入した上で、確率の関数\(P\)の定義域の違いも\(P(\mathbb{A}_{i})\)や\(P(\mathbb{A}^{‘}_{i})\)と区別しましたが、通常は、これらの事実は前提なので\(P(A_{i})\)と書いて済ませます。

直観的にも独立試行において、\(P(A_{i})\)のようなある試行の事象の確率だけを考えるのであれば、その他の試行によって\(P(A_{i})\)が変わらないことは明らかなので、確率の関数\(P\)の定義域が\(\Omega_{i}\)の部分集合の集合なのか\(\Omega^{n}\)の部分集合の集合なのかということは言及されません。

ただ、このようなことを理解しておくと、難しい確率を理解するときでも、全事象の設定に困ることが少なくなるのではないかと思います。

なぜなら、多くの人にとって確率を理解する妨げとなっているのが、直観的に確率を理解しょうとする姿勢にあると、私は感じているからです。

そうではなく、集合や関数などの理詰めで考えるための数学の道具をきちんと活用して、定義から理屈で正確に論理的に考えていこうとする姿勢が大切なのだと思います。

これは、数学を学ぶ人には当たり前の話かもしれませんが、通常の紙媒体の教科書では、紙面の制約もあり、細かな注釈が多い解説も読みにくいので、時に論理的な正確さは後回しにされます。

そして、それを補って読むのが数学の作法なのですが、その作法を知らずに理解が進まない人も多くいますし、その作法を知っていても補い切れずに理解がとん挫することがよくあります。

このことは、初学者特有の出来事かというと、数学者においてもまったく変わらぬ数学の原理のようなもので、その時代の時代の高度な数学になればなるほど、論理的な整理が追いつかないためか、この問題が顕在化するらしく、数学発展を阻害する肝とも言えるだろうと思います。

ついでに余談ですが、直観的に数学を理解できるのは、数学に必要とされる頭の容量がかなり高めの人だけで、私を含めた普通の人は、難しいことを理解するためには物事を正確に丁寧に細かく分解する必要があると思います。

一方、数学を前進させてきたのは数学に必要とされる頭の容量もありますが、物事を正確に丁寧に分解するなどの考え方の発展によるところが大きいことを知ることも大切だと思います。

反復試行と独立な試行

教科書によると、反復試行とは、

同じ条件のもとで同じ試行を何回か繰り返し行う試行

と定義されています。

そもそも、試行の定義を思い出すと、

同じ状態のもとで繰り返すことができ、その結果が偶然によって決まる実験や観測など

であり、試行は、同じ状態のもとで繰り返すことが前提となっていますので、同じ条件のもとで同じ試行を何回か繰り返し行う、という反復試行を考えることがそもそも試行を考える際の視野に入っています。

それでは、試行と反復試行の違いは何かというと、元の試行はその結果の一つの事象の確率を考えますが、反復試行は複数の元の試行を一つの試行、そして、その結果である複数の事象を一つの事象として考えて、その確率を考えることになります。

つまり、反復試行は、複数の同じ試行を一つの試行としてまとめて考えると言えます。

そして、試行はその結果が偶然によって決まりますので、当然、同じ試行を繰り返しても、ある試行はほかの試行の結果によって影響を受けることはありません。

したがって、反復試行は独立試行であることが分かります。逆に、すべての試行が同じ試行である独立試行が反復試行であるとも言えます。

そのため、

\[\Omega_{1} = \Omega_{2} =\ \cdots\ = \Omega_{n}\]

であり、各試行の確率の関数\(P\)やその定義域も等しくなります。

くわえて、もちろん、上述した独立試行の性質がすべて成立します。

【反復試行の確率】
そこで、\(n\)回の反復試行で、確率\(p\)の事象\(A\)が\(r\)回起こる確率を考えてみると、

まず、事象\(A\)でない事象を事象\(A\)の余事象と言いますが、事象\(A\)の余事象を\(\overline{A}\)と書くと、

上述した独立試行で説明した通り、反復試行の事象は、各試行の結果である事象の組として表わせますので、今回の反復試行の事象は、集合\(\mathbb{A}^{‘}\)が\(r\)個と、集合\(\overline{\mathbb{A}^{‘}}\)が\(n-r\)個の共通部分で表せることが分かります。

さらに、反復試行のある一つの試行において、事象\(A\)が起こるか事象\(\overline{A}\)が起こるかによって、その反復試行の事象は異なる事象となるので、その共通部分は複数あることが分かります。

そこで、まず、その任意の共通部分一つを\(\mathbb{B}^{‘}\)で、その事象を\(B\)で表して考えを進めたいと思います。

そうすると、上記の条件を満たす反復試行の事象\(B\)は、\(n\)回の試行において事象\(A\)が\(r\)回起こる並びとして\(_n \mathrm{C} _r\)個あることが分かります。

くわえて、その確率\(P(\mathbb{B}^{‘})\)は、反復試行は独立試行なので、どれも\(p^{r}(1-p)^{n-r}\)であることも分かります。

同じように、反復試行のある一つの試行において、事象\(A\)が起こるか事象\(\overline{A}\)が起こるかによって、\(_n \mathrm{C} _r\)個のそれぞれの事象\(B\)は同時には起こらないので、排反事象であり、したがって、加法定理が成立するので、反復試行の事象の確率は、

\[_n \mathrm{C} _rp^{r}(1-p)^{n-r}\]

であることが分かりました。

条件付確率と乗法定理

教科書によると、条件付確率\(P_{A}(B)\)とは、

事象\(A\)が起こったときに、事象\(B\)が起こる確率

と定義しています。

それでは、やはり、確率の定義に戻って、条件付確率\(P_{A}(B)\)の全事象が何かを考えてみましょう。

まず、そもそも事象\(A\)と事象\(B\)が起こる試行があることが前提となっています。そして、その試行の結果の全事象を\(U\)とすると、事象\(A\)と事象\(B\)は、全事象\(U\)に含まれているわけです。

それでは、条件付確率\(P_{A}(B)\)の全事象が\(U\)かというと、\(P_{A}(B)\)は定義より事象\(A\)が起こらない場合は含まれていないので、事象\(A\)の余事象\(\overline{A}\)が含まれている\(U\)を全事象とすることはできません。

つまり、事象\(A\)が起こったとき、だけを\(P_{A}(B)\)は考えているので、\(P_{A}(B)\)の全事象は事象\(A\)ということになります。

よって、条件付確率\(P_{A}(B)\)とは、ある試行において、その全事象を事象\(A\)に限定して定義された確率ということができます。

したがって、根元事象が同様に確からしい場合には、

\[P_{A}(B) = \frac{n(\mathbb{A}^{‘} \cap \mathbb{B}^{‘} )}{n(\mathbb{A}^{‘})} \]

となります。

この数式を変形すると、

\begin{eqnarray}
P_{A}(B) & = & \frac{\frac{n(\mathbb{A}^{‘} \cap \mathbb{B}^{‘} )}{ n(\mathbb{U}^{‘}) }}{\frac{n(\mathbb{A}^{‘})}{ n(\mathbb{U}^{‘}) }} \\[12pt]
& = & \frac{P(\mathbb{A}^{‘} \cap \mathbb{B}^{‘} )}{P(\mathbb{A}^{‘})} \tag{1}
\end{eqnarray}

したがって、以下の乗法定理が得られます。

\[P(A \cap B) = P(A)P_{A}(B) \]

条件付確率は、事象\(A\)と事象\(B\)が排反事象であったり、独立試行であっても考えることのできる概念です。

つまり、事象\(A\)と事象\(B\)が排反事象である場合には、

\[\mathbb{A}^{‘} \cap \mathbb{B}^{‘} = \varnothing\]

なので、\(P_{A}(B) = 0\)となります。

事象\(A\)と事象\(B\)が独立試行における各試行の事象である場合には、「独立な試行と積の法則」の節の数式(1)より、

\[P(\mathbb{A}^{‘} \cap \mathbb{B}^{‘}) = P(\mathbb{A}^{‘})P(\mathbb{B}^{‘})\]

であり、これとこの節の数式(1)より、\(P_{A}(B) = P(B)\)となります。

事象\(A\)と事象\(B\)が独立試行における各試行の、特に全事象である場合には、上式よりも分かりますが、「集合の組(直積集合)の利用」の節の数式(3)も成り立つので、

\[\mathbb{A}^{‘} \cap \mathbb{B}^{‘} = \mathbb{A}^{‘}\]

なので、\(P_{A}(B) = 1\)となります。

ただ、主に条件付確率を考えるのは、排反事象や独立試行ではない場合です。

つまり、排反事象の場合は、\(\mathbb{A}^{‘}\)の任意の要素(組)について、集合\(\mathbb{B}\)の項は\(\varnothing\)です。

独立試行の場合は、\(\mathbb{A}^{‘}\)の要素(組)を考えると、集合\(\mathbb{A}\)の任意の要素について、集合\(\mathbb{B}\)のすべての要素が対応しています。

これらに対して、そうではない場合とは、例えば、

\(\mathbb{A}^{‘}\)の要素(組)を考えると、集合\(\mathbb{A}\)の各要素について、対応する集合\(\mathbb{B}\)の要素が異なってる場合や、(ちなみに、この場合は少なくとも\(P_{A}(B) \neq 0\)が言えます)

\(\mathbb{A}^{‘}\)のすべての要素(組)について、集合\(\mathbb{B}\)の要素がある場合や、(ちなみに、この場合は独立試行を含みますが、独立試行でない場合であっても\(P_{A}(B) = 1\)になります)

\(\mathbb{A}^{‘}\)のある要素(組)について、集合\(\mathbb{B}\)の項が\(\varnothing\)である場合、(この場合は少なくとも\(P_{A}(B) \neq 1\)が言えます)

などです。

つまり、事象\(A\)によって事象\(B\)の起こり方が影響を受ける場合と言えます。このような場合に条件付確率を考えることが多いわけです。

以上で集合から始まり場合の数と確率、それらの各概念の繋がりや関係を説明してきましたが、このように確率の基本への理解を深めると、さらに複雑な確率の公式でも理解を伴って活用できるようになります。

公開日:2019年9月09日
修正日:ー