正規分布(ガウス分布)の式をできるだけわかりやすく求めてみます。あわせてガウス積分も導出します。
スポンサーリンク
ダーツの的をイメージする

最初は2次元の的をイメージする。的の中心を狙ってダーツを投げる時、的の中心に当たることもあるが、外れてしまうこともある。一応、狙っているのだから、的の中心にダーツが到達する確率が一番高く、的の外側ほど低くなる。(なかなか中心に当たらないのは、確率が低いのではなく、中心以外の面積の方が圧倒的に大きいため)いま、\(xy\)平面に的を置き、原点を的の中心とする時、原点から距離\(r\)の位置にダーツが到達する確率密度を\(z\)軸にとり、それを表す関数を\(f(r)\)とする。\(f(r)\)を確率密度関数と言う。
確率密度関数の形をイメージする

確率密度関数\(f(r)\)は、原点が山頂の滑らかな山のような形となる。山の高さがダーツ到達の確率密度を表すのだから、山は円形で、山の体積を規格化すれば1となる。ダーツが上手い人ほど山は尖った形になり、下手な人ほどなだらかな形になる。
確率密度関数を求める
まず、原点からの距離\(r\)は、\(r=\sqrt{x^2+y^2}\)であるから、
$$f(r)=f(\sqrt{x^2+y^2})$$となる。\(x\)と\(y\)は独立した変数で、\(x\)が決まっても\(y\)は決まらない。例えば、\(x\)軸方向に位置\(x\)までダーツを外す確率が50%(0.5)で、\(y\)軸方向に位置\(y\)までダーツを外す確率が30%(0.3)なら、位置\(\boldsymbol{r}(x,y)\)にダーツが当たる確率は、50%×30%=15%(0.15)となる。したがって、\(x\)と\(y\)は変数分離で別々の関数の積で表すことができ、また、対称性から\(x\)と\(y\)の関数は同じであるから、
$$f(\sqrt{x^2+y^2})=g(x)g(y)$$となる。\(y=0\)の時を考えると、
$$f(x)=g(x)g(0)$$となり、これを一つ前の式に代入すれは、
$$f(\sqrt{x^2+y^2})=\frac{f(x)}{g(0)}g(y)$$となる。同様に\(x=0\)を考えると、
$$f(\sqrt{x^2+y^2})=\frac{f(x)f(y)}{g(0)^2}$$となる。ここで、関数を\(F(X^2)=f(X)\)、定数を\(C=1/g(0)^2\)と置くと、
$$CF(x^2+y^2)=C^2F(x^2)F(y^2)$$となる。このような関係式が成り立つ関数は、指数関数であるから、任意の定数\(a\)と任意の変数\(R\)を使って
$$F(R)=e^{aR}$$と書くことができる。\(R=r^2\)として、\(f(r)\)に戻すと、
$$f(r)=e^{ar^2}=e^{a(x^2+y^2)}$$となる。この関数は、確率密度を表しているが、任意の定数\(a\)が正の時は、原点が谷の底のような形になってしまい、確率密度が全方向で発散してしまう。したがって、定数\(a\)は負でなければならず、そのことを明確にするため、
$$f(r)=e^{-ar^2}=e^{-a(x^2+y^2)}(a\gt 0)$$とする。
確率密度関数を積分して規格化する
関数\(f(r)\)の体積が1となるように規格化する。\(xy\)平面で積分することは、半径\(r\)の円周で、\(r\)を0から\(\infty\)に積分することと同じだから、\(f(r)\)を積分すると、
\begin{eqnarray} \iint_{-\infty}^\infty f(r) dxdy&=&\int_0^\infty 2\pi rf(r) dr\\ &=&2\pi\int_0^\infty re^{-ar^2} dr\\ &=&2\pi\left[ -\frac{1}{2a}e^{-ar^2} \right]_0^\infty\\ &=&-\frac{\pi}{a}[0-1]\\ &=&\frac{\pi}{a} \end{eqnarray}となる。したがって、\(f(r)\)を規格化すると、
$$f(r)=\frac{a}{\pi}e^{-ar^2}$$となる。
ガウス積分
先程求めた規格化する前の確率密度関数の積分は、変数分離して積の形となることを利用すれば、
$$\iint_{-\infty}^\infty f(r) dxdy=\iint_{-\infty}^\infty f(x)f(y) dxdy=\int_{-\infty}^\infty f(x)dx\int_{-\infty}^\infty f(y)dy=\frac{\pi}{a}$$となる。ここで\(x\)と\(y\)は対称でそれぞれの積分は同じ値になる筈だから、
$$\int_{-\infty}^\infty f(x)dx=\boxed{\int_{-\infty}^\infty e^{-ax^2}dx=\sqrt{\frac{\pi}{a}}}$$となる。この積分をガウス積分と言う。
1次元の確率密度関数
これまでダーツの的をイメージして、2次元(\(xy\)平面)の確率密度関数を考えていたが、1次元(\(x\)軸)の確率密度関数を考える。1次元の確率密度関数は、2次元の確率密度関数の\(y\)が一定の時と考えられるから、定数\(e^{-ay^2}\)を\(b\)とおくと、
$$f(x)=e^{-a(x^2+y^2)}=e^{-ax^2}e^{-ay^2}=be^{-ax^2}$$となる。定数\(b\)は\(y\)を動かして任意に選ぶことができるから、\(f(x)\)の面積が1となるように規格化し、\(b\)の値を求める。ガウス積分より、
$$\int_{-\infty}^\infty f(x)dx=\int_{-\infty}^\infty be^{-ax^2}dx=b\sqrt{\frac{\pi}{a}}$$となるから、\(f(x)\)を規格化するように\(b\)を選ぶと、
$$f(x)=\sqrt{\frac{a}{\pi}}e^{-ax^2}$$となる。
平均
的の例で言えば、原点に的の中心があり、回転対称なので、\(x\)、\(y\)共に平均値は0となる。このことは、正規分布の特徴として、平均値、最頻値、中央値が一致していることに由来する。平均値が\(\mu\)となる場合、グラフの中心をずらせば良いので、
$$f(x)=\sqrt{\frac{a}{\pi}}e^{-a(x-\mu)^2}$$となる。
分散
1次元の確率密度関数の分散\(\sigma\)を計算してみる。分散の2乗の求め方は、各値\(x\)から平均\(\mu\)を引いて偏差を求め、偏差を2乗して値ごとの個数(\(f(x)\))を掛けて合計(積分)し、データの個数(グラフの面積)で割る。したがって、面積は1に規格化されているから、
\begin{eqnarray} \sigma^2&=&\int_{-\infty}^\infty(x-\mu)^2 f(x) dx \div 1\\ &=&\sqrt{\frac{a}{\pi}}\int_{-\infty}^\infty (x-\mu)^2 e^{-a(x-\mu)^2} dx \end{eqnarray}となる。\(X=a(x-\mu)^2\)とおくと、
$$\sigma^2=\sqrt{\frac{a}{\pi}}\int_{-\infty}^\infty \frac{1}{a}X e^{-X} \frac{dx}{dX} dX$$となる。
$$\frac{dX}{dx}=\frac{da(x-\mu)^2}{dx}=2a(x-\mu)=2\sqrt{aX}$$であり、また式の対象性から積分範囲を0からにして倍にすると、
\begin{eqnarray} \sigma^2&=&\frac{1}{a\sqrt{\pi}}\int_0^\infty \sqrt{X} e^{-X} dX\\ &=&\frac{1}{a\sqrt{\pi}}\cdot\frac{\sqrt{\pi}}{2}(ガンマ関数の公式 \Gamma\left(\frac{3}{2}\right)=\int_0^\infty x^\frac{1}{2}e^{-x}dx=\frac{\sqrt{\pi}}{2}より)\\ &=&\frac{1}{2a} \end{eqnarray}となる。したがって、aを\(\sigma\)で表し、平均値を含めた1次元の確率密度関数の式に代入すれば、正規分布の式が
$$\boxed{f(x)=\frac{1}{\sqrt{2\sigma^2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}}$$となる。期待したとおり、分散の逆数がxの係数となっているため、分散が小さい(ダーツが上手な)ほど、グラフは尖った形になり、分散が大きい(ダーツが下手な)ほど、グラフはなだらかな形になる。
正規分布の表し方
これまで見てきたとおり、正規分布の形は、平均と分散の2乗で決まる。したがって、正規分布を\(N(\mu,\sigma^2)\)と表す。
標準正規分布

\(\mu=0\)、\(\sigma^2=1\)、つまり\(N(0,1)\)のときを標準正規分布と言い、
$$\boxed{f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}}$$となる。
スポンサーリンク

