← 統計検定テキスト 一覧

📊 対象級:2級 | 重要度:B(標準)

一様分布(連続一様分布)

要点(BLUF)

  • 連続一様分布 U(a,b)U(a,b) は、区間 [a,b][a,b] の中ならどこでも同じ確率密度をとる最も単純な連続分布。確率は「密度 × 幅 = 面積」で読む。
  • 期待値は区間の中点 a+b2\frac{a+b}{2}、分散は区間幅の2乗に比例して (ba)212\frac{(b-a)^2}{12}
  • 00 から 11 までの一様乱数は、逆関数法によって他のあらゆる分布の乱数を作る「種」になる。
f(x)=1ba  (axb),E[X]=a+b2,V[X]=(ba)212\boxed{\,f(x)=\dfrac{1}{b-a}\ \ (a\le x\le b),\qquad E[X]=\dfrac{a+b}{2},\qquad V[X]=\dfrac{(b-a)^2}{12}\,}

1. 概念:区間内なら「どこも同じ起こりやすさ」

連続一様分布とは、ある区間 [a,b][a,b] の中であれば、どの値も同じ「起こりやすさ」を持つ連続型の確率分布です。確率変数 XX がこの分布に従うことを XU(a,b)X \sim U(a,b) と書きます。

イメージは「長さ bab-a の棒の上に、絵の具を一様にベタ塗りした」状態です。棒のどこを切り取っても、同じ厚さで絵の具が乗っています。この「厚さ」が確率密度であり、区間内でずっと一定の高さになります。

具体例:


2. 定式化:PDFとCDF

確率密度関数(PDF)

連続一様分布の確率密度関数(PDF)は、区間内で一定値、区間外でゼロです。

f(x)={1ba(axb)0(それ以外)f(x)= \begin{cases} \dfrac{1}{b-a} & (a \le x \le b)\\[2mm] 0 & (\text{それ以外}) \end{cases}

高さが 1ba\frac{1}{b-a} なのは偶然ではありません。確率密度関数は全区間で積分すると必ず 11 になるという大原則(全確率=1)から決まります。底辺 bab-a × 高さ hh の長方形の面積が 11 になるには、h=1bah=\frac{1}{b-a} でなければならないからです。

要するに:高さ 1ba\frac{1}{b-a} は「面積を1にするための辻褄合わせ」で自動的に決まる値であって、覚える前に作れる値です。

累積分布関数(CDF)

累積分布関数(CDF) F(x)=P(Xx)F(x)=P(X \le x) は、密度を aa から xx まで積分した「左からの面積」です。

F(x)={0(x<a)xaba(axb)1(x>b)F(x)= \begin{cases} 0 & (x < a)\\[1mm] \dfrac{x-a}{b-a} & (a \le x \le b)\\[1mm] 1 & (x > b) \end{cases}

区間内では F(x)=xabaF(x)=\frac{x-a}{b-a} という**1次関数(直線)**になります。これは「左端 aa からどれだけ進んだか」を「区間全体の幅」で割った割合そのものです。

要するに:連続一様分布の確率は、面積を計算するまでもなく「区間に占める割合」で読める。P(Xx)P(X \le x) は単に「aa から xx までが全体の何割か」。

PDFとCDFの形(イメージ)

一様分布U(2,8)のPDF(長方形)とCDF(直線ランプ)。確率は面積に対応

左:PDFは区間[2,8]で一定値1/(b-a)の長方形(塗った区間[4,6]の面積が確率)。右:CDFは区間内を一定の傾きで0→1へ。図は simulations/ichiyou_bunpu_keijou.py で生成。

PDFは「区間内で一定高さの長方形」、CDFは「区間内で一直線に立ち上がる傾斜」になります。

xychart-beta
    title "連続一様分布 U(2,6) の PDF(確率密度関数)"
    x-axis "x" 0 --> 8
    y-axis "密度 f(x)" 0 --> 0.4
    line [0, 0, 0.25, 0.25, 0.25, 0.25, 0.25, 0, 0]
xychart-beta
    title "連続一様分布 U(2,6) の CDF(累積分布関数)"
    x-axis "x" 0 --> 8
    y-axis "確率 F(x)" 0 --> 1
    line [0, 0, 0, 0.25, 0.5, 0.75, 1, 1, 1]

上の2図は a=2, b=6a=2,\ b=6(幅 44)の場合です。PDFは区間 [2,6][2,6] で高さ 162=0.25\frac{1}{6-2}=0.25 の平らな台、CDFは x=2x=2 から x=6x=6 にかけて 00 から 11 へまっすぐ登る直線になります。


3. 確率の計算:確率=面積(=幅の割合)

連続一様分布で「XX がある区間 [c,d][c,d] に入る確率」は、その区間の長方形の面積です。高さが一定 1ba\frac{1}{b-a} なので、面積は単純に「幅 × 高さ」になります。

P(cXd)=(dc)1ba=dcba(acdb)P(c \le X \le d) = (d-c)\cdot \dfrac{1}{b-a} = \dfrac{d-c}{b-a}\qquad (a\le c \le d \le b)

要するに:確率は「知りたい区間の幅 ÷ 全体の幅」だけ。積分記号に身構える必要はありません。

具体例:XU(0,10)X \sim U(0,10)(待ち時間が0〜10分の一様)のとき、

P(3X7)=73100=410=0.4P(3 \le X \le 7) = \dfrac{7-3}{10-0} = \dfrac{4}{10} = 0.4

「3分以上7分以下待つ確率は40%」。区間幅4分が全体10分の40%を占めるからです。

なお連続分布では、ある1点ぴったりの確率は0です。

P(X=c)=ccba=0P(X = c) = \dfrac{c-c}{b-a} = 0

幅ゼロの長方形は面積ゼロだからです。このため連続一様分布では \le<< を区別する必要がありません(P(Xc)=P(X<c)P(X \le c)=P(X<c))。


4. 期待値の完全導出:E[X]=a+b2E[X]=\dfrac{a+b}{2}

期待値は定義どおり「xx × 密度」を全区間で積分します。

E[X]=abxf(x)dx=abx1badxE[X]=\int_{a}^{b} x\,f(x)\,dx=\int_{a}^{b} x\cdot \dfrac{1}{b-a}\,dx

定数 1ba\frac{1}{b-a} を積分の外に出します。

=1baabxdx=1ba[x22]ab=1bab2a22=\dfrac{1}{b-a}\int_{a}^{b} x\,dx =\dfrac{1}{b-a}\left[\dfrac{x^2}{2}\right]_{a}^{b} =\dfrac{1}{b-a}\cdot\dfrac{b^2-a^2}{2}

ここで b2a2=(ba)(b+a)b^2-a^2=(b-a)(b+a) と因数分解すると、bab-a が約分されます。

=(ba)(b+a)2(ba)=a+b2=\dfrac{(b-a)(b+a)}{2(b-a)}=\dfrac{a+b}{2}

要するに:期待値は区間のちょうど真ん中。左右対称な分布なので、重心が中点に来るのは図形的にも当然です。積分しなくても対称性から a+b2\frac{a+b}{2} と即答できます。


5. 分散の完全導出:V[X]=(ba)212V[X]=\dfrac{(b-a)^2}{12}

分散は V[X]=E[X2](E[X])2V[X]=E[X^2]-\bigl(E[X]\bigr)^2 で求めます。まず E[X2]E[X^2] を積分します。

E[X2]=abx21badx=1ba[x33]ab=1bab3a33E[X^2]=\int_{a}^{b} x^2\cdot\dfrac{1}{b-a}\,dx =\dfrac{1}{b-a}\left[\dfrac{x^3}{3}\right]_{a}^{b} =\dfrac{1}{b-a}\cdot\dfrac{b^3-a^3}{3}

b3a3=(ba)(b2+ab+a2)b^3-a^3=(b-a)(b^2+ab+a^2) と因数分解すると、bab-a が約分されます。

E[X2]=(ba)(b2+ab+a2)3(ba)=a2+ab+b23E[X^2]=\dfrac{(b-a)(b^2+ab+a^2)}{3(b-a)}=\dfrac{a^2+ab+b^2}{3}

次に (E[X])2=(a+b2)2=a2+2ab+b24\bigl(E[X]\bigr)^2=\left(\dfrac{a+b}{2}\right)^2=\dfrac{a^2+2ab+b^2}{4} を引きます。通分のため両者を 1212 分母にそろえます。

V[X]=a2+ab+b23a2+2ab+b24=4(a2+ab+b2)3(a2+2ab+b2)12V[X]=\dfrac{a^2+ab+b^2}{3}-\dfrac{a^2+2ab+b^2}{4} =\dfrac{4(a^2+ab+b^2)-3(a^2+2ab+b^2)}{12}

分子を展開して整理します。

4(a2+ab+b2)=4a2+4ab+4b2,3(a2+2ab+b2)=3a2+6ab+3b24(a^2+ab+b^2)=4a^2+4ab+4b^2,\qquad 3(a^2+2ab+b^2)=3a^2+6ab+3b^2 V[X]=(4a23a2)+(4ab6ab)+(4b23b2)12=a22ab+b212=(ab)212=(ba)212V[X]=\dfrac{(4a^2-3a^2)+(4ab-6ab)+(4b^2-3b^2)}{12} =\dfrac{a^2-2ab+b^2}{12}=\dfrac{(a-b)^2}{12}=\dfrac{(b-a)^2}{12}

要するに:分散は区間幅 bab-a の2乗に比例する。幅が2倍になればばらつき(分散)は4倍、標準偏差は2倍。位置 a,ba,b そのものではなく「区間の広さだけ」でばらつきが決まるのが一様分布の特徴です。標準偏差は ba12=ba23\dfrac{b-a}{\sqrt{12}}=\dfrac{b-a}{2\sqrt{3}}


6. 離散一様分布との区別(混同注意)

「一様分布」には離散連続の2種類があり、公式が違います。2級では主に連続一様分布が問われますが、離散版と取り違えると公式を間違えます。

連続一様分布 U(a,b)U(a,b)離散一様分布(1,2,,n1,2,\dots,n を等確率)
値のとり方区間 [a,b][a,b]実数すべて1,2,,n1,2,\dots,n飛び飛びの整数
表す関数確率密度関数 f(x)=1baf(x)=\dfrac{1}{b-a}確率質量関数 P(X=k)=1nP(X=k)=\dfrac{1}{n}
期待値a+b2\dfrac{a+b}{2}n+12\dfrac{n+1}{2}
分散(ba)212\dfrac{(b-a)^2}{12}n2112\dfrac{n^2-1}{12}
待ち時間、乱数 U(0,1)U(0,1)サイコロの目

サイコロ(n=6n=6)は離散一様分布で、期待値 6+12=3.5\frac{6+1}{2}=3.5、分散 62112=35122.92\frac{6^2-1}{12}=\frac{35}{12}\approx2.92 です。これに連続版の公式 (ba)212\frac{(b-a)^2}{12} を当てはめてはいけません(区間幅で計算する連続版とは別物)。どちらも分母に 1212 が出るため、形が似ていて混同を誘います。


7. 応用:逆関数法(一様乱数がすべての種になる)

U(0,1)U(0,1) の一様乱数が重要なのは、これさえあれば**逆関数法(逆変換サンプリング)**で他の任意の連続分布の乱数を作れるからです。2級では深い計算までは問われませんが、「一様分布が乱数生成の出発点である」という位置づけは押さえておく価値があります。

仕組み:作りたい分布の累積分布関数を FF とします。UU(0,1)U \sim U(0,1) を1つ引き、その逆関数に通した

X=F1(U)X = F^{-1}(U)

は、ちょうど分布 FF に従います。

なぜ成り立つかX=F1(U)X=F^{-1}(U) の累積分布を計算すると、FF が単調増加なので

P(Xx)=P(F1(U)x)=P(UF(x))=F(x)P(X \le x)=P\bigl(F^{-1}(U)\le x\bigr)=P\bigl(U \le F(x)\bigr)=F(x)

最後の等号は「U(0,1)U(0,1) では P(Uu)=uP(U \le u)=u」(U(0,1)U(0,1) のCDFが uu そのもの)という一様分布の性質から来ます。結果 P(Xx)=F(x)P(X\le x)=F(x) となり、XX が望みの分布 FF に従うことが示せました。

指数分布の例:パラメータ λ\lambda の指数分布は F(x)=1eλxF(x)=1-e^{-\lambda x}。これを uu について解くと逆関数は

x=F1(u)=1λln(1u)x=F^{-1}(u)=-\dfrac{1}{\lambda}\ln(1-u)

なので、U(0,1)U(0,1) の乱数 uu1λln(1u)-\frac{1}{\lambda}\ln(1-u) に変換すれば、指数分布の乱数が得られます。

要するに:一様分布は「面白みのない平らな分布」ではなく、CDFの逆関数を通すことであらゆる分布へ変身できる原材料。変数変換の詳細は 確率変数の変換・モーメント母関数・積率 を参照。


8. 試験での問われ方(2級)

2級では計算と性質の確認が中心で、難所はありません。典型は次の4タイプです。

  1. 期待値・分散の値を答えるU(a,b)U(a,b) の数値を与え、a+b2\frac{a+b}{2}(ba)212\frac{(b-a)^2}{12} に代入させる。標準偏差まで聞かれることも。
  2. 区間に入る確率P(cXd)=dcbaP(c\le X\le d)=\frac{d-c}{b-a} の「幅の割合」計算。
  3. PDF/CDFの形の理解:密度が一定(長方形)、CDFが直線、といったグラフ選択や記述。
  4. 離散一様との区別:サイコロ(離散)に連続の公式を当てない、など概念の取り違えを問う。

⚠️ 引っかけポイント・頻出論点


9. よくある疑問(Q&A)

Q1. 連続一様分布で、密度 f(x)=1baf(x)=\frac{1}{b-a} が1を超えることはありますか?それは確率なのに変では? あります。たとえば U(0,0.5)U(0,0.5) なら f(x)=10.5=2f(x)=\frac{1}{0.5}=2。これは矛盾ではありません。連続分布では f(x)f(x) は**確率ではなく確率密度(高さ)**で、1を超えてかまいません。確率になるのは「密度 × 幅=面積」のときだけで、面積(確率)は決して1を超えません(区間 [0,0.5][0,0.5] 全体でも 2×0.5=12\times0.5=1)。

Q2. なぜ分散の分母が 1212 なのですか?覚えるしかない? 覚える必要はありません。導出の通り、E[X2]E[X^2] の通分(33 分母)と (E[X])2(E[X])^2 の通分(44 分母)をそろえる最小公倍数が 1212 です。3344 の最小公倍数が 1212 だから、という機械的な結果です。導出を一度自分でたどれば、1212 は自然に出てきます。

Q3. サイコロも「すべて同じ確率」だから連続一様分布の公式 (ba)212\frac{(b-a)^2}{12} で計算していいですか? いけません。サイコロは離散一様分布(目は飛び飛びの 161\sim6)なので、分散は n2112=3512\frac{n^2-1}{12}=\frac{35}{12} です。連続の (ba)212\frac{(b-a)^2}{12}b=6,a=1b=6,a=1 を入れると 2512\frac{25}{12} となり誤り。連続版は「区間に実数が詰まっている」前提の公式で、6個の点しかないサイコロには使えません。

Q4. P(X=c)=0P(X=c)=0 なら、その値は絶対に起きないということですか? いいえ。「確率が0」と「起こりえない」は連続分布では別物です。XX は区間内のどこかの実数を必ずとるので、ある特定の値も「起こりうる」が、無限個の候補に対する1点の確率は0になります。連続分布では「点」ではなく「区間(幅のある範囲)」で確率を考えるのが約束事です。

Q5. U(0,1)U(0,1) だけ特別に重要なのはなぜですか? 逆関数法の原材料だからです(§7)。U(0,1)U(0,1) の乱数 uu を作りたい分布のCDFの逆関数 F1F^{-1} に通せば、その分布の乱数 F1(u)F^{-1}(u) が得られます。コンピュータの乱数生成は「まず U(0,1)U(0,1) を作り、そこから変換する」のが基本戦略なので、U(0,1)U(0,1) はすべての分布の出発点になります。


10. まとめ


関連ノート