📊 対象級：準1級・ 1級　|　重要度：C（低頻度）

順序統計量の分布

要点（BLUF）

順序統計量：標本 $X_1,\dots,X_n$ を小さい順に並べ替えたものを $X_{(1)}\le X_{(2)}\le\dots\le X_{(n)}$ と書く。 $X_{(1)}$ が最小値、 $X_{(n)}$ が最大値、 $X_{(k)}$ が「 $k$ 番目に小さい値（第 $k$ 順序統計量）」。範囲・中央値・極値はすべて順序統計量から作られる。
導出の核（これ1つ）：「 $X_{(k)}\le x$ 」 ⇔ 「 $n$ 個のうち $x$ 以下のものが $k$ 個以上」。 $x$ 以下になる個数は二項分布 $\mathrm{Bin}(n,F(x))$ にしたがう。この一言から最小・最大・第 $k$ のCDF/PDFが全部出る。 $\boxed{\,f_{X_{(k)}}(x)=\dfrac{n!}{(k-1)!\,(n-k)!}\,f(x)\,F(x)^{k-1}\,\{1-F(x)\}^{n-k}\,}$ 要するに「境界 $x$ の左に $k-1$ 個・ちょうど $x$ に1個・右に $n-k$ 個」を並べる場合の数（多項係数）× それぞれの確率。
一様分布だと正体がベータ： $X_i\sim U(0,1)$ なら $F(x)=x$ なので $X_{(k)}\sim \mathrm{Be}(k,\,n-k+1)$ 、 $E[X_{(k)}]=\dfrac{k}{n+1}$ 。 $n$ 個が区間 $[0,1]$ を等間隔に分け合うイメージ。

本文

0. なにを並べ替えるのか

標本 $X_1,X_2,\dots,X_n$ は「取った順」のデータです。これを値の小さい順に並べ替えると、

$X_{(1)}\le X_{(2)}\le \dots \le X_{(n)}$

という新しい確率変数の列ができます。これらを**順序統計量（order statistics）**と呼びます。括弧つきの添字 $(k)$ は「順位 $k$ 番目」を意味し、 $X_k$ （ $k$ 番目に取ったデータ）とは別物です。

記号	意味	別名
$X_{(1)}$	最小値 $\min_i X_i$	第1順序統計量
$X_{(n)}$	最大値 $\max_i X_i$	第 $n$ 順序統計量
$X_{(k)}$	$k$ 番目に小さい値	第 $k$ 順序統計量
$X_{(n)}-X_{(1)}$	範囲（レンジ）	range
$X_{((n+1)/2)}$ など	中央値	median（ $n$ 奇数のとき）

前提：以下では $X_1,\dots,X_n$ は独立同分布（i.i.d.）で、共通の累積分布関数（CDF） $F(x)=P(X\le x)$ と密度 $f(x)=F'(x)$ を持つ連続分布とします。連続なら同点（タイ）が確率0で起きないので、不等号はすべて狭義 $X_{(1)}<\dots<X_{(n)}$ と思って構いません。

graph LR
    R["生データ X1,X2,...,Xn 取った順"] --> S["小さい順に並べ替え"]
    S --> O1["X(1) 最小"]
    S --> Ok["X(k) 第k"]
    S --> On["X(n) 最大"]
    O1 --> RANGE["範囲 = X(n) - X(1)"]
    On --> RANGE
    Ok --> MED["中央値 = 真ん中の順序統計量"]

なぜ重要か：極値（洪水の最大水位、部品寿命の最小値＝一番早く壊れるもの）、範囲（管理図のレンジ $R$ ）、中央値・分位点（外れ値に強い要約）はどれも順序統計量です。ノンパラメトリック手法（ノンパラメトリック検定（符号・順位和・Wilcoxon））や信頼区間の一部も順序統計量で構成されます。

1. 導出の核：「 $x$ 以下の個数」は二項分布

順序統計量の分布はすべて、次の橋渡しから出ます。

各 $X_i$ について「 $X_i\le x$ かどうか」を成功・失敗とみなす。1個が「 $x$ 以下」になる確率は $F(x)$ 。 $n$ 個は独立なので、 $x$ 以下になった個数 $N_x$ は二項分布 $\mathrm{Bin}(n,\,F(x))$ にしたがう。

ここで決定的な同値関係：

$\{X_{(k)}\le x\}\ \Longleftrightarrow\ \{x\text{ 以下の個数が }k\text{ 個以上}\}=\{N_x\ge k\}.$

要するに：「 $k$ 番目に小さい値が $x$ 以下」とは「少なくとも $k$ 個が $x$ の左側に来た」ということ。 $k$ 個以上左にあれば、 $k$ 番目の値は $x$ を超えられません。逆も同様。この左辺＝右辺の言い換えが、順序統計量を二項分布の問題に翻訳します。

graph TD
    Q["X(k) ≤ x ?"] --> E["⇔ x以下の個数 Nx ≥ k"]
    E --> B["Nx ~ Bin(n, F(x))"]
    B --> CDF["F_X(k)(x) = P(Nx ≥ k) = Σ_(j=k)^n C(n,j) F(x)^j (1-F(x))^(n-j)"]

2. 最大値・最小値（特別な場合から先に）

第 $k$ の一般式の前に、 $k=n$ （最大）と $k=1$ （最小）を直接やると感覚がつかめます。

2-1. 最大値 $X_{(n)}$

「最大値が $x$ 以下」⇔「全員が $x$ 以下」。独立なので確率を掛け算：

$F_{X_{(n)}}(x)=P(X_{(n)}\le x)=P(X_1\le x,\dots,X_n\le x)=\prod_{i=1}^n P(X_i\le x)=F(x)^n.$

密度はこれを微分（合成関数の微分、 $\dfrac{d}{dx}F(x)^n=nF(x)^{n-1}f(x)$ ）：

$\boxed{\,f_{X_{(n)}}(x)=n\,f(x)\,F(x)^{n-1}\,}.$

要するに：最大値が $x$ 付近にあるには「ちょうど1個が $x$ （密度 $f(x)$ 、それが誰でもいいので $\times n$ ）、残り $n-1$ 個は $x$ より小さい（各 $F(x)$ ）」。

2-2. 最小値 $X_{(1)}$

「最小値が $x$ より大きい」⇔「全員が $x$ より大きい」のほうが素直なので、補集合から攻めます：

$P(X_{(1)}>x)=P(X_1>x,\dots,X_n>x)=\{1-F(x)\}^n.$

よってCDFは

$F_{X_{(1)}}(x)=1-P(X_{(1)}>x)=1-\{1-F(x)\}^n.$

微分して（ $\dfrac{d}{dx}\{1-F(x)\}^n=-n\{1-F(x)\}^{n-1}f(x)$ 、マイナスが打ち消える）：

$\boxed{\,f_{X_{(1)}}(x)=n\,f(x)\,\{1-F(x)\}^{n-1}\,}.$

要するに：最小値が $x$ 付近にあるには「ちょうど1個が $x$ （ $\times n$ 通り）、残り $n-1$ 個は $x$ より大きい（各 $1-F(x)$ ）」。最大値の式で $F\leftrightarrow 1-F$ を入れ替えただけ。

3. 第 $k$ 順序統計量の完全導出

一般の $X_{(k)}$ を2通りで導きます。(A) CDFを二項和で書いて微分、(B) 微小区間で多項分布として直接。どちらも同じ式に着地します。

(A) CDFを微分する（二項和ルート）

第1節の核から、CDFは「 $x$ 以下が $k$ 個以上」の確率＝二項分布の上側和：

$F_{X_{(k)}}(x)=P(N_x\ge k)=\sum_{j=k}^{n}\binom{n}{j}F(x)^j\,\{1-F(x)\}^{n-j}.$

これを $x$ で微分すると密度が出ます。各項を微分し、 $F'(x)=f(x)$ を使うと隣り合う項どうしが望遠鏡的に打ち消し合い（telescoping）、中央の1項だけが残ります。結果（途中計算は本節末の補足参照）：

$\boxed{\,f_{X_{(k)}}(x)=\frac{n!}{(k-1)!\,(n-k)!}\,f(x)\,F(x)^{k-1}\,\{1-F(x)\}^{n-k}\,}.$

(B) 微小区間で直接数える（多項分布ルート・直感的）

密度の定義 $f_{X_{(k)}}(x)\,dx\approx P\big(X_{(k)}\in[x,x+dx]\big)$ を、「 $n$ 個を3つの箱に振り分ける」問題として数えます。 $X_{(k)}$ が微小区間 $[x,x+dx]$ にあるとは：

箱	条件	個数	1個あたり確率
左	$x$ より小さい	$k-1$ 個	$F(x)$
中	$[x,x+dx]$ にある	ちょうど1個	$f(x)\,dx$
右	$x+dx$ より大きい	$n-k$ 個	$1-F(x)$

「どの個体がどの箱か」の割り当て総数は多項係数 $\dfrac{n!}{(k-1)!\,1!\,(n-k)!}$ 。掛け合わせて：

$f_{X_{(k)}}(x)\,dx=\underbrace{\frac{n!}{(k-1)!\,(n-k)!}}_{\text{割り当て数}}\,F(x)^{k-1}\,\underbrace{f(x)\,dx}_{\text{中の1個}}\,\{1-F(x)\}^{n-k}.$

両辺を $dx$ で割れば (A) と同じ式。要するに：第 $k$ 順序統計量の密度は「境界 $x$ の左に $k-1$ 個・ $x$ に1個・右に $n-k$ 個」を並べる多項分布そのもの。

graph LR
    L["左の箱: k-1 個 各 F(x)"] --- C["中の箱: 1個 f(x)dx"]
    C --- Rt["右の箱: n-k 個 各 1-F(x)"]
    M["多項係数 n! / ((k-1)! 1! (n-k)!)"] -.掛ける.-> C

整合チェック

$k=n$ ： $\dfrac{n!}{(n-1)!\,0!}=n$ 、 $F^{n-1}\{1-F\}^0=F^{n-1}$ → $nf\,F^{n-1}$ 。第2-1節と一致。
$k=1$ ： $\dfrac{n!}{0!\,(n-1)!}=n$ 、 $F^{0}\{1-F\}^{n-1}$ → $nf\{1-F\}^{n-1}$ 。第2-2節と一致。

💡 補足（(A) のtelescoping）： $\dfrac{d}{dx}\sum_{j=k}^n\binom{n}{j}F^j(1-F)^{n-j}$ を積の微分で展開すると、各 $j$ から $+\binom{n}{j}jF^{j-1}(1-F)^{n-j}f$ と $-\binom{n}{j}(n-j)F^{j}(1-F)^{n-j-1}f$ の2項が出る。 $\binom{n}{j}j=\binom{n}{j-1}(n-j+1)$ などの恒等式で隣接項が相殺し、和の下端 $j=k$ 由来の項 $\binom{n}{k}kF^{k-1}(1-F)^{n-k}f$ だけが生き残る。 $\binom{n}{k}k=\dfrac{n!}{(k-1)!(n-k)!}$ なので所望の式。

4. 一様分布の順序統計量＝ベータ分布

ここが順序統計量の「正体」が見える名場面です。 $X_i\sim U(0,1)$ （一様分布（連続一様分布））なら、 $0\le x\le 1$ で $F(x)=x$ 、 $f(x)=1$ 。第 $k$ の密度式に代入すると：

$f_{X_{(k)}}(x)=\frac{n!}{(k-1)!\,(n-k)!}\,x^{k-1}\,(1-x)^{n-k}\qquad(0\le x\le 1).$

これはベータ分布（指数分布・ガンマ分布・ベータ分布）の密度 $\dfrac{1}{B(\alpha,\beta)}x^{\alpha-1}(1-x)^{\beta-1}$ そのもの。 $\alpha-1=k-1$ 、 $\beta-1=n-k$ と読み取れば $\alpha=k$ 、 $\beta=n-k+1$ 。正規化定数も一致します（ $\dfrac{n!}{(k-1)!(n-k)!}=\dfrac{1}{B(k,\,n-k+1)}$ 、ベータ関数 $B(\alpha,\beta)=\dfrac{(\alpha-1)!(\beta-1)!}{(\alpha+\beta-1)!}$ を使う）。したがって

$\boxed{\,X_{(k)}\sim \mathrm{Be}(k,\ n-k+1)\,}.$

ベータ分布の平均 $\dfrac{\alpha}{\alpha+\beta}$ 、分散 $\dfrac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}$ に $\alpha=k,\ \beta=n-k+1$ を入れて：

$E[X_{(k)}]=\frac{k}{n+1},\qquad V[X_{(k)}]=\frac{k(n-k+1)}{(n+1)^2(n+2)}.$

要するに： $n$ 個の一様乱数は区間 $[0,1]$ を $n+1$ 個の隙間に等間隔で分け合う。だから $k$ 番目の点は期待値で $\dfrac{k}{n+1}$ の位置に来る（ $n=1$ なら唯一の点が真ん中 $1/2$ 、 $n=3$ なら $1/4,2/4,3/4$ ）。これは確率積分変換（任意の連続 $X$ は $U=F(X)\sim U(0,1)$ ）を通じて、あらゆる連続分布の順序統計量の解析を一様分布に帰着できることの入口でもあります。

一様分布(n=10)の順序統計量：kが大きいほど山が右へ（Be(k,n-k+1)）

図は simulations/junjo_toukeiryo_beta_keijou.py で生成。

5. 同時分布と「独立でない」こと

5-1. 全順序統計量の同時密度

$X_{(1)},\dots,X_{(n)}$ の同時密度は、 $y_1<y_2<\dots<y_n$ の領域上で

$f_{X_{(1)},\dots,X_{(n)}}(y_1,\dots,y_n)=n!\,\prod_{i=1}^n f(y_i)\qquad(y_1<\dots<y_n).$

要するに：もとの $n$ 個は区別がつくので $n!$ 通りの並べ方がある。それを「小さい順」の1通りに固定したので、密度が $n!$ 倍に集中する（同時分布・周辺分布・条件付き分布）。

5-2. なぜ独立でないのか

もとの $X_i$ は独立でも、並べ替えた瞬間に順序統計量どうしは独立でなくなります。理由は順序制約 $X_{(1)}\le X_{(2)}\le\dots\le X_{(n)}$ そのもの。たとえば $X_{(2)}$ の値を知ると「 $X_{(1)}$ はそれ以下」という情報が必ず付くので、 $X_{(1)}$ の条件付き分布が変わる。同時密度が $\prod_i f_{X_{(i)}}(y_i)$ の形に因数分解できない（領域が $y_1<\dots<y_n$ という三角形で、長方形でない）ことが数学的な証拠です。

⚠️ 「もとが独立だから順序統計量も独立」は誤り。並べ替えは独立性を壊す操作。一様分布の場合、隣接する順序統計量の差（スペーシング） $X_{(k)}-X_{(k-1)}$ には正の相関的な制約が入る。

6. 数値例

例1：3個の一様乱数の最大値

$X_1,X_2,X_3\sim U(0,1)$ 独立。最大値 $X_{(3)}$ について。

CDF： $F_{X_{(3)}}(x)=x^3$ （ $0\le x\le1$ ）。
PDF： $f_{X_{(3)}}(x)=3x^2$ 。
期待値（ベータで $k=3,n=3$ ）： $E[X_{(3)}]=\dfrac{3}{3+1}=\dfrac34=0.75$ 。直接積分でも $\displaystyle\int_0^1 x\cdot 3x^2\,dx=\Big[\tfrac34 x^4\Big]_0^1=\tfrac34$ 。一致。
「3個とも0.5以下」の確率＝ $P(X_{(3)}\le0.5)=0.5^3=0.125$ 。

例2：指数分布の最小値

$X_1,\dots,X_n\sim \mathrm{Exp}(\lambda)$ 独立（ $F(x)=1-e^{-\lambda x}$ ）。最小値 $X_{(1)}$ の分布は？

$F_{X_{(1)}}(x)=1-\{1-F(x)\}^n=1-\big(e^{-\lambda x}\big)^n=1-e^{-n\lambda x}.$

これは指数分布 $\mathrm{Exp}(n\lambda)$ のCDFそのもの。つまり「 $n$ 個の指数の最小値は、レート $n$ 倍の指数」。

$\boxed{\,\min(X_1,\dots,X_n)\sim \mathrm{Exp}(n\lambda)\,},\qquad E[X_{(1)}]=\frac{1}{n\lambda}.$

要するに： $n$ 個の部品（各寿命がレート $\lambda$ の指数）を並列に動かすと、最初に壊れるまでの時間はレート $n\lambda$ の指数。故障率が $n$ 倍になる（待ち行列・信頼性で頻出）。指数分布の無記憶性が効く美しい例。

7. 試験での問われ方（級差）

準1級：最小値・最大値のCDF/PDFを公式または短い導出で出せること、一様分布の順序統計量がベータになること・期待値 $k/(n+1)$ を使えることが中心。 1級（数理）：第 $k$ の一般式を自力で完全導出、2つの順序統計量の同時分布・共分散、指数や一様での具体計算、確率積分変換を絡めた応用まで。記述式で導出過程が採点対象。

級	典型的な問い	求められる深さ
準1級	$\min/\max$ の分布、 $U(0,1)$ で $E[X_{(k)}]$	公式適用＋簡単な導出
1級	$f_{X_{(k)}}$ の導出、 $\mathrm{Cov}(X_{(i)},X_{(j)})$ 、同時分布	完全導出・多変数積分

年度・出題範囲表は改訂されうるため要最新確認（特に準1級・1級の範囲表）。重要度は全体としては C（低頻度）だが、出たときは導出を問われると差がつくテーマ。

⚠️ 引っかけポイント

$X_{(k)}$ と $X_k$ は別物。 $X_{(k)}$ は「 $k$ 番目に小さい値（順位）」、 $X_k$ は「 $k$ 番目に観測した値（取った順）」。括弧の有無で意味が180度違う。順序統計量は必ず添字を括弧で書く。
順序統計量どうしは独立でない（もとが独立でも）。並べ替えが順序制約 $X_{(1)}\le\dots\le X_{(n)}$ を生み、同時密度が三角領域上の $n!\prod f$ になって因数分解できない。「i.i.d.なら順序統計量もi.i.d.」は誤り。
PDFの多項係数の分母を間違える。 $f_{X_{(k)}}$ の係数は $\dfrac{n!}{(k-1)!(n-k)!}$ 。 $\binom{n}{k}$ （ $=\dfrac{n!}{k!(n-k)!}$ ）ではない。「左 $k-1$ 個・中1個・右 $n-k$ 個」なので $k$ ではなく $k-1$ の階乗が入る。
ベータのパラメータの取り違え。 $X_{(k)}\sim\mathrm{Be}(k,\,n-k+1)$ 。第2引数は $n-k$ ではなく $n-k+1$ （密度の $1-x$ の指数 $n-k$ に $+1$ ）。期待値 $\dfrac{k}{n+1}$ の分母が $n+1$ （ $n$ でない）こととセットで覚える。
最小値の補集合の取り方。最小値は「 $\le x$ 」を直接掛けられない（「全員 $\le x$ 」は最大値の条件）。最小値は「 $>x$ 」＝「全員 $>x$ 」を掛けて補集合を取る。最大値とは攻め方が逆。
連続分布が前提。同点が確率0で起きるのは連続のとき。離散分布だとタイ（同値）が正の確率で起き、 $X_{(1)}<\dots<X_{(n)}$ の狭義不等号や上記の密度式がそのままでは使えない。

よくある疑問

Q1. 第 $k$ 順序統計量のPDFの係数が、なぜ二項係数 $\binom{n}{k}$ ではなく $\dfrac{n!}{(k-1)!(n-k)!}$ なんですか？ A. 順序統計量は $n$ 個を3つのグループに分ける問題だからです。二項係数は「2グループに分ける（ $x$ 以下が $k$ 個・残り）」場合の数。一方、密度では「 $x$ より小さい $k-1$ 個・ちょうど $x$ の1個・ $x$ より大きい $n-k$ 個」と3グループに分けるので、多項係数 $\dfrac{n!}{(k-1)!\,1!\,(n-k)!}=\dfrac{n!}{(k-1)!(n-k)!}$ になります。「ちょうど $x$ に1個ある」という中央のグループ（密度 $f(x)$ に対応）が二項にはない第3のグループです。CDF（ $x$ 以下が $k$ 個以上）の段階なら二項係数で正しく、それを微分すると中央項が立ち上がって多項係数に化けます。

Q2. 一様分布だとベータになるのはわかりました。一様でない一般の分布の順序統計量はどう扱うんですか？ A. 確率積分変換を使います。任意の連続分布 $X\sim F$ に対し $U=F(X)$ は $U(0,1)$ にしたがう、という定理があります。順序を保つ単調変換なので $F(X_{(k)})=U_{(k)}\sim\mathrm{Be}(k,n-k+1)$ 。つまり一般の順序統計量は「一様の順序統計量（＝ベータ）を $F^{-1}$ で押し戻したもの」と見なせます。たとえば $X_{(k)}=F^{-1}(U_{(k)})$ の関係から、一様で計算してから変換で戻すという定石が使えます。一様分布が「順序統計量の標準形」である理由です。

Q3. なぜ順序統計量は独立でないんですか？もとのデータは独立なのに。 A. 「並べ替える」という操作自体が独立性を壊すからです。並べ替えた後は定義上 $X_{(1)}\le X_{(2)}\le\dots$ という順序の鎖が必ず成り立ちます。すると $X_{(2)}=v$ と知った瞬間「 $X_{(1)}\le v$ 」が確定し、 $X_{(1)}$ の取りうる範囲が縛られる。これは「 $X_{(2)}$ の情報が $X_{(1)}$ の分布を変える」ということ、すなわち独立でないということです。数式では同時密度 $n!\prod_i f(y_i)$ が $y_1<\dots<y_n$ という三角形の領域でしか正でなく、各変数の周辺密度の積（長方形領域なら独立）に分解できないことが証拠になります。

Q4. 範囲（レンジ） $R=X_{(n)}-X_{(1)}$ の分布はどう求めるんですか？ A. 最大値と最小値の同時分布から差の分布へ変数変換します。 $X_{(1)}=u$ 、 $X_{(n)}=v$ （ $u\le v$ ）の同時密度は、「1個が $u$ ・1個が $v$ ・残り $n-2$ 個が $(u,v)$ の間」を数えて $f_{X_{(1)},X_{(n)}}(u,v)=n(n-1)f(u)f(v)\{F(v)-F(u)\}^{n-2}$ （ $u<v$ ）。ここから $R=v-u$ の周辺分布を積分で出します。一様 $U(0,1)$ なら $R\sim\mathrm{Be}(n-1,2)$ で $E[R]=\dfrac{n-1}{n+1}$ という綺麗な結果になります。1級でこの同時密度の導出が問われることがあります。

Q5. 中央値（メディアン）も順序統計量ですよね。標本中央値の分布は？ A. はい。 $n$ が奇数なら標本中央値は $X_{((n+1)/2)}$ という1個の順序統計量そのものなので、第 $k$ の公式に $k=(n+1)/2$ を入れれば分布が出ます。一様分布なら $\mathrm{Be}\big(\tfrac{n+1}{2},\tfrac{n+1}{2}\big)$ で、左右対称・期待値 $1/2$ 。 $n$ が偶数なら中央の2つ $X_{(n/2)},X_{(n/2+1)}$ の平均と定義するので、2つの順序統計量の同時分布から平均の分布を導きます（独立でないので単純な畳み込みにはならない点に注意）。標本中央値が外れ値に強い・大標本で漸近正規になることは、この分布から議論されます。

まとめ

順序統計量 $X_{(1)}\le\dots\le X_{(n)}$ は標本を小さい順に並べ替えたもの。 $(k)$ は順位（取った順 $X_k$ と区別）。
すべての導出の核は「 $x$ 以下の個数 $\sim\mathrm{Bin}(n,F(x))$ 」。ここから最大 $F^n$ 、最小 $1-(1-F)^n$ 、第 $k$ の二項和CDFが出る。
第 $k$ のPDFは $\dfrac{n!}{(k-1)!(n-k)!}f(x)F(x)^{k-1}\{1-F(x)\}^{n-k}$ 。係数は二項でなく多項係数（3グループ分け：左 $k-1$ ・中1・右 $n-k$ ）。
一様 $U(0,1)$ では $X_{(k)}\sim\mathrm{Be}(k,n-k+1)$ 、 $E[X_{(k)}]=\dfrac{k}{n+1}$ 。確率積分変換で一般分布もこれに帰着。指数の最小値は $\mathrm{Exp}(n\lambda)$ 。
全順序統計量の同時密度は三角領域上で $n!\prod f$ 。順序統計量どうしは独立でない（並べ替えが順序制約を生む）。
級差：準1級は $\min/\max$ ・ベータ・期待値の適用、1級は第 $k$ の完全導出・同時分布・共分散まで。年度依存は要最新確認。