← 統計検定テキスト 一覧

📊 対象級:準1級 ・ 1級 | 重要度:B(標準)

要点(BLUF)

中央値・相関係数・複雑な統計量の標準誤差や信頼区間は、数式で求めようとすると標本分布がわからず手詰まりになります。ブートストラップジャックナイフは、これを「手元の標本を母集団とみなして再標本を作り、統計量がどれだけばらつくかを計算機で実測する」ことで近似する手法です。

  ブートストラップ: 標本から復元抽出でサイズ n の再標本を B 回 → 各々で θ^ を計算ジャックナイフ: 1個ずつ抜いた n 個の再標本 → 各々で θ^ を計算  \boxed{\; \begin{aligned} \text{ブートストラップ}&:\ \text{標本から}\textbf{復元抽出}\text{でサイズ }n\text{ の再標本を }B\text{ 回 → 各々で }\hat\theta\text{ を計算}\\ \text{ジャックナイフ}&:\ \text{1個ずつ抜いた }n\text{ 個の再標本 → 各々で }\hat\theta\text{ を計算} \end{aligned} \;}

要するに「標本分布を数式で出せないなら、リサンプリングで実験的に作ってしまえ」ということです。土台は「標本が母集団の最良の推定」というプラグイン原理。準1級ではブートSE・ブート信頼区間・ジャックナイフのバイアス/分散の計算が、1級ではなぜそれで近似できるのか(F^nF\hat F_n\to F の一致性)とBCa・理論的正当化が問われます。


1. 問題意識:標本分布が手に入らないとき

推定量 θ^\hat\theta(標本から計算する量)の良し悪しを語るには、その標本分布——標本を取り直すたびに θ^\hat\theta がどうばらつくか——が必要です。具体的には次の3つを知りたい。

標本平均 Xˉ\bar X なら話は簡単で、se(Xˉ)=σ/n\mathrm{se}(\bar X)=\sigma/\sqrt n と解析的に出ますし、中心極限定理で分布も正規に近づきます(標本平均・標本比率の標本分布(標準誤差))。ところが——

要するに「θ^\hat\theta が複雑だと標本分布の数式が破綻する」。ここでリサンプリングの出番です。

graph LR
  A["知りたい:θ̂ の<br/>SE・バイアス・信頼区間"] --> B{"標本分布は<br/>解析的に出る?"}
  B -- "出る(平均など)" --> C["公式で計算<br/>se=σ/√n 等"]
  B -- "出ない(中央値・相関係数)" --> D["リサンプリングで<br/>計算機近似"]
  D --> E["ブートストラップ<br/>(復元抽出)"]
  D --> F["ジャックナイフ<br/>(1個抜き)"]

2. プラグイン原理と経験分布関数(すべての土台)

リサンプリングが成り立つ理屈の核心はプラグイン原理です。1級の正当化はここに帰着します。

母集団は分布 FF で表されます。知りたい量はたいてい「分布 FF の関数」として書けます。例えば平均は θ=T(F)=xdF(x)\theta=T(F)=\int x\,dF(x)、中央値は T(F)=F1(1/2)T(F)=F^{-1}(1/2)、分散は T(F)=(xμ)2dF(x)T(F)=\int (x-\mu)^2 dF(x)。このように θ=T(F)\theta=T(F) と書ける量を汎関数と呼びます。

しかし FF は未知です。手元にあるのは標本 X1,,XnX_1,\dots,X_n だけ。そこで FF の代わりに、標本そのものを分布とみなした経験分布関数(empirical distribution function) F^n\hat F_n を使います。

F^n(x)=1ni=1n1(Xix)\hat F_n(x)=\frac1n\sum_{i=1}^{n}\mathbf 1(X_i\le x)

要するに「F^n\hat F_n は、nn 個の各データ点に等しい重み 1/n1/n を置いた離散分布」です。xx 以下のデータが何割あるかを数えているだけ。

プラグイン推定量は、未知の FF をこの F^n\hat F_n で置き換えたものです。

θ^=T(F^n)\hat\theta=T(\hat F_n)

要するに「真の分布 FF がわからないなら、観測された分布 F^n\hat F_n を代わりに差し込む(plug-in)」。平均なら T(F^n)=xdF^n=1nXi=XˉT(\hat F_n)=\int x\,d\hat F_n=\frac1n\sum X_i=\bar X と、ちゃんと標本平均が出てきます。

なぜ F^n\hat F_n で代用してよいのか(一致性の根拠)

これが効く根拠は2つあります。

  1. 各点での大数の法則:固定した xxF^n(x)\hat F_n(x) は割合(指示関数の平均)なので、大数の法則(大数の法則(弱法則・強法則))より F^n(x)a.s.F(x)\hat F_n(x)\xrightarrow{\text{a.s.}}F(x)。標本が増えれば経験分布は真の分布に各点で収束する。
  2. 一様収束(グリベンコ–カンテリの定理):実はもっと強く、supxF^n(x)F(x)a.s.0\sup_x\lvert \hat F_n(x)-F(x)\rvert\xrightarrow{\text{a.s.}}0。つまり F^n\hat F_nFF一様に近づく。

要するに「nn が大きければ F^n\hat F_nFF の極めて良い近似」。だから「FF のもとでの θ^\hat\theta の分布」を知りたいとき、「F^n\hat F_n のもとでの再標本の統計量の分布」で代用できる——これがブートストラップの理論的正当化です。F^n\hat F_n のもとで標本を取り直すことが、まさに復元抽出にあたります(各点が確率 1/n1/n で等しく選ばれるから)。

ここが1級の核心:ブートストラップとは「未知の FF のもとでの標本分布」を、「既知の F^n\hat F_n のもとでの標本分布」で近似する操作。F^nF\hat F_n\to F(グリベンコ–カンテリ)と、汎関数 TT の連続性(滑らかさ)があれば、ブートストラップ分布は真の標本分布に収束する。逆に TT が滑らかでない・F^n\hat F_n が裾を捉えられない場面で破綻します(第7節)。


3. ブートストラップ

ブートストラップ標本分布

1標本から復元抽出した中央値の分布(青)が、母集団から取り直した本当の標本分布(灰)にほぼ一致。解析的に難しい統計量の標本分布を近似できる。図は simulations/bootstrap_bunpu_keijou.py で生成。

3.1 アルゴリズム

flowchart TD
  A["元の標本<br/>X₁,…,Xₙ"] --> B["復元抽出でサイズ n の<br/>再標本(ブートストラップ標本)を作る"]
  B --> C["各再標本で統計量 θ̂*ᵇ を計算"]
  C --> D{"B 回<br/>繰り返した?"}
  D -- "まだ" --> B
  D -- "完了" --> E["θ̂*¹,…,θ̂*ᴮ の分布<br/>=標本分布の近似"]
  E --> F["この分布の<br/>標準偏差 → ブートSE<br/>分位点 → 信頼区間<br/>平均−θ̂ → バイアス"]

手順を言葉で書くと:

  1. 元の標本 X1,,XnX_1,\dots,X_n から、復元抽出(同じ点を何度選んでもよい)でサイズ nn(元と同じ大きさ)の再標本 X1,,XnX_1^{*},\dots,X_n^{*} を作る。これをブートストラップ標本と呼ぶ。
  2. その再標本で統計量を計算する:θ^=T(再標本)\hat\theta^{*}=T(\text{再標本})。これを**ブートストラップ複製(replicate)**と呼ぶ。
  3. 1–2 を BB 回(通常 B=100010000B=1000\sim10000)繰り返し、θ^1,,θ^B\hat\theta^{*1},\dots,\hat\theta^{*B} を得る。
  4. この BB 個の散らばりが、θ^\hat\theta の標本分布の近似になっている。

⚠️ 再標本は必ず「復元抽出」で「元と同じサイズ nn。ここが頻出の引っかけ。非復元で同サイズに取ると元の標本そのものに戻ってしまう(順番が違うだけ)ので意味がない。復元だからこそ、ある点が2回入ったり0回だったりして、F^n\hat F_n からの新しい標本になる。

3.2 ブートストラップ標準誤差(導出)

θ^\hat\theta の標準誤差は「標本分布の標準偏差」でした。標本分布をブートストラップ複製の集まりで近似したのだから、その標本標準偏差がブートストラップ標準誤差です。

まず複製の平均を

θ^ˉ=1Bb=1Bθ^b\bar{\hat\theta^{*}}=\frac1B\sum_{b=1}^{B}\hat\theta^{*b}

と置きます(BB 個の複製の平均値)。ブートストラップ標準誤差は

  se^B=1B1b=1B(θ^bθ^ˉ)2  \boxed{\;\widehat{\mathrm{se}}_B=\sqrt{\frac{1}{B-1}\sum_{b=1}^{B}\bigl(\hat\theta^{*b}-\bar{\hat\theta^{*}}\bigr)^2}\;}

要するに「BB 個の複製がどれだけばらついているかの標準偏差が、そのまま θ^\hat\theta の標準誤差の推定値」。分母が B1B-1 なのは標本分散と同じ不偏化の慣例です(BB が大きいので BB でも B1B-1 でも実質変わりません)。

この式が成り立つ理屈:理想的には「FF から標本を取り直すたびの θ^\hat\theta の標準偏差」が真の se\mathrm{se}FFF^n\hat F_n で置き換えると「F^n\hat F_n から取り直すたびの θ^\hat\theta^{*} の標準偏差」になり、それを BB 個の複製でモンテカルロ近似したのが上式です。二段階の近似FF^nF\to\hat F_n と、無限回の再標本→有限 BB 回)が入っている点が大事で、BB を増やすと2段目の誤差は消えますが、1段目(F^nF\hat F_n\ne F)の誤差は nn を増やさない限り消えません。

3.3 バイアスのブートストラップ推定

バイアスは bias=EF[θ^]θ=EF[T(F^n)]T(F)\mathrm{bias}=E_F[\hat\theta]-\theta=E_F[T(\hat F_n)]-T(F)。プラグインで FF^nF\to\hat F_n と置き換えると、θ=T(F)\theta=T(F)θ^=T(F^n)\hat\theta=T(\hat F_n) に、EF[θ^]E_F[\hat\theta] は再標本での期待値 E[θ^]E_{*}[\hat\theta^{*}] になります。これを複製平均で近似して

  bias^B=θ^ˉθ^  \boxed{\;\widehat{\mathrm{bias}}_B=\bar{\hat\theta^{*}}-\hat\theta\;}

要するに「ブートストラップ複製の平均が、元の推定値からどれだけずれているかがバイアスの推定**」。複製の中心 θ^ˉ\bar{\hat\theta^{*}} が元の θ^\hat\theta より系統的に大きい/小さいなら、θ^\hat\theta にも同じ方向のバイアスがあると見なす。バイアス補正した推定量は θ^bias^B=2θ^θ^ˉ\hat\theta-\widehat{\mathrm{bias}}_B=2\hat\theta-\bar{\hat\theta^{*}} になります。

3.4 ブートストラップ信頼区間

代表的な3つ。準1級ではパーセンタイル法を計算できれば十分、基本法との違いとBCaの考え方を知っていればなお良い。

(1) パーセンタイル法(percentile)——いちばん素直。ブートストラップ複製の分布から、下側 α/2\alpha/2 分位点と上側 1α/21-\alpha/2 分位点をそのまま端点にする。

[θ^(α/2), θ^(1α/2)]\bigl[\hat\theta^{*}_{(\alpha/2)},\ \hat\theta^{*}_{(1-\alpha/2)}\bigr]

要するに「複製を小さい順に並べ、下から2.5%・上から2.5%を切り落とした残りの範囲」(95%区間なら)。B=2000B=2000 なら 50 番目と 1950 番目の複製値が端点。

(2) 基本法(basic / pivotal)——「複製のばらつきの形」を元の推定値の周りに折り返す。ピボット θ^θ\hat\theta-\theta の分布を θ^θ^\hat\theta^{*}-\hat\theta で近似する発想で、

[2θ^θ^(1α/2),  2θ^θ^(α/2)]\bigl[\,2\hat\theta-\hat\theta^{*}_{(1-\alpha/2)},\ \ 2\hat\theta-\hat\theta^{*}_{(\alpha/2)}\,\bigr]

要するに「パーセンタイル法を θ^\hat\theta を中心に左右反転させたもの」。分布が歪んでいるとパーセンタイル法と食い違い、どちらが妥当かは状況による。

(3) BCa(bias-corrected and accelerated, バイアス補正・加速)——パーセンタイル法を2つの量で補正する。1級で名前と趣旨が問われる。

要するに「BCa はパーセンタイル法に『中心ズレ』と『歪み』の2補正を入れたもの」。素のパーセンタイル法より精度が高く(2次の精度 o(n1)o(n^{-1}))、歪んだ分布で信頼できる。


4. ジャックナイフ

ジャックナイフはブートストラップより古く・単純で・決定的(乱数を使わない)な手法です。再標本のしかたは「1個ずつ抜く(leave-one-out)」だけ。

4.1 定義

ii 番目のデータを除いた n1n-1 個で計算した統計量を θ^(i)\hat\theta_{(i)} と書きます(ジャックナイフ複製)。これが i=1,,ni=1,\dots,nnn 個できます。その平均を

θ^()=1ni=1nθ^(i)\hat\theta_{(\cdot)}=\frac1n\sum_{i=1}^{n}\hat\theta_{(i)}

と置きます(nn 個のジャックナイフ複製の平均)。要するに「1個抜きを全データで試した nn 通りの推定値と、その平均」。乱数も繰り返し回数 BB も要らず、再標本は nn 通りに固定されます。

4.2 ジャックナイフのバイアス推定(完全導出)

公式は

  bias^jack=(n1)(θ^()θ^)  \boxed{\;\widehat{\mathrm{bias}}_{\mathrm{jack}}=(n-1)\bigl(\hat\theta_{(\cdot)}-\hat\theta\bigr)\;}

なぜ係数が (n1)(n-1) なのか。これは「バイアスが標本サイズに反比例して減る」という典型的な構造から出ます。順を追います。

ステップ1:バイアスの形を仮定する。 多くの推定量で、サイズ mm の標本に基づくバイアスは 1/m1/m の冪で展開できます。

E[θ^m]θ=a1m+a2m2+E[\hat\theta_m]-\theta=\frac{a_1}{m}+\frac{a_2}{m^2}+\cdots

ここで a1,a2a_1,a_2mm に依らない定数。要するに「バイアスは主に a1/ma_1/m という、標本が増えれば消える項でできている」(1次のバイアス)。

ステップ2:2つのサイズを比べる。 元の推定量はサイズ nn なので

E[θ^]θ=a1n+a2n2+E[\hat\theta]-\theta=\frac{a_1}{n}+\frac{a_2}{n^2}+\cdots

一方、ジャックナイフ複製 θ^(i)\hat\theta_{(i)} はサイズ n1n-1 の標本に基づくので、その期待値は

E[θ^()]θ=a1n1+a2(n1)2+E[\hat\theta_{(\cdot)}]-\theta=\frac{a_1}{n-1}+\frac{a_2}{(n-1)^2}+\cdots

θ^()\hat\theta_{(\cdot)} は同サイズ n1n-1 の複製の平均なので、期待値は1個分と同じ。)要するに「1個抜くとサイズが n1n-1 になり、バイアスが少しだけ大きくなる」。

ステップ3:差を取る。 2式を引きます(1次項まで)。

E[θ^()]E[θ^]=a1 ⁣(1n11n)+O ⁣(1n2)=a1n(n1)n(n1)+=a1n(n1)+E[\hat\theta_{(\cdot)}]-E[\hat\theta] =a_1\!\left(\frac{1}{n-1}-\frac1n\right)+O\!\left(\frac{1}{n^2}\right) =a_1\cdot\frac{n-(n-1)}{n(n-1)}+\cdots =\frac{a_1}{n(n-1)}+\cdots

要するに「サイズの違いから生じる差は a1/{n(n1)}a_1/\{n(n-1)\}」。ここに a1a_1 が分離して出てくるのがポイント。

ステップ4:(n1)(n-1) を掛けて1次バイアスを復元する。 元の推定量の1次バイアスは a1/na_1/n でした。上の差に (n1)(n-1) を掛けると

(n1)(E[θ^()]E[θ^])=(n1)a1n(n1)+=a1n+O ⁣(1n2)=E[θ^]θ1次バイアス+O ⁣(1n2)(n-1)\bigl(E[\hat\theta_{(\cdot)}]-E[\hat\theta]\bigr) =(n-1)\cdot\frac{a_1}{n(n-1)}+\cdots =\frac{a_1}{n}+O\!\left(\frac1{n^2}\right) =\underbrace{E[\hat\theta]-\theta}_{\text{1次バイアス}}+O\!\left(\frac1{n^2}\right)

要するに「(n1)(n-1) という係数は、サイズ差で薄まったバイアスを元の濃さに戻す増幅率」。最後に期待値を標本での実現値 θ^(),θ^\hat\theta_{(\cdot)},\hat\theta で置き換えれば、推定量

bias^jack=(n1)(θ^()θ^)\widehat{\mathrm{bias}}_{\mathrm{jack}}=(n-1)\bigl(\hat\theta_{(\cdot)}-\hat\theta\bigr)

が得られます。これを引いてバイアス補正したジャックナイフ推定量

θ^jack=θ^bias^jack=nθ^(n1)θ^()\hat\theta_{\mathrm{jack}}=\hat\theta-\widehat{\mathrm{bias}}_{\mathrm{jack}}=n\hat\theta-(n-1)\hat\theta_{(\cdot)}

となり、1/n1/n の項が消えてバイアスが O(1/n2)O(1/n^2) に改善します。これがジャックナイフの本来の目的(バイアス削減)です。

4.3 擬似値とジャックナイフ分散推定

各データ点について**擬似値(pseudo-value)**を

θ~i=nθ^(n1)θ^(i)\tilde\theta_i=n\hat\theta-(n-1)\hat\theta_{(i)}

と定義します。要するに「ii 番目の点を抜いたときの変化を (n1)(n-1) 倍に増幅し、全体推定値 nθ^n\hat\theta から測った『ii 番目の点の寄与』」。擬似値の平均はちょうどジャックナイフ推定量 θ^jack=1nθ~i\hat\theta_{\mathrm{jack}}=\frac1n\sum\tilde\theta_i になります。

平均が θ^\hat\theta なら、その標準誤差は擬似値を nn 個の独立な観測のように扱って求めます。これがジャックナイフ分散推定です。

  Var^jack=1n1n1i=1n(θ~iθ^jack)2=n1ni=1n(θ^(i)θ^())2  \boxed{\;\widehat{\mathrm{Var}}_{\mathrm{jack}}=\frac{1}{n}\cdot\frac{1}{n-1}\sum_{i=1}^{n}\bigl(\tilde\theta_i-\hat\theta_{\mathrm{jack}}\bigr)^2 =\frac{n-1}{n}\sum_{i=1}^{n}\bigl(\hat\theta_{(i)}-\hat\theta_{(\cdot)}\bigr)^2\;}

2つ目の等号は、擬似値の偏差 θ~iθ^jack=(n1)(θ^(i)θ^())\tilde\theta_i-\hat\theta_{\mathrm{jack}}=-(n-1)\bigl(\hat\theta_{(i)}-\hat\theta_{(\cdot)}\bigr) を代入し、(n1)2(n-1)^2 を整理すると出ます(1n(n1)(n1)2=n1n\frac{1}{n(n-1)}\cdot(n-1)^2=\frac{n-1}{n})。要するに「ジャックナイフ複製のばらつきに n1n\frac{n-1}{n} を掛けたものが分散の推定」。係数が n1n\frac{n-1}{n}(1より少し小さい)ではなく**(n1)(n-1) 倍に近い大きな膨張**になっている点に注意——複製同士は n1n-1 個もデータを共有していて差が小さいので、その小さな差を大きく増幅して真のばらつきに合わせています。


5. ブートストラップとジャックナイフの関係

決定的に重要な事実:**ジャックナイフはブートストラップの線形近似(一次近似)**です。

直観:統計量 TT を、各データ点の重みを少し動かしたときの変化で1次近似(テイラー展開)すると、その傾き(影響関数, influence function)が現れます。

要するに「ジャックナイフ=ブートストラップを1次(線形)で打ち切ったもの」。だから TT が線形に近い(平均など)なら両者はほぼ一致し、TT が強く非線形・非平滑だとジャックナイフだけがずれる。

なぜ中央値でジャックナイフが破綻するか(頻出論点)

中央値は非平滑な統計量です。nn が奇数なら中央値は真ん中の1個の値そのもの。ここで1点を抜くと——

つまりジャックナイフ複製 θ^(i)\hat\theta_{(i)} は数種類の値しか取らず、θ^(i)θ^()\hat\theta_{(i)}-\hat\theta_{(\cdot)} が真のばらつきを大きく過小評価します。線形近似(影響関数)が中央値では存在しない(微分不可能)ことの現れです。

要するに「中央値・分位点のような非平滑統計量ではジャックナイフは一致性を失う」。一方ブートストラップは復元抽出で中央値を大きく揺らせるので、中央値の標準誤差はブートストラップで推定するのが定石。

graph TD
  B["ブートストラップ<br/>(重みを大きく揺らす)"] -->|"線形(1次)に<br/>打ち切ると"| J["ジャックナイフ<br/>(1点抜き=有限差分)"]
  B --- B2["非線形・非平滑でも<br/>有効(中央値OK)"]
  J --- J2["線形・平滑なら一致<br/>非平滑(中央値)で破綻"]

6. 比較表

観点ブートストラップジャックナイフ
再標本のしかた復元抽出でサイズ nn1個抜き(leave-one-out)
再標本の個数BB 回(任意、乱数で生成。10310410^3\sim10^4nn 通り(固定・決定的)
乱数使う(モンテカルロ近似)使わない(再現性100%)
主な用途SE・バイアス・信頼区間(分布全体)SE・バイアス(主にこの2つ)
非線形・非平滑統計量有効(中央値の SE もOK)線形近似なので非平滑で破綻(中央値NG)
計算量大(BB×\times 統計量計算)小(nn 回。nn が大きいと逆に重いことも)
位置づけ一般的・主流ブートの線形近似(古典的・前身)

要するに「ジャックナイフは軽くて決定的だが線形近似ゆえ非平滑統計量で破綻。ブートストラップは重いが汎用で信頼区間まで出せる」。歴史的にはジャックナイフが先(Quenouille・Tukey)で、Efron がそれを一般化したのがブートストラップ(論文題が “Another Look at the Jackknife”)。


7. ブートストラップが失敗する場面(万能ではない)

ブートストラップは強力ですが万能ではありません。1級では「いつ破綻するか」が問われます。プラグイン原理(第2節)が崩れる場面、すなわち F^n\hat F_nFF をうまく代理できない/汎関数 TT が滑らかでない場面で失敗します。

要するに「極値・重い裾・従属・境界では素のブートストラップは破綻する」。逆に言えば、滑らかな統計量+独立+裾が軽い、という標準的な状況でこそ威力を発揮します。


試験での問われ方(級ごとの差)

ブートストラップ・ジャックナイフは準1級・1級の範囲ですが、毎回出るわけではありません(出題範囲・配点は改訂されうるため要最新確認)。級で深さがはっきり違います。

準1級レベル

ここで問われるのは「計算と概念」。アルゴリズムを説明でき、ブートSE・ブート信頼区間(パーセンタイル法)・ジャックナイフのバイアス/分散を数値で計算できるか。

1級レベル

ここで問われるのは「理論的正当化と精緻化」。なぜ近似が成り立つか(F^nF\hat F_n\to F)を論じ、ジャックナイフ=ブートの線形近似であること、BCa の趣旨、破綻条件を説明・導出できるか。

土台は、バイアス/分散の概念が 点推定(推定量の良さ:不偏性・一致性・有効性・十分性)、信頼区間が 区間推定(母平均・母比率・母分散の信頼区間)、近似する標本分布そのものが 標本平均・標本比率の標本分布(標準誤差)、一致性の根拠が 大数の法則(弱法則・強法則) です。


⚠️ 引っかけ・頻出論点


よくある疑問(Q&A)

Q1. 復元抽出で同じ点が何度も選ばれたら、それは「水増し」で不正ではないのですか?

不正ではありません。むしろ復元抽出の本質です。ブートストラップは「経験分布 F^n\hat F_n(各点に重み 1/n1/n を置いた分布)から新しく標本を取る」操作で、F^n\hat F_n から1個引くとは「nn 個のどれかが等確率 1/n1/n で出る」こと。だから同じ点が2回出たり0回だったりするのが正しい振る舞いです。これにより各再標本が少しずつ違う構成になり、統計量がばらつく=標本分布を再現できる。もし非復元なら毎回同じ nn 個(順番違い)になってばらつきが出ず、何も推定できません。

Q2. BB(再標本の回数)はいくつにすればいいですか? 多いほど良いですか?

用途で変わります。標準誤差・バイアスの推定なら B=2001000B=200\sim1000 で十分信頼区間(特に裾の分位点を使う)なら B=200010000B=2000\sim10000 が目安。多いほどモンテカルロ誤差(有限回しか再標本していないことによる誤差)は減りますが、BB を無限にしても精度には天井があります。なぜなら本質的な誤差は「F^n\hat F_n が真の FF と違う」こと(標本サイズ nn 由来)で、これは BB では一切改善しないから。BB は「計算の精度」、nn は「推定の精度」と切り分けて理解してください。

Q3. ジャックナイフが中央値で使えないのに、なぜ教科書に載っているのですか?

(1) 歴史的に先だから。ジャックナイフ(1950–60年代)はブートストラップ(1979年)より20年早く、バイアス削減の古典的手法として確立していました。(2) 平滑な統計量では今でも有効で、乱数を使わず決定的・軽量という利点があります(平均・分散・回帰係数など)。(3) ブートストラップの線形近似という理論的な位置づけが重要で、両者の関係を理解すると「リサンプリングが何をしているか」(影響関数の推定)が見通せます。試験では「中央値で破綻する」ことと「ブートの線形近似である」ことがセットで問われます。

Q4. ブートストラップ信頼区間が複数あって混乱します。結局どれを使えばいいですか?

精度と手間のトレードオフです。パーセンタイル法は最も単純(複製を並べて分位点を取るだけ)で準1級の中心。ただし分布が歪んでいると被覆確率がずれます。基本(pivotal)法はピボットの発想で、これも単純。最も精度が高いのはBCaで、バイアスと歪みの2補正を入れた2次精度の区間ですが計算が複雑(加速 aa をジャックナイフで出す)。実務では BCa が推奨されることが多いですが、試験(準1級)ではパーセンタイル法が計算できれば十分で、BCa は「より高精度な改良版」として趣旨を知っていれば良いです。

Q5. ブートストラップは「分布を仮定しない」と聞きましたが、本当に何の仮定もないのですか?

「特定の分布形(正規など)を仮定しない」という意味では正しいですが、仮定がゼロではありません。隠れた前提は (1) 観測が独立同分布(だから1点ずつ復元抽出してよい——時系列の従属データでは崩れる)、(2) F^n\hat F_nFF の良い近似(裾の薄い・サンプルの足りる状況——重い裾や極値では崩れる)、(3) 統計量 TT が滑らか(中央値のような非平滑だと注意が要る)です。つまり「分布形フリー」ではあるが「無条件」ではない。第7節の破綻条件は、これらの隠れた前提が破れる場面そのものです。


まとめ


関連ノート