← 統計検定テキスト 一覧

📊 対象級:1級 | 重要度:B(標準)

要点(BLUF)

推定量 θ^\hat\theta が漸近正規(n(θ^θ)dN(0,σ2)\sqrt n(\hat\theta-\theta)\xrightarrow{d}N(0,\sigma^2))なら、その滑らかな関数 g(θ^)g(\hat\theta) もまた漸近正規で、分散は g(θ)2σ2g'(\theta)^2\sigma^2 になります。これがデルタ法です。証明は「gg を1次テイラー展開して、傾き g(θ^)g'(\hat\theta) をスルツキー定理で g(θ)g'(\theta) に差し替える」だけ。推定量を変換したときの標準誤差を出す万能道具で、ここから分散安定化変換も自然に導けます。

1級(統計応用・理工学)では推定量の関数の標準誤差計算・分散安定化変換の導出として問われます(範囲・配点は改訂されうるため要最新確認)。土台は大数の法則・中心極限定理・最尤推定量の漸近正規性です。

graph TD
  ROOT["漸近正規性<br/>√n(θ̂−θ) → N(0, σ²)"] --> DM["デルタ法<br/>√n(g(θ̂)−g(θ)) → N(0, g'(θ)²σ²)"]
  DM --> MV["多変量デルタ法<br/>分散 = ∇g(θ)ᵀ Σ ∇g(θ)"]
  DM --> VST["分散安定化変換<br/>g'(θ) ∝ 1/√V(θ) で分散を定数化"]
  DM --> SECOND["g'(θ)=0 のとき<br/>2次のデルタ法 → χ²₁ が出る"]
  VST --> EX["√X(ポアソン)<br/>arcsin√p̂(二項比率)<br/>フィッシャーz(相関)"]

1. デルタ法 — 推定量を変換したらどうなるか

1.1 問題設定

最尤推定量や標本平均は、たいてい次の形の漸近正規性を満たします(中心極限定理や最尤推定量の一般論から)。

n(θ^θ)dN(0,σ2)\sqrt n(\hat\theta-\theta)\xrightarrow{d}N(0,\sigma^2)

要するに「θ^\hat\theta は真値 θ\theta のまわりに、おおよそ N(θ,σ2/n)N(\theta,\sigma^2/n) でばらつく」。標本を増やすと σ2/n0\sigma^2/n\to0 で1点に潰れます。

ところが知りたいのは θ\theta そのものではなく、θ\theta の関数 g(θ)g(\theta) であることが多い。たとえば指数分布のレート λ\lambda ではなく平均 1/λ1/\lambda、ベルヌーイの確率 pp ではなくオッズ p/(1p)p/(1-p) など。このとき g(θ^)g(\hat\theta) の分布はどうなるか——それに答えるのがデルタ法です。

1.2 導出(1次テイラー展開+スルツキー定理)

デルタ法:変換g(θ)の接線で分散が伝播する様子と、平方根変換による分散安定化

図は simulations/delta_hou_keijou.py で生成。

結論を先に。ggθ\theta で微分可能で g(θ)0g'(\theta)\ne0 なら、

  n(g(θ^)g(θ))dN(0,  g(θ)2σ2)  \boxed{\;\sqrt n\bigl(g(\hat\theta)-g(\theta)\bigr)\xrightarrow{d}N\bigl(0,\;g'(\theta)^2\,\sigma^2\bigr)\;}

導出は3ステップです。

ステップ1:1次テイラー展開(平均値の定理). ggθ\theta のまわりで展開します。平均値の定理を使うと、θ^\hat\thetaθ\theta の間にある点 θ~\tilde\theta を使って剰余項なしで書けます。

g(θ^)=g(θ)+g(θ~)(θ^θ),θ~(θ,θ^)g(\hat\theta)=g(\theta)+g'(\tilde\theta)\,(\hat\theta-\theta),\qquad \tilde\theta\in(\theta,\hat\theta)

要するに「g(θ^)g(\hat\theta)g(θ)g(\theta) の差は、傾き g(θ~)g'(\tilde\theta) かける (θ^θ)(\hat\theta-\theta)」。これを移項して n\sqrt n を掛けます。

n(g(θ^)g(θ))=g(θ~)n(θ^θ)\sqrt n\bigl(g(\hat\theta)-g(\theta)\bigr)=g'(\tilde\theta)\cdot\sqrt n(\hat\theta-\theta)

ステップ2:傾きを g(θ)g'(\theta) に差し替える. θ^pθ\hat\theta\xrightarrow{p}\theta なので(漸近正規なら一致もする)、間に挟まれた θ~\tilde\thetaθ~pθ\tilde\theta\xrightarrow{p}\thetagg' が連続なら連続写像定理により

g(θ~)pg(θ)g'(\tilde\theta)\xrightarrow{p}g'(\theta)

要するに「θ^\hat\theta が真値に近づくにつれ、テイラー展開の傾きも真の点の傾き g(θ)g'(\theta) に近づく」。g(θ)g'(\theta) はただの定数です。

ステップ3:スルツキー定理で合体. いま手元には2つの量があります。

スルツキー定理は「定数に確率収束する量 ×\times 分布収束する量は、その定数を掛けた分布に分布収束する」と言います。よって積は

g(θ~)n(θ^θ)dg(θ)N(0,σ2)=N(0,g(θ)2σ2)g'(\tilde\theta)\cdot\sqrt n(\hat\theta-\theta)\xrightarrow{d}g'(\theta)\cdot N(0,\sigma^2)=N\bigl(0,\,g'(\theta)^2\sigma^2\bigr)

正規分布を定数 c=g(θ)c=g'(\theta) 倍すると分散は c2c^2 倍になる(Var(cZ)=c2Var(Z)\text{Var}(cZ)=c^2\text{Var}(Z))ので、分散が g(θ)2σ2g'(\theta)^2\sigma^2 になります。これで導出完了です。

💡 導出の心臓部は「非線形な gg を、真の点 θ\theta のまわりで直線(接線)に置き換える」こと。接線の傾きが g(θ)g'(\theta) で、漸近的には θ^\hat\thetaθ\theta のすぐ近くにしかいないので、その狭い範囲では gg は接線とほぼ同じ。直線変換は正規分布を正規分布に保ち、傾きの2乗だけ分散を伸縮する——それがデルタ法の正体です。

1.3 実用形:標準誤差の計算

漸近分布が分かれば**標準誤差(SE)**が出せます。θ^\hat\theta の標準誤差が SE^(θ^)\widehat{\text{SE}}(\hat\theta) のとき、変換後は

SE^(g(θ^))g(θ^)SE^(θ^)\widehat{\text{SE}}\bigl(g(\hat\theta)\bigr)\approx\bigl|g'(\hat\theta)\bigr|\cdot\widehat{\text{SE}}(\hat\theta)

要するに「変換後のSEは、元のSEに傾きの絶対値 g(θ^)|g'(\hat\theta)| を掛ける」(n\sqrt n が両辺で約分され、θ\theta は推定値 θ^\hat\theta で置く)。これが1級でデルタ法を使う最頻出の場面です。

例:オッズの標準誤差. ベルヌーイ試行で p^\hat p の漸近分散が p(1p)/np(1-p)/n のとき、オッズ g(p)=p/(1p)g(p)=p/(1-p) の標準誤差を求めます。g(p)=1(1p)2g'(p)=\dfrac{1}{(1-p)^2} なので、

Var(g(p^))[1(1p)2]2p(1p)n=pn(1p)3\text{Var}\bigl(g(\hat p)\bigr)\approx \left[\frac{1}{(1-p)^2}\right]^2\cdot\frac{p(1-p)}{n}=\frac{p}{n(1-p)^3}

要するに「p^\hat p の分散に gg' の2乗を掛ければオッズの分散になる」。pp が1に近いとオッズの分散が爆発する(分母 (1p)3(1-p)^3)ことも式から読めます。


2. 多変量デルタ法

2.1 勾配とヤコビアン

推定量がベクトル θ^=(θ^1,,θ^k)\hat{\boldsymbol\theta}=(\hat\theta_1,\dots,\hat\theta_k)^\top で、漸近的に多変量正規

n(θ^θ)dN(0,Σ)\sqrt n(\hat{\boldsymbol\theta}-\boldsymbol\theta)\xrightarrow{d}N(\mathbf 0,\Sigma)

を満たすとします(Σ\Sigmak×kk\times k の漸近共分散行列)。このときスカラー値の滑らかな関数 g:RkRg:\mathbb R^k\to\mathbb R について、

  n(g(θ^)g(θ))dN(0,  g(θ)Σg(θ))  \boxed{\;\sqrt n\bigl(g(\hat{\boldsymbol\theta})-g(\boldsymbol\theta)\bigr)\xrightarrow{d}N\Bigl(0,\;\nabla g(\boldsymbol\theta)^\top\,\Sigma\,\nabla g(\boldsymbol\theta)\Bigr)\;}

ここで g(θ)=(g/θ1,,g/θk)\nabla g(\boldsymbol\theta)=\bigl(\partial g/\partial\theta_1,\dots,\partial g/\partial\theta_k\bigr)^\top勾配ベクトルです。要するに「1変数の g(θ)g'(\theta) が勾配ベクトル g\nabla g に、g(θ)2σ2g'(\theta)^2\sigma^2Σ\Sigma を勾配で挟む2次形式 gΣg\nabla g^\top\Sigma\,\nabla g に置き換わるだけ」。

導出は1変数とまったく同じ筋です。1次の多変量テイラー展開

g(θ^)g(θ)+g(θ)(θ^θ)g(\hat{\boldsymbol\theta})\approx g(\boldsymbol\theta)+\nabla g(\boldsymbol\theta)^\top(\hat{\boldsymbol\theta}-\boldsymbol\theta)

の両辺に n\sqrt n を掛け、g(θ)\nabla g(\boldsymbol\theta) を定数ベクトルとみてスルツキー定理を適用します。多変量正規 N(0,Σ)N(\mathbf 0,\Sigma) を定数ベクトル a=g(θ)\mathbf a=\nabla g(\boldsymbol\theta) で線形結合した aX\mathbf a^\top X の分散は aΣa\mathbf a^\top\Sigma\,\mathbf a(正規分布の線形結合の公式)なので、上の2次形式が出ます。

💡 出力がベクトル値の関数 g:RkRm\mathbf g:\mathbb R^k\to\mathbb R^m なら、勾配ベクトルはヤコビ行列 J=g/θJ=\partial\mathbf g/\partial\boldsymbol\thetam×km\times k)に一般化され、漸近共分散は JΣJJ\,\Sigma\,J^\topm×mm\times m)になります。スカラー版はこの m=1m=1 の特別な場合です。

2.2 例:比の分散

2つの推定量の g(θ1,θ2)=θ1/θ2g(\theta_1,\theta_2)=\theta_1/\theta_2 の漸近分散を求めます。勾配は

g=(gθ1,gθ2)=(1θ2,θ1θ22)\nabla g=\left(\frac{\partial g}{\partial\theta_1},\,\frac{\partial g}{\partial\theta_2}\right)^\top=\left(\frac{1}{\theta_2},\,-\frac{\theta_1}{\theta_2^2}\right)^\top

漸近共分散行列を Σ=(σ12σ12σ12σ22)\Sigma=\begin{pmatrix}\sigma_1^2 & \sigma_{12}\\ \sigma_{12} & \sigma_2^2\end{pmatrix} とすると、2次形式 gΣg\nabla g^\top\Sigma\,\nabla g を展開して

Var ⁣(θ^1θ^2)1n(σ12θ222θ1σ12θ23+θ12σ22θ24)\text{Var}\!\left(\frac{\hat\theta_1}{\hat\theta_2}\right)\approx\frac{1}{n}\left(\frac{\sigma_1^2}{\theta_2^2}-\frac{2\theta_1\sigma_{12}}{\theta_2^3}+\frac{\theta_1^2\sigma_2^2}{\theta_2^4}\right)

要するに「比の分散には分子・分母それぞれの分散だけでなく、両者の共分散 σ12\sigma_{12} も効く」。θ1,θ2\theta_1,\theta_2 が相関していれば交差項を落としてはいけません。これは多変量デルタ法を使わないと正しく出せない典型例です。


3. 分散安定化変換 — 漸近分散を定数にする

3.1 動機と一般原理

デルタ法の式 Var(g(θ^))g(θ)2V(θ)\text{Var}\bigl(g(\hat\theta)\bigr)\approx g'(\theta)^2\,V(\theta) を逆に読みます。多くの分布で漸近分散 V(θ)V(\theta) が母数 θ\theta に依存します(ポアソンなら分散=平均、二項なら p(1p)p(1-p)、相関係数なら (1ρ2)2(1-\rho^2)^2)。これは不便です——信頼区間の幅が母数の値で変わり、θ\theta の値を知らないと区間が引けない、分散分析の等分散仮定が崩れる、などの問題が起きます。

そこで「変換後の分散 g(θ)2V(θ)g'(\theta)^2 V(\theta)θ\theta によらない定数になるような gg」を探します。定数になる条件は

g(θ)2V(θ)=const  g(θ)1V(θ)  g'(\theta)^2\,V(\theta)=\text{const} \quad\Longleftrightarrow\quad \boxed{\;g'(\theta)\propto\frac{1}{\sqrt{V(\theta)}}\;}

要するに「傾き gg' を、分散の平方根の逆数に比例させればよい」。VV が大きい(ばらつきやすい)ところでは gg を緩やかに、VV が小さいところでは急にすることで、変換後のばらつきを一定に均す、という発想です。これを積分して

  g(θ)=1V(θ)dθ  \boxed{\;g(\theta)=\int\frac{1}{\sqrt{V(\theta)}}\,d\theta\;}

が分散安定化変換です。以下の3つの代表例は、すべてこの1本の積分から出ます。

flowchart TD
  START["漸近分散 V(θ) が θ に依存して困る"] --> COND["条件:g'(θ)²·V(θ) = 定数<br/>⟺ g'(θ) ∝ 1/√V(θ)"]
  COND --> INT["積分:g(θ) = ∫ dθ / √V(θ)"]
  INT --> P["V=μ(ポアソン)<br/>→ ∫dμ/√μ = 2√μ<br/>変換 √X、分散 ≈ 1/4"]
  INT --> B["V=p(1−p)(二項比率)<br/>→ ∫dp/√(p(1−p)) = 2·arcsin√p<br/>変換 arcsin√p̂、分散 ≈ 1/(4n)"]
  INT --> R["V=(1−ρ²)²(相関)<br/>→ ∫dρ/(1−ρ²) = artanh ρ<br/>フィッシャーz、分散 ≈ 1/(n−3)"]

3.2 ポアソン分布:平方根変換 X\sqrt X

ポアソン分布は分散=平均 V(μ)=μV(\mu)=\mu という性質を持ちます(母数 μ\mu が大きいほどばらつく)。これを積分します。

g(μ)=1μdμ=2μg(\mu)=\int\frac{1}{\sqrt\mu}\,d\mu=2\sqrt\mu

定数倍は分散安定化に影響しない(傾きを定数倍しても分散の比は変わらない)ので、g(μ)=μg(\mu)=\sqrt\mu と取れます。よって観測値の平方根 X\sqrt X が分散安定化変換です。変換後の漸近分散は

Var(X)(12μ)2μ=14\text{Var}\bigl(\sqrt X\bigr)\approx \left(\frac{1}{2\sqrt\mu}\right)^2\cdot\mu=\frac14

要するに「X\sqrt X を取ると、平均 μ\mu がいくつであっても分散がほぼ 1/41/4 で一定になる」。ポアソン計数データを分散分析や回帰にかける前処理として古典的に使われます。

3.3 二項比率:逆正弦(arcsin)変換 arcsinp^\arcsin\sqrt{\hat p}

標本比率 p^\hat p の漸近分散は V(p)=p(1p)/nV(p)=p(1-p)/n1/n1/n は定数なので、θ=p\theta=p について V(p)p(1p)V(p)\propto p(1-p) を積分します。

g(p)=1p(1p)dpg(p)=\int\frac{1}{\sqrt{p(1-p)}}\,dp

この積分は標準形です。p=sin2up=\sin^2 u と置くと dp=2sinucosududp=2\sin u\cos u\,dup(1p)=sinucosu\sqrt{p(1-p)}=\sin u\cos u なので

g(p)=2sinucosusinucosudu=2u=2arcsinpg(p)=\int\frac{2\sin u\cos u}{\sin u\cos u}\,du=2u=2\arcsin\sqrt p

定数倍を落として g(p)=arcsinp^g(p)=\arcsin\sqrt{\hat p} が**逆正弦変換(arcsine / angular transformation)**です。変換後の漸近分散は

Var(arcsinp^)(12p(1p))2p(1p)n=14n\text{Var}\bigl(\arcsin\sqrt{\hat p}\bigr)\approx\left(\frac{1}{2\sqrt{p(1-p)}}\right)^2\cdot\frac{p(1-p)}{n}=\frac{1}{4n}

要するに「arcsinp^\arcsin\sqrt{\hat p} を取ると、pp がいくつでも分散がほぼ 1/(4n)1/(4n) で一定になる」。pp が0や1に近いと p^\hat p の分散が極端に小さくなる(端で潰れる)のを、変換が引き伸ばして均します。

⚠️ ただし pp が0や1の極端では逆正弦変換の近似は良くありません(メタアナリシス等での arcsin 系変換には批判もあり、用途次第で別の変換が推奨される——要最新確認)。試験では「分散安定化変換として導出できること」が主眼です。

3.4 相関係数:フィッシャーのz変換

標本相関係数 rr は、母相関 ρ\rho のもとで漸近的に

n(rρ)dN(0,(1ρ2)2)\sqrt n(r-\rho)\xrightarrow{d}N\bigl(0,\,(1-\rho^2)^2\bigr)

を満たします。すなわち V(ρ)=(1ρ2)2V(\rho)=(1-\rho^2)^2。これは ρ\rho への依存が強く(ρ\rho±1\pm1 に近いと分散が0に潰れ、分布も激しく歪む)、rr をそのまま正規近似で扱うのは危険です。積分します。

g(ρ)=1(1ρ2)2dρ=11ρ2dρ=12ln1+ρ1ρ=artanhρg(\rho)=\int\frac{1}{\sqrt{(1-\rho^2)^2}}\,d\rho=\int\frac{1}{1-\rho^2}\,d\rho=\frac12\ln\frac{1+\rho}{1-\rho}=\operatorname{artanh}\rho

これがフィッシャーのz変換 z=12ln1+r1rz=\tfrac12\ln\dfrac{1+r}{1-r}(逆双曲線正接 artanhr\operatorname{artanh} r)です。変換後の漸近分散は

Var(z)(11ρ2)2(1ρ2)2n=1n\text{Var}(z)\approx\left(\frac{1}{1-\rho^2}\right)^2\cdot\frac{(1-\rho^2)^2}{n}=\frac1n

要するに「z変換すると、ρ\rho がいくつでも分散がほぼ 1/n1/n で一定になる」。実用上は精度を上げた補正 Var(z)1n3\text{Var}(z)\approx\dfrac{1}{n-3} を使い、zN ⁣(artanhρ,1n3)z\sim N\!\bigl(\operatorname{artanh}\rho,\,\tfrac{1}{n-3}\bigr) として相関の信頼区間や検定を行います。区間を zz で作ってから tanh\tanhrr のスケールに戻すのが定石です。

分布漸近分散 V(θ)V(\theta)変換 gg変換後の分散
ポアソンμ\muX\sqrt X1/4\approx 1/4
二項比率p(1p)/np(1-p)/narcsinp^\arcsin\sqrt{\hat p}1/(4n)\approx 1/(4n)
相関係数(1ρ2)2/n(1-\rho^2)^2/nz=12ln1+r1rz=\tfrac12\ln\frac{1+r}{1-r}1/n\approx 1/n(補正 1/(n3)1/(n-3)

3つとも「dθ/V(θ)\int d\theta/\sqrt{V(\theta)}」という同じ1本の積分から出ている、という統一的理解が1級では効きます。


4. 1次微分が0のとき — 2次のデルタ法

デルタ法は g(θ)0g'(\theta)\ne0 を前提にしていました。もし g(θ)=0g'(\theta)=0 だと、漸近分散 g(θ)2σ2=0g'(\theta)^2\sigma^2=0 となり「1次近似では g(θ^)g(\hat\theta) のばらつきが消えてしまう」——これは近似が破綻したサインで、より高次の項を見る必要があります。

g(θ)=0g'(\theta)=0 かつ g(θ)0g''(\theta)\ne0 のときは2次の項まで展開します。

g(θ^)g(θ)g(θ)=0(θ^θ)+12g(θ)(θ^θ)2=12g(θ)(θ^θ)2g(\hat\theta)-g(\theta)\approx\underbrace{g'(\theta)}_{=0}(\hat\theta-\theta)+\frac12 g''(\theta)(\hat\theta-\theta)^2=\frac12 g''(\theta)(\hat\theta-\theta)^2

ここで n(θ^θ)dN(0,σ2)\sqrt n(\hat\theta-\theta)\xrightarrow{d}N(0,\sigma^2) なので、n(θ^θ)2=[n(θ^θ)]2n(\hat\theta-\theta)^2=\bigl[\sqrt n(\hat\theta-\theta)\bigr]^2 は「正規分布の2乗」に分布収束します。標準正規の2乗が χ12\chi^2_1 である事実から [n(θ^θ)/σ]2dχ12\bigl[\sqrt n(\hat\theta-\theta)/\sigma\bigr]^2\xrightarrow{d}\chi^2_1、すなわち n(θ^θ)2dσ2χ12n(\hat\theta-\theta)^2\xrightarrow{d}\sigma^2\chi^2_1。したがってスケーリングが n\sqrt n ではなく nn になり、

  n(g(θ^)g(θ))d12g(θ)σ2χ12  \boxed{\;n\bigl(g(\hat\theta)-g(\theta)\bigr)\xrightarrow{d}\frac12 g''(\theta)\,\sigma^2\,\chi^2_1\;}

要するに「g(θ)=0g'(\theta)=0 では極限が正規分布ではなく(スケールされた)カイ二乗分布になり、収束の速さも 1/n1/\sqrt n ではなく 1/n1/n オーダーに速くなる」。gg の接線が水平(極値)なので、θ^\hat\theta がどちらにずれても gg は同じ向き(gg'' の符号の側)に動く——これが分布が片側に寄った χ2\chi^2 になる直観です。

⚠️ 試験で g(θ)=0g'(\theta)=0 となる点(gg の極値)での分布を聞かれたら、正規ではなくカイ二乗が答え。g(θ)2σ2g'(\theta)^2\sigma^2 にそのまま代入して「分散0」と書くのは誤りです。


5. 試験での問われ方(1級)

理工学分野での1級の典型的な問われ方を論点ごとに整理します(出題範囲・配点は要最新確認)。


6. 引っかけ・頻出論点


よくある疑問(Q&A)

Q1. なぜ「1次テイラー展開」で済むのですか? 高次の項を無視していいのは何故?

漸近的に θ^\hat\theta が真値 θ\thetaごく近くにしかいないからです。n(θ^θ)\sqrt n(\hat\theta-\theta) が有限の分布に収束するということは、θ^θ\hat\theta-\theta 自体は 1/n1/\sqrt n のオーダーで0に潰れていく、という意味です。テイラー展開の2次項は (θ^θ)2(\hat\theta-\theta)^2 のオーダー(1/n1/n)で、n\sqrt n を掛けても 1/n01/\sqrt n\to0 で消えます。一方1次項は (θ^θ)(\hat\theta-\theta) のオーダー(1/n1/\sqrt n)で、n\sqrt n を掛けるとちょうど O(1)O(1) で生き残る。つまり「n\sqrt n 倍して見る」というスケールが1次項だけを拾うように設計されているのです。だから g(θ)0g'(\theta)\ne0 である限り1次で十分。逆に g(θ)=0g'(\theta)=0 で1次が消えると、生き残るのは2次項になり、それが2次のデルタ法(第4節)です。

Q2. スルツキー定理は具体的に何をしてくれているのですか?

確率収束する量分布収束する量を、安心して掛け算・足し算してよい」ことを保証してくれます。デルタ法の途中で、傾き g(θ~)g'(\tilde\theta) は定数 g(θ)g'(\theta)確率収束n(θ^θ)\sqrt n(\hat\theta-\theta) は正規分布に分布収束、と種類の違う収束が2つ出てきます。素朴には「収束先どうしを掛けて g(θ)×N(0,σ2)g'(\theta)\times N(0,\sigma^2)」としたいところですが、それが本当に正しいか(分布収束の極限が壊れないか)は自明ではありません。スルツキー定理はまさに「片方が定数に確率収束するなら、その積は定数を掛けた分布収束になる」と言ってくれるので、g(θ~)n(θ^θ)dg(θ)N(0,σ2)g'(\tilde\theta)\sqrt n(\hat\theta-\theta)\xrightarrow{d}g'(\theta)N(0,\sigma^2) が厳密に正当化されます。デルタ法の証明はテイラー展開とスルツキー定理の二人三脚です。

Q3. 分散安定化変換と「正規化のための変換」は同じものですか?

目的が違います。分散安定化変換は「分散を母数 θ\theta に依存させない(等分散にする)」のが目的で、g(θ)1/V(θ)g'(\theta)\propto1/\sqrt{V(\theta)} から導きます。一方「正規化変換」は「分布の形を正規に近づける」のが目的で、Box-Cox 変換などが代表です。両者はしばしば副次的に重なります(分散が安定すると分布も正規に近づきやすい)が、原理的には別物です。フィッシャーz変換は分散安定化として導かれますが、結果的に rr の歪んだ分布をかなり正規に近づける効果も持つ、という具合に「両得」になることが多いだけで、定義上は分散安定化が主目的です。試験で「分散を一定にする変換」と問われたら 1/V1/\sqrt{V} の積分、「正規に近づける」と問われたら別系統、と切り分けてください。

Q4. ポアソンの X\sqrt X で「分散が 1/41/4」になるのに、なぜ 2μ2\sqrt\mu ではなく X\sqrt X を使うのですか?

積分から出る変換は g(μ)=2μg(\mu)=2\sqrt\mu ですが、定数倍は分散安定化の本質に影響しないからです。ggcc 倍すると傾きも cc 倍、分散は c2c^2 倍になりますが、「θ\theta によらず一定」という性質は保たれます。2μ2\sqrt\mu なら分散 1\approx1μ\sqrt\mu なら分散 1/4\approx1/4 で、どちらも定数。実務では扱いやすい X\sqrt X(係数1)を使うのが普通で、そのときの分散が 1/41/4 になる、というだけです。試験では「変換の形(\sqrt{}arcsin\arcsin\sqrt{}artanh\operatorname{artanh} か)」が問われるので、定数倍は気にせず関数形を答えれば十分なことが多いです。

Q5. g(θ)=0g'(\theta)=0χ2\chi^2 が出るのは、現実にどんな場面ですか?

gg が真値 θ\theta で**極値(山か谷)**を取る場合です。たとえば g(θ)=θ2g(\theta)=\theta^2θ=0\theta=0 で評価すると g(0)=0g'(0)=0θ^\hat\theta が0の左右どちらにずれても g(θ^)=θ^20g(\hat\theta)=\hat\theta^2\ge0 で必ず正の側に動くので、g(θ^)g(0)g(\hat\theta)-g(0) の分布は0以上に偏った非対称な分布になる——それが(正規の2乗である)χ12\chi^2_1 をスケールしたものです。より実践的には、ある統計量がパラメータ空間の境界や対称点で評価されるとき(尤度比検定統計量が帰無の境界で χ2\chi^2 混合になる現象などと地続き)に現れます。1級では「g=0g'=0 なら正規でなく χ2\chi^2、スケールは nn」という結論を押さえておけば十分です。


まとめ


関連ノート