← 統計検定テキスト 一覧

📊 対象級:2級 ・ 準1級 | 重要度:A(頻出)

期待値・分散の性質(線形性・和の分散・共分散)

要点(BLUF)

このトピックで一番大事なのは、たった1つの非対称性です。「期待値の足し算は独立を仮定せずいつでも成り立つ/分散の足し算は無相関(独立)のときだけ成り立つ」── 期待値には余計な項が出ませんが、分散には 2Cov(X,Y)2\,\mathrm{Cov}(X,Y)(2変数が一緒に動く度合い)の項が出ます。これが本トピックの山です。

本文

1. 期待値の線形性

定数倍・定数足し(1変数)

E[aX+b]=aE[X]+b(a,b は定数)\boxed{\,E[aX+b]=a\,E[X]+b\,}\qquad(a,b \text{ は定数})

要するに**「定数倍は外に出せて、足した定数はそのまま足される」**。これは XX がどんな分布でも成り立つ(導出は「数式の直観的意味」)。

和の期待値(2変数)── 独立を仮定しないのが最重要

E[X+Y]=E[X]+E[Y](独立でなくてもつねに成立)\boxed{\,E[X+Y]=E[X]+E[Y]\,}\qquad(\text{独立でなくてもつねに成立})

要するに**「和の期待値=期待値の和。2変数が絡んでいても無条件でOK」**。ここが期待値の最大の強み。独立の仮定 p(x,y)=pX(x)pY(y)p(x,y)=p_X(x)p_Y(y) を1度も使わずに導ける(「数式の直観的意味」)。これが「分散の加法性」と決定的に違う点。

一般形(まとめて使う形)

E[aX+bY]=aE[X]+bE[Y](つねに成立)E[aX+bY]=a\,E[X]+b\,E[Y]\qquad(\text{つねに成立})

さらに nn 個でも E ⁣[i=1naiXi]=i=1naiE[Xi]E\!\left[\sum_{i=1}^n a_i X_i\right]=\sum_{i=1}^n a_i E[X_i]期待値は完全に線形で、独立性に一切依存しない。

2. 分散の性質:V[aX+b]=a2V[X]V[aX+b]=a^2 V[X]

V[aX+b]=a2V[X](σ[aX+b]=aσ[X])\boxed{\,V[aX+b]=a^2\,V[X]\,}\qquad(\sigma[aX+b]=|a|\,\sigma[X])

要するに**「足した定数 bb は分散に効かない(散らばりは平行移動で変わらない)。掛けた定数 aa は2乗で効く」**。

3. 共分散:定義と計算公式

Cov(X,Y)=E[(XμX)(YμY)]=E[XY]E[X]E[Y]\boxed{\,\mathrm{Cov}(X,Y)=E\big[(X-\mu_X)(Y-\mu_Y)\big]=E[XY]-E[X]\,E[Y]\,}

要するに**「XX が平均からズレる向き × YY が平均からズレる向き、の平均」=「積の期待値 − 期待値の積」**。2変数が一緒に同じ向きに動くか、逆向きに動くかを測る。

V[X]=E[X2](E[X])2V[X]=E[X^2]-(E[X])^2 の2変数版で、Y=XY=X とすれば Cov(X,X)=E[X2](E[X])2=V[X]\mathrm{Cov}(X,X)=E[X^2]-(E[X])^2=V[X] に戻る。

Phase 1 の標本共分散とのつながり:記述統計の標本共分散 sxy=1ni=1n(xixˉ)(yiyˉ)s_{xy}=\frac1n\sum_{i=1}^n (x_i-\bar x)(y_i-\bar y)2変数の記述(散布図・共分散・相関係数)── 相関≠因果/rは直線関係しか測れない/外れ値1点で激変)は、この Cov(X,Y)\mathrm{Cov}(X,Y)標本版xˉμX\bar x\to\mu_X1nE[]\frac1n\sum\to E[\cdot] と置き換えれば母集団・理論版になる。

共分散の双線形性(準1級の共分散行列計算で効く):

Cov(aX+b, cY+d)=acCov(X,Y),Cov(X, Y+Z)=Cov(X,Y)+Cov(X,Z)\mathrm{Cov}(aX+b,\ cY+d)=ac\,\mathrm{Cov}(X,Y),\qquad \mathrm{Cov}(X,\ Y+Z)=\mathrm{Cov}(X,Y)+\mathrm{Cov}(X,Z)

定数足し b,db,d は共分散に効かない、定数倍 a,ca,c は掛かって出る。Cov(X,X)=V[X]\mathrm{Cov}(X,X)=V[X] も基本性質。

4. 和の分散:V[X+Y]=V[X]+V[Y]+2Cov(X,Y)V[X+Y]=V[X]+V[Y]+2\,\mathrm{Cov}(X,Y)

V[X+Y]=V[X]+V[Y]+2Cov(X,Y)\boxed{\,V[X+Y]=V[X]+V[Y]+2\,\mathrm{Cov}(X,Y)\,}

要するに**「和の分散=各分散の和+一緒に動く度合いの2倍」**。期待値と違って、ここに Cov\mathrm{Cov} という余計な項が出る(導出は「数式の直観的意味」)。

差の分散YYY\to -Y とすると Cov(X,Y)=Cov(X,Y)\mathrm{Cov}(X,-Y)=-\mathrm{Cov}(X,Y)V[Y]=V[Y]V[-Y]=V[Y]):

V[XY]=V[X]+V[Y]2Cov(X,Y)V[X-Y]=V[X]+V[Y]-2\,\mathrm{Cov}(X,Y)

⚠️ 差でも分散は足し算が基本+V[Y]+V[Y])。引かれるのは共分散の項だけ。「差だから V[X]V[Y]V[X]-V[Y]」は誤り。

一般形

V[aX+bY]=a2V[X]+b2V[Y]+2abCov(X,Y),V ⁣[i=1nXi]=i=1nV[Xi]+2i<jCov(Xi,Xj)V[aX+bY]=a^2 V[X]+b^2 V[Y]+2ab\,\mathrm{Cov}(X,Y),\qquad V\!\left[\sum_{i=1}^n X_i\right]=\sum_{i=1}^n V[X_i]+2\sum_{i<j}\mathrm{Cov}(X_i,X_j)

nn 変数だと、すべてのペア (i,j)(i,j) の共分散が効く。全ペアが無相関なら第2項が消えて、分散はきれいに足し算になる(次節)。

5. 独立性との関係 ── 本トピック最大の引っかけ

独立 ⟹ 無相関(共分散ゼロ)

X,YX,Y独立なら E[XY]=E[X]E[Y]E[XY]=E[X]E[Y] が成り立つ(導出は「数式の直観的意味」)。したがって

Cov(X,Y)=E[XY]E[X]E[Y]=0(独立  無相関).\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]=0\quad(\text{独立 } \Rightarrow \text{ 無相関}).

独立なら分散は足し算(分散の加法性)

Cov=0\mathrm{Cov}=0 なら V[X+Y]=V[X]+V[Y]+20V[X+Y]=V[X]+V[Y]+2\cdot 0。つまり

X,Y が独立(無相関)V[X+Y]=V[X]+V[Y]\boxed{\,X,Y \text{ が独立(無相関)} \Rightarrow V[X+Y]=V[X]+V[Y]\,}

nn 個でも、互いに独立なら全ペアの共分散が0なので V ⁣[Xi]=V[Xi]V\!\left[\sum X_i\right]=\sum V[X_i]これが後の二項分布・標本平均の計算の土台(第7節)。

逆は成り立たない ── 無相関でも独立とは限らない

独立無相関だが無相関⇏独立\text{独立} \Rightarrow \text{無相関}\qquad\text{だが}\qquad \text{無相関} \not\Rightarrow \text{独立}

Cov=0\mathrm{Cov}=0(無相関)は直線的な関係がないことしか言わない。非線形な依存があっても共分散は0になりえる2変数の記述(散布図・共分散・相関係数)── 相関≠因果/rは直線関係しか測れない/外れ値1点で激変 の「r0r\approx0 でもU字の強い関係がありうる」と同じ話)。

反例XX1,0,1-1,0,1 が等確率 13\frac13 の確率変数、Y=X2Y=X^2 とおく。YY は完全に XX で決まる(強い依存=独立でない)のに:

Y=X2Y=X^2 という完全な依存関係があるのに共分散は0。「無相関だから独立」は誤り

例外:X,YX,Y二変量正規分布に従う場合に限り「無相関 ⟺ 独立」が成り立つ(準1級)。一般には片方向だけ。

期待値の加法性 vs 分散の加法性(核心の対比)

期待値分散
加法性の式E[X+Y]=E[X]+E[Y]E[X+Y]=E[X]+E[Y]V[X+Y]=V[X]+V[Y]+2Cov(X,Y)V[X+Y]=V[X]+V[Y]+2\mathrm{Cov}(X,Y)
独立は必要か不要(つねに成立)無相関(独立)が必要
独立でないときそのまま成立+2Cov+2\mathrm{Cov} の補正が必要
差のときE[XY]=E[X]E[Y]E[X-Y]=E[X]-E[Y]V[XY]=V[X]+V[Y]2CovV[X-Y]=V[X]+V[Y]-2\mathrm{Cov}+のまま

この表が本トピックで覚える唯一にして最大のポイント。 期待値は無条件、分散は条件付き(無相関のとき)。試験はこの差を執拗に突いてくる。

下のフローは「独立性から何が言えるか」の一方向の含意(点線の「逆は不成立」が反例)。

flowchart LR
  A["X, Y が独立"] --> B["E[XY]=E[X]E[Y]"]
  B --> C["Cov(X,Y)=0(無相関)"]
  C --> D["V[X+Y]=V[X]+V[Y]"]
  C -.->|"逆は不成立"| A

6. 相関係数(母集団版)

共分散は単位に依存して大小で強さを測れない(2変数の記述(散布図・共分散・相関係数)── 相関≠因果/rは直線関係しか測れない/外れ値1点で激変 と同じ難点)。そこで標準偏差で割って無次元化したのが母相関係数

ρ=ρXY=Cov(X,Y)σXσY(1ρ1)\boxed{\,\rho=\rho_{XY}=\frac{\mathrm{Cov}(X,Y)}{\sigma_X\,\sigma_Y}\,}\qquad(-1\le\rho\le 1)

要するに**「共分散を単位で割って 11-1\sim1 に正規化したもの」**。標本相関係数 rr2変数の記述(散布図・共分散・相関係数)── 相関≠因果/rは直線関係しか測れない/外れ値1点で激変)の母集団・理論版。

7. 応用:級の実戦力に直結する2つの計算

二項分布の分散 np(1p)np(1-p) を「独立和」で出す

二項分布 XB(n,p)X\sim B(n,p) は「成功確率 pp の試行を独立に nn 回やった成功回数」。これは独立なベルヌーイ変数 nn 個の和として書ける:

X=X1+X2++Xn,XiBernoulli(p) (独立)X=X_1+X_2+\cdots+X_n,\qquad X_i\sim\text{Bernoulli}(p)\ (\text{独立})

XiX_iE[Xi]=pE[X_i]=pV[Xi]=p(1p)V[X_i]=p(1-p)確率変数(離散・連続)と期待値・分散 で導出済み)。

母関数を使わずに np(1p)np(1-p) がこれだけで出る。「分散の加法性が独立で成り立つ」ことの威力がよく分かる例。

標本平均の分散 V[Xˉ]=σ2/nV[\bar X]=\sigma^2/n(大数の法則・CLTへの布石)

母平均 μ\mu、母分散 σ2\sigma^2 の母集団から独立に nn 個を取った標本 X1,,XnX_1,\dots,X_n(独立同分布 i.i.d.)。標本平均 Xˉ=1ni=1nXi\bar X=\frac1n\sum_{i=1}^n X_i

V[Xˉ]=V ⁣[1ni=1nXi]=1n2i=1nV[Xi]=1n2nσ2=σ2n.V[\bar X]=V\!\left[\frac1n\sum_{i=1}^n X_i\right]=\frac{1}{n^2}\sum_{i=1}^n V[X_i]=\frac{1}{n^2}\cdot n\sigma^2=\boxed{\frac{\sigma^2}{n}}.

要するに**「標本を増やすほど標本平均のばらつきは 1/n1/n で小さくなる」。標準偏差にすると σ/n\sigma/\sqrt{n} で、これが標準誤差(standard error)。この V[Xˉ]=σ2/nV[\bar X]=\sigma^2/n が、大数の法則大数の法則(弱法則・強法則)nn\to\inftyV[Xˉ]0V[\bar X]\to0)と中心極限定理**(中心極限定理(CLT)XˉN(μ,σ2/n)\bar X\sim N(\mu,\sigma^2/n))の両方の出発点。1n2\frac{1}{n^2}n2n^2 と独立和の nn 個ぶんが約分して 1/n1/n になるこの計算は推測統計のいたるところで出る。

8. 準1級への接続:共分散行列(分散共分散行列)

準1級では変数が増え、ベクトル・行列で一気に扱う。確率ベクトル X=(X1,,Xp)\mathbf{X}=(X_1,\dots,X_p)^\top に対して:

Σ=V[X]=E[(Xμ)(Xμ)],Σij=Cov(Xi,Xj)\Sigma=V[\mathbf{X}]=E\big[(\mathbf{X}-\boldsymbol{\mu})(\mathbf{X}-\boldsymbol{\mu})^\top\big],\qquad \Sigma_{ij}=\mathrm{Cov}(X_i,X_j)

対角に各変数の分散 Σii=V[Xi]\Sigma_{ii}=V[X_i]、非対角に共分散 Σij=Cov(Xi,Xj)\Sigma_{ij}=\mathrm{Cov}(X_i,X_j) を並べた行列(2×22\times2 の例):

Σ=(V[X1]Cov(X1,X2)Cov(X2,X1)V[X2])\Sigma=\begin{pmatrix} V[X_1] & \mathrm{Cov}(X_1,X_2)\\ \mathrm{Cov}(X_2,X_1) & V[X_2]\end{pmatrix}

Cov(Xi,Xj)=Cov(Xj,Xi)\mathrm{Cov}(X_i,X_j)=\mathrm{Cov}(X_j,X_i) なので**Σ\Sigma は対称行列**。さらに任意のベクトル a\mathbf{a} について aΣa=V[aX]0\mathbf{a}^\top\Sigma\mathbf{a}=V[\mathbf{a}^\top\mathbf{X}]\ge0 なので半正定値(本節4-2の一般形 V[aX1+bX2]=a2V[X1]+b2V[X2]+2abCovV[aX_1+bX_2]=a^2V[X_1]+b^2V[X_2]+2ab\,\mathrm{Cov} が、行列で aΣa\mathbf{a}^\top\Sigma\mathbf{a} とコンパクトに書ける)。この Σ\Sigma多変量正規分布・主成分分析・マハラノビス距離の中心的な道具になる(準1級・Phase 6 多変量解析。※該当ノートはファイル名未確定のため将来作成時にリンク)。

試験での問われ方

数式の直観的意味

なぜ E[aX+b]=aE[X]+bE[aX+b]=aE[X]+b か(定義の分解)

期待値の定義 E[g(X)]=xg(x)p(x)E[g(X)]=\sum_x g(x)\,p(x)(連続は \sum\to\int)に g(X)=aX+bg(X)=aX+b を入れて和を分解する:

E[aX+b]=x(ax+b)p(x)=axxp(x)+bxp(x)=aE[X]+b1=aE[X]+b.E[aX+b]=\sum_x (a x+b)\,p(x)=a\sum_x x\,p(x)+b\sum_x p(x)=a\,E[X]+b\cdot 1=aE[X]+b.

最後に xp(x)=1\sum_x p(x)=1(確率の合計は1)を使う。XX がどんな分布でも成り立つ

なぜ E[X+Y]=E[X]+E[Y]E[X+Y]=E[X]+E[Y] は独立不要か(導出)

2変数の期待値は同時分布 p(x,y)=P(X=x,Y=y)p(x,y)=P(X=x,Y=y)E[g(X,Y)]=xyg(x,y)p(x,y)E[g(X,Y)]=\sum_x\sum_y g(x,y)p(x,y) と定義(厳密化は 同時分布・周辺分布・条件付き分布)。g=X+Yg=X+Y を代入:

E[X+Y]=xy(x+y)p(x,y)=xyxp(x,y)+xyyp(x,y).E[X+Y]=\sum_x\sum_y (x+y)\,p(x,y)=\sum_x\sum_y x\,p(x,y)+\sum_x\sum_y y\,p(x,y).

第1項は xx を内側の y\sum_y の外に出すと yp(x,y)=pX(x)\sum_y p(x,y)=p_X(x)YY を足し潰した周辺分布同時分布・周辺分布・条件付き分布)になり xxpX(x)=E[X]\sum_x x\,p_X(x)=E[X]。第2項も同様に E[Y]E[Y]独立の形 p(x,y)=pXpYp(x,y)=p_Xp_Y を一度も使わない。だから常に成立。

なぜ V[aX+b]=a2V[X]V[aX+b]=a^2V[X] か(bb が消える理由)

Z=aX+bZ=aX+bE[Z]=aE[X]+bE[Z]=aE[X]+b、ズレ ZE[Z]=(aX+b)(aE[X]+b)=a(XE[X])Z-E[Z]=(aX+b)-(aE[X]+b)=a(X-E[X]) ── bb が引き算で消える。2乗の期待値で a2a^2 が外へ:V[aX+b]=E[a2(XE[X])2]=a2V[X]V[aX+b]=E[a^2(X-E[X])^2]=a^2 V[X]。分散は「平均からのズレ」だけで決まる量だから、平行移動 +b+b では不変、aa 倍はズレを2乗するので a2a^2 倍。

なぜ Cov=E[XY]E[X]E[Y]\mathrm{Cov}=E[XY]-E[X]E[Y] か(導出)

定義の中身を展開し、期待値の線形性で項ごとにバラす(μX,μY\mu_X,\mu_Y は定数):

Cov(X,Y)=E[(XμX)(YμY)]=E[XY]μXE[Y]μYE[X]+μXμY=E[XY]μXμY.\mathrm{Cov}(X,Y)=E[(X-\mu_X)(Y-\mu_Y)]=E[XY]-\mu_X E[Y]-\mu_Y E[X]+\mu_X\mu_Y=E[XY]-\mu_X\mu_Y.

中央の2項 μXμYμYμX=2μXμY-\mu_X\mu_Y-\mu_Y\mu_X=-2\mu_X\mu_Y と末尾 +μXμY+\mu_X\mu_Y が打ち消して μXμY-\mu_X\mu_Y が残る(分散公式と同構造)。

なぜ V[X+Y]=V[X]+V[Y]+2CovV[X+Y]=V[X]+V[Y]+2\mathrm{Cov} か(導出)

V[X+Y]=E[(X+Y)2](E[X+Y])2V[X+Y]=E[(X+Y)^2]-(E[X+Y])^2 を展開:

E[(X+Y)2]=E[X2]+2E[XY]+E[Y2],(E[X+Y])2=(E[X])2+2E[X]E[Y]+(E[Y])2.E[(X+Y)^2]=E[X^2]+2E[XY]+E[Y^2],\qquad (E[X+Y])^2=(E[X])^2+2E[X]E[Y]+(E[Y])^2.

引き算して {E[X2](E[X])2}+{E[Y2](E[Y])2}+2{E[XY]E[X]E[Y]}=V[X]+V[Y]+2Cov(X,Y)\{E[X^2]-(E[X])^2\}+\{E[Y^2]-(E[Y])^2\}+2\{E[XY]-E[X]E[Y]\}=V[X]+V[Y]+2\mathrm{Cov}(X,Y)

なぜ独立で Cov=0\mathrm{Cov}=0 か(独立がここで効く)

独立 p(x,y)=pX(x)pY(y)p(x,y)=p_X(x)p_Y(y)条件付き確率・独立性・全確率の定理)なら

E[XY]=xyxypX(x)pY(y)=(xxpX(x))(yypY(y))=E[X]E[Y].E[XY]=\sum_x\sum_y xy\,p_X(x)p_Y(y)=\Big(\sum_x x\,p_X(x)\Big)\Big(\sum_y y\,p_Y(y)\Big)=E[X]E[Y].

二重和が「xx だけの和」と「yy だけの和」の積に分離できるのは、p(x,y)p(x,y)積の形だから。独立がここで初めて本質的に効く。よって Cov=E[XY]E[X]E[Y]=0\mathrm{Cov}=E[XY]-E[X]E[Y]=0

期待値の加法性 vs 分散の加法性(なぜ差が出るか)

期待値の和の導出には積 XYXY が現れず、周辺分布に潰すだけで済む。一方、分散の和には必ず E[XY]E[XY] が現れ、これを E[X]E[Y]E[X]E[Y] に分離するには独立が要る。E[XY]E[X]E[Y]E[XY]\ne E[X]E[Y] のズレがそのまま共分散として残るかどうかが両者の差。要するに**「積 XYXY が出るかどうか」**が分かれ目。

⚠️ 引っかけポイント・頻出論点・級ごとの差

よくある疑問

Q1. なぜ期待値だけ独立がいらないのに、分散には独立がいるの?

A. 期待値の和の導出では、同時分布 p(x,y)p(x,y) を足し潰して周辺分布にするだけで済み、p(x,y)=pXpYp(x,y)=p_X p_Y という独立の形は使いませんでした。一方、分散の和には必ず E[XY]E[XY] が現れ、これを E[X]E[Y]E[X]E[Y] に分離するには独立が必要。E[XY]E[X]E[Y]E[XY]\ne E[X]E[Y] のズレがそのまま共分散 Cov=E[XY]E[X]E[Y]\mathrm{Cov}=E[XY]-E[X]E[Y] で、これが残るかどうかが両者の差です。要するに**「積 XYXY が出るかどうか」**が分かれ目です。

Q2. 「無相関」と「独立」は同じ意味では?

A. 違います。独立 ⟹ 無相関は正しいですが、逆は不成立。無相関は Cov=0\mathrm{Cov}=0、つまり「直線的な関係がない」だけ。Y=X2Y=X^2 のような非線形の完全な依存があっても Cov=0\mathrm{Cov}=0 になりえます(反例)。「無相関だから独立、だから何でも分離できる」と進めると誤りです。ただし二変量正規分布に限れば「無相関 ⟺ 独立」が成り立ちます(準1級)。

Q3. 差の分散はなぜ V[X]V[Y]V[X]-V[Y] じゃないの?

A. 分散は必ず非負で、ばらつきは引き算で減るものではないからです。V[XY]=V[X+(Y)]V[X-Y]=V[X+(-Y)] と見て、V[Y]=(1)2V[Y]=V[Y]V[-Y]=(-1)^2V[Y]=V[Y]a=1a=-1 を2乗)。共分散は Cov(X,Y)=Cov(X,Y)\mathrm{Cov}(X,-Y)=-\mathrm{Cov}(X,Y) で符号が反転。結果 V[XY]=V[X]+V[Y]2Cov(X,Y)V[X-Y]=V[X]+V[Y]-2\mathrm{Cov}(X,Y)分散の本体は足し算(+V[Y]+V[Y])のまま、符号が変わるのは共分散の項だけです。独立なら V[XY]=V[X]+V[Y]V[X-Y]=V[X]+V[Y](和でも差でも同じ)。

Q4. 標本平均の分散がなぜ σ2/n\sigma^2/nσ2/n2\sigma^2/n^2 じゃない)?

A. Xˉ=1nXi\bar X=\frac1n\sum X_i で、定数 1n\frac1n は2乗で外に出るので 1n2V[Xi]\frac{1}{n^2}V[\sum X_i]。独立なので V[Xi]=V[Xi]=nσ2V[\sum X_i]=\sum V[X_i]=n\sigma^2。よって 1n2nσ2=σ2n\frac{1}{n^2}\cdot n\sigma^2=\frac{\sigma^2}{n}1n2\frac{1}{n^2}n2n^2 と、独立和の nn 個ぶんが約分して 1n\frac1n が残るのがポイントです。

Q5. Cov(X,X)\mathrm{Cov}(X,X) は何になる?

A. Cov(X,X)=E[XX]E[X]E[X]=E[X2](E[X])2=V[X]\mathrm{Cov}(X,X)=E[X\cdot X]-E[X]E[X]=E[X^2]-(E[X])^2=V[X]共分散の特別な場合(同じ変数同士)が分散です。だから分散共分散行列の対角に分散が並びます。

まとめ

対応するシミュレーション

和の分散と共分散の関係(独立・正相関・負相関)

二項分布の分散は独立ベルヌーイ和

関連ノート