← 統計検定テキスト 一覧

📊 対象級:4級 ・ 3級 ・ 2級 | 重要度:A(頻出)

時系列データの処理 ── 指数・増減率・移動平均・成長率(なぜ成長率は幾何平均なのか)

要点(BLUF)

対象級について:指数(基準時=100)・増減率・移動平均は統計検定3級が中心です。ラスパイレス/パーシェ指数と、幾何平均で出す年平均成長率(CAGR)は2級の頻出論点。対数階差(log差分)や連続複利は準1級以降の時系列・金融データへの橋渡しとして触れます。前トピック 標準化(z得点)・偏差値・チェビシェフの不等式 ── 標準化≠正規化/偏差値に上限なし/どんな分布でも成り立つ歯止め でやった「データを共通のものさしに乗せ替える」発想は、ここの「基準時を100にそろえる指数」とそっくりです。

結論:時系列を読む4つの道具

時系列データ(時間順に並んだデータ)を読むための基本道具は4つです。まず結論から。

道具一言でいうと
指数It=xtx0×100I_t=\dfrac{x_t}{x_0}\times100基準時を100にして「基準の何%か」で見る3級
増減率rt=xtxt11r_t=\dfrac{x_t}{x_{t-1}}-11期前から何%増減したか(前期比・前年同月比)3級
移動平均前後 NN 項の平均ギザギザ(ノイズ)を均して傾向を見る3級
成長率(年平均)1+g=(xnx0)1/n1+g=\left(\dfrac{x_n}{x_0}\right)^{1/n}「毎年一定率なら年率いくら」=幾何平均2級

この記事で絶対に外してほしくない核心を先に3つ。

  1. 成長率の平均は「幾何平均」で出す。算術平均は間違い。「+100%と−50%の平均は+25%」は誤りで、正解は0%です(往復して元に戻るので)。理由は「成長は掛け算(複利)で積み上がるから」。これを導出まで説明します。
  2. ラスパイレス=基準時の数量で重みづけ、パーシェ=比較時の数量で重みづけ。どちらの時点の数量を使うかだけの違いです。取り違えが頻出。
  3. 移動平均は項数を増やすほど滑らかになるが、端が欠け、急な変化に鈍くなる。「滑らかさ」と「追従性」はトレードオフです。

1. 指数(index number)── 基準を100にそろえる

単一の系列の指数

ある時点(基準時)の値を x0x_0、比べたい時点を xtx_t とすると、指数は

It=xtx0×100I_t = \frac{x_t}{x_0}\times100

要するに:基準時を「100」という物差しに固定して、ほかの時点が「基準の何%か」で表したものです。It=120I_t=120 なら基準より20%高い、It=100I_t=100 なら基準と同じ、It=95I_t=95 なら5%低い。

単位が違う系列(円・個・kg)でも、それぞれを指数にすれば同じ土俵で増減を比べられます。これは前トピックの標準化(標準化(z得点)・偏差値・チェビシェフの不等式 ── 標準化≠正規化/偏差値に上限なし/どんな分布でも成り立つ歯止め)が「平均0・標準偏差1にそろえて比べる」のと同じ、“ものさしを揃える”発想です。

⚠️ 基準時の取り方で見え方が変わります。基準を不況の年にすると、その後がすべて高く見えます。指数を読むときは「いつを100にしているか」を必ず確認しましょう。

複数品目をまとめる物価指数:ラスパイレスとパーシェ

品目が複数あると、「価格 pp を、どの数量 qq で重みづけて1つにまとめるか」という問題が出ます。ここでどの時点の数量を重み(ウェイト)に使うかで2つの流派に分かれます。これが2級の頻出論点です。

ラスパイレス指数(基準時の数量 q0q_0 をウェイト)

PL=ipt,iq0,iip0,iq0,i×100P_L=\frac{\sum_i p_{t,i}\,q_{0,i}}{\sum_i p_{0,i}\,q_{0,i}}\times100

要するに:「昔(基準時)と同じ買い物カゴを、今の値段で買うといくら?/昔の値段ではいくら?」の比です。分子も分母も数量は昔のまま(q0q_0 で固定)、価格だけを動かします。

パーシェ指数(比較時の数量 qtq_t をウェイト)

PP=ipt,iqt,iip0,iqt,i×100P_P=\frac{\sum_i p_{t,i}\,q_{t,i}}{\sum_i p_{0,i}\,q_{t,i}}\times100

要するに:「今(比較時)の買い物カゴを、今の値段で買うといくら?/昔の値段ではいくら?」の比です。数量は今のもの(qtq_t)で固定します。

フィッシャー指数(両者の幾何平均)

PF=PL×PPP_F=\sqrt{P_L\times P_P}

要するに:あとで述べる「上振れしやすいラスパイレス」と「下振れしやすいパーシェ」の真ん中を取った指数です。

3つの違いは「数量をどの時点で固定するか」だけ。表にまとめます。

指数ウェイト(数量)イメージ実際の使われ方
ラスパイレス PLP_L基準時 q0q_0(昔で固定)昔のカゴを今の価格で買うと消費者物価指数(CPI)・企業物価指数
パーシェ PPP_P比較時 qtq_t(今で更新)今のカゴを評価するGDPデフレータ
フィッシャー PFP_F両者の幾何平均両方の偏りの中間理論上の「理想指数」

実務でラスパイレスがよく使われるのは、比較時の数量を毎回調べ直さなくてよい(昔の数量を据え置けばいい)ので調査コストが低いからです。

💡 覚え方:ラスパイレス=基準(昔)固定、パーシェ=比較(今)で更新。「ラ」の指数は分子分母とも数量が q0q_0 でそろっている、と確認すれば取り違えません。

なぜ「一般にラスパイレス ≧ パーシェ」になりやすいのか

ここは2級でよく問われます。ただし注意が必要で、これは**いつも必ず成り立つ不等式ではなく、現実のデータで起きやすい”傾向”**です。理由は経済の「需要の法則」=**値段が上がると買う量が減る(価格と数量が逆の動き)**にあります。

つまり「価格の上がり方」と「数量の減り方」が逆相関のとき PLPPP_L \ge P_P になりやすい。逆相関でない(一緒に上がる)ケースでは逆転もあり得るので、試験で「必ず PLPPP_L \ge P_P」と書くと誤りになり得ます。


2. 増減率(変化率)── 1期前から何%変わったか

rt=xtxt1xt1=xtxt11r_t=\frac{x_t-x_{t-1}}{x_{t-1}}=\frac{x_t}{x_{t-1}}-1

要するに:1期前と比べて何%増減したか。×100\times100 して%で表します。

指数との関係でいうと、増減率は「1期前を基準(100%)にした指数から100%を引いたもの」。指数が水準の相対化、増減率はその1期ぶんの差分です。

補足:対数の差は増減率の近似(準1級以降への橋渡し)

少し進んだ話ですが、変化が小さいときは「対数の差」が増減率とほぼ一致します。コードや数式が苦手な方は読み飛ばして構いません。

倍率を 1+rt=xt/xt11+r_t=x_t/x_{t-1} と書くと、対数の差(log差分)は

logxtxt1=logxtlogxt1=log(1+rt)rt(rt が小さいとき)\log\frac{x_t}{x_{t-1}}=\log x_t-\log x_{t-1}=\log(1+r_t)\approx r_t \quad(\text{$r_t$ が小さいとき})

要するに:「+3%」くらいの小さな変化なら、対数の差をとっても増減率とほぼ同じ値になります。なぜ役立つかというと、複数期の倍率は掛け算 (1+ri)\prod(1+r_i) ですが、対数をとると足し算 log(1+ri)\sum\log(1+r_i) になって扱いやすいから。金融で「対数収益率(log return)」が好まれる理由でもあります。ただし rr が大きい(例:+50%)と近似は崩れるので、小さい変化限定の話です。


3. 移動平均(moving average)── ギザギザを均して傾向を見る

定義(奇数項)

注目する点 xix_i を中心に、前後 kk 個ずつ(合計 N=2k+1N=2k+1 個)を平均します。

mai=12k+1(xik++xi++xi+k)\mathrm{ma}_i=\frac{1}{2k+1}\Big(x_{i-k}+\cdots+x_i+\cdots+x_{i+k}\Big)

たとえば3項移動平均(k=1k=1)なら、5番目の移動平均は x4+x5+x63\dfrac{x_4+x_5+x_6}{3} です。

要するに:注目点の前後をならして1点に潰すと、細かいギザギザ(短期のノイズ)が消えて、全体の傾向(トレンド)が浮かび上がります。

偶数項は「両端を半分」にする(中心化移動平均)

4項のような偶数項だと、中心がデータ2点の間に来てズレてしまいます。これを直すため、両端を0.5倍して中心を合わせます(中心化移動平均)。

mai=0.5xi2+xi1+xi+xi+1+0.5xi+24(4項の例)\mathrm{ma}_i=\frac{0.5\,x_{i-2}+x_{i-1}+x_i+x_{i+1}+0.5\,x_{i+2}}{4}\quad(\text{4項の例})

月次データの12項移動平均は1年ぶんをまるごと均すので、季節変動を消すのに使えます(季節調整の入口)。

弱点:端が欠ける/急な変化に鈍い

前後 kk 個がないと計算できないので、最初の kk 個と最後の kk 個は値が出ません。データ10個に3項移動平均なら、出てくるのは2番目〜9番目の8個だけ。最新の値が出ないので、移動平均は予測には向きません

そして項数を増やすと滑らかになりますが、そのぶん端の欠損が増え、急な変化や季節の山谷への追従が鈍くなります。滑らかさと追従性はトレードオフです。下のグラフは、項数を増やすほどギザギザが減っていくイメージ(残ったノイズの大きさ)です。

xychart-beta
    title "項数を増やすほど残るノイズは小さくなる(σ=4 の例)"
    x-axis "移動平均の項数" ["1(なし)", "3項", "7項", "25項"]
    y-axis "残ったノイズの大きさ" 0 --> 4.5
    bar [4.0, 2.31, 1.51, 0.8]

このグラフの値は「ノイズの標準偏差 σ=4\sigma=4 を、NN 項で平均すると σ/N\sigma/\sqrt{N} に縮む」という理論値です。なぜ N\sqrt{N} で割れるのかは「数式の直観的意味」で説明します。


4. 成長率(年平均成長率・CAGR)── なぜ幾何平均なのか

ここがこのトピックの山場です。「率・倍率の平均は、足し算の平均(算術平均)ではなく、掛け算の平均(幾何平均)で出す」。これが2級の頻出かつ最頻出の誤解ポイントです。

定義

nn 期で x0x_0 から xnx_n に変化したとき、「毎年一定の率 gg で複利成長したと見なすと年率いくらか」が**年平均成長率(CAGR)**です。

1+g=(xnx0)1/ng=(xnx0)1/n11+g=\left(\frac{x_n}{x_0}\right)^{1/n}\quad\Longleftrightarrow\quad g=\left(\frac{x_n}{x_0}\right)^{1/n}-1

各年の成長率 r1,,rnr_1,\dots,r_n で書くと

1+g=[(1+r1)(1+r2)(1+rn)]1/n1+g=\Big[(1+r_1)(1+r_2)\cdots(1+r_n)\Big]^{1/n}

要するに:年平均成長率は「各年の倍率 (1+ri)(1+r_i) を全部掛けて、年数ぶんの累乗根をとったもの(=幾何平均)から1を引いた値」です。導出と「なぜ算術平均はダメか」は「数式の直観的意味」でフルに示します。


数式の直観的意味

1. なぜ成長率は幾何平均なのか(CAGR の導出)

出発点:成長は「足し算」でなく「掛け算」で積み上がる(複利)。 各期で前年の (1+ri)(1+r_i) 倍になるので、nn 期後は

xn=x0(1+r1)(1+r2)(1+rn).x_n=x_0\,(1+r_1)(1+r_2)\cdots(1+r_n).

ここで「毎年同じ率 gg だったら同じ xnx_n に着く」ような gg を年平均成長率と定義する:

x0(1+g)n=xn    (1+g)n=xnx0=i=1n(1+ri).x_0(1+g)^n=x_n\;\Longrightarrow\;(1+g)^n=\frac{x_n}{x_0}=\prod_{i=1}^n(1+r_i).

両辺を 1/n1/n 乗すれば

1+g=[i=1n(1+ri)]1/n.1+g=\Big[\prod_{i=1}^n(1+r_i)\Big]^{1/n}.

右辺はまさに (1+ri)(1+r_i) たちの幾何平均。つまり「掛けて積み上がる量(率=比)の代表値は幾何平均」。これは一般原則で、比・倍率・成長率を平均するときは幾何平均(→ 代表値 ── 平均・中央値・最頻値の定義と使い分け(外れ値への強さ・歪んだ分布での大小関係) の平均の使い分け)。

なぜ算術平均ではダメか(数値例で破綻を示す)

2年で「+100%(2倍)→ −50%(半分)」と動いたとする。実際は x02x0x0x_0\to2x_0\to x_0 で**元に戻る=年平均成長率0%**であるべき。

算術平均が誤るのは、(1+ri)(1+r_i) を足してしまうと複利(積)の構造を壊すから。xn/x0x_n/x_0 は積で決まるのに、和の平均はそれを再現できない。

AM–GM 不等式との関係:相加平均 ≥ 相乗平均(1n(1+ri)[(1+ri)]1/n\frac1n\sum(1+r_i)\ge[\prod(1+r_i)]^{1/n}、等号は全 rir_i が等しいとき)。変動があるほど両者の差が開く=算術平均は成長率を必ず過大評価する(ばらつくほど過大)。だから成長率は幾何平均で出さねばならない。

2. なぜ移動平均は平滑化するのか

平均操作は独立な変動(ノイズ)の分散を 1/k1/k に縮める。 真の傾向 μi\mu_i にノイズ εi\varepsilon_i が乗ったモデル xi=μi+εix_i=\mu_i+\varepsilon_i を考える(εi\varepsilon_i は平均0・分散 σ2\sigma^2 で互いに独立)。区間内で傾向 μ\mu がほぼ一定とみなせる範囲で kk 項平均すると、ノイズ部分は

1kj=1kεj,Var ⁣[1kj=1kεj]=1k2j=1kVar[εj]=1k2kσ2=σ2k.\frac{1}{k}\sum_{j=1}^{k}\varepsilon_j,\qquad \mathrm{Var}\!\Big[\frac1k\sum_{j=1}^k\varepsilon_j\Big]=\frac{1}{k^2}\sum_{j=1}^k\mathrm{Var}[\varepsilon_j]=\frac{1}{k^2}\cdot k\sigma^2=\frac{\sigma^2}{k}.

要するに:独立なノイズを kk 個平均すると、ノイズの散らばり(標準偏差)は σ/k\sigma/\sqrt{k} に縮む。項数 kk を増やすほどギザギザ(高周波の変動)が打ち消し合って消え、傾向 μ\mu が残る。これが「ならすと滑らかになる」の数理(→ 散らばり(ばらつき)の指標 ── 範囲・四分位範囲・分散・標準偏差・変動係数(なぜ偏差を2乗するか/なぜn−1で割るか) の分散、後の 中心極限定理(CLT) と同じ σ/n\sigma/\sqrt n の発想)。

トレードオフkk を大きくすると滑らかになる(分散 σ2/k\sigma^2/k が小さい)が、(a) 端の欠損が kk 個ずつ増え、(b) 区間内で μ\mu が一定という仮定が崩れて急な変化に追従できず鈍る(位相遅れ)。平滑さと追従性は二律背反。

3. ラスパイレス vs パーシェ:ウェイトの違いと大小関係

両者の差は分子分母の数量ウェイトだけq0q_0qtq_t)。価格 pt/p0p_t/p_0 は同じでも、重みが違えば加重平均の値がずれる。

一般にラスパイレス ≥ パーシェ になりやすい傾向(厳密な恒等不等式ではなく経験則)。理由は需要の法則=価格と数量の負の相関

形式的には、価格相対 pt,i/p0,ip_{t,i}/p_{0,i} と数量変化 qt,i/q0,iq_{t,i}/q_{0,i}負相関のとき PLPPP_L\ge P_P(共分散が負)。正相関なら逆転もあり得るので「常に PLPPP_L\ge P_P」と断言するのは誤り(→ ⚠️)。フィッシャー PF=PLPPP_F=\sqrt{P_L P_P} は両偏りを幾何平均で相殺するため、理論上の「理想指数」とされる。

4. 増減率と対数階差(log\log 差 ≈ 増減率)

倍率を 1+rt=xt/xt11+r_t=x_t/x_{t-1} とすると、対数階差(log差分)は

logxtxt1=logxtlogxt1=log(1+rt).\log\frac{x_t}{x_{t-1}}=\log x_t-\log x_{t-1}=\log(1+r_t).

log(1+r)\log(1+r) のマクローリン展開は(r<1|r|<1

log(1+r)=rr22+r33\log(1+r)=r-\frac{r^2}{2}+\frac{r^3}{3}-\cdots

なので rr が小さければ log(1+rt)rt\log(1+r_t)\approx r_t要するに:小さな変化なら「対数の差」と「増減率」はほぼ一致する。

実務でのうれしさ(理論的裏付け):

⚠️ 引っかけポイント・頻出論点・級ごとの差

よくある疑問

Q1. ラスパイレスとパーシェ、結局どっちを覚えればいい?

両方です。覚え方は「ラスパイレス=基準時(昔)の数量 q0q_0 で固定、パーシェ=比較時(今)の数量 qtq_t で固定」。式の分子・分母で数量の添字(0 か tt か)がそろっているかを確認すれば取り違えません。実務ではラスパイレス(CPI)が主流、という事実もセットで。

Q2. 「ラスパイレス ≧ パーシェ」は暗記していい?

“傾向”として覚えるのはOKですが、「必ず成り立つ」と思い込むのは危険です。これは「値上がりすると買う量が減る(価格と数量が逆相関)」という現実の傾向から来るもので、逆相関でなければ逆転もあり得ます。試験で「常に成立」と断定する選択肢があれば疑いましょう。

Q3. なぜ成長率に算術平均を使ってはいけないの?

成長は掛け算(複利)で積み上がるからです。各年の倍率 (1+r)(1+r) を足して平均すると、掛け算の構造が壊れ、最終値を再現できません(必ず過大評価になります)。「率・倍率・成長率の平均は幾何平均」と覚えてください。


まとめ

次は 2変数の記述(散布図・共分散・相関係数)── 相関≠因果/rは直線関係しか測れない/外れ値1点で激変(散布図・相関係数)に進みます。ラスパイレス/パーシェの大小を決めた「価格と数量の逆相関」は、まさに2変数の関係=相関の話につながります。

対応するシミュレーション

移動平均は項数を増やすほど平滑になる(ノイズ低減 σ/√N)

成長率は幾何平均(CAGR)でないと最終値に一致しない

関連ノート