← 統計検定テキスト 一覧

📊 対象級:3級 ・ 2級 | 重要度:A(頻出)

箱ひげ図と外れ値 ── 5数要約・ひげの2流派・1.5×IQRルール(なぜ係数が1.5なのか/約2.7σ・0.7%)

要点(BLUF)

対象級について:3級が中心です。箱ひげ図の読み取りそのものは4級でも触れます。外れ値の1.5×IQR判定は3級〜2級にまたがる頻出論点です。前トピック 散らばり(ばらつき)の指標 ── 範囲・四分位範囲・分散・標準偏差・変動係数(なぜ偏差を2乗するか/なぜn−1で割るか) でそろえた四分位数(Q1,Q2,Q3Q_1, Q_2, Q_3)と四分位範囲 IQR を、ここで1枚の図に落とし込みます。さらに「なぜ外れ値の係数が 1.5 なのか」を、正規分布での計算(約±2.7σ・全体の約0.7%)まで踏み込んで説明します。

結論:箱ひげ図は「5数要約を1枚にした図」。外れ値は Q11.5×Q_1-1.5\timesIQR/Q3+1.5×Q_3+1.5\timesIQR の外側

最初に結論です。**箱ひげ図(box-and-whisker plot)は、データを5つの数(5数要約)**に圧縮して1枚の図にしたものです。5数要約とは次の5つ。

5数要約記号箱ひげ図での位置
最小値minひげの左端(素朴版)
第1四分位数Q1Q_1箱の左端
中央値Q2Q_2箱の中の線
第3四分位数Q3Q_3箱の右端
最大値maxひげの右端(素朴版)

そして**外れ値(outlier)**は、次の境界線(フェンス)の外側にあるデータと判定します。

下側フェンス=Q11.5×IQR,上側フェンス=Q3+1.5×IQR\text{下側フェンス} = Q_1 - 1.5\times\text{IQR}, \qquad \text{上側フェンス} = Q_3 + 1.5\times\text{IQR}

ここで IQR=Q3Q1\text{IQR} = Q_3 - Q_1(四分位範囲=中央50%の幅 → 散らばり(ばらつき)の指標 ── 範囲・四分位範囲・分散・標準偏差・変動係数(なぜ偏差を2乗するか/なぜn−1で割るか))です。要するに「箱(中央50%)の幅の1.5倍ぶん、箱の外側に引いた線を越えたら外れ値」ということ。本記事で深掘りする核心を先に3つ言っておきます。

  1. ひげには2つの流派がある ── 素朴版(最小〜最大まで伸ばす)と、現代の標準であるTukey版(ひげはフェンス内の最端データまで、フェンスを越えた点は外れ値として個別に打つ)。試験で問われるのはTukey版です。
  2. なぜ係数が 1.5 なのか ── 正規分布だとフェンスが約±2.7σに来て、外れ値になるのは**全体の約0.7%**だけ。「拾いすぎず・見逃しすぎない」絶妙な閾値だからです(後で数式で示します)。
  3. 箱ひげ図の最大の利点は複数群の一括比較。一方で二峰性など分布の細かい形は隠れる(そこはヒストグラムの出番 → 度数分布表とヒストグラム ── 階級・相対度数・累積度数とスタージェスの公式)。

箱ひげ図の構造 ── 箱・ひげ・外れ値の点

箱ひげ図は、前トピック 散らばり(ばらつき)の指標 ── 範囲・四分位範囲・分散・標準偏差・変動係数(なぜ偏差を2乗するか/なぜn−1で割るか) で求めた四分位数を数直線の上に図示したものです。構成要素は次のとおり。

※ここは手描きExcalidraw推奨 箱ひげ図そのものの構造図は、Mermaidでは綺麗に描けない「主役級」の図です。手描きで作る場合の構図案: 数直線を1本(横向き)引く → その上に長方形の「箱」を置き、箱の左端に Q1Q_1、右端に Q3Q_3 のラベル → 箱の中に縦線を1本引いて「中央値 Q2Q_2」 → 箱の左右から水平の「ひげ」を伸ばし、その先端に「フェンス内の最端データ」と注記 → ひげの外側に小さな丸を2〜3個打って「外れ値」 → 箱の外側に点線でフェンス Q11.5Q_1-1.5IQR と Q3+1.5Q_3+1.5IQR の位置を示し、フェンスとひげ先が別物であることを矢印で強調。 実際の見た目は下の「対応するシミュレーション」で出力した箱ひげ図の画像(hakohige_iqr_hazurechi_boxplot.png)を見てください。赤い点が外れ値です。

ひげの2つの流派 ── 素朴版とTukey版(試験で問われるのはこちら)

ここが最初の引っかけポイントです。「ひげをどこまで伸ばすか」には2つの流派があります。

流派ひげの先端外れ値の扱い使われ方
素朴版(skeletal)最小値・最大値まで伸ばす外れ値という概念がない(全データがひげの中)簡易・小学/中学の導入
Tukey版(schematic・modified)フェンス内の最も端のデータ点までフェンスを越えた点を外れ値として個別に打つ現代の標準・試験で問われる

現代の統計やソフト(matplotlib・R・Excelなど)の箱ひげ図は、ほぼすべてTukey版です。統計検定で「外れ値」を扱う問題もTukey版が前提です。

頻出の誤解:ひげの先=フェンスではない

最も間違えやすいのがここです。**ひげの先端は「フェンスそのもの」ではなく、「フェンスの内側にある実データの最も端の点」**です。

たとえば上側フェンスが 76.976.9 だったとして、フェンス内の最大のデータが 74.274.2 なら、ひげの先は 74.274.2 で止まります76.976.9 まで伸びるのではない)。フェンスはあくまで「ここから外は外れ値」という判定用の見えない線であって、ひげの先がそこに来るわけではありません。「ひげの長さ = 必ず 1.5×1.5\timesIQR」と覚えてしまうと間違えます。ひげの長さはデータ次第で、最大でも 1.5×1.5\timesIQR ぶんですが、たいていそれより短くなります。

外れ値の判定 ── 1.5×IQRルール

外れ値の判定手順は次の3ステップだけです。

ステップやること
1IQR を求めるIQR=Q3Q1\text{IQR} = Q_3 - Q_1
2フェンスを計算する下:Q11.5×IQRQ_1 - 1.5\times\text{IQR}/上:Q3+1.5×IQRQ_3 + 1.5\times\text{IQR}
3フェンスの外側を外れ値とするx<Q11.5IQRx < Q_1-1.5\text{IQR} または x>Q3+1.5IQRx > Q_3+1.5\text{IQR}
flowchart LR
    A["四分位数 Q1・Q3 を求める"] --> B["IQR = Q3 − Q1"]
    B --> C["下側フェンス = Q1 − 1.5×IQR<br/>上側フェンス = Q3 + 1.5×IQR"]
    C --> D{"データはフェンスの<br/>外側か?"}
    D -->|外側| E["外れ値"]
    D -->|内側| F["通常のデータ<br/>(ひげの中)"]

↑ 外れ値判定の流れ。四分位数 → IQR → フェンス → 範囲外を外れ値、という一直線の手順です。

極端な外れ値(3×IQR)

係数を 3.0 にした Q13×IQRQ_1 - 3\times\text{IQR}Q3+3×IQRQ_3 + 3\times\text{IQR} を**外側フェンス(outer fence)**と呼び、これを越える値を「極端な外れ値(far out)」とする流儀もあります。Tukey本人の用語では、1.5×1.5\timesIQR の内側フェンスと 3×3\timesIQR の外側フェンスの間にある点を「外れ値(outside)」、外側フェンスを越える点を「極端な外れ値(far out)」と区別します。3級では基本の 1.5×1.5\timesIQR を押さえれば十分ですが、「3×3\timesIQR はさらに極端な値だけを拾う厳しい基準」という対比だけ知っておくとよいです。

箱ひげ図からの分布の読み取り

箱ひげ図は、形から分布の特徴を読み取れます。試験でも「この箱ひげ図はどんな分布か」を問う問題が出ます。

中央値の偏りで歪みを読む直観

なぜ「中央値が箱の下寄り → 右に裾」なのか。中央値は箱をデータ数で半分ずつに区切る線です。中央値が Q1Q_1 寄り(箱の左寄り)にあるということは、Q2Q_2 から Q3Q_3 までの区間が Q1Q_1 から Q2Q_2 までより横に広いということ。つまり上側(大きい値の側)のデータが横に間延びして広がっている = 右側に裾が長い、というわけです。「データが詰まっている側に中央値が寄り、間延びしている側に裾ができる」と覚えてください。

箱ひげ図の限界 ── 二峰性は見えない

箱ひげ図の弱点は、5数要約に圧縮するぶん、分布の細かい形が消えることです。とくに重要なのが二峰性(山が2つある分布)を隠してしまうこと。

前トピック 散らばり(ばらつき)の指標 ── 範囲・四分位範囲・分散・標準偏差・変動係数(なぜ偏差を2乗するか/なぜn−1で割るか) の例を思い出してください。「平均60点で、30点と90点に真っ二つ」のクラス。このデータの箱ひげ図は、「ほどよく中央に中央値があり、左右にひげが伸びた、ごく普通の単峰の分布」と見分けがつきません。山が2つあるか1つあるかは、5数要約だけでは原理的に判別できないのです。

**山が2つあるか・分布が滑らかか凸凹かを見たいときは、ヒストグラム(→ 度数分布表とヒストグラム ── 階級・相対度数・累積度数とスタージェスの公式)**を使います。箱ひげ図は「複数群をざっくり一括比較する」のに強く、ヒストグラムは「1つの分布の形を細かく見る」のに強い。用途で使い分けるのが正解で、どちらが上ということはありません。

数式の直観的意味

ここからが本トピックの理論的な肝です。2つの「なぜ」を潰します。

1. なぜ係数が「1.5」なのか(約±2.7σ・全体の約0.7%)

結論:正規分布のデータだと、1.5×1.5\timesIQR のフェンスがちょうど約±2.7σの位置に来て、外れ値になるのは全体の約0.7%(片側約0.35%)だけ。「拾いすぎず・見逃しすぎない」絶妙なバランスだから、Tukeyはこの値を選びました。

順を追って計算します。正規分布を仮定すると、四分位数は標準偏差 σ\sigma で次のように書けます(標準正規分布で下から25%・75%に当たる点が z±0.674z\approx\pm0.674 だから)。

Q1μ0.674σ,Q3μ+0.674σQ_1 \approx \mu - 0.674\sigma, \qquad Q_3 \approx \mu + 0.674\sigma

これは「正規分布では Q1Q_1 は平均より 0.674σ0.674\sigma 下、Q3Q_30.674σ0.674\sigma 上にある」という意味です。すると IQR は

IQR=Q3Q1(0.674(0.674))σ=1.349σ\text{IQR} = Q_3 - Q_1 \approx (0.674 - (-0.674))\sigma = 1.349\sigma

「正規分布では IQR は標準偏差の約1.35倍」ということ。これを使って上側フェンスを計算します。

Q3+1.5×IQR0.674σ+1.5×1.349σ=0.674σ+2.024σ2.698σQ_3 + 1.5\times\text{IQR} \approx 0.674\sigma + 1.5\times 1.349\sigma = 0.674\sigma + 2.024\sigma \approx 2.698\sigma

(平均 μ\mu を基準にした σ\sigma 単位の表記です。)つまり上側フェンスは平均から約 +2.7σ+2.7\sigma、下側フェンスは約 2.7σ-2.7\sigma の位置に来ます。正規分布で**±2.698σより外側にある確率は、両側合わせて約0.7%(片側約0.35%)**。要するに「正規分布のデータなら、1.5×1.5\timesIQRルールはごく一部(1%未満)だけを外れ値とみなす」ということです。

なぜ 1.51.5 がちょうどよいか、他の係数と比べると一目です。

係数フェンスの位置(σ単位)性質
1.01.0±2.0σ\pm 2.0\sigma厳しすぎ(外れ値を拾いすぎる)
1.51.5±2.7σ\pm 2.7\sigmaちょうどよい(正規データで約0.7%)
3.03.0±4.7σ\pm 4.7\sigma緩すぎ(極端な値しか拾わない・far out用)

係数 1.01.0 だと ±2σ\pm 2\sigma(正規分布で約4.6%が外れ値)になり、正常なデータまで外れ値扱いしてしまう。係数 3.03.0 だと ±4.7σ\pm 4.7\sigma(ほぼ0%)で、よほど極端な値しか拾わない。1.51.5 は両者の中間で、正規分布の常識(3σルール=約±3σにほぼ全データが入る)にも近い。これが「1.51.5 は理論的にきっちり導かれた値というより、正規分布で都合のよい実用的な閾値としてTukeyが選んだ」と言われる理由です。

なお「1.51.5 に厳密な必然性があるわけではない」点は誤解しないでください。1.51.5正規分布を念頭に置いた経験的な選択であって、データが正規分布から大きくずれる(強く歪む・裾が重い)と「約0.7%」は成り立ちません。歪んだデータでは 1.5×1.5\timesIQR が片側だけ外れ値を量産することもあります。

2. なぜ四分位ベースの判定は外れ値に強いのか

結論:Q1,Q3,IQRQ_1, Q_3, \text{IQR} はすべて順位(位置)ベースなので、判定の基準そのものが外れ値に汚染されない。 これは前トピック 散らばり(ばらつき)の指標 ── 範囲・四分位範囲・分散・標準偏差・変動係数(なぜ偏差を2乗するか/なぜn−1で割るか) で見た「中央値・四分位範囲が外れ値に強い(頑健)」性質の、外れ値判定への応用です。

対比すると分かりやすいです。外れ値判定にはもう一つ「平均 ±kσ\pm k\sigma を越えたら外れ値」という方法(k=2k=2k=3k=3)があります。しかしこの方法には自己矛盾があります。

一方、1.5×1.5\timesIQRルールは Q1,Q3Q_1, Q_3(順位ベース)だけを使います。順位ベースの量は、上下25%ずつを捨てているので、極端な値が混じっても基準がほとんど動かない。だから「外れ値があっても基準が歪まず、外れ値を正しく外れ値と判定できる」。これが四分位ベースの判定が頑健(ロバスト)である理由です。「基準を測る道具が、測りたい外れ値に汚されていない」と理解してください。

⚠️ 引っかけポイント・頻出論点・級ごとの差

よくある疑問

Q1. ひげの先端はフェンス(Q3+1.5Q_3+1.5IQR)と同じ位置じゃないの?

**違います。ひげの先端は「フェンスの内側にある実データの最も端の点」**です。

フェンスは「ここから外は外れ値」という判定用の見えない線で、ひげの先がそこに来るとは限りません。上側フェンスが 76.976.9 でも、フェンス内の最大データが 74.274.2 なら、ひげは 74.274.2 で止まります。ひげの長さは最大でも 1.5×1.5\timesIQR ぶんですが、たいていそれより短くなります(データがフェンスぎりぎりに無い限り)。「ひげ=必ず 1.5×1.5\timesIQRの長さ」という思い込みが失点の原因になります。

Q2. 外れ値は「異常値(捨てるべき間違ったデータ)」ということ?

いいえ。「外れ値(outlier)」は統計的な基準で『他から離れている』というだけで、『間違っている』『捨てるべき』という意味ではありません。

1.5×1.5\timesIQRルールは「フェンスの外」という機械的な基準で点を拾うだけです。その点が測定ミスや入力ミスなら除外を検討すべきですが、本物の珍しい値(例:本当に身長が高い人、本当に高額な取引)なら貴重な情報で、勝手に捨ててはいけません。外れ値を見つけたら「なぜこの値が出たのか」を調べるのが正しい対応で、自動的に削除するのは誤りです。「外れ値 ≠ 異常値・誤データ」と覚えてください。

Q3. 係数の 1.51.5 には数学的な必然性があるの?

厳密な必然性はありません。正規分布を念頭に置いたTukeyの経験的な選択です。

本文で見たとおり、正規分布だと 1.5×1.5\timesIQR が約±2.7σ・外れ値約0.7%という「ちょうどよい」値になります。1.01.0 だと拾いすぎ、3.03.0 だと拾わなさすぎ。その中間で実用的だから 1.51.5 が標準になった、という経緯です。データが強く歪んでいたり裾が重い分布だと「約0.7%」は成り立たないので、1.51.5 を絶対の真理だと思わないことが大事です(歪んだデータ向けに係数を調整する手法もあります → 準1級以降のロバスト統計)。

Q4. 箱ひげ図とヒストグラム、どっちを使えばいいの?

用途が違うので使い分けます。どちらが上ということはありません。

「複数グループをざっくり比べたい → 箱ひげ図」「1つの分布の形を詳しく見たい → ヒストグラム」と覚えてください。実務では両方を併用することも多いです。

Q5. 「平均±3σで外れ値」と「1.5×1.5\timesIQR」はどう違う? どっちがいい?

判定基準の頑健性が違います。外れ値を含むデータでは 1.5×1.5\timesIQR(四分位ベース)のほうが信頼できます。

「平均±kσk\sigma」方式は、判定に使う σ\sigma外れ値で膨らんでしまうため、外れ値が自分自身を隠す(マスキング)危険があります(本文「数式の直観的意味」参照)。一方 1.5×1.5\timesIQR は順位ベースの Q1,Q3Q_1, Q_3 だけを使うので、基準が外れ値に汚染されない。だから外れ値の検出には四分位ベースのほうが向いています。ただし「データが正規分布に近い」とわかっていて外れ値も少ないなら、±3σ方式でも実用上は大きな問題は起きません。外れ値の有無や分布の素性が不明なときは 1.5×1.5\timesIQR が安全、と覚えておきましょう。

まとめ

四分位数を図に落とし込み、外れ値を判定する道具がそろいました。次は、データを共通のものさしに乗せ替える標準化(zz得点)・偏差値・チェビシェフの不等式へ進みます(→ 標準化(z得点)・偏差値・チェビシェフの不等式 ── 標準化≠正規化/偏差値に上限なし/どんな分布でも成り立つ歯止め)。

対応するシミュレーション

1.5×IQRルールによる箱ひげ図と外れ値(赤い点)

ヒストグラムにフェンスの赤縦線・外側の裾が外れ値領域

関連ノート