スケールフリー（Barabási–Albert）

🎓 レベル：発展　|　重要度：A（必須）

📎 前提：次数中心性と次数分布・Erdős–Rényiランダムグラフ　|　関連：攻撃耐性とロバスト性

要点（BLUF）

スケールフリー：次数分布がべき則 $P(k)\sim k^{-\gamma}$ に従い、少数の巨大ハブと多数の低次数ノードが共存する。
Barabási–Albertモデル：①成長（ノードが増える）＋②優先的選択（新ノードは高次数ノードに繋がりやすい）からべき則が創発する。
「金持ちはより金持ちに」のメカニズムが、Web・引用・タンパク質など実ネットワークのハブを説明する。

概念：ハブはどこから来るのか

ER（Erdős–Rényiランダムグラフ）にはハブが出ません。でも現実の Web や引用ネットワークには、桁違いに次数の大きいノード（Google、超有名論文）が必ずいる。このハブの起源を、たった2つの原理で説明したのが Barabási–Albert モデルです。鍵は「ネットワークは静的でなく成長する」「新参者は人気者に繋がりたがる」という動的な視点。

モデルの定義

成長：小さな初期グラフから始め、毎ステップ新しいノードを1個追加する。新ノードは既存ノードへ $m$ 本のエッジを張る。
優先的選択（preferential attachment）：新ノードが既存ノード $i$ に繋ぐ確率は、 $i$ の次数に比例する。

\Pi(i) = \frac{k_i}{\sum_j k_j}

次数が高いノードほど新しいリンクを獲得しやすい。すると「先行者が雪だるま式に次数を増やす」正のフィードバックが働き、巨大ハブが生まれます。

この過程の定常状態での次数分布は、解析的にべき則になることが示せます。

P(k) \sim k^{-\gamma}, \qquad \gamma = 3

「スケールフリー」の名は、べき則が特徴的なスケール（典型的な次数）を持たないことに由来します。平均のまわりに集中するポアソン（ER）とは対照的です。

コードで確認

import networkx as nx
import numpy as np

# BA: 2000ノード、各新ノードが2本繋ぐ
G = nx.barabasi_albert_graph(2000, 2, seed=3)
degs = np.array([d for _, d in G.degree()])
print("BA: 平均次数=", round(degs.mean(),2), " 最大次数=", degs.max(),
      " 次数>50のノード数=", int((degs > 50).sum()))

# 同じ密度の ER と比べる
m_edges = G.number_of_edges()
p = 2*m_edges / (2000*1999)
ER = nx.erdos_renyi_graph(2000, p, seed=3)
er_degs = np.array([d for _, d in ER.degree()])
print("同密度ERの最大次数=", er_degs.max(), "(ハブが出ない)")

実行結果：

BA: 平均次数= 4.0  最大次数= 73  次数>50のノード数= 8
同密度ERの最大次数= 12 (ハブが出ない)

平均次数は両者とも約4。なのに BA の最大次数は 73（平均の18倍のハブ）で、次数50超のハブが8個も存在。同じ密度の ER では最大でも12止まり。成長＋優先的選択というメカニズムだけで、ハブが自然発生することが数値で確認できます。

メカニズムの図解

graph TD
    New["新ノード（参加）"] -->|"確率 ∝ 次数"| Hub["高次数ノード（ハブ）"]
    New -.->|"確率小"| Low["低次数ノード"]
    Hub -->|"次数がさらに増える"| Hub

数式の直観的意味

優先的選択 $\Pi(i) \propto k_i$ は「金持ちはより金持ちに（rich-get-richer）」の数式表現です。すでにリンクを多く持つノードは、新しいリンクを得る確率も高い。この自己強化が、次数の格差を指数的に拡大させ、べき則の重い裾を生みます。指数 $\gamma=3$ は「成長」と「次数比例」が釣り合う点から導かれる値で、現実ネットワークでは $2 < \gamma < 3$ がよく観測されます。スケールフリー性は、ロバスト性（ランダム故障に強いが標的攻撃に弱い、攻撃耐性とロバスト性）に直結します。

⚠️ よくある誤解・落とし穴

「べき則っぽい」だけでスケールフリーと断定しない：対数正規分布など他の重い裾分布と区別するには、統計的検定（最尤推定＋Kolmogorov–Smirnov）が必要。「直線に見える」は証拠として弱いです。
優先的選択だけがべき則の原因ではない：適応度モデルや複製モデルなど、べき則を生む機構は複数あります。
BA はクラスタ係数が低い：成長＋優先選択は三角形をあまり作らない。高クラスタも欲しいなら別の機構が要ります。

対応シミュレーション

本文のコードがそのまま検証用です。ハブとロバスト性の関係は攻撃耐性とロバスト性。