🗺️ このノートは 第6章「レプリケーションとパーティショニング」のハブ です。
第6章 ── レプリケーションとパーティショニング
データを増やす方向の2大技術です。レプリケーション(複製)は同じデータを複数ノードに持ち、可用性と読み性能を上げる。パーティショニング(分割)はデータを分けて持ち、容量と書き性能を伸ばす。実システムは両方を組み合わせます。この章は、複製の方式(同期/非同期・リーダー/リーダーレス)と、その正しさを支えるクォーラム条件 R+W>N、データを分けるシャーディング、ノード増減に強い一貫性ハッシュ、そしてメンバー管理と収束を支えるゴシップ・故障検出までを、最小シミュで実証しながら扱います。
通底するテーマは「重なり(クォーラム)で一貫性を買い、分割でスケールを買う」。両者のトレードオフを定量的に掴むのが目標です。
トピック一覧
- レプリケーション方式(同期/非同期・リーダー/リーダーレス) — 複製の4象限と衝突
- クォーラム(R+W>N) — 重なりで一貫性を作る
- パーティショニング/シャーディング — 範囲分割とハッシュ分割
- 一貫性ハッシュ — 再配置を最小化する
- ゴシップ・反エントロピー・故障検出(SWIM) — 中央なしで揃え、壊れを見つける
この章の位置づけ
- 強一貫の複製は前章 Raft の合意で、弱い複製は PACELC・結果整合性 の収束機構で
- 衝突検出は ベクトル時計、CAPの位置づけは CAP定理
- Spark等の分散処理実装は データエンジニアリング へ。ここは複製・分割の理論