Mímisbrunnr知恵の泉

← クラウドインフラ 一覧

🗺️ このノートは 第7章「監視と可観測性」のハブ です。

第7章 ── 監視と可観測性

動かして・届けたシステムが本当に健全かを知る手段が可観測性(observability)です。可観測性とは「出てくる信号(メトリクス・ログ・トレース)から、中で何が起きているかを推し量れる度合い」。これが無ければ、障害は「ユーザーからの苦情」で初めて気づくことになります。SRE(第8章 SREと信頼性 目次)の SLO もアラートも、すべてここで集める信号の上に立ちます。

この章では、信号の3本柱(メトリクス・ログ・トレース:07-01)、人を起こすに値するアラートの設計(07-02)、サービスをまたぐ1リクエストの追跡(分散トレーシング:07-03)を順に見ます。

トピック一覧

この章の位置づけ

クラウド・インフラ/SRE・DevOps 全体目次