Google、12月14日の約45分間ダウンの原因と対策を詳解

米Googleは12月18日(現地時間)、12月14日の約45分間にわたる多数のサービスダウンの原因と今後の対策について、ステータスダッシュボードで説明した。
大まかに要約すると、根本的な原因は、10月にユーザーIDサービスを新しいクォータシステムに登録するための変更を行ったが、その際に古いクォータシステムの一部が残ってしまい、誤った報告があったことという。
意図しないクォータ変更を防止するための安全性チェックはあったが、単一のサービスで負荷がゼロと報告されるシナリオは想定していなかったため、猶予期間中にアラートが発生せず、ユーザーIDシステムでの読み取り操作ができなくなり、エラーが発生した。
午前3時46分に発生したこのエラーアラートで問題が検出され、午前4時8分には原因と修正方法が特定されたが、完全に回復するのには時間がかかった。今後は、割り当て管理の自動化の変更をすぐに実装しないようにし、監視とアラートのシステムを改善するなどの複数の対策を追加する。

引用:https://www.itmedia.co.jp/news/articles/2012/21/news049.html

─ YODOQの見方───────────────────────────

今回発生した障害によりGmailやYouTubeが見られない等、困った方も多いのではないでしょうか。
こうした不測の事態には正しい情報を得ることが大切です。Googleのサービスにおいてどのサービスがダウンしているのかは以下のダッシュボードで確認することができます。

Google Workspace ステータス ダッシュボード
GoogleCloudステータスダッシュボード

各サービスに対し、以下の3色でステータスを表しています。
緑:問題なし
橙:サービス障害
赤:サービス停止

サービス障害やサービス停止に関しては履歴が残っており、調査中であることや復旧の見込みなど詳細な報告を確認することができます。世界規模でサービスを提供するGoogleのサービスダウンの影響は大きく、また時差もあるため活動時間帯で障害に見舞われた地域もあるでしょう。通常、ユーザーにも影響を与える可能性のあるシステムの変更などは、ユーザーの利用が最も少ないだろう時間帯を見極めて、実行することが多いのですが、マーケット規模が世界となるとそう単純な話ではなくなります。
いつも利用しているサービスが突然、利用できなくなった時、自分だけが利用できなくなったのではないか?あるいは、自分が何らかの操作を誤ったからではないのか?と不安になったりもするかもしれません。いたずらに検索しても、不確かな情報に振り回される可能性もあります。
そうならないためにもユーザー側は、不測の事態に備え、正しい情報を得るための方法を把握しておく必要もあるのではないでしょうか。

参考:https://news.mynavi.jp/article/20201215-1593111/