2024年11月15日、世界最大級のCRMプラットフォームであるセールスフォース(Salesforce)で大規模な障害が発生しました。
https://www.itmedia.co.jp/news/articles/2411/15/news188.html
この障害により、多くの企業や組織の業務に支障が出ており、ビジネス界に大きな波紋を広げています。
セールスフォース障害の概要
セールスフォースの障害は日本時間11月15日午後2時55分頃から発生し、世界中のユーザーに影響を及ぼしています。
多くのユーザーがセールスフォースにログインできない状態に陥り、重要な顧客データにアクセスできないなど、業務に深刻な影響が出ています。
障害の原因と影響範囲
データベース接続の異常増加
セールスフォースの技術チームによると、この障害の主な原因は最近適用された変更により、データベース接続が異常に増加したことだと報告されています。
https://forest.watch.impress.co.jp/docs/news/1640011.html
具体的には、データベースの安定性に影響を与えるほどの高レベルのネットワークトラフィックが観測されたとのことです。
影響を受けたデータセンター
この障害は、セールスフォースが運用する複数のデータセンターに影響を及ぼしています。
具体的には、IT3、IT4、IA7、HN3、HN4の5つのデータセンターのインスタンスが影響を受けていることが報告されています。
これらのデータセンターは、世界中の顧客にサービスを提供しており、障害の影響が広範囲に及んでいることを示しています。
https://cafe-dc.com/security/ssalesforce-service-disruption-causes-outage-at-five-data-centers
グローバルな影響
この障害は日本だけでなく、全世界で発生しているとみられます。
セールスフォースは世界中の企業や組織で利用されているため、この障害のグローバルな影響は計り知れません。
例えば、アメリカやヨーロッパの企業でも同様の問題が報告されており、国際的なビジネス活動に支障をきたしています。
他のクラウドサービスへの影響
セールスフォースの障害は、他のクラウドサービスにも波及効果をもたらしています。
特に、セールスフォースと連携している多くのサードパーティアプリケーションやサービスが影響を受けています。
公共サービスへの影響
例えば、三重県の防災情報サイト「防災みえ.jp」が閲覧できなくなるなど、公共サービスにも影響が出ています。
https://www.chunichi.co.jp/article/986793
これは、多くの組織がセールスフォースのプラットフォームを基盤として様々なサービスを構築していることを示しています。
ビジネスエコシステムへの影響
セールスフォースは単なるCRMツールではなく、多くの企業のビジネスプロセスの中核を担っています。
そのため、この障害は顧客管理だけでなく、営業活動、マーケティング、カスタマーサポートなど、企業活動の広範囲に影響を及ぼしています。
例えば、セールスチームが顧客情報にアクセスできない、マーケティングチームがキャンペーンデータを取得できないなど、日々の業務に大きな支障が出ています。
セールスフォースの復旧見通し
現時点(2024年11月16日10時(日本時間))で、セールスフォースの完全な復旧の見通しは立っていません。
セールスフォースの技術チームは懸命に復旧作業を行っていますが、問題の複雑さから時間がかかっているようです。
復旧への取り組み
セールスフォースは11月15日午後5時15分頃から影響を緩和する措置を開始しました。
具体的には、過剰なトラフィック、ネットワーク利用率、およびデータベースの安定性を制御するための対策を講じています。
また、データベースチームは影響を受けたデータベースを分析し、一部の不整合を特定、最新の安定したバックアップへの復元作業を行っています。
復旧の難しさ
セールスフォースのようなグローバルで複雑なシステムの復旧には、単純なリブートや再起動では対応できません。
データの整合性を保ちながら、世界中のデータセンターを同期させる必要があります。
また、復旧後のパフォーマンス低下や二次的な問題を防ぐためにも、慎重な対応が求められます。
ユーザーへの影響
復旧の遅れは、多くのユーザー企業に深刻な影響を与えています。
特に、月末や四半期末などの重要な業務時期と重なった場合、財務報告や営業目標の達成に大きな支障をきたす可能性があります。
Salesforce障害発生時の対策
セールスフォースのような重要なクラウドサービスに障害が発生した場合、企業はどのように対応すべきでしょうか。以下に、いくつかの重要な対策を提案します。
1. 代替手段の準備
セールスフォースに依存しすぎないよう、重要なデータや機能のバックアップを別のシステムに保持しておくことが重要です。
例えば、顧客連絡先情報を定期的にエクスポートし、オフラインでも参照できるようにしておくことで、緊急時の業務継続が可能になります。
2. コミュニケーション計画の策定
障害発生時に、社内外のステークホルダーとどのようにコミュニケーションを取るかを事前に計画しておくことが重要です。
例えば、顧客への連絡方法、社内での情報共有手段などを明確にしておくことで、混乱を最小限に抑えることができます。
3. マニュアルプロセスの準備
クラウドサービスに依存している業務プロセスについて、一時的にマニュアルで対応できる手順を準備しておくことも有効です。
例えば、受注処理や在庫管理などの基本的な業務を、一時的に紙ベースやスプレッドシートで管理できるようにしておくことで、業務の継続性を確保できます。
4. リスク分散
単一のクラウドサービスに全面的に依存するのではなく、複数のサービスを組み合わせてリスクを分散させることも検討すべきです。
例えば、CRM機能とマーケティング機能を異なるプロバイダーのサービスで運用するなど、障害の影響を局所化する戦略が有効です。
5. 定期的な訓練と見直し
障害対応計画を策定するだけでなく、定期的に訓練を行い、実効性を確認することが重要です。
また、クラウドサービスの利用状況や業務プロセスの変化に合わせて、対策を適宜見直すことも忘れてはいけません。
クラウドサービスの信頼性と課題
今回のセールスフォースの障害は、クラウドサービスの信頼性と課題について、改めて考えさせられる機会となりました。
クラウドサービスの利点
クラウドサービスは、スケーラビリティ、コスト効率、アクセシビリティなど、多くの利点を提供します。
セールスフォースのような大規模なプラットフォームは、通常、高度な冗長性と堅牢なインフラストラクチャを備えており、個々の企業が自前で構築するよりも高い信頼性を提供しています。
集中リスク
一方で、多くの企業が同一のクラウドサービスに依存することで、「集中リスク」が生じています。
今回の障害のように、一つのプラットフォームの問題が世界中の企業に影響を及ぼす可能性があります。
これは、クラウドコンピューティングの時代における新たなリスクと言えるでしょう。
透明性の重要性
クラウドサービスプロバイダーには、障害発生時の迅速かつ透明性の高い情報開示が求められます。
セールスフォースは今回、公式チャネルを通じて定期的に更新情報を提供していますが、より詳細な技術情報や復旧の見通しについての説明が求められています。
レジリエンスの構築
企業は、クラウドサービスの利便性を享受しつつ、同時にレジリエンス(回復力)を高める必要があります。
これには、重要なデータやプロセスのバックアップ、代替システムの準備、そして従業員のトレーニングなどが含まれます。
まとめ
セールスフォースの大規模障害は、現代のビジネスがいかにクラウドサービスに依存しているかを如実に示しました。
この事態は、クラウドサービスの利点と同時に、そのリスクも浮き彫りにしています。
企業は、クラウドサービスを活用しつつも、障害発生時のリスクを最小限に抑えるための戦略を持つことが重要です。
また、クラウドサービスプロバイダーには、より高い信頼性と透明性が求められています。
今回の障害を教訓として、企業はビジネス継続性計画を見直し、クラウドサービスの利用戦略を再考する良い機会となるでしょう。
技術の進化とともに、私たちのビジネスのあり方も進化し続ける必要があります。