Docs Menu
Docs Home
/ /

リージョン停止のシミュレーション

注意

この機能は、次の配置では使用できません。

  • M0 無料クラスター

  • Flex クラスター

詳しくは、「 の制限 」を参照してください。

Atlas UIと APIを使用して、Atlasマルチリージョンクラスターの停止時をシミュレートし、アプリケーションが1 つ以上のリージョンで停止時をどのように処理するかを確認できます。複数のシミュレーションを実行することもできます。複数のシミュレーションを実行中場合は、シミュレーション間隔を 5 分にすることをお勧めします。

停止時シミュレーションを開始するには、プロジェクトに対するOrganization OwnerまたはProject Ownerアクセス権が必要です。

Atlas UI またはAPIを使用して停止をテストするためのリクエストを送信すると、Atlas は停止イベントをシミュレートします。 シミュレートされた停止中、Atlas は次のように動作します。

  • 選択したリージョン内のノードへのネットワーク接続を削除します。

  • のモニタリング triggerアラートは されReplica set has no primary ません 。

  • 設定可能な有効期限(1、3、または 7 日)の経過後にシミュレーションを自動的に終了します。

アプリケーションが一部のノードへの接続が失われたことを認識するまでに15分以上かかる場合は、 TCP再送信タイムアウト値を減らすことをお勧めします。 詳しくは、 が tcp_retry 2値を変更するのを参照してください。

Atlas UI でリージョン停止をシミュレートするには、次の手順に従います。

1
  1. まだ表示されていない場合は、希望するプロジェクトを含む組織を選択しますナビゲーション バーのOrganizationsメニュー

  2. まだ表示されていない場合は、ナビゲーション バーのProjectsメニューから目的のプロジェクトを選択します。

  3. サイドバーで、 Database見出しの下のClustersをクリックします。

[ Clusters (クラスター) ] ページが表示されます。

2
  1. 停止テストを実行するクラスターについては、 ...ボタンをクリックします。

  2. [Test Resilience] をクリックします。

  3. Regional Outageを選択します。 Atlas には、停止イベントをシミュレートするために Atlas が実行する手順を含むTest Resilienceモーダルが表示されます。 詳細については、「リージョン停止プロセスのシミュレート 」を参照してください。

3
  1. [Select Regions] をクリックします。

  2. シミュレートする停止のタイプに対応するタブを選択します。

    選択可能なノードの半分より少なく選択します。

    選択可能なノードの半分以上を選択し、少なくとも 1 つの選択可能なノードを残ります。

    選択可能なノードの過半数を選択すると、レプリカセットにはプライマリ ノードがなくなります。 つまり、レプリカセットでは、適切なreadPreference が設定されていない書込み操作および読み取り操作を実行できません。

  3. (任意)Simulation Duration ドロップダウンから、自動的に期限切れになる前に実行するシミュレーション期間を選択します。この値のデフォルトは 3 日です。

  4. テストを開始するには、 Simulate Regional Outageを選択します。

    Atlas は停止が発生すると通知します。

4

シミュレーションは、Simulation Duration に設定された期間に達すると自動的に終了します。早期にシミュレーションを手動で終了することもできます。

注意

Atlas は期限切れのシミュレーションを 24 時間ごとにチェックするため、シミュレーションが完全に解決されるまでに、有効期限の後の追加で最大 日がかかる場合があります。

実行している停止のタイプに対応するタブを選択します。

停止時テストが終了したら、 End Simulationをクリックします。

リージョン停止のテストが終了したら、次のいずれかを実行できます。

停止時テストAPIエンドポイントを使用して、停止時イベントをシミュレートできます。 停止プロセスの詳細については、「リージョン停止プロセスのシミュレート 」を参照してください。

停止が成功したことを確認するには、アプリケーションをモニターして、読み取りおよび書込み操作が期待どおりに動作していることを確認します。

シャーディングされたクラスター内の最も優先度の高いリージョンに影響するリージョン停止時またはリージョン停止時シミュレーションにより、クラスターが読み取り操作を実行できなくなる可能性があります。コンフィギュレーションサーバーを復元するには、次の手順を実行します。

戻る

プライマリ フェールオーバーをテストする

項目一覧