/ /

/ /

プライマリフェールオーバーをテストする

注意

この機能は、無料クラスターと Flex クラスターでは使用できません。使用できない機能の詳細については、Atlas 無料クラスターの制限を参照してください。

Atlas は、パッチの更新、スケーリングイベント、および障害が発生した場合に、構成を変更する際にレプリカセットの選挙を実行します。アプリケーションでは、ダウンタイムなしでレプリカセットの選挙を処理する必要があります。回復力のあるアプリケーションを構築する方法については、「 MongoDB Atlas で回復力のあるアプリケーションを構築する」を参照してください。

URI 接続に retryWrites=true Atlasstringを追加することで、再試行可能な書き込みを有効にすることができます。詳細については、「再試行可能な書込み」を参照してください。

Atlas UIとAPIを使用して、Atlas クラスター内のレプリカセットプライマリの障害をテストし、アプリケーションがレプリカセットのフェイルオーバーをどのように処理するかを確認できます。

必要なアクセス権

フェイルオーバーテストを開始するには、プロジェクトに対するOrganization Owner 、 Project Owner 、 Project Cluster Manager 、またはProject Stream Processing Ownerのアクセス権が必要です。

前提条件

レプリカセットプライマリの障害をテストする前に、次の条件を満たす必要があります。

クラスターに対するすべての保留中の変更が完了している必要があります。
クラスターのすべてのノードは、最新のモニタリングデータを使用して正常な状態である必要があります。
各レプリカセットまたはシャードにはプライマリノードが必要です。
クラスターのすべてのノードのレプリケーションラグは 10 秒未満である必要があります。
クラスターのすべてのノードは、使用可能なディスク領域の 5% 以上が残っている必要があります。
すべてのプライマリノードの oplog には 3 時間の操作に十分なスペースが必要です。

プライマリフェイルオーバープロセスのテスト

重要

プライマリフェイルオーバーをテストする前に、Atlas クラスターが正常であることを確認してください。そうしないと、Atlas がリクエストを拒否する可能性があります。

プライマリフェイルオーバーをテストするリクエストを送信すると、Atlas はフェイルオーバーイベントをシミュレートします。このプロセス中:

Atlas は現在のプライマリをシャットダウンします。
レプリカセットのノードは、どのセカンダリが新しいプライマリになるかを選出するために選挙を行います。平均して、選挙には約5秒かかります。
Atlas は元のプライマリをセカンダリとしてレプリカセットに戻します。古いプライマリがレプリカセットに再参加すると、新しいプライマリと同期して、ダウンタイム中に発生したすべての書込み (write) をキャッチアップします。

次のステートメントは、ロールオーバー中とシャーディングされたクラスターでフェイルオーバーをテストする際の Atlas の動作を説明します。

プライマリの降格時に、元のプライマリが受け入れた書き込み (write) 操作がセカンダリに正常に複製されなかった場合、プライマリはレプリカセットに再度参加して同期を開始するときに、それらの書き込み (write) 操作をロールバックします。学ぶには、「Atlas のフェイルオーバー中のロールバック」を参照してください。
シャーディングされたクラスター内のレプリカセットのプライマリと同じインスタンス上のmongosプロセスのみが再起動されます。
シャーディングされたクラスター内のレプリカセットのプライマリは並行して再起動されます。

Atlas CLI を使用してプロジェクト内の指定されたクラスターのフェイルオーバーテストを開始するには、次のコマンドを実行します。

atlas clusters failover <clusterName> [options]

コマンド構文とパラメータの詳細については、 Atlasクラスターのフェイルオーバーに関する Atlas CLI ドキュメントを参照してください。

フェイルオーバーAPIエンドポイントを使用して、フェイルオーバーイベントをシミュレートできます。フェイルオーバープロセスの詳細については、「フェイルオーバープロセスのテスト」を参照してください。

Atlas UI を使用してプライマリフェイルオーバーテストを実行するには、次の手順に従います。

Atlas で、プロジェクトの [Clusters] ページに移動します。
1. まだ表示されていない場合は、希望するプロジェクトを含む組織を選択しますナビゲーションバーのOrganizationsメニュー
2. まだ表示されていない場合は、ナビゲーションバーのProjectsメニューから目的のプロジェクトを選択します。
3. サイドバーで、 Database見出しの下のClustersをクリックします。
  [ Clusters （クラスター） ] ページが表示されます。
フェイルオーバーテストを実行するクラスターについては、 ...ボタンをクリックします。
[Test Resilience] をクリックします。
Test Resilienceモーダルで、 Primary Failoverタブをクリックします。 Atlas には、フェイルオーバーイベントをシミュレートするのに必要な手順が表示されます。詳細については、「フェイルオーバープロセスのテスト」を参照してください。
テストを開始するには、 Restart Primaryをクリックします。 Atlas では、フェイルオーバープロセスのシミュレート結果がTest Resilienceモーダルに表示されます。

フェイルオーバーの確認

フェイルオーバーが成功したことを確認するには、以下の手順を行います。

Atlas で、プロジェクトの [Clusters] ページに移動します。

まだ表示されていない場合は、希望するプロジェクトを含む組織を選択しますナビゲーションバーのOrganizationsメニュー
まだ表示されていない場合は、ナビゲーションバーのProjectsメニューから目的のプロジェクトを選択します。
サイドバーで、 Database見出しの下のClustersをクリックします。

[ Clusters （クラスター） ] ページが表示されます。

ノードを観察します。

フェイルオーバーテストを実行したクラスターの名前をクリックします。
Overviewタブのノードのリストで次の変更を確認します。
- 元のPRIMARYノードはSECONDARYノードになりました。
- 以前のSECONDARYノードはPRIMARYノードになりました。

フェイルオーバーの問題のトラブルシューティング

アプリケーションがフェイルオーバーをグレースフルに処理しない場合は、次の点を確認してください。

SRV 接続形式を使用している
最新バージョンのドライバーを使用しています。
アプリケーションに適切な再試行ロジックが実装されました。

戻る

レジリエンスのテスト

リージョン停止のシミュレーション

プライマリ フェールオーバーをテストする

注意

必要なアクセス権

前提条件

プライマリ フェイルオーバー プロセスのテスト

重要

フェイルオーバーの確認

Atlas で、プロジェクトの [Clusters] ページに移動します。

ノードを観察します。

フェイルオーバーの問題のトラブルシューティング

プライマリフェールオーバーをテストする

プライマリフェイルオーバープロセスのテスト