スケーリング
ERDDAP™- 重負荷、グリッド、クラスタ、フェデレーション、クラウドコンピューティング
ERDDAP: : :
ERDDAP™さまざまなローカルおよびリモートソースから科学データを集約し、一般的なファイル形式でデータのサブセットをダウンロードし、グラフやマップを作成するためのシンプルで一貫した方法を提供するWebアプリケーションとWebサービスです。 このページでは、重い問題について議論していますERDDAP™使用は、グリッド、クラスター、フェデレーション、クラウドコンピューティングを介して非常に重い負荷に対処するための可能性をロードし、探索します。
オリジナル版は2009年6月より作成されました。 重要な変更はありません。 2019年4月15日更新
免責事項
このページの内容は、ボブ・サイモンの個人的な意見であり、必ずしも政府や政府のいかなる位置を反映していないNational Oceanic and Atmospheric Administrationお問い合わせ 計算は単純ですが、結論は正しいと思います。 障害のあるロジックを使用していたり、自分の計算で間違いを犯したりしましたか? そうなら、欠陥は一人で鉱山です。 メールでのお問い合わせerd dot data at noaa dot govお問い合わせ
重負荷/制約
重い使用を使って、スタンドアロンERDDAP™制約される (ほとんどの場合から少なくとも可能性) によって:
遠隔源の帯域幅
- リモートデータソースの帯域幅 — 効率的な接続でも (例)OPeNDAP) リモートデータソースが非常に高い帯域幅のインターネット接続を持っている場合を除き、ERDDAP's の応答は速度によって制約されますERDDAP™データソースからデータを取得できます。 データセットをコピーするソリューションERDDAP's ハードドライブ, おそらくとEDDGridコピーまたはEDDTableコピーお問い合わせ
ERDDAP'サーバー帯域幅
- なしERDDAP's サーバーは非常に高い帯域幅のインターネット接続を持っています、ERDDAP's の応答は速度によって制約されますERDDAP™データソースからデータを取得することができ、高速化ERDDAP™クライアントにデータを返すことができます。 唯一のソリューションは、より高速なインターネット接続を取得することです。
メモリ
- 同時リクエストが多い場合、ERDDAP™メモリを外して一時的に新しいリクエストを拒否することができます。 (ERDDAP™これを回避し、それが起こるならば、結果を最小限に抑えるメカニズムのカップルを持っています。) つまり、サーバのメモリが向上します。 32ビットサーバーでは、4GBは本当に良いです、2 GBは大丈夫です、あまりお勧めしません。 64ビットサーバーでは、メモリの多くを取得することで、ほぼ完全に問題を回避できます。 詳細はこちら\-Xmx と -Xms の設定お問い合わせERDDAP/Tomcat。 ログインERDDAP™メモリの8GBと-Xmxセットを4000Mに設定した64ビットサーバーでコンピュー タ上で重く使用することはまれに、メモリによって制約される。
ハイドドライブ帯域幅
- サーバーのハードドライブに保存されたデータへのアクセスは、リモートデータにアクセスするよりも大幅に高速です。 でも、そうなら、ERDDAP™サーバは帯域幅が非常に高く、ハードドライブ上のデータにアクセスすることはボトルネックになります。 部分的な解決策は、より速く使うことです (例:10,000RPM) 磁気ハードドライブまたはSSDドライブ (センスのコストを賢くするなら) お問い合わせ 別のソリューションは、異なるドライブ上の異なるデータセットを保存することです。
Too 多くのファイルキャッシュ
- たくさんのファイルをtooキャッシュディレクトリ —ERDDAP™すべての画像をキャッシュしますが、特定の種類のデータリクエストのデータをキャッシュするだけです。 一時的に複数のファイルを持つデータセット用のキャッシュディレクトリに可能です。 これは、ファイルがキャッシュにあるかどうかを確認するリクエストを遅くします (本当に!) お問い合わせ<キャッシュ Minutes> でセ ットアップ。xmlファイルが削除される前にキャッシュにどのくらいの期間を設定できます。 小さな番号を設定すると、この問題を最小限に抑えます。
ログイン
- 2 回のみ CPU 時間を多く取る:
- NetCDF4と4HDFデータの内部圧縮をサポートできるようになりました。 大きい圧縮された分解NetCDF4 /HDF5つのデータファイルが10秒以上かかります。 (実装障害ではありません。 圧縮の性質です。) そのため、圧縮されたファイルに保存されたデータでデータセットへの複数の同時リクエストは、任意のサーバーに厳しい負担をかけることができます。 これが問題の場合、このソリューションは、非圧縮ファイルで人気のあるデータセットを保存したり、複数のコアを持つCPUでサーバーを取得することです。
- グラフの作成 (地図を含む) : グラフごとの約0.2〜1秒 そのため、グラフの同時固有のリクエストが多かった場合 (WMSクライアントは、多くの場合、6つの同時リクエストを作る!) CPUの制限があるかもしれません。 複数のユーザーが実行しているときWMSクライアントは問題になります。
複数のIdenticalERDDAPs の負荷分散?
質問はしばしば出てくる: "重負荷に対処するため、複数の同一を設定できますERDDAPs の負荷分散? それはすぐにの中心に得るのでそれは興味深い質問ですERDDAPデザイン。 迅速な回答は「いいえ」です。 答えを失望していることは知っていますが、直接的な理由のカップルと私が設計したいくつかの大きな根本的な理由がありますERDDAP™異なるアプローチを使用する (の連盟のERDDAPs、この文書のバルクで説明) 私はより良いソリューションであると信じている、。
複数の同一の設定ができない直接的な理由ERDDAPs は:
- 与えられたERDDAP™ファイル内のデータ範囲を見つけるために最初に利用可能なときに各データファイルを読み込みます。 その情報をインデックスファイルに保存します。 後で、データに対するリクエストが来るとき、ERDDAP™そのインデックスを使用して、要求されたデータを参照するファイルを確認します。 複数の同一であった場合ERDDAPs, 彼らはそれぞれ、このインデックス作成を行うだろう, これは、努力を浪費. 以下に説明したフェデレーションシステムでは、インデックス作成は一度だけ行われます。ERDDAPお問い合わせ
- ユーザーのリクエストの種類 (例).nc、.png、.pdfファイル) ERDDAP™応答が送信される前にファイル全体を作る必要があります。 お問い合わせERDDAP™これらのファイルを短時間でキャッシュします。 同一リクエストがない場合 (多くの場合、特にURLがWebページに埋め込まれている画像の場合) ,ERDDAP™キャッシュされたファイルを再利用することができます。 複数の同一のシステムERDDAPs、これらのキャッシュされたファイルは共有されていないので、それぞれERDDAP™不要で無駄に再創造する.nc、.png、または.pdfファイル。 以下に示 すフェデレーションされたシステムによって、ファイルは一度だけ作られます、ERDDAPs、再使用。
- ERDDAP's サブスクリプションシステムが複数で共有されるように設定されていないERDDAPお問い合わせ 例えば、ロードバランサーが1つにユーザーを送信しますERDDAP™ユーザはデータセットを購読します。ERDDAPs はそのサブスクリプションを認識しません。 その後、ロードバランサーが異なるユーザーに送信する場合ERDDAP™サブスクリプションのリストを要求し、その他ERDDAP™何もないと言う (他の ERED で重複サブスクリプションを作成するために彼/彼女をリードDAP) お問い合わせ 以下に示すフェデレーションシステムでは、サブスクリプションシステムは、単にメイン、パブリック、コンポジットによって処理されますERDDAPお問い合わせ
はい、それぞれの問題に対して、私はできる (素晴らしい努力で) ソリューションを設計 (情報を共有するERDDAPツイート) 、しかし私は思うフィードバックERDDAPs アプローチ (この文書の一括で記述) それは複数の代表的な他の問題に対処するので、はるかに優れた全体的なソリューションです。ERDDAPs-with-a-load-balancer アプローチは、世界におけるデータソースの分散性ではなく、アドレスに開始しません。
私は設計しなかった単純な事実を受け入れるのが最善ですERDDAP™複数の同一として展開するERDDAPs の負荷バランサ。 私は意識的に設計しましたERDDAP™連盟内でうまくいくERDDAP私は多くの利点があると信じているs。 確かに、連盟ERDDAPsは、私たちが現実世界で持っているデータセンターの分散型分散システムと完全に整列されます (異なるIOOS領域、または異なるコーストウォッチ領域、またはNCEIの異なる部分、または100の他のデータセンターの思考NOAA, または異なる NASA DAACs, または 1000 の世界のデータセンター) お問い合わせ 彼らが彼らの努力を放棄し、一元化された「データ湖」にすべてのデータを置く必要がある世界のすべてのデータセンターを言う代わりに (可能であった場合でも、多くの理由で恐ろしい考えです。さまざまな分析では、多くの利点を示す分散型システム) ,ERDDAP's design は、世界とつながるデザインです。 データを生成する各データセンターは、データの維持、キュレーション、および提供を継続できます。 (彼らが) とまだ、ERDDAP™、データは一元化からすぐに利用できますERDDAP、集中化にデータを送信する必要性なしでERDDAP™データの重複コピーを格納する。 確かに、与えられたデータセットは同時に利用できます からERDDAP™実際にデータを格納する組織で (例:GoMOOS) , からERDDAP™親組織で (例:IOOS セントラル) , 全てからNOAA ERDDAP™, 全米連邦政府からERDDAP™, グローバルからERDDAP™ (ログイン) , 専門分野ERDDAPツイート (例)ERDDAP™HAB研究に専念する機関) , メタデータのみが間で転送されるため、すべての本質的に瞬時に効率的にERDDAPs、データではなく。 最初から、すべてのベストERDDAP™原発組織で、他者全員ERDDAPsはすぐにセットアップすることができます (数時間勤務) 最小限のリソースで (ローカルのデータを保存しないため、データストレージの RAID を必要としない 1 つのサーバー) 、そして従って偽りなく最低の費用。 集中型データセンターの設定と維持のコストと、データ湖と本当に巨大で、本当に高価な、インターネット接続、および集中型データセンターの参加者の問題は、故障の1つのポイントです。 お問い合わせERDDAPs の分散化、フェデレーションされたアプローチは遠く、はるかに優れています。
特定のデータセンターが複数のニーズを必要とする状況ERDDAPsは高需要を満たすために、ERDDAP's design は複数の代表的な性能を一致するか、または超過する十分に可能です-ERDDAPs-with-a-load-balancer アプローチ。 常に設定するオプションがあります多岐コンポジットERDDAPツイート (下記の通り) 、それぞれが他のデータからすべてのデータを取得するERDDAPsの負荷バランス無し。 この場合、各コンポジットを付与するポイントを作ることをお勧めしますERDDAPs は別の名前/アイデンティティおよび可能であれば世界の異なった部分でそれらをセットアップします (例:AWS の異なる領域) 、例えば、ERD\_US\_イースト、ERD\_US\_西,ERD\_IE,ERD\_FR,ERD\_IT, ユーザが意識的に, 繰り返し, 特定の作業ERDDAP、失敗の1つのポイントからリスクを削除した利点が追加されました。
グリッド、クラスタ、およびフェデレーション
非常に重い使用の下で、単一のスタンドアローンERDDAP™1 つ以上で実行される制約上記および提案されたソリューションも不十分です。 そのような状況のために、ERDDAP™スケーラブルグリッドを簡単に構築できる機能 (クラスターやフェデレーションとも呼ばれる) インフォメーションERDDAPシステムが非常に重い使用を処理することを可能にするs (大型データセンター向けなど) お問い合わせ
お問い合わせグリッド型を示すための一般的な用語としてコンピュータクラスターすべての部品が1つの施設に物理的に配置されていない、または集中的に管理されない場合があります。 共同配置された、集中的に所有し、管理された格子の利点 (クラスター) スケールの経済性から恩恵を受ける (特に人間のワークロード) システムの部品を一緒に働かせ、簡素化して下さい。 非連結格子、非中央の所有および管理の利点 (フェデレーション) 人間のワークロードおよび費用を配り、付加的な欠陥の許容を提供するかもしれないことです。 以下に提案するソリューションは、すべてのグリッド、クラスター、およびフェデレーションのトポグラフィに適しています。
スケーラブルなシステムの設計の基本的な考え方は、潜在的なボトルネックを特定し、システムの一部がボトルネックを軽減するために必要なように複製することができるように、システムの設計することです。 理想的には、各レプリカ部品は、システムのその部分の能力を線形に増加させます (スケールの効率) お問い合わせ 全てのボトルネックのスケーラブルなソリューションが なければ、システムはスケーラブルではありません。スケーラビリティ効率とは異なる (タスクを素早く実行する方法 — パーツの効率性) お問い合わせ スケーラビリティは、システムがあらゆるレベルの要求に対応できるようにします。 ソリューション (スケールと部品) 特定のレベルの要求に応じるために、サーバーなど、必要なサーバーの数を決定します。 効率は非常に重要ですが、常に限界があります。 スケーラビリティは、処理できるシステムを構築する唯一の実用的なソリューションです。 お問い合わせ 重い使用。 理想的には、システムがスケーラブルで効率的になります。
ゴール
このデザインの目標は次のとおりです。
- 拡張可能なアーキテクチャを作成する (過負荷になる部分を複製することで簡単に拡張できるもの) お問い合わせ 利用可能なコンピューティングリソースに与えられたデータの可用性とスループットを最大限に活用する効率的なシステムを作る。 (コストはほぼ常に問題です。)
- システムの1つの部分が別の部分を圧倒しないように、システムの一部の機能のバランスをとるため。
- システムがセットアップし、管理すること容易であるように簡単な建築を作るため。
- すべてのグリッドのトポグラフィーでうまく機能するアーキテクチャを作る。
- どの部分が過負荷になったら優雅で、限られた方法で失敗するシス テムを作るため。 (大規模なデータセットをコピーするために必要な時間は、特定のデータセットに対する要求の急激な増加に対処するためのシステムの能力を常に制限します。)
- (可能であれば) 特定の条件に縛られていないアーキテクチャを作るためクラウドコンピューティングサービスまたはその他の外部サービス (それを必要としないので) お問い合わせ
推奨事項
当社の推奨事項は
- 基本的にはコンポジットの設定をおすすめしますERDDAP™ ( ダイバーシティ ダイアグラム) 、それは規則的ですERDDAP™それ以外は、単に他のデータを扱うERDDAPお問い合わせ グリッドのアーキテクチャは、できるだけ多くの仕事をシフトするように設計されている (CPU使用量、メモリ使用量、帯域幅使用量) コンポジットからERDDAP™その他へERDDAPお問い合わせ
- ERDDAP™2つの特別なデータセットのタイプがあります、EDDGridErddapからそして、EDDTableFromErddapの特長, 参照する 他のデータセットERDDAPお問い合わせ
- コンポジット時ERDDAP™これらのデータセット、コンポジットからのデータや画像のリクエストを受け取るERDDAP™ リダイレクト他のデータを要求するERDDAP™サーバ。 結果は:
- これは非常に有効です (CPU、メモリ、帯域幅) , その他
- コンポジットERDDAP™データを他のユーザーに送信するERDDAPお問い合わせ
- その他ERDDAP™データを取得し、それを再フォーマットし、データをコンポジットに送信しますERDDAPお問い合わせ
- コンポジットERDDAP™データの受け取り (追加の帯域幅を使用する) 、それを再フォーマットして下さい (余分 CPU 時間および記憶を使用して) データをユーザに送信する (追加の帯域幅を使用する) お問い合わせ データのリクエストをリダイレクトし、他のデータを許可することでERDDAP™ユーザーに直接応答を送信するには、コンポジットERDDAP™データリクエストのCPU時間、メモリ、または帯域幅を一切使用しません。
- リダイレクトは、クライアントソフトウェアに関係なくユーザーに透明です (ブラウザまたはその他のソフトウェアまたはコマンドラインツール) お問い合わせ
- これは非常に有効です (CPU、メモリ、帯域幅) , その他
グリッド部品
ツイート : : : 高帯域幅を持つすべてのリモートデータソースOPeNDAPリモートサーバに直接接続できます。 リモートサーバがERDDAP™、使用して下さいEDDGridFromErddap または EDDTableFrom からERDDAPコンポジットのデータを扱うためERDDAPお問い合わせ リモートサーバが他のタイプである場合DAPサーバ、例えば、THREDDS、Hyrax、または GrADS の使用EDDGridFromDapから。
ツイート : すべてERDDAP-ableデータソース (データソースからERDDAPデータを読むことができます) 高帯域幅のサーバーを持っている、別の設定ERDDAP™このデータソースからデータを扱う責任があるグリッドで。
- こんな場合ERDDAPs は、データに対する多くの要求を得ることができません。1 つにそれらを統合できます。ERDDAPお問い合わせ
- もし、ERDDAP™1つのリモートソースからデータを取得することに専念して、あまりにも多くの要求を得ています, 追加を追加するためのテンプテーションがありますERDDAPs はリモートデータソースにアクセスします。 特別なケースでは、これは理にかなっているかもしれませんが、これはリモートデータソースを圧倒する可能性が高い (これは、自己啓発です) また、他のユーザーがリモートデータソースにアクセスしないようにする (それは素晴らしいではありません) お問い合わせ そのような場合は、別の設定を検討してくださいERDDAP™データセットを1つ提供し、そのデータセットをコピーするERDDAPハードドライブ (詳しくはこちら ツイート ) , 多分とEDDGridコピーおよび/またはEDDTableコピーお問い合わせ
- ツイート サーバは一般にアクセス可能です。
ツイート : すべてERDDAP- 帯域幅の低いサーバを持つデータソース (または他の理由で遅いサービスである) 別の設定を検討するERDDAP™データセットのコピーを格納するERDDAP's ハードドライブ, おそらくとEDDGridコピーおよび/またはEDDTableコピーお問い合わせ こんな場合ERDDAPs は、データに対する多くの要求を得ることができません。1 つにそれらを統合できます。ERDDAPお問い合わせ ツイート サーバは一般にアクセス可能です。
コンポジットERDDAP
ダイバーシティ : : : コンポジットERDDAP™定番ですERDDAP™それ以外は、単に他のデータを扱うERDDAPお問い合わせ
- コンポジットのためERDDAP™すべてのデータセットに関するメモリに情報があり、データセットのリストのリクエストに迅速に対応できます。 (完全なテキスト検索、カテゴリ検索、すべてのデータセットのリスト) 個々のデータセットのデータアクセスフォーム、グラフフォームの作成、またはWMSサイトマップ これらは、メモリ内で保持される情報に基づいて、すべての小さく、動的に生成されたHTMLページです。 そのため、応答は非常に高速です。
- 実際のデータへのリクエストはすぐに他のデータにリダイレクトされるためERDDAPs、合成ERDDAP™CPU時間、メモリ、帯域幅を使わずに、実際のデータへのリクエストに迅速に対応できます。
- できるだけ多くの仕事をシフトすることで (CPU、メモリ、帯域幅) コンポジットからERDDAP™その他へERDDAPs、合成ERDDAP™すべてのデータセットからデータを提供するように見えますが、大量のユーザーからの大量のデータリクエストを引き続き維持できます。
- 予 備テストはコンポジットを示していますERDDAP™CPU時間の~1ms、1000リクエスト/秒でほとんどのリクエストに対応できます。 そのため、8つのコアプロセッサは、約8000のリクエスト/秒に対応する必要があります。 スローダウンの原因となるより高い活動の破裂を想定することは可能ですが、多くのスループットです。 複合体の前にデータセンターの帯域幅がネックになる可能性が高いERDDAP™ボトルネックになります。
最新最大 (タイムタイム) お問い合わせ
ザ・オブ・ザ・EDDGrid/TableFromErddap のコンポジットERDDAP™ソース・データセットがあるとき、各ソース・データセットに関する保存された情報のみを変更します。「リロード」メタデータの変更の一部 (例:変数の時刻actual\_range) サブスクリプション通知を生成します。 ソースデータセットに頻繁に変更するデータがある場合 (例えば、毎秒新しいデータ) そして使用して下さい「更新」基礎データへの頻繁な変化に気づくシステム、EDDGrid/TableFromErddapは、次のデータセット「リロード」まで、これらの頻繁な変更について通知されません。EDDGrid/TableFromErddap は最新ではありません。 ソースデータセットを変更することで、この問題を最小限に抑えることができます<reloadEveryNMinutes> より小さい値へ (60? 15?) より多くのサブスクリプション通知があ るように、EDDGrid/TableFromErddap は、ソースデータセットに関する情報を更新します。
または、ソースのデータセットが新しいデータを持っているときにデータ管理システムが知っている場合 (例えば、データファイルをコピーするスクリプトを使って、) 、そしてそれが極度の頻繁でなければ (例:5分ごとに、または頻度が少ない) 、よりよい解決があります:
- 使用しないでください<updateEveryNMillis> ソースデータを最新の状態に保つ
- ソースデータセットの設定<reloadEveryNMinutes> より大きい数へ (1440?) お問い合わせ
- スクリプトがソースのデータセットに問い合わせるフラグ URL新しいデータファイルをコピーして配置する直後に。 これにより、ソースデータセットが完全に最新になり、サブスクリプション通知を生成し、それに送信されるようになります。EDDGrid/TableFromErddap データセット。 それは導きますEDDGrid/TableFromErddap のデータセットを完全に更新する (5秒以内に新しいデータを追加) お問い合わせ そして、そのすべてが効率的に行われる (不要なデータセットリロードなし) お問い合わせ
多数の合成物ERDDAPツイート
- 非常に極端な場合、または欠陥の許容のために、あなたは1つの複合体以上を設定したいかもしれませんERDDAPお問い合わせ システムの他の部分は、 (同様に、データセンターの帯域幅) コンポジットの前に問題になりますERDDAP™ボトルネックになります。 ソリューションは、おそらく追加、地理的に多様な、データセンターを設定する (ミラー) 1つの合成物が付いているそれぞれERDDAP™サーバERDDAPs と (少なくとも) 需要が高いデータセットのミラーコピー。 このようなセットアップは、障害耐性とデータのバックアップも提供します (コピー) お問い合わせ この場合、コンポジットなら最適ですERDDAPs には異なる URL があります。
本当にすべてのコンポジットを望むならERDDAP同じ URL を持つ s は、指定したユーザをコンポジットの 1 つに割り当てるフロントエンド システムを使用します。ERDDAPツイート (IPアドレスに基づく) つまり、すべてのユーザーの要求がコンポジットの1つだけに行くようにERDDAPお問い合わせ 2つの理由があります。
- 根本的なデータセットがリロードされ、メタデータが変更されるとき (例えば、グリッドされたデータセット内の新しいデータファイルが、時刻変数の時刻を引き起こします。actual\_range変更する) 、コンポジットERDDAPsは、同期から少しずつ外されますが、イベントの一貫性お問い合わせ 通常は5秒以内に再同期しますが、時間が長くなります。 ユーザーが自動システムを作る場合ERDDAP™サブスクリプションアクションをトリガーすると、簡単な同期の問題が重要になります。
- 2+コンポジットERDDAPそれぞれが独自のサブスクリプションのセットを維持 (上記の同期の問題のため) お問い合 わせ
そのため、特定のユーザーはコンポジットの1つに向けるべきです。ERDDAPこれらの問題を避けるためにs。 複合体の場合ERDDAPs がダウンし、フロントエンドシステムはそれをリダイレクトすることができますERDDAP'ユーザーを別のユーザーにERDDAP™です。 しかし、最初のコンポジットを引き起こす能力問題である場合ERDDAP™失敗する (圧倒的なユーザー? は、サービスの拒否攻撃お問い合わせ) これにより、ユーザーは他のコンポジットにリダイレクトする可能性が非常に高いERDDAPs は、カスケーディング障害お問い合わせ したがって、最も堅牢なセットアップはコンポジットを持っていることですERDDAPs は異なる URL を使用します。
または、多分よりよい、複数の合成物をセットアップして下さいERDDAPs 負荷分散なし。 この場合、各点をそれぞれ与える点を作る必要がありますERDDAPs は別の名前/アイデンティティおよび可能であれば世界の異なった部分でそれらをセットアップします (例:AWS の異なる領域) 、例えば、ERD\_US\_イースト、ERD\_US\_西,ERD\_IE,ERD\_FR,ERD\_IT, ユーザが意識的に, 繰り返し特定の操作をするようにERDDAPお問い合わせ
- \[1つのサーバーで実行される高性能システムの魅力的な設計については、これを参照してくださいMailinatorの詳細な説明お問い合わせ\]
非常に高い需要のデータセット
本当に珍しいケースでは、 ツイート , ツイート または ツイート ERDDAPs は、帯域幅やハードドライブの制限が制限されているため、要求に追いつくことはできません。 (お問い合わせ) 別のサーバー+hardに ドライブ+ERDDAP, 多分とEDDGridコピーおよび/またはEDDTableコピーお問い合わせ 元のデータセットとコピーされたデータセットが合成の1つのデータセットとしてシームレスに表示されるのは理想的なかもしれませんがERDDAP™2つのデータセットが異なる時の状態になるので、これは困難です (当然のことながら、元が新しいデータを取得した後、コピーしたデータセットがコピーされる前に) お問い合わせ そのため、データセットが若干異なるタイトルを付与されることをお勧めしています。 (例:「... (コピー #1) お問い合わせ (コピー #2) "、または" (ミラー # ログイン ) または " (サーバ # ログイン ) ツイート) コンポジットに別々のデータセットとして表示ERDDAPお問い合わせ ユーザーの一覧を表示するために使用ミラーサイト一般的なファイルのダウンロードサイトでは、驚きや失望するべきではありません。 特定の場所での帯域幅制限が制限されているため、別のサイトにある鏡を持ってい ることは意味があるかもしれません。 ミラーのコピーが異なるデータセンターにある場合、データセンターのコンポジットだけでアクセスERDDAP™、別のタイトル (例:「ミラー#1」) 必須ではありません。
RAIDs 対定期的なハードドライブ
大量のデータセットやデータセットのグループが使用されていない場合は、障害の許容範囲を提供し、別のサーバーの処理能力や帯域幅を必要としないため、RAIDにデータを保存する感覚を作ることができます。 しかし、データセットが重く使用されている場合、別のサーバーにデータをコピーする方が意味があるかもしれません+ERDDAP™+ ハードドライブ (と同様Googleが何をしているのか) 1つのサーバーと RAID を使用して、複数のデータセットを保存します。ERDDAPそれらが失敗するまでグリッド内のs。
失敗
もし...
- 1つのデータセットの要求の破烈があります (例えば、クラス内のすべての生徒が同じデータを同時にリクエストする) お問い合わせ あなただけのERDDAP™データセットが圧倒的に遅くなり、リクエストを拒否するようになります。 コンポジットERDDAP™その他ERDDAPs は影響しません。 システム内の特定のデータセ ットの制限要因は、データとのハードドライブであるため (コメントはありませんERDDAP) 、唯一の解決 (即時ではありません) 別のサーバー+hardDrive+でデータセットのコピーを作ることですERDDAPお問い合わせ
- ログイン ツイート , ツイート または ツイート ERDDAP™失敗 (例えば、ハードドライブの故障) お問い合わせ データセットのみ (ツイート) によって提供されるERDDAP™影響を受ける。 データセットの場合 (ツイート) 別のサーバー+hardDrive+でミラーリングされますERDDAP効果は最小限です。 問題がレベル5または6 RAIDでハードドライブの故障の場合、ドライブを交換し、RAIDがドライブにデータを再構築するだけです。
- コンポジットERDDAP™失敗? 非常にシステムを作りたいと思うなら高可用性、セットアップできます多岐コンポジットERDDAPツイート (上記の議論として) 、のような何かを使用して下さいガンインックスまたはログイン負荷分散を処理するため。 特定のコンポジットに注意してください。ERDDAP™多数のユーザーからのリクエストを扱います。 メタデータの要求は小さく、メモリ内の情報によって処理され、 データのリクエスト (大きいかもしれない) 子にリダイレクトされるERDDAPお問い合わせ