Scaling
ERDDAP™- Ağır Yükler, Grids, Clusters, Federasyonlar ve Cloud Computing
ERDDAP:
ERDDAP™Farklı yerel ve uzaktan kaynaklardan gelen bilimsel verileri toplayan bir web uygulaması ve verilerin alt setlerini ortak dosya formatlarında indirmenin basit, tutarlı bir yolu sunar ve grafikler ve haritalar oluşturun. Bu web sayfası ağırla ilgili sorunları tartışırERDDAP™Kullanım Yükleri ve ızgaralar, kümeler, federasyonlar ve bulut bilişim yoluyla son derece ağır yüklerle uğraşmak için olanaklar keşfedin.
Orijinal versiyon Haziran 2009'da yazılmıştır. Önemli değişiklikler yoktu. Bu son güncellenmiş 2019-04-15 idi.
DISCLAIMER
Bu web sayfasının içeriği Bob Simons kişisel görüşleridir ve mutlaka Hükümetin veya Hükümetin herhangi bir konumunu yansıtmaz.National Oceanic and Atmospheric Administration. Hesaplamalar basittir, ancak sonuçların doğru olduğunu düşünüyorum. Hatalı mantığı mı kullandım yoksa hesaplamalarımda bir hata mı yaptım? Eğer öyleyse, hata benim tek başına. Lütfen düzeltme ile bir e-posta gönderinerd dot data at noaa dot gov.
Heavy Loads / Constraints
Ağır kullanımla, bir standaloneERDDAP™Kısıtılacak (En azından muhtemelen) Tarafından:
Uzak Kaynak Band genişliği
- Uzak bir veri kaynağının bant genişliği – verimli bir bağlantı ile bile (E.g., via viaOPeNDAP) Uzak bir veri kaynağı çok yüksek bir bant internet bağlantısına sahip olmadıkça,ERDDAP“Sorular ne kadar hızlı bir şekilde kısıtlanacaktırERDDAP™Veri kaynağından veri alabilir. Bir çözüm, veri kümesini kopyalamakERDDAP“Zengin sürücü, belki deEDDGridKopya kopyaveyaEDDTableCopy.
ERDDAP's Server Band genişlik
- Aksi takdirdeERDDAP's server'ın çok yüksek bantlı internet bağlantısı var,ERDDAP“Sorular ne kadar hızlı bir şekilde kısıtlanacaktırERDDAP™Veri kaynaklarından veri alabilir ve ne kadar hızlıERDDAP™Veriler müşterilere geri dönebilir. Tek çözüm daha hızlı bir internet bağlantısı elde etmektir.
Hafıza
- Birçok eşzamanlı istek varsa,ERDDAP™hafızadan çıkabilir ve geçici olarak yeni talepleri reddedebilir. (ERDDAP™Bunu önlemek ve olursa sonuçları en aza indirmek için birkaç mekanizma var.) Bu yüzden sunucudaki daha fazla bellek daha iyi. 32-bit sunucuda, 4+ GB ger çekten iyi, 2 GB tamam, daha az tavsiye edilmez. 64-bit sunucusunda, bir sürü hafıza alarak sorunu neredeyse tamamen kaçınabilirsiniz. Bakın,\-Xmx ve -Xms ayarlarıÇünküERDDAP/ Tomcat. An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An AnERDDAP™64-bit sunucu ile bir bilgisayarda 8GB bellek ve -Xmx set to 4000M nadiren, eğer her zaman, hafıza tarafından kısıtlanırsa.
Drive Band genişlik
- Sunucunun zor sürücüsünde depolanan verilere erişmek uzaktan verilere erişmekten çok daha hızlıdır. Öyle olsa bile, eğerERDDAP™server'ın çok yüksek bant genişliği internet bağlantısı var, zor sürücüdeki verilere erişmenin bir şişenck olması mümkündür. Kısmi bir çözüm daha hızlı kullanmak (e.g., 10.000 RPM) Manyetik sert sürücüler veya SSD sürücüleri (Eğer bu mantıklı maliyet-bildirir) . Başka bir çözüm, farklı sürücülerde farklı veri setlerini depolamak, bu yüzden toplu sert sürücü bant genişliği çok daha yüksek.
Too Many Files Cached
- Çok fazla dosyaÖnbelli önbelli önbelli önbelli önbelli önbelli önbelli önbelli önbelli önbelli önbellirehberi –ERDDAP™Tüm görüntüleri önbellekler, ancak yalnızca belirli veri talepleri için verileri önbellekler. Bir veri kümesi için önbellek dizinin geçici olarak çok sayıda dosya olması mümkündür. Bu, bir dosya önbellekte olup olmadığını görmek için yavaşlayacaktır. (Gerçekten!) .<Önbelli önbelli önbelli önbelli önbelli önbelli önbelli önbelli önbelli önbelli önbelli Dakikalar> içindeKurulum.xmlBir dosyanın silinmeden önce önbellekte ne kadar uzun olabileceğini ayarlamanıza izin verin. Daha küçük bir sayı kurmak bu sorunu en aza indirecektir.
CPU CPU CPU
- Sadece iki şey çok fazla CPU zamanı alır:
- NetCDF4 ve 4HDF5 Şimdi verilerin iç sıkıştırmasını destekliyor. Büyük sıkıştırılmış bir baskıNetCDF4 / 4HDF5 veri dosyası 10 veya daha fazla saniye sürebilir. (Bu bir uygulama hatası değil. Bu, sıkıştırmanın doğasıdır.) Bu nedenle, sıkıştırılmış dosyalarda depolanan verilerle birden eş zamanlı istekler herhangi bir sunucuda ciddi bir gerginlik yaratabilir. Eğer bu bir problemse, çözüm, sıkıştırılmamış dosyalarda popüler veri setlerini depolamak veya daha çekirdekli bir CPU ile bir sunucu almaktır.
- Grafikler yapmak (Ayrıca haritalar da dahil) : kabaca 0.2 - grafik başına 1 saniye. Yani grafikler için birçok eşzamanlı olarak benzersiz istek varsa (WMSMüşteriler genellikle 6 eşzamanlı istek yapar!) Ancak CPU sınırlaması olabilir. Birden fazla kullanıcı çalışırkenWMSMüşteriler, bu bir problem haline gelir.
Çoklu IdenticalERDDAPYük Balancing ile mi?
Soru sık sık ortaya çıkıyor: “ ağır yüklerle uğraşmak, birden fazla aynı şekilde ayarlanabilirim.ERDDAPYük dengelemesi ile mi? ” İlginç bir soru çünkü hızlı bir şekilde özüne alırERDDAP's design. Hızlı cevap "hayır". Bunun hayal kırıklığılı bir cevap olduğunu biliyorum, ancak birkaç doğrudan sebep var ve bazı daha büyük temel sebepler tasarladım nedenERDDAP™Farklı bir yaklaşım kullanmak (Bir federasyonERDDAPs, bu belgenin dökmesinde tarif edilen) İnandığım şey daha iyi bir çözüm.
Bazı doğrudan nedenler neden yapamıyorsunuz / birden fazla aynı şekilde ayarlayamıyorsunuzERDDAPs are:
- A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A given A givenERDDAP™Dosyadaki verilerin aralıklarını bulmak için ilk olarak mevcut olduğunda her veri dosyasını okur. O zaman bir indeks dosyasında bu bilgiyi depolar. Daha sonra, bir kullanıcı verileri talep geldiğinde,ERDDAP™İstenen verilere bakmak için hangi dosyaları bulmak için bu indeksi kullanın. Birden çok aynı olsaydıERDDAPs, her biri bu indeksleme yapacaklardı, ki bu boşa harcanıyor. Aşağıdaki tarif edilen besleyici sistemle, indeksleme sadece bir kez yapılır, biri tarafındanERDDAPs.
- Bazı kullanıcı istekleri için (E.g., çünkü.nc, .txt, .pdf dosyaları) ERDDAP™Yanıt gönderilmeden önce tüm dosyayı yapmak zorunda. Bu yüzdenERDDAP™Bu dosyaları kısa bir süre için önbellekler. Aynı bir istek gelirse, (Çoğu zaman olduğu gibi, özellikle URL'nin bir web sayfasında yer aldığı görüntüler için) ,ERDDAP™Bu önbellek dosyasını yeniden kullanabilir. Birden çok aynı sistemdeERDDAPs, bu önbellek dosyaları paylaşılmıyor, bu yüzden her biri paylaşılmıyor.ERDDAP™gereksiz ve boşanmış bir şekilde yeniden yaratacaktır.nc, .txt veya .pdf dosyaları. Aşağıda açıklanan besleyici sistemle, dosyalar sadece bir kez yapılır, biri tarafındanERDDAPs, ve tekrarladı.
- ERDDAP'In abonelik sistemi birden çok tarafından paylaşılacak şekilde ayarlanmamıştırERDDAPs. Örneğin, yük bakiyesi bir kullanıcıyı bir kişiye gönderirseERDDAP™Ve kullanıcı bir veri kümesine abone olur, sonra diğerERDDAPs bu abonelikten haberdar olmayacak. Daha sonra, yük bakiyesi kullanıcıyı farklı bir şekilde gönderirseERDDAP™Ve onun / aboneliklerinin bir listesini isteyin, diğeriERDDAP™Söyleyecek hiçbir şey yok (Onu / diğer ERED'de tekrarlanan bir abonelik yapmak içinDAP) . Aşağıda açıklanan besleyici sistemle, abonelik sistemi sadece ana, halk, kompozitERDDAP.
Evet, bu sorunların her biri için, yapabilirdim (Büyük çaba ile) Mühendis bir çözüm (Bilgiyi paylaşmak içinERDDAPs) Ama sanırımfederasyon-of-ERDDAPs yaklaşım (Bu belgenin dökmesinde tarif edilen) Çok daha iyi bir genel çözüm, kısmen diğer sorunlarla birden-identical-ERDDAPs-a-load-balancer yaklaşımı, özellikle dünyadaki veri kaynaklarının merkezi olmayan doğasını ele almaya bile başlamaz.
Tasarımdığım basit gerçeği kabul etmek en iyisidirERDDAP™Birden çok aynı şekilde konuşlandırılmakERDDAPBir yük dengesi ile. Bilinçli olarak tasarlanmıştırERDDAP™Bir federasyon içinde iyi çalışmakERDDAPİnandığım birçok avantaja sahip. Ne yazık ki, bir federasyonERDDAPs, gerçek dünyada sahip olduğumuz veri merkezlerinin merkezi olmayan, dağıtılmış sistemi ile mükemmel bir şekilde uyumludur. (Farklı IOOS bölgeleri veya farklı CoastWatch bölgeleri veya NCEI'nin farklı bölgeleri veya 100 diğer veri merkezi hakkında düşünün.NOAAYa da farklı NASA DAACs veya dünya çapında 1000 veri merkezi) . Dünyanın tüm veri merkezlerinin, çabalarını terk etmeleri ve tüm verilerini merkezileştirilmiş bir "data gölü"ne koymaları gerektiğini söylemek yerine. (Mümkün olsa bile, sayısız nedenden dolayı korkunç bir fikir - çeşitli analizlerin sayısız avantajlarını gösteriyormerkezi olmayan sistemler) ,ERDDAP“ Tasarım, olduğu gibi dünya ile çalışır. Veriler üreten her veri merkezi, korumak, tedavi etmeye ve verilerine hizmet etmeye devam edebilir (Onlar olduğu gibi) Ama yine de,ERDDAP™Ancak veriler aynı zamanda merkezileştirilmiş bir merkezden anında kullanılabilir olabilirERDDAPAncak verileri merkeziize etmek için gerek kalmadanERDDAP™veya verilerin tekrar kopyalarını depolamak. Aslında, verilen bir veri kümesi aynı anda kullanılabilir olabilir BirindenERDDAP™Üreten ve aslında üretilen organizasyonda verileri depolar (E.g., GoMOOS) , BirindenERDDAP™ebeveyn organizasyonunda (E.g., IOOS merkezi) , Her şeydenNOAA ERDDAP™, Tüm ABD destekli bir hükümettenERDDAP™, Küresel bir dünyadanERDDAP™ (GOOS) , ve özel olarakERDDAPs (E.g., anERDDAP™HAB araştırmalarına adanmış bir kurumda) , Tüm aslında anında ve verimli çünkü sadece metadata transfer edilirERDDAPs, veriler değil. En iyisi, başlangıçtan sonraERDDAP™Yaratılan organizasyonda, diğer tüm diğerERDDAPs hızla ayarlanabilir (Birkaç saat çalışması) En az kaynaklarla (Veri depolama için herhangi bir RAIDs'e ihtiyaç duymuyor çünkü yerel olarak veri depolamıyor) Ve böylece gerçekten en az maliyet. Bu, bir veri gölü ile merkezileştirilmiş bir veri merkezi kurma ve merkezileştirilmiş bir veri merkezi kurma maliyeti ve gerçekten büyük, gerçekten pahalı, internet bağlantısı, artı merkezileştirilmiş veri merkezinin tek bir başarısızlık noktası olma sorunu. Bana,ERDDAPOrtamsız, besleyici yaklaşım çok daha üstün.
Belirli bir veri merkezinin birden çok ihtiyacı olduğu durumlarda birden fazla veri merkezine ihtiyaç vardırERDDAPYüksek talep karşılamak için,ERDDAP“ Tasarım, birden çok-identical-in performansını tamamen eşleştirmeye veya aşmaya muktedirdir.ERDDAPs-with-a-load-balancer yaklaşımı. Her zaman ayarlanma seçeneğine sahipsinizBirden çok bileşikERDDAPs (Aşağıda tartışıldığı gibi) Her biri tüm verilerini diğerlerinden alırERDDAPs, dengeleme olmadan. Bu durumda, her bir kompozite vermenin bir noktası yapmanızı öneririm.ERDDAPFarklı bir isim / kimlik ve onları dünyanın farklı bölgelerinde ayarlarsanız (e.g., farklı AWS bölgeleri) E.g.,ERD\US\ East,ERD\_US\_West,ERD\_IE,ERD\_FR,ERD\_IT, böylece kullanıcılar bilinçli olarak, defalarca, belirli bir şeyle çalışırERDDAPBununla birlikte, riski tek bir başarısızlık noktasından kaldırdığınız ek fayda ile.
Grids, Clusters ve Federasyonlar
Çok ağır kullanım altında, tek bir standaloneERDDAP™Bir veya daha fazla koşacakkısıtlamalarYukarıda listelenen ve hatta önerilen çözümler yetersiz olacaktır. Böyle durumlarda,ERDDAP™ölçeklenebilir ızgaralar inşa etmek kolay hale getiren özellikler vardır (Ayrıca kümeler veya federasyonlar olarak da adlandırılır) Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of Of OfERDDAPSistemin çok ağır kullanımı yönetmesine izin verenler (e.g., büyük bir veri merkezi için) .
Ben kullanıyorumağ ağıGenel bir terim olarak bir tür belirtmek içinbilgisayar kümesiTüm parçaların bir tesiste fiziksel olarak yer olmayabilir veya merkezi olarak yönetilmeyebilir. Eş konumlanmış, merkezi olarak sahip olunan ve uygulanan ızgaraların bir avantajı (Setler) ölçek ekonomilerinden faydalandıkları içindir. (Özellikle insan iş yükü) Sistemin parçalarını birlikte iyi hale getirmek ve basitleştirmek. non-ko-located gridlerin bir avantajı, merkezi olmayan olmayan ve uygulanan bir avantaj (Federasyonlar) İnsan iş yükünü ve maliyeti dağıttıkları ve bazı ek hata toleransı sağlayabilirler. Aşağıda önerdiğim çözüm tüm ağ, küme ve federasyon topografları için iyi çalışır.
Bir ölçeklenebilir bir sistem tasarlamanın temel fikri, potansiyel şişeleri tanımlamak ve sonra sistemi tasarlamaktır, böylece sistemin parçaları şişeleri hafifletmeye ihtiyaç duyulabilir. İdeal olarak, her çoğaltmalı kısım sistemin bu kısmının kapasitesini lineer olarak artırır. (ölçeklendirme verimliliği) . Sistem, her şişenck için ölçeklenebilir bir çözüm olmadığı sürece ölçeklenebilir değildir.ScalabilityVerimlilikten farklıdır (Bir görev ne kadar çabuk yapılabilir - parçaların verimliliğini) . Scalability, sistemin herhangi bir talep seviyesini idare etmesini sağlar. Verimlilik Verimliliği (ölçeklendirme ve parçaların) Birçok sunucunun, vs.'nin belirli bir talep seviyesine ulaşmak için nasıl gerekli olacağını belirler. Verimlilik çok önemlidir, ancak her zaman sınırları vardır. Scalability, idare edebilecek bir sistemi inşa etmek için tek pratik çözümdür. çok çok çok çok çok çok çok çok çok Ağır kullanım. İdeal olarak, sistem ölçeklenebilir ve verimli olacaktır.
Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef Hedef
Bu tasarımın hedefleri şunlardır:
- Bir ölçeklenebilir bir mimarlık yapmak (Herhangi bir bölümünü kopyalayarak kolayca silinemez olan bir kişi, aşırı yükleniyor) . Mevcut bilişim kaynaklarına verilen verilerin erişilebilirliğini ve bağlantılarını en üstlenen verimli bir sistem yapmak. (Maliyet neredeyse her zaman bir konudur.)
- Sistemin bölümlerinin yeteneklerini dengelemek için, bu yüzden sistemin bir parçası başka bir parça abartmayacak.
- Basit bir mimari yapmak için, sistem kurmak ve yönetmek kolaydır.
- Tüm ızgara topograflarla iyi çalışan bir mimarlık yapmak.
- Herhangi bir bölümün aşırı yüklendiği bir sistem yapmak. (Büyük bir veri setlerini kopyalamak için gereken zaman, sistemin belirli bir veri kümesi için talepte aniden artışlarla başa çıkma yeteneğini her zaman sınırlayacaktır.)
- (Mümkünse) Herhangi bir özelliğe bağlı olmayan bir mimari yapmakbulut bilişimhizmet veya diğer dış hizmetler (Çünkü onlara ihtiyaç yok) .
Tavsiyeler
Önerilerimiz bizim
- Temel olarak, bir Kompozit ayarlamayı öneririmERDDAP™ ( D D D diyagramda) Ama bu normal bir şeydirERDDAP™Bunun dışında sadece diğerlerinden veri servis ederERDDAPs. Kafein mimarisi, mümkün olduğunca çok iş değiştirmek için tasarlanmıştır (CPU kullanımı, hafıza kullanımı, bant genişliği kullanımı) KompozittenERDDAP™DiğerineERDDAPs.
- ERDDAP™İki özel veri kümesi tipi vardır,EDDGridFromErddapveEDDTable FromErddapAma bu, işaret eder Diğer veri setleriERDDAPs.
- Şeker ne zamanERDDAP™Bu veri kümelerinden gelen veriler veya görüntüler için bir istek alın, kompozitERDDAP™ yönlendirmelerVeri isteği diğerineERDDAP™sunucu. Sonuç:
- Bu çok verimli (CPU, hafıza ve bant) Çünkü aksi takdirde
- KompozitERDDAP™Veri talebini diğerine göndermek zorundaERDDAP.
- DiğeriERDDAP™Veriler elde etmek, reform yapmak ve verileri kompozitiğe iletmek zorundadır.ERDDAP.
- KompozitERDDAP™Verileri almak zorunda (Ekstra bant genişliği kullanımı) Ama reform onu (Ekstra CPU zamanı ve hafıza) , ve verileri kullanıcıya iletir (Ekstra bant genişliği kullanımı) . Veri talebini yönlendirerek ve diğerine izin vererekERDDAP™Yanıtı doğrudan kullanıcıya göndermek için, kompozitERDDAP™Temel olarak CPU zamanı, bellek veya veri talepleri üzerinde bant genişliği harcamaz.
- Yönlendirme, istemci yazılımlarından bağımsız olarak kullanıcıya şeffafdır. (Bir tarayıcı veya başka herhangi bir yazılım veya komut satırı aracı) .
- Bu çok verimli (CPU, hafıza ve bant) Çünkü aksi takdirde
Grid Parçalar
A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A : Yüksek bant genişliğine sahip olan her uzaktan veri kaynağı içinOPeNDAPsunucu, doğrudan uzaktan sunucuya bağlanabilirsiniz. Uzak sunucu bir sunucu iseERDDAP™, kullanımıEDDGridErddap veya EDDTable FromERDDAPData in the CompositeERDDAP. Uzak sunucu başka bir tür iseDAPsunucu, e.g., THREDDS,Hyrax, veya GrADS, kullanınEDDGridFromDap.
B : Her şey içinERDDAP-able data source (Bir veri kaynağı hangisindenERDDAPVerileri okuyabilebilir) Bu yüksek bant genişliği sunucusu var, başka bir tane daha kurduERDDAP™Verilere bu veri kaynağından hizmet etmekten sorumlu olan ızgarada.
- Eğer birkaç tane böyleyseERDDAPVeriler için birçok istek almıyor, onları bir kişiye birleştirebilirsinizERDDAP.
- EğerERDDAP™Bir uzaktan kaynaktan veri almak için adanmış çok fazla istek alıyor, ek eklemek için bir uyarı var.ERDDAPUzak veri kaynağına erişmek için. Özel durumlarda, bu mantıklı olabilir, ancak bunun uzaktan veri kaynağı kaynağı kaynağının sona ereceği daha olasıdır. (Bu, kendi kendine has bir şeydir) Ayrıca diğer kullanıcıların uzaktan veri kaynağına erişmesini de engeller (Hangi güzel değil) . Böyle bir durumda, başka bir şey kurmayı düşününERDDAP™Bu bir veri kümesine hizmet etmek ve verileri kopyalayınERDDAP“Zorlu araba (see see see see see see C C C C ) Belki de onunla birlikteEDDGridKopya kopyave/veyaEDDTableCopy.
- B sunucular halka açık olarak erişilebilir olmalıdır.
C C C C : Her şey içinERDDAP- düşük bant genişliği bir sunucuya sahip olan veri kaynağı (Ya da diğer nedenlerle yavaş bir hizmettir) , başka bir şey kurmayı düşününERDDAP™Ve bu konuda veri kümesinin bir kopyasını depolayın veERDDAP“Zengin sürücüler, belki deEDDGridKopya kopyave/veyaEDDTableCopy. Eğer birkaç tane böyleyseERDDAPVeriler için birçok istek almıyor, onları bir kişiye birleştirebilirsinizERDDAP. C C C C sunucular halka açık olarak erişilebilir olmalıdır.
Kompozit Kompozit KompozitERDDAP
D D D : KompozitERDDAP™normaldirERDDAP™Bunun dışında sadece diğerlerinden veri servis ederERDDAPs.
- Çünkü kompozitERDDAP™Tüm veri kümeleri hakkında hafızada bilgi vardır, veri setlerinin listeleri için isteklere hızlıca cevap verebilir. (Tam metin aramaları, kategori aramaları, tüm veri kümelerinin listesi) , ve bireysel bir veri kümesinin Data Access Formu için talepler, bir Graph formu veya veyaWMSBilgi sayfası. Bunlar, hafızada tutulan bilgilere dayanan tüm küçük, dinamik olarak üretilen HTML sayfalarıdır. Bu yüzden cevaplar çok hızlı.
- Çünkü gerçek veriler için talepler hızla diğerine yönlendirilirERDDAPs, kompozitlerERDDAP™Herhangi bir CPU zamanı, hafıza veya bant kullanmadan gerçek veriler için taleplere hızlıca cevap verebilir.
- Mümkün olduğunca çok iş değiştirmek (CPU, bellek, bant genişliği) KompozittenERDDAP™DiğerineERDDAPs, kompozitlerERDDAP™Tüm veri kümelerinden gelen verilere hizmet edebilir ve hala çok sayıda kullanıcıdan gelen çok sayıda veri isteğiyle devam edebilir.
- Preliminary testleri, bileşiklerin gösteriyorERDDAP™CPU zamanında veya 1000 istek / saniyedeki çoğu isteke cevap verebilir. Bu yüzden 8 temel işlemci yaklaşık 8000 istek / saniyeye cevap verebilir. Yavaşlamalara neden olacak daha yüksek aktivite patlamalarını tahmin etmek mümkün olsa da, bu çok fazla bağlantı. Muhtemelen veri merkezi bant genişliği kompozitten uzun süre önce şişenck olacaktır.ERDDAP™Şişenck olur.
Up-to-date max (Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman Zaman) ??
The The The The The The The TheEDDGrid/Table FromErddap in the kompozitERDDAP™Kaynak veri kümesi olduğunda depolanan her kaynak veri kümesi hakkında sadece bilgilerini değiştirir."reload"edVe bazı metadata değişiklikleri (e.g., zaman değişkeniactual\_range) Böylece bir abonelik bildirimini oluşturun. Kaynak veri kümesi, değişiklikleri sık sık etkileyen veriler varsa (Örneğin, her saniye yeni veriler) ve kullanır"update"Orta verilere sık sık değişiklikleri fark etmek için sistem, temel verilere,EDDGrid/Table FromErddap, bir sonraki veri setine "reload" olana kadar bu sık değişiklikler hakkında bilgilendirilmeyecek, bu yüzdenEDDGrid/Table FromErddap mükemmel bir şekilde güncel olmayacak. Bu sorunu kaynak veri kümesinin değiştirerek en aza edebilirsiniz<HerNMinutes> daha küçük bir değer için (60? 15?) Bu yüzden anlatmak için daha fazla abonelik bildirimleri varEDDGrid/Table FromErddap to update its information about the source dataset.
Ya da, veri yönetimi sisteminiz kaynak veri kümesinin yeni veri kümesinin ne zaman olduğunu biliyorsa (e.g., bir veri dosyasını yere kopyalayan bir senaryo aracılığıyla) Ve eğer bu süper sıkılmıyorsa (e.g., her 5 dakika veya daha az sık) Daha iyi bir çözüm var:
- Don't use<HerNMillis> güncelleme; kaynağı güncel tutmak.
- Kaynağı dataset'in setlerini ayarlayın<Reload EveryNMinutes> daha büyük bir sayı için (1440?) .
- Senaryo kaynağı veri kümesinin temasına geçtiBayrak URLHemen sonra yeni bir veri dosyasını yere kopyalar. Bu, kaynak veri kümesine mükemmel bir şekilde devam edecek ve bir abonelik bildirim üretmesine neden olacaktır, bu da gönderilecek.EDDGrid/Table FromErddap dataset. Bu, liderlik edecekEDDGrid/Table FromErddap dataset to be perfect up-to-date (İyi, yeni verilerin 5 saniye içinde ekleniyor) . Ve tüm bunlar verimli bir şekilde yapılır (gereksiz veri kümesi reloads olmadan) .
Birden çok Kompozit Kompozit KompozitERDDAPs
- Çok aşırı durumlarda, ya da hata toleransı için, bir kompozitörden fazla kurmak isteyebilirsinizERDDAP. Muhtemelen sistemin diğer bölümlerinin (Özellikle, veri merkezinin bant genişliği) Kompozitten uzun bir süre önce bir sorun olacakERDDAP™Bir şişenck olur. Dolayısıyla çözüm muhtemelen ek, coğrafi olarak çeşitli, veri merkezleri kurmaktır. (Aynalar) Her biri bir bileşikleERDDAP™ve sunucularERDDAPs ve (En azından) Yüksek talepte bulunan veri kümelerinin ayna kopyaları. Bu tür bir kurulum da hata toleransı ve veri yedekleme sağlar (Kopyalama yoluyla) . Bu durumda, eğer kompozit olursa en iyisidirERDDAPs have different URLs.
Gerçekten tüm kompozitleri istiyorsanızERDDAPAynı URL'ye sahip olmak için, verilen bir kullanıcıyı sadece kompozitlerden birine atan bir ön son sistemi kullanın.ERDDAPs (IP adresine dayanarak) Ancak kullanıcının tüm istekleri sadece kompozitlerden birine gidiyor.ERDDAPs. İki neden var:
- Temel bir veri kümesi yeniden yüklendiği zaman ve metadata değişiklikleri (e.g., bir şebekeli veri kümesindeki yeni bir veri dosyası zaman değişkeninin nedenlerine neden olur.actual\_rangedeğiştirmek için değiştirmek) , kompozitERDDAPs geçici olarak biraz senkronize edilecek, ancak ileKalıcı tutarlılık. Normalde, 5 saniye içinde tekrar gelecekler, ancak bazen daha uzun olacaktır. Bir kullanıcı, güvenen otomatik bir sistem yaparsaERDDAP™Abonelik abonelikleriBu tetikleyici eylemler, kısa senkronizasyon sorunları önemli olacaktır.
- 2+ kompozitERDDAPHer biri kendi abonelik setlerini koruyor (Yukarıda açıklanan senkronizasyon problemi nedeniyle) .
Bu yüzden verilen bir kullanıcı sadece kompozitlerden birine yönlendirilmelidir.ERDDAPBu sorunları önlemek için. Eğer kompozitlerden biri varsaERDDAPs gider, ön son sistem bunu yönlendirebilirERDDAP“Kullanıcılar başka bir şeyeERDDAP™Bu yukarı. Ancak, ilk kompozitiğe neden olan bir kapasite sorunuysaERDDAP™Başarısız olmak için (Aşırı bir kullanıcı mı? Birbiriinkâr-of-service saldırısı??) Ancak bu, kullanıcılarını diğer kompozitiğe yönlendirmek çok olasıdırERDDAPs bir sebep olacaktırKaliding başarısızlık. Böylece, en sağlam kurulumun kompozit olması gerekirERDDAPFarklı URL'ler ile.
Ya da belki daha iyi, birden fazla kompozit kurmakERDDAPdengeleme olmadan s. Bu durumda, her birini vermenin bir noktası yapmalısınızERDDAPFarklı bir isim / kimlik ve onları dünyanın farklı bölgelerinde ayarlarsanız (e.g., farklı AWS bölgeleri) E.g.,ERD\US\ East,ERD\_US\_West,ERD\_IE,ERD\_FR,ERD\_IT, böylece kullanıcılar bilinçli olarak, defalarca belirli bir şeyle çalışırERDDAP.
- \[Bir sunucuda çalışan yüksek bir performans sisteminin büyüleyici bir tasarımı için, bunu görMailinatorun ayrıntılı açıklaması.\]
Datasets in Very High Request
Gerçekten alışılmadık durumda, bunlardan biri A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A , B Ya da C C C C ERDDAPs, bant sınırlamaları veya sert sürücü sınırlamaları nedeniyle taleplerle devam edemez, verileri kopyalamak mantıklıdır (Tekrar tekrar tekrar tekrar tekrar tekrar tekrar) Başka bir sunucu +hard Drive+ERDDAPBelki de onunla birlikteEDDGridKopya kopyave/veyaEDDTableCopy. Orijinal veri kümesine sahip olmak için ideal görünebilir ve kopyalanan veri seti, kompozitte bir veri kümesi olarak sorunsuz görünür.ERDDAP™Bu zordur, çünkü iki veri kümesi farklı zamanlarda biraz farklı eyaletlerde olacaktır. (Özellikle, orijinal yeni veriler aldıktan sonra, ancak kopyalanan veri setinden önce kopyası kopyasını alır.) . Bu nedenle, veri kümelerinin biraz farklı başlıklara verildiğini öneririm (E.g., "... (kopya #1) " ve "... (kopya #2) ", ya da belki " (Ayna # n n n ) " veya " (server # n n n ) " " "") Ve kompozitlerde ayrı veri setleri olarak görünERDDAP. Kullanıcılar listelerini görmek için kullanılırAyna siteleriPopüler dosya indirme sitelerinde, bu yüzden sürpriz ya da hayal kırıklığına uğratmamalıdır. Verilen bir sitede bant sınırlamaları nedeniyle, başka bir sitede bulunan aynaya sahip olmak mantıklı olabilir. Ayna kopyası farklı bir veri merkezindeyse, sadece bu veri merkezinin kompozitiğine erişimERDDAP™Farklı başlıklar (E.g., "mirror #1) Gerekli değil.
Düzenli Hard Drives karşı RAIDs
Büyük bir veri kümesi veya bir veri setleri grubu ağır kullanılmazsa, hata toleransı teklif ettiğinden ve başka bir sunucunun işleme gücüne veya bant genişliğine ihtiyacınız olmadığı için bir RAID üzerinde verileri depolamak mantıklı olabilir. Ancak bir veri kümesi ağır kullanılıyorsa, verileri başka bir sunucu + + +'da kopyalamak daha mantıklı olabilirERDDAP™+ sert sürücü (Benzer şekilde benzerGoogle ne yapar) Birden fazla veri setlerini depolamak için bir sunucu ve bir RAID kullanmak yerine, her iki sunucu +hardDrive+ERDDAPBunlardan biri başarısız olana kadar ızgarada.
Başarısızlık Başarısızlık
Ne olur...
- Bir veri kümesi için bir talep patlaması var (e.g., bir sınıftaki tüm öğrenciler aynı anda benzer veriler talep ediyor) ?? Sadece sadeceERDDAP™Bu veri kümesine hizmet etmek boğulacak ve yavaşlayacak veya talepleri reddedecektir. KompozitERDDAP™Ve diğer veERDDAPs etkilenmeyecek. Sistem içindeki belirli bir veri kümesi için limit faktörü, verilerle zor sürücüdür (Değil değilERDDAP) , tek çözüm (Hemen hemen değil) Farklı bir sunucu +hardDrive+ üzerinde veri kümesinin bir kopyasını yapmakERDDAP.
- An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An An A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A , B Ya da C C C C ERDDAP™Başarısızlık başarısız olmaz (E.g., sert sürücü başarısızlık) ?? Sadece dataset (s) Yemin ederim ki,ERDDAP™Etkileniyor. Eğer veri kümesi (s) Başka bir sunucu +hardDrive+ üzerinde aynalıERDDAPAncak etki minimumdur. Sorun 5 veya 6 RAID seviyesinde zor bir sürücü başarısızlığıysa, sadece sürücüyü değiştirir ve sürüşteki verileri yeniden inşa etmiş olursunuz.
- KompozitERDDAP™Başarısız mı? Bir sistemi çok iyi yapmak istiyorsanızyüksek kullanılabilirlik, yukarı ayarlanabilirBirden çok bileşikERDDAPs (Yukarıda tartışıldığı gibi) , gibi bir şey kullanarakNGINXveyaTraefikYük dengelemek için. Verilen bir kompozitinERDDAP™Çok sayıda kullanıcıdan çok fazla istekle başa çıkabilir çünkü birçok kullanıcıdan çok fazla talep alabilir çünkü metadata için talepler küçüktür ve hafızada olan bilgiler tarafından ele alınır ve Veriler için talepler (Hangi büyük olabilir) çocuğa yönlendirilirERDDAPs.
Basit, Scalable
Bu sistem kurmak ve yönetmek kolaydır ve herhangi bir kısmının aşırı yüklendiği zaman kolayca silinebilir. Belirli bir veri merkezi için verilen tek gerçek sınırlama, veri merkezinin bant genişliği ve sistemin maliyetidir.
Band Wide Band
Sistemin yaygın olarak kullanılan bileşenlerin yaklaşık bant genişliğini unutmayın:
Bilej | Approximate Band genişliği (GBytes /s) |
---|---|
Krishna memory | 2.5 |
SSD sürücüsü | 1 1 1 |
Maske sert sürücü | 0.3 |
Gigabit Ethernet | 0.1 0.1 0.1 |
OC-12 | 0.06 |
OC-3 | 0.015 |
T1 | 0.0002 |
Yani, bir tane sert sürücü (0.3GB/s) One server with one serverERDDAP™Muhtemelen bir Gigabit Ethernet LAN'ı satabilir (0.1GB/s) . Ve bir Gigabit Ethernet LAN (0.1GB/s) Muhtemelen OC-12 Internet bağlantısı saturate an OC-12 internet bağlantısı (0.06GB/s) . Ve en azından bir kaynak listesi OC-12 hatları ayda yaklaşık 100,000 dolara mal oluyor. (Evet, bu hesaplamalar sistemi sınırlarına itmeye dayanıyor, bu iyi değil çünkü çok zor cevaplara yol açıyor. Ancak bu hesaplamalar sistemin parçalarını planlamak ve dengelemek için faydalıdır.) Açıkçası, veri merkeziniz için uygun bir şekilde hızlı internet bağlantısı, sistemin en pahalı parçasıdır. Bir düzine sunucu ile kolayca ve nispeten ucuz bir şekilde bir ızgara inşa edebilirsinizERDDAPÇok sayıda veriyi hızlı bir şekilde pompalayabilen s, ancak uygun bir hızlı internet bağlantısı çok pahalı olacaktır. Kısmi çözümler şunlardır:
- Encourage müşterileri, gerekli olan tüm verilerden alt setleri talep etmek için. Müşteri küçük bir bölge veya daha düşük bir karar için yalnızca verilere ihtiyaç duyarsa, talep etmeleri gereken şey budur. Subcept, protokollerin merkezi bir odak noktasıdırERDDAP™Veriler talep etmek için destekler.
- Encourage sıkıştırılmış verileri iletmektedir.ERDDAP™ sıkıştırlarBir veri iletimi eğer "kabul-encoding" bulursaHTTP GETTalep başlığı. Tüm web tarayıcıları "kabul-encoding" kullanıyor ve cevabı otomatik olarak bastırıyor. Diğer müşteriler (e.g., bilgisayar programları) Açıkça kullanmak zorunda.
- sunucularınızı, nispeten daha az pahalı bant maliyetleri sunan bir ISS veya başka bir sitede konumlandırın.
- sunuculara,ERDDAPFarklı kurumlara gelir, böylece maliyetler dağılır. Daha sonra kompozitlerinizi bağlayabilirsinizERDDAP™OnlaraERDDAPs.
Not that Not that Note that NotCloud Computingve web barındırma hizmetleri ihtiyacınız olan tüm internet bantlarını sunar, ancak fiyat problemini çözmeyin.
Ölçeklenebilir, yüksek kapasite, hata-tolerant sistemler hakkında genel bilgi için, Michael T. Nygard'ın kitabını görünKonuşuyor.
Legos gibi
Yazılım tasarımcıları genellikle iyi kullanmaya çalışırYazılım tasarım modelleriProblemleri çözmek için. İyi desenler iyidir, çünkü iyi yaratmak ve çalışmak, iyi özelliklere yol açan genel amaçlı çözümler. Desen isimleri standart değildir, bu yüzden deseni çağıracağımERDDAP™Lego Desen kullanır. Her Lego (Her biri herERDDAP) Basit, küçük, standart, stand-alone, tuğla (Data server) Diğer legoslarla bağlantılı olmasına izin veren tanımlanmış bir arayüzle (ERDDAPs) . BölümlerERDDAP™Bu sistemi oluşturan: abonelik ve bayrakURL sistemleri (Hangi iletişim için izin verirERDDAPs) EDD...Erddap yönlendirme sistemi ve sistemRESTfulKullanıcılar veya diğer kullanıcılar tarafından oluşturulabilecek veriler için taleplerERDDAPs. Bu nedenle, iki veya daha fazla böfke verildi (ERDDAPs) , çok sayıda farklı şekil oluşturabilirsin (Ağ topolojileriERDDAPs) . Elbette, tasarım ve özellikleriERDDAP™Lego gibi değil, belki de belirli bir topoloji için mümkün ve optimize etmek için farklı bir şekilde yapılabilirdi. Ama bunu hissediyoruzERDDAP‘ Lego gibi tasarım, herhangi bir çözümü sağlayan iyi, genel amaçlı bir çözüm sunuyorERDDAP™yönetici yönetici yönetici (veya yönetici grubu) Her türlü farklı federasyon topolojilerini oluşturmak. Örneğin, tek bir organizasyon üç tane kurulabilir (veya daha fazla) ERDDAPs as shown in theERDDAP™Grid/Cluster Diagram Yukarıda. Ya da dağıtılmış bir grup (IOOS? CoastWatch? NCEI? NWS?NOAA?? USGS? DataONE? NEON? LTER? OOI? BODC? ONC? JRC? WMO?) Bir tane kurmak olabilirERDDAP™Her küçük outpost (Böylece veriler kaynağa yakın kalabilir) Ve sonra bir kompozit kurmakERDDAP™Sanal veri setleriyle merkezi ofiste (Bu her zaman mükemmel bir şekilde güncelleniyor) Her birinden küçük outpostERDDAPs. Gerçekten de, hepsiERDDAPDünya çapında çeşitli kurumlarda kuruldu, bu da diğerlerinden veri alırERDDAPs ve/veya diğer verilere veri sağlarERDDAPs, dev bir ağ oluşturmakERDDAPs. Nasıl serin?! Yani, Lego’nun olduğu gibi, olasılıklar sonsuzdur. Bu yüzden bu iyi bir model. Bu yüzden bu iyi bir tasarım çünküERDDAP.
Farklı istek türleri
Veri sunucu topolojilerinin bu tartışmasının gerçek yaşam komplikasyonlarından biri, farklı talep türleri ve farklı talepleri optimize etmenin farklı yolları olmasıdır. Bu çoğunlukla ayrı bir konudur (Ne kadar hızlı olabilirERDDAP™Veriler için talepe cevap verir mi?) Topoloji tartışmalarından (Veri sunucuları ve hangi sunucunun gerçek verilere sahip olduğu ilişkilerle hangi anlaşmalara sahiptir) .ERDDAP™Elbette, her türlü istekle verimli bir şekilde başa çıkmaya çalışır, ancak diğerlerinden daha iyi davranır.
- Birçok istek basittir. Örneğin: Bu veri kümesi için metadata nedir? Ya da: Bu ızgara veri kümesi için zaman boyutunun değerleri nedir?ERDDAP™Bunu mümkün olduğunca çabuk işlemek için tasarlanmıştır (genellikle içinde<=2 ms) Bu bilgiyi hafızada tutmak.
- Bazı istekler oldukça zor. Örneğin: Bana bir veri kümesinin bu alt setini verin (Hangi bir veri dosyasında) . Bu istekler nispeten hızlı bir şekilde ele alınabilir çünkü bu zor değil.
- Bazı istekler zordur ve böylece zaman alıcıdır. Örneğin: Bana bir veri kümesinin bu alt setini verin (10.000+ veri dosyalarından herhangi birinde olabilir veya her birinin 10 saniyeden caydırıcı veri dosyalarından olabilir) .ERDDAP™v2.0, bu isteklerle başa çıkmak için bazı yeni, daha hızlı yollar tanıttı, özellikle de istek-çalışan iplerin talep edilen farklı alt setlerle başa çıkmalarına izin vererek. Ama bu probleme başka bir yaklaşım daha var ki bu problemeERDDAP™Henüz destek değil: verilen bir veri kümesi için veri dosyalarının alt setleri ayrı bilgisayarlarda depolanabilir ve analiz edilebilir ve sonra orijinal sunucuda yapılan sonuçlar. Bu yaklaşım denirMapReduceVe abartılırHadoopİlk önce, (??) Açık kaynak MapReduce programı, Google kağıtlarından fikirlere dayanıyordu. (MapReduce'ye ihtiyacınız varsaERDDAPLütfen bir e-posta isteği göndererd.data at noaa.gov.) Google'ın Google'ıBigQueryİlginçtir çünkü MapReduce'nin alt tabut veri setlerine uygulanan bir uygulama gibi görünüyor, bu da bir tanesidir.ERDDAP“Temel hedefler. Muhtemelen bir yaratabileceğinizdirERDDAP™BigQuery veri setinden veri kümesi aracılığıylaEDDTable FromDatabaseÇünkü BigQuery JDBC arayüzü ile erişilebilir.