Együttműködésdatasets.xmlFile
\[Ez a weboldal csak érdekes leszERDDAP™adminisztrátorok.\]
Miután követted aERDDAP™ telepítési utasítások, szerkesztenie kelldatasets.xmlfájl Tomcat /content/erddap/ leírja azokat az adatkészleteket, amelyeket aERDDAP™A telepítés szolgálni fog.
Láthat egy példátdatasets.xmlGitHub...
Bevezetés
Néhány közgyűlés szükséges
Adatkészlet beállításaERDDAP™nem csak egy dolog, ami rámutat az adatkészlet könyvtárára vagy URL-re. Meg kell írnia egy darab XML-tdatasets.xmlamely leírja az adatkészletet.
- A rácsos adatkészletek esetében, hogy az adatkészlet megfeleljenERDDAPA rácsos adatok adatstruktúrája, azonosítania kell az adatkészlet változóinak leállítását, amelyek ugyanazokat a dimenziókat osztják meg. (Miért? Hogyan?)
- Az adatkészlet jelenlegi metaadatát automatikusan importálják. De ha módosítani szeretné ezt a metaadatot, vagy hozzáadni más metaadatot, akkor meg kell határoznia.datasets.xml... ÉsERDDAP™más metaadatokra van szükség, beleértveglobális tulajdonságok (mint példáulinfoUrlintézmény,sourceUrlösszefoglaló és cím) ésváltozó tulajdonságok (mint példáullong\_nameés egység) ... Ahogyan a metaadata, amely jelenleg az adatkészletben található, leíró információkat ad az adatkészlethez, a metadata által kértERDDAP™leíró információkat ad az adatkészlethez. A további metaadat jó kiegészítés az adatkészlet és segítERDDAP™tegyen jobb munkát az adatok bemutatására olyan felhasználók számára, akik nem ismerik.
- ERDDAP™Szüksége van arra, hogy különleges dolgokat tegyenHosszúság, magasság, magasság (vagy mélység) és az idő változók...
Ha megveszi ezeket az ötleteket, és kitölti az XML létrehozására irányuló erőfeszítéstdatasets.xml, kapsz minden előnye, hogyERDDAP™beleértve:
- Teljes szöveges keresés az adatkészletekhez
- Adatkészletek keresése kategória szerint
- Adathozzáférési formák ( datasetID .html) így számos különböző fájlformátumban kérhet egy adatkészletet
- Forms kérni grafikonok és térképek ( datasetID .gráf)
- Web Map szolgáltatás (WMS) a rácsos adatkészletekért
- RESTfulHozzáférés az adataihoz
A készítésdatasets.xmljelentős erőfeszítéseket tesz az első néhány adatkészlet számára, de könnyebb lesz ... Az első adatkészlet után gyakran újra felhasználhatja a munkát a következő adatkészlethez. szerencsére,ERDDAP™jön kétEszközökhogy segítsen létrehozni az XML-t minden adatkészlethezdatasets.xml... Ha megragadsz, lásd a mirész további támogatás megszerzéséről...
Adatszolgáltató Formátum
Amikor egy adatszolgáltató érkezik hozzád, remélve, hogy hozzáad néhány adatot aERDDAPNehéz és időigényes, hogy összegyűjtse az összes metaadatát (információ az adatkészletről) szükséges az adatkészlet hozzáadásáhozERDDAP... Számos adatforrás (például .csv fájlok, Excel fájlok, adatbázisok) nincs belső metaadata, ígyERDDAP™rendelkezik olyan adatszolgáltatói formanyomtatványsal, amely összegyűjti a metaadatot az adatszolgáltatótól, és más iránymutatást ad az adatszolgáltatónak, ideértve a kiterjedt útmutatást is.Adatbázisok... A benyújtott információ átalakul adatasets.xmlformátum, majd e-mailbenERDDAP™adminisztrátor (Te vagy) írás (Megjelent) a bigParentDirectory[szerkesztés] /logs/dataProviderForm.log Így a forma félautomatizálja az adatkészlet beszerzésének folyamatátERDDAPde aERDDAP™Az adminisztrátornak még mindig befejeznie kelldatasets.xmlcunk és foglalkozik az adatfájl megszerzésével (s) a szolgáltatótól vagy az adatbázishoz való csatlakozástól.
A tényleges adatfájlok külső forrásokból történő benyújtása hatalmas biztonsági kockázat, ígyERDDAP™nem foglalkozik ezzel. Meg kell találnia egy olyan megoldást, amely az Ön és az adatszolgáltató számára működik, például e-mail (kis fájlokhoz) , húzza ki a felhőből (például a DropBox vagy a Google Drive) Sftp webhely (jelszavakkal) vagy sneaker Net (USB hüvelykujjj meghajtó vagy külső merevlemez) ... Valószínűleg csak olyan fájlokat kell elfogadnia az emberektől, akiket ismer. Meg kell szkennelni a fájlokat vírusok és más biztonsági óvintézkedések.
Nincs kapcsolatERDDAP™az adatszolgáltatói űrlaphoz (például,ERDDAP™weboldal) ... Ehelyett, ha valaki azt mondja, hogy az adatait az Ön által szolgáltatottERDDAPKüldhet nekik egy e-mailt, mondván valamit: Igen, megkaphatjuk az adataitERDDAP... Kezdéshez kérjük, töltse ki az űrlapot https://yourUrl/erddap/dataProviderForm.html (vagyhttp://hahttps://nem engedélyezett) ... Miután befejezte, kapcsolatba lépek, hogy dolgozzon ki a végső részleteket. Ha csak meg akarja nézni a formát (anélkül, hogy kitölte volna) Láthatja a formátERDAERDDAP:Bevezetés,1. rész,2. rész,3. részés4. rész... Ezek a linkek aERD ERDDAP™Információt küldj hozzám, nem te, ezért ne nyújts be információt velük, hacsak nem szeretné hozzáadni az adatokatERD ERDDAP...
Ha el akarja távolítani az adatszolgáltatói űrlapot az ÖntőlERDDAP™, tedd
<dataProviderFormActive>false</dataProviderFormActive>
a setup.xml fájlban.
Ennek az impetusa voltNOAA2014Közös hozzáférés a kutatási eredményekhez (PARR) irányelvami megköveteli, hogy mindenNOAAaz adófizetői dollárokon keresztül finanszírozott környezeti adatokat egy adatszolgáltatáson keresztül elérhetővé kell tenni (Nem csak fájlok) a teremtés 12 hónapján belül. Tehát fokozott érdeklődés van a használatbanERDDAP™az ASAP szolgáltatáson keresztül elérhető adatkészletek készítése. Egy hatékonyabb módszerre volt szükségünk ahhoz, hogy számos adatszolgáltatóval foglalkozzunk.
Visszajelzések/Suggestions? Ez a forma új, ezért kérjük e-mailerd dot data at noaa dot govha bármilyen visszajelzése vagy javaslata van ennek javítására.
Eszközök
ERDDAP™jön két parancssori programok, amelyek eszközök, hogy segítsen létrehozni az XML minden adatkészlet, hogy azt akarja, hogy aERDDAP™szolgálni. Miután létrehoztálERDDAP™és futtassa (legalább egy alkalommal) megtalálhatja és használhatja ezeket a programokat a programokban Tomcat /webapps/erddap/WEB-INF könyvtár. Vannak Linux/Unix shell szkriptek (a kiterjesztés .sh) Windows scriptek (a kiterjesztés .bat) minden program.\[Linuxon futtassa ezeket az eszközöket, mint ugyanazt a felhasználót (Tomcat?) Ez fogja futtatni Tomcat.\]Amikor fut minden programot, kérdéseket tesz fel. Minden kérdés esetén írja be a választ, majd press Enter. Vagy sajtó ^C, hogy bármikor kilép egy program.
A program nem fut?
- Ha egy ismeretlen programot kapsz (vagy hasonló) hibaüzenet, a probléma valószínűleg az, hogy az operációs rendszer nem találtJava... Ki kell találnod, holJavaa számítógépén van, majd szerkesztse a java referenciát a .bat vagy .sh fájlban, amelyet megpróbál használni.
- Ha kap egy jar fájl nem talált vagy osztály nem talált hibaüzenetet, akkorJavanem találhatja meg az egyik osztályt, amely szerepel a .bat vagy .sh fájlban, amelyet megpróbál használni. A megoldás az, hogy kitaláljuk, hol van ez a .jar fájl, és szerkeszteni a java hivatkozást a .bat vagy .sh fájlban.
- Ha egy verziót használJavatúl öreg egy programhoz, a program nem fut, és hibaüzenetet fog látni, mint például
Kivétel a szálban "fő" java.lang.UnsupportedClassVersionError:
Néhány / osztály / név : Nem támogatott nagy.minor verzió dalszöveg: SomeNumber
A megoldás az, hogy frissítsük a legújabb verziójátJavaés győződjön meg arról, hogy a .sh vagy .bat fájl a program használja.
Az eszközök különböző diagnosztikai üzeneteket nyomtatnak:
- Az "ERROR" szót akkor használják, amikor valami olyan rosszul ment, hogy az eljárás nem sikerült befejezni. Bár bosszantó hiba, a hiba arra kényszeríti, hogy foglalkozzon a problémával.
- A "WARNING" szót akkor használják, amikor valami rosszul ment, de az eljárás befejeződött. Ezek elég ritkák.
- Bármi más csak informatív üzenet. Hozzáadhat \-verbose-t aGenerateDatasetsXmlvagyDasDdsparancssor további informatív üzenetek megszerzéséhez, amelyek néha segítenek a problémák megoldásában.
A két eszköz nagy segítség, de még mindig el kell olvasnia ezeket az utasításokat ezen az oldalon óvatosan, és fontos döntéseket hoz magának.
GenerateDatasetsXml
- GenerateDatasetsXml egy parancssori program, amely képes létrehozni egy durva tervezet az adatkészlet XML szinte bármilyen típusú adatkészlet.
Rendben vagyunk azzal, hogy használod a GenerateDatasets-t Xml ahelyett, hogy cunkkokat hozna létredatasets.xmlkézzel, mert:
- GenerateDatasets Az Xml másodpercekben működik. Ennek kézzel történő megtétele legalább egy órás munka, még akkor is, ha tudod, mit csinálsz.
- GenerateDatasets Az Xml jobb munkát végez. Ennek kézzel történő elvégzése kiterjedt tudást igényel arról, hogyanERDDAP™munkák. Nem valószínű, hogy jobb munkát fog végezni kézzel. (Bob Simons mindig használja a GenerateDatasets Xml az első tervezethez, és írtaERDDAP...)
- GenerateDatasets Az Xml mindig érvényes darabot generáldatasets.xml... Bármelyik részegdatasets.xmlhogy írsz, valószínűleg legalább néhány hibát, amelyek megakadályozzákERDDAP™az adatkészlet betöltésétől. Gyakran órákat vesz igénybe ezeknek a problémáknak a diagnosztizálására. Ne pazarolja az idejét. Let Generate Adatkészletek Xml csinálja a kemény munkát. Ezután finomíthatja a .xml-t kézzel, ha akarja.
Ha használja a GenerateDatasets Xml program:
- A Windows-on az első alkalommal futtatja a GenerateDatasetsXml-t, szerkesztenie kell a GenerateDatasetsXml.bat fájlt egy szövegszerkesztővel, hogy megváltoztassa az utat a javára. Exe fájl, hogy a Windows találjonJava...
- GenerateDatasets Xml először kéri, hogy adja meg az EDDType-t (Erd Dap Adatkészlet típus) az adatkészlet. Lásd:Adatkészlet típusok listája (ebben a dokumentumban) kitalálni, hogy melyik típus megfelelő az adatkészlethez, amelyen dolgozol. A rendszeres EDDTypes mellett néhánySpeciális/Pseudo adatkészlet típusok (pl. az egyik, amely összetör egy THREDDS katalógust, hogy létrehozzon egy darab darabotdatasets.xmlminden adatkészlet a katalógusban) ...
- GenerateDatasets Az Xml egy sor kérdést tesz fel, amelyek specifikusak az EDDType számára. A kérdések összegyűjtik a szükséges információkatERDDAP™az adatkészlet forrásához való hozzáféréshez. Hogy megértsük, miERDDAP™kéri, lásd a dokumentációt az EDDType számára, amelyet az azonos adatkészlettípusra kattintva megadottAdatkészlet típusok listája...
Ha speciális karakterekkel kell belépnie egy sztringbe (pl. fehértér karakterek az elején vagy végén, nem-ASCII karakterek) belépj egyJSON stílusú sztring (speciális karakterekkel elmenekült \ karakterekkel) ... Például, hogy belépjen csak egy lapos karakter, lépjen be "\t" (a környező kettős idézetek, amelyek azt mondják,ERDDAP™ez egy JSON stílusú sztring.
- Gyakran az egyik válasz nem lesz az, amire a GenerateDatasetsXml-nek szüksége van. Ezután próbálkozhat újra, felülvizsgált válaszokkal a kérdésekre, amíg a GenerateDatasets Az Xml sikeresen megtalálhatja és megértheti a forrásadatokat.
- Ha helyesen válaszol a kérdésekre (vagy elég helyesen) , GenerateDatasets Az Xml összekapcsolja az adatkészlet forrását, és összegyűjti az alapvető információkat (például változó nevek és metaadata) ... Adatkészletek, amelyek a helyiNetCDF .ncés kapcsolódó fájlok, GenerateDatasets Az Xml gyakran kinyomtatja a fájl ncdump-szerű szerkezetét, miután először olvassa el a fájlt. Ez adhat információt, hogy válaszoljon a kérdések jobb egy későbbi hurok keresztül GenerateDatasetsXml.
- GenerateDatasets Az Xml ezután az XML adatkészletének durva tervezetét fogja létrehozni.
- Diagnosztikai információk és az XML adatkészlet durva tervezete meg lesz írva bigParentDirectory[szerkesztés] /log/GenerateDatasetsXml.log .
- Az XML adatkészlet durva tervezetét meg kell írni bigParentDirectory[szerkesztés] /logs/GenerateDatasetsXml.out .
"0 fájl" hibaüzenet
Ha fut a GenerateDatasets Xml vagyDasDdsvagy ha megpróbálsz betölteni egyEDDGridFájlok vagy EDDTableFrom... Files adatkészletERDDAP™, és kap egy "0 fájl" hibaüzenetet, amely jelzi, hogyERDDAP™talált 0 megfelelő fájlokat a könyvtárban (ha úgy gondolja, hogy van egyező fájlok ebben a könyvtárban) :
-
Ellenőrizze, hogy megadta a könyvtár teljes nevét. És ha megadta a minta fájlnév, győződjön meg róla, hogy megadta a fájl teljes nevét, beleértve a teljes könyvtár nevét.
-
Ellenőrizze, hogy a fájlok valóban ebben a könyvtárban vannak.
-
Ellenőrizze a könyvtár neve varázslatát.
-
Ellenőrizze a fájlNameRegex. Valójában nagyon könnyű hibákat hibáztatni a regexekkel. Tesztcélok esetén próbálja meg a regex .\*-t, amely minden fájlnévhez illeszkedik. (Lásd eztregex dokumentációésregex bemutató...)
-
Ellenőrizze, hogy a felhasználó, aki fut a program (pl. felhasználó=tomcat (?) Tomcat/ERDDAP) "olvassa" az engedélyt ezekre a fájlokra.
-
Egyes operációs rendszerekben (például SELinux) és a rendszerbeállításoktól függően a felhasználónak, aki futtatja a programot, „olvassa” a könyvtárak egész láncolatát, amely a fájlokat tartalmazó könyvtárhoz vezet.
-
Ha olyan problémák vannak, amelyeket nem lehet megoldani,kérés támogatásaa lehető legtöbb információval. Hasonlóképpen, ha úgy tűnik, hogy az adott adatkészlet megfelelő EDDType-je nem működik az adatkészlettel, vagy ha nincs megfelelő EDDType, kérjük, írjon egyA GitHub kérdésea részletekkel (mintafájl, ha releváns) ...
Meg kell szerkeszteni a kimenetet a GenerateDatasets Xml, hogy jobbá tegye.
-
DISCLAIMER: A pogánydatasets.xmlMADE BE GenerateDatasets Xml ISN'T PERFECT. MINDEN MINDEN VÁLLALKOZÓ ÉS EDIT THE XML BEFORE FELÜLVIZSGÁLATERDDAP... GenerateDatasets Xml RELIES A RULES-OF-THUMB WHICH ALWAYS CORRECT. AZ ELNÖK AZ ELNÖK KORRÁNYULÓJÁNAK AZ ELNÖK AZ ELNÖK AZ ELNÖK AZ ELNÖK AZ ELNÖK SZÁMÁRAERDDAPSdatasets.xmlFILE.
(Fun Fact: Nem kiabálok. Történelmi jogi okokból a kiáltókat minden sapkában meg kell írni.)
A GenerateDatasetsXml kimenete durva tervezet. Majdnem mindig kell szerkeszteni. Folytattuk, és továbbra is óriási erőfeszítést teszünk annak érdekében, hogy a kimenet a lehető legkészebb legyen, de vannak korlátozások. Gyakran előfordul, hogy a szükséges információk egyszerűen nem állnak rendelkezésre a forrás metaadatából.
Az alapvető probléma az, hogy számítógépes programot kérünk (GenerateDatasetsXml) hogy egy olyan feladatot, ahol, ha ugyanazt a feladatot 100 ember, akkor kap 100 különböző eredményeket. Nincs egyetlen "jobb" válasz. Nyilvánvaló, hogy a program legközelebb áll a Bob elmének olvasásához (Nem a tiéd) De még így sem, ez nem egy teljesen értetlen AI program, csak egy csomó heurisztika összefonódott, hogy egy AI-szerű feladat. (Egy teljesen érthetetlen AI program napja jön, de még nem. Ha/ha ez megtörténik, akkor az embereknek nagyobb problémái lehetnek. Legyen óvatos, hogy mit akarsz.)
-
Információs célokra a kibocsátás a globális forrásAttributes és változó forrásAttributes mint észrevételek.ERDDAP™A forrásAttributes ésaddAttributes (mely előbbi) hogy a kombinált Olyan tulajdonságok, amelyeket a felhasználónak mutatnak. (És más tulajdonságok automatikusan hozzáadódik a hosszúsághoz, a magassághoz, a magassághoz, a mélységhez és az idő változókhoz, amikorERDDAP™ténylegesen teszi az adatkészletet) ...
-
Ha nem tetszik egy forrásAttribute, írja felül az addAttribute hozzáadása ugyanazzal a névvel, de más érték (vagy nem érték, ha el akarja távolítani) ...
-
MindenaddAttributesszámítógép-generált javaslatok. Szeressétek őket! Ha nem tetszik egy addAttribute, változtassa meg.
-
Ha mást szeretne hozzáadniaddAttributesadd hozzá őket.
-
Ha változtatni akarszdestinationNameVáltoztasd meg. De ne változzonsourceNameS.
-
Meg tudod változtatni a rendetdataVariablevagy távolítsa el őket.
- Ezután használhatóDasDds (lásd alább) ismételten tesztelni az XML-t az adatkészlet számára annak biztosítása érdekében, hogy az elért adatkészlet úgy jelenjen meg, ahogy azt szeretné, hogy bekapcsolja.ERDDAP...
- Érezze szabadon, hogy kis változásokat tegyendatasets.xmlcunk, amit generált, például jobb ellátástinfoUrlösszefoglaló vagy cím.
DoNotAddStandardNames
Ha tartalmazza a \-doNotAddStandardNames mint parancssori paraméter, ha fut generál Adatkészletek Xml, generál Adatkészletek Xml nem fog hozzáadnistandard\_nameaaddAttributesbármilyen változó más, mint a latitude, hosszúság, magasság, mélység vagy idő (amely nyilvánvalóstandard\_names) ... Ez hasznos lehet, ha a termelést használja Adatkészletek Xml közvetlenülERDDAP™a kimenet szerkesztése nélkül, mert generál Adatkészletek Xml gyakran guessesstandard\_nameHelytelenül. (Vegye figyelembe, hogy mindig azt javasoljuk, hogy szerkesztse a kimenetet, mielőtt használja aztERDDAP...) Ezzel a paraméterrel más kisebb hatások is lesznek, mert a kitaláltstandard\_namegyakran használják más célokra, például egy új létrehozásralong\_nameÉs létrehozni a színBar beállításokat.
Jelölés
Alternatívaként a kérdések megválaszolására interaktívan a billentyűzeten, és a további adatkészletek létrehozására való looping, parancssori érveket biztosíthat, hogy válaszoljon az összes kérdésre egy adatkészlet létrehozásához. GenerateDatasets Az Xml feldolgozza ezeket a paramétereket, írja a kimenetet a kimeneti fájlba, és kilép a programból.
A beállításhoz először használja a programot interaktív módban, és írja le a válaszokat. Íme egy részleges példa: Tegyük fel, hogy futtassa a forgatókönyvet: ./GenerateDatasetsXml.sh Ezután lépjen be: EDDTableFromAsciiFiles Ezután lépjen be: /u00/data/ Ezután lépjen be: .\*\.asc Ezután lépjen be: /u00/data/sampleFile.asc Ezután lépjen be: ISO-8859-1
Hogy ezt nem interaktív módon futtassa, használja ezt a parancssort: ./GenerateDatasetsXml.sh EDDTableFromAsciiFiles /u00/data/ .\*=.asc /u00/data/sampleFile.asc ISO-8859-1 Tehát alapvetően csak felsorolja az összes választ a parancssoron. Ez hasznos lehet az olyan adatkészletek számára, amelyek gyakran változnak olyan módon, amely megköveteli a GenerateDatasets újraindítását Xml (nevezetesenEDDGridFromThreddsCatalog) ...
Részletek:
- Ha egy paraméter tartalmaz egy teret vagy egy speciális karaktert, akkor kódolja a paramétert, mint egyJSON stílusú sztringpl.: „A paraméterem a terekkel és kettővel\nvonalak.”
- Ha egy üres sztringet paraméterként szeretné meghatározni, használja: semmi
- Ha egy paraméter alapértelmezett értéket szeretne meghatározni, használja: alapértelmezett
- GenerateDatasets Xml támogatja a -i adatkészletek XmlName # TagName parancssori paraméter, amely beilleszti a kimenetet a megadottdatasets.xmlfájl (az alapértelmezés Tomcat /content/erddap/datasets.xml) ... GenerateDatasets Az Xml két vonalat keres az adatkészletekben XmlName:
<!-- Begin GenerateDatasetsXml #*tagName someDatetime* -->
és
<!-- End GenerateDatasetsXml #*tagName someDatetime* -->
és cserélje ki mindent az e sorok között az új tartalommal, és megváltoztatja a SomeDatetime-t.
- A -i kapcsoló csak feldolgozott (változásokdatasets.xmlcsak) ha fut a GenerateDatasets Xml parancssori érvek, amelyek meghatározzák az összes választ az összes kérdésre egy hurok a program. (Lásd: „Scripting” fent.) (A gondolkodás: Ez a paraméter a forgatókönyvekkel való használatra szól. Ha a programot interaktív módban használja (Info beírása a billentyűzeten) Valószínűleg az XML hibás darabjait generálod, mielőtt létrehozod azt, amit akarsz.)
- Ha a Kezdő és Végső sorokat nem találják, akkor ezeket a sorokat és az új tartalmakat közvetlenül beillesztik</erddapDatasets>.
- Van még egy -I (tőke i) kapcsolja be a tesztelési célokat, amelyek ugyanazt működnek, mint -i, de létrehozza az úgynevezett fájltdatasets.xml dalszöveg és nem változtat megdatasets.xml...
- Ne futtassa GenerateDatasets Xml - egyszerre két folyamatban. Van egy esély, hogy csak egy sor változás fog tartani. Lehet, hogy komoly baj van (például korrupt fájlok) ...
Ha használja a "GenerateDatasetsXml -verbose", akkor a szokásosnál több diagnosztikai üzenetet fog nyomtatni.
Speciális/Pseudo adatkészlet típusok
Általában az EDDType lehetőségek a GenerateDatasets-ben Az e dokumentumban leírt EDD-típusok Xml-es egyezése (lásd:Adatkészlet típusok listája) létrehozni egydatasets.xmlegy adatkészlet létrehozása egy adott adatforrásból. Néhány kivétel és különleges eset van:
EDDGridFromErdap
Ez az EDDType az összesdatasets.xmlcunks szükséges ahhoz, hogyEDDGridFromErdapadatkészletek az összesEDDGridadatkészletek egy távoliERDDAP... Lehetősége lesz az eredeti megtartásáradatasetIDs (amely megduplázhat néhányatdatasetIDmár bennedERDDAP) vagy új nevek létrehozása, amelyek egyediek lesznek (de általában nem olyan emberi olvasható) ...
EDDTableFromErddap
Ez az EDDType az összesdatasets.xmlcunks szükséges ahhoz, hogyEDDTableFromErddapaz összes EDDTable adatkészletből egy távoliERDDAP... Lehetősége lesz az eredeti megtartásáradatasetIDs (amely megduplázhat néhányatdatasetIDmár bennedERDDAP) vagy új nevek létrehozása, amelyek egyediek lesznek (de általában nem olyan emberi olvasható) ...
EDDGridFromThreddsCatalog
Ez az EDDType az összesdatasets.xmla zsák szükséges az összesEDDGriddalszövegolyan adatkészletek, amelyeket visszanyerő módon találhat egy THREDDS-en keresztül (alá: beadás) katalógus. Számos formája van a THREDDS katalógus URL-eknek. Ez az opció REQUIRES egy THREDDS .xml URL /catalog / benne, például,
https://oceanwatch.pfeg.noaa.gov/thredds/catalog/catalog.xml vagy
https://oceanwatch.pfeg.noaa.gov/thredds/catalog/Satellite/aggregsatMH/chla/catalog.xml
(Egy kapcsolódó .html katalógus van
https://oceanwatch.pfeg.noaa.gov/thredds/Satellite/aggregsatMH/chla/catalog.html amely nem elfogadhatóEDDGridFromThreddsCatalog.
Ha problémái vannakEDDGridFromThredd Katalógus:
- Győződjön meg róla, hogy az URL-t használja, érvényes, tartalmazza / katalog /, és végződik /catalog.xml .
- Ha lehetséges, használjon nyilvános IP-címet (például, https://oceanwatch.pfeg.noaa.gov ) az URL-ben, nem egy helyi numerikus IP-cím (például, https://12.34.56.78 ) ... Ha a THREDDS csak a helyi numerikus IP címen keresztül érhető el, használhatja [<átalakításToPublicSourceUrl> (#konverttopublicsourceurl) ígyERDDAP™a felhasználók látják a nyilvános címet, bárERDDAP™adatokat kap a helyi numerikus címről.
- Ha olyan problémák vannak, amelyeket nem lehet megoldani,Ellenőrizze a hibaelhárítási tippeket...
- Az alacsony szintű kód ezt most használjaUnidatanetcdf-java katalógus személyzeti kód (Szárak. katalógus osztályok) hogy kezelje az összes THREDDS katal ógust (amely meglepően bonyolult lehet) KöszönömUnidataehhez a kódhoz.
EDDGridLonPM180FromErddapCatalog
Ez az EDDType generáljadatasets.xmlHogyEDDGridLonPM180adatkészletek az összesEDDGridadatkészletek egyERDDAPolyan hosszúsági értékek, amelyek 180-nál nagyobbak.
- Ha lehetséges, használjon nyilvános IP-címet (például, https://oceanwatch.pfeg.noaa.gov ) az URL-ben, nem egy helyi numerikus IP-cím (például, https://12.34.56.78 ) ... HaERDDAP™csak a helyi numerikus IP-címen keresztül érhető el, használhatja [<átalakításToPublicSourceUrl> (#konverttopublicsourceurl) ígyERDDAP™a felhasználók látják a nyilvános címet, bárERDDAP™adatokat kap a helyi numerikus címről.
EDDGridLon0360 FromErddapCatalog
Ez az EDDType generáljadatasets.xmlHogyEDDGridLon0360adatkészletek az összesEDDGridadatkészletek egyERDDAPaminek bármilyen hosszúsági értéke kevesebb, mint 0.
- Ha lehetséges, használjon nyilvános IP-címet (például, https://oceanwatch.pfeg.noaa.gov ) az URL-ben, nem egy helyi numerikus IP-cím (például, https://12.34.56.78 ) ... HaERDDAP™csak a helyi numerikus IP-címen keresztül érhető el, használhatja [<átalakításToPublicSourceUrl> (#konverttopublicsourceurl) ígyERDDAP™a felhasználók látják a nyilvános címet, bárERDDAP™adatokat kap a helyi numerikus címről.
EDDSFromFiles
Tekintettel az induló könyvtárra, ez megfordítja a könyvtárat és az összes alirányítót, és megpróbál létrehozni egy adatkészletet minden egyes adatfájlhoz, amelyet megtalál.
- Ez azt feltételezi, hogy amikor egy adatkészlet megtalálható, az adatkészlet tartalmazza az összes aláírót.
- Ha egy adatkészlet megtalálható, hasonló testvéri könyvtárakat fognak kezelni külön adatkészletként (Például az 1990-es évek könyvtárai, a 2000-es évek, a 2010-es évek, külön adatkészleteket fognak létrehozni) ... Könnyűnek kell lenniük a kézzel kombinálni - csak megváltoztatni az első adatkészletet<fájlDir> a szülői könyvtárba, és törölje az összes későbbi testvéri adatkészletet.
- Ez csak egy darabot próbál generálnidatasets.xmla leggyakoribb típusú fájl kiterjesztése egy könyvtárban (nem számít .md5, amely figyelmen kívül hagyja) ... Tehát, adott egy könyvtár 10.ncfájlokat és 5 .txt fájlokat, adatkészletet generálnak.ncfájlok csak.
- Ez azt feltételezi, hogy az összes fájl egy könyvtárban azonos kiterjesztéssel tartozik ugyanabban az adatkészletben. Ha egy könyvtár van néhány.ncfájlok SST adatokkal és néhány.ncfájlok chlorophyll adatok, csak egy minta.ncfájl lesz olvasva (SST? Chlorophyll?) és csak egy adatkészlet jön létre az ilyen típusú fájlhoz. Ez az adatkészlet valószínűleg nem terheli a komplikáci ók miatt, hogy megpróbálja betölteni két típusú fájlt ugyanazon adatkészletbe.
- Ha kevesebb, mint 4 fájl van a leggyakoribb kiterjesztéssel egy könyvtárban, ez azt feltételezi, hogy nem adatfájlok, és csak kihagyja a könyvtárat.
- Ha van 4 vagy több fájl egy könyvtárban, de ez nem képes sikeresen létrehozni egy darabotdatasets.xmla fájlokhoz (például egy nem támogatott fájltípus) Ez generál egyEDDTableFromFileNamesadatkészlet a fájlokhoz.
- A diagnózis végén, hogy ez a logfájlra ír, csak mielőttdatasets.xmlcunks, ez egy táblázatot fog nyomtatni, amely összefoglalja az összes előirányzatot átnyomó információt. Az asztal felsorolja az összes előirányzatot, és jelzi a leggyakoribb típusú fájl kiterjesztését, a fájlok teljes számát, és mely típusú adatkészletet hoztak létre ezekhez a fájlokhoz. (ha valaki) ... Ha összetett, mélyen fészkelt fájlstruktúrával szembesül, fontolja meg a GenerateDatasets futtatását Xml EDDType=EDDSFromFiles csak azért, hogy létrehozza ezt az információt,
- Ez az opció nem tehet nagyszerű munkát a legjobb EDDType kitalálásában egy adott adatfájlok csoportja számára, de gyors, egyszerű és érdemes kipróbálni. Ha a forrásfájlok megfelelőek, jól működik, és jó első lépés a generálásbandatasets.xmlegy fájlrendszer, sok előirányzattal, mindegyik adatfájlok különböző adatkészletek.
EDDTableFromEML és EDDTableFromEMLBatch
Ezek a különleges EDDType generáljadatasets.xmlHogy egyEDDTableFromAsciiFilesaz egyes táblákból származó adatkészlet, amelyet egyökológiai metaadata nyelvXML fájl. A "Batch" változat működik az összes EML fájl egy helyi vagy távoli könyvtárban. Kérjük, lásd a különállótdokumentáció EDDTableFromEML...
EDDTableFromInPort
Ez a különleges EDDType generáljadatasets.xmlHogy egyEDDTableFromAsciiFilesadatkészlet az információból egyInport-xmlfájl. Ha hozzáférhet a forrásadat fájlhoz (az inport-xml-fájlnak rendelkeznie kell azzal, hogy hol találja meg) működőképes adatkészletet készíthetERDDAP...
A következő lépések felvázolják, hogyan kell használni a GenerateDatasets Xml inport-xml fájllal, hogy munkaadatot kapjonERDDAP...
- Miután hozzáfér az inport-xml fájlhoz (vagy URL-ként vagy helyi fájlként) Futás GenerateDatasets Xml, megjelöli az EDDType=EDDTableFromInPort-ot, meghatározza az inport-xml URL-t vagy a teljes fájlnévet, meghatározza, hogy melyikChild=0, és meghatározza a többi kért információt (ha ismert) ... (Ezen a ponton nem kell a forrásadat fájlt megadnia, vagy meg kell határoznia a nevét.) Az, amiChild=0 beállítás mondja a GenerateDatasets Xml, hogy megírja az információkat Minden A<entity-attribute-információ><entity> az inport-xml fájlban (ha vannak) ... Kinyomtat egy Background információs összefoglalót is, beleértve az összes letöltési url listáját az inport-xml fájlban.
- Nézz át az összes információt (beleértve a Background információkat, amelyek a GenerateDatasets Xml nyomtatások) és látogasson el a letöltési URL (s) annak érdekében, hogy megpróbálja megtalálni a forrásadat fájlt (s) ... Ha megtalálja (őket) Töltse le (őket) olyan könyvtárba, amely hozzáférhetőERDDAP... (Ha nem talál semmilyen forrásadat fájlt, nincs pont az eljárásban.)
- Run Generate Adatkészletek Xml ismét. Ha a forrásadat fájl megfelel az egyik inport-xml fájlnak<entity-attribute-információ><entitás> megadja, melyikChild= Az Entity'sNumber (pl.: 1, 2, 3, ...) ...ERDDAP™megpróbálja megegyezni az oszlopneveket a forrásadat file-ban az entitásinformációk neveihez, és ösztönözni kell az elfogadást/tagadni bármilyen eltérést. Vagy ha az inport-xml fájlnak nincs semmilyen<entity-attribute-információ><entitás> megadja, melyikChild=0.
- A zsákbandatasets.xmlEzt a GenerateDatasets készítette Xml, felülvizsgálja a [global]<addAttributes>>>>>> (#globális tulajdonságok) szükség/kívánatos.
- A zsákbandatasets.xmlEzt a GenerateDatasetsXml készítette, add / felülvizsgálja [<dataVariable>>>>>> (#datavariable) a szükséges / kívánatos információ, hogy leírja az egyes változók. Ügyeljen arra, hogy megfelelően azonosítsa az egyes változókat [[szerkesztés]]<sourceName>>>>>> (#sourcename) (ahogy megjelenik a forrásban) , [[szerkesztés]]<destinationName>>>>>> (#destinationname) (amely több korláttal rendelkezik az engedélyezett karakterekre, mintsourceName) , [[szerkesztés]]<egység>] (#uniták) (különösen, ha ez egyidő vagy időmérő változóahol az egységeknek meg kell határozniuk a formátumot) és [[szerkesztés]]<missing\_value>>>>>> (#missing_érték) ,
- Amikor közel vagy befejezni, ismételten használja aDasDdseszköz, hogy gyorsan megnézze, hogy az adatkészlet leírása érvényes-e, és ha az adatkészlet megjelenikERDDAP™ahogy akarod.
Nagyszerű lenne, ha az InPortot használó csoportok dokumentálnák adatkészleteiket, szintén használnákERDDAP™elérhetővé tenni a tényleges adatokat:
- ERDDAP™olyan megoldás, amelyet most használhatunk, így teljesíthetNOAAAKözös hozzáférés a kutatási eredményekhez (PARR) követelményekmost, nem valami homályos időben a jövőben.
- ERDDAP™a felhasználók számára elérhető tényleges adatokat, nem csak a metaadatot. (Milyen jó a metaadata adatok nélkül?)
- ERDDAP™támogatások metaadata (nevezetesen a változók egységei) Ellentétben néhány más adatkiszolgáló szoftvert. (Milyen jó az adatok metadata nélkül?) Olyan szoftver használatához, amely nem támogatja a metaadatot, hogy meghívja az adatokat félreértésre és visszaélésre.
- ERDDAP™ingyenes és nyílt forráskódú szoftver, ellentétben néhány más szoftvert. Folyamatos fejlődésERDDAP™már fizetett. TámogatásERDDAP™A felhasználók ingyenesek.
- ERDDAPA megjelenés könnyen testreszabható, hogy tükrözze és kiemelje a csoportot (nemERDvagyERDDAP) ...
- ERDDAP™következetes módot kínál az összes adatkészlethez.
- ERDDAP™számos adatfájlból és a kapcsolati adatbázisokból olvashat adatokat.
- ERDDAP™nagy adatkészletekkel, beleértve az adatkészleteket is, ahol a forrásadat számos adatfájlban található.
- ERDDAP™adatokat írhat sokféle adatfájlra, a felhasználó kérésére, beleértve a netCDF, ESRI .csv ésODV .txt...
- ERDDAP™egyedi grafikonokat és térképeket készíthet az adatok alkészleteiről, a felhasználó specifikációi alapján.
- ERDDAP™nem adatkészletekkel, például képgyűjteményekkel, videóval vagy audiofájlokkal foglalkozhat.
- ERDDAP™telepítették és használjáktöbb mint 60 intézmény világszerte...
- ERDDAP™a használatra javasolt adatkiszolgálók egyikeként szerepelNOAAaNOAAAdathozzáférési eljárási irányelvEllentétben néhány más szoftvert.
- ERDDAP™egy termékNMFS/NOAA, így használja belülNMFSésNOAAlegyen a büszkeség pontjaNMFSésNOAA...
Kérjük, adja megERDDAP™Egy próbát. Ha segítségre van szüksége, küldjön üzenetet aERDDAP™Google csoport.
addFillValueAttributes
Ez a különleges EDDType opció nem adatkészlet. Ez egy eszköz, amely hozzáadhatja a \_FillValue tulajdonságait néhány változóhoz bizonyos adatkészletekben. LásdaddFillValueAttributes...
FindDuplic Idő
Ez a különleges EDDType opció nem adatkészlet. Ehelyett azt mondja a GenerateDatasets Xml keresni egy gyűjtött gyűjteményt.nc (és kapcsolódó) fájlokat találni és nyomtatni a fájlok listáját duplikált időértékekkel. Amikor az időértékeket nézi, az eredeti egységekről átalakítja őket"seconds since 1970-01-01"ha a különböző fájlok különböző egységeket használnak. Meg kell adnia a kezdő könyvtárat (vagy anélkül, hogy nyomkövető slash) , a fájlnév rendszeres kifejezés (pl.: \* \.nc ) , és az idő neve változó a fájlokban.
ncdump
Ez a különleges EDDType opció nem adatkészlet. Ehelyett azt mondja a GenerateDatasets Xml nyomtatni egyncdump\-szerű nyomtatás egy.nc,.ncml, vagy.hdffájl. Valójában használja a netcdf-javaNCdumpEz egy korlátozottabb eszköz, mint az NCdump C verziója. Ha ezt a lehetőséget használja, a GenerateDatasetsXml arra kéri Önt, hogy használja az egyik lehetőséget: "h" (Fejlesztő) , "-c" (koordinált vars) , "vall" (default) , "v var1;var2", "v var1 (0:10,0:20) "..." Ez azért hasznos, mert ncdump nélkül nehéz megtudni, mi van egy.nc,.ncml, vagy.hdffájl és így az EDDType meg kell határozni a GenerateDatasets Xml. Egy.ncml fájl, ez kinyomtatja a ncdump kimenetet az eredményért.ncml fájlváltozások az alapul szolgáló.ncvagy.hdffájl.
DasDds
- DasDds egy parancssori program, amelyet használhat, miután létrehozott egy első kísérletet az XML-nél egy új adatkészletredatasets.xml... A DasDds-szel többször is tesztelheti és finomíthatja az XML-t. Ha a DasDds programot használja:
- A Windows-on az első alkalommal futtatja a DasDds-eket, szerkesztenie kell a DasDds-eket. bat fájl egy szövegszerkesztővel, hogy megváltoztassa az utat a java felé. Exe fájl, hogy a Windows találjonJava...
- A DasDds kéri ÖntdatasetIDaz Ön által végzett adatkészlet ért.
- A DasDds megpróbálja létrehozni az adatkészletet ezzeldatasetID...
- A DasDds mindig sok diagnosztikai üzenetet nyomtat. Ha "DasDds -verbose"-t használ, a DasDds a szokásosnál több diagnosztikai üzenetet fog nyomtatni.
- A biztonság érdekében a DasDds mindig törli az összes csípős adatkészlet információit (fájlok) az adatkészlet számára, mielőtt megpróbálná létrehozni az adatkészletet. Ez az egyenértékű egykemény zászlóTehát az összesített adatkészletek esetében előfordulhat, hogy módosítani szeretné a fájltNameRegex ideiglenesen, hogy korlátozza a fájlok számát az adatgyártó megtalálja.
- Ha az adatkészlet nem terheli (bármilyen okból) A DasDds megállítja és megmutatja a hibaüzenetet az első hiba miatt, amit talál.
Ne próbálja kitalálni, hogy mi lehet a probléma. Olvassa el gondosan az ERROR üzenetet.
Ha szükséges, olvassa el az előző diagnosztikai üzeneteket, hogy több nyomot és információt is találjon. - Változtasson az adatkészlet XML-jére, hogy megpróbálja megoldani a THAT problémát
és hagyja, hogy a DasDds újra létrehozza az adatkészletet. - Ha ismételten megoldja minden problémát, akkor végül megoldja az összes problémát
és az adatkészlet betöltődik.
- Minden DasDds kimenet (diagnosztika és eredmények) a képernyőre írnak, és bigParentDirectory[szerkesztés] /logs/DasDds.log
- Ha a DasDds létrehozhatja az adatkészletet, a DasDds majd megmutatja Önnek a.das (Adatkészlet tulajdonság struktúra) ,.dds (Dataset Descriptor Szerkesztés) ésIdőszakok (Időbeli szakadékok) információ az adatkészlet a képernyőn, és írja őket, hogy bigParentDirectory[szerkesztés] /log/DasDds.out .
- Gyakran előfordul, hogy kis változást szeretne elérni az adatkészlet XML-jéhez, hogy megtisztítsa az adatkészlet metaadatát és újraindítsa a DasDds-t.
Bónusz Harmadik fél eszköz:ERDDAP-lint
ERDDAP-lint egy program Rob Fuller és Adam Leadbetter az ír tengerészeti intézet, hogy lehet használni, hogy javítsa a metaadat aERDDAP™adatkészletek.ERDDAP-lint "megtartja a szabályokat és egy egyszerű statikus webes alkalmazást néhány ellenőrző teszt futtatásáhozERDDAP™szerver. Minden teszt fut a webböngészőben.” Mint aUnix/Linux lint eszköz szerkesztheti a meglévő szabályokat, vagy új szabályokat adhat hozzá. LásdERDDAP-lintTovábbi információkért.
Ez az eszköz különösen hasznos az olyan adatkészletek számára, amelyeket néhány évvel ezelőtt hoztál létre, és most naprakészen akarod hozni a jelenlegi metaadat preferenciáiddal. Például a GenerateDatasets korai verziói Az Xml nem tett erőfeszítést a globális megteremtés érdekébencreator\_name,creator\_email, alkotó\_type, vagycreator\_urlMetaadata. HasználhatjaERDDAP-lint azonosítani azokat az adatkészleteket, amelyek hiányoznak ezek a metaadatok tulajdonságai.
Robnak és Ádámnak köszönhetően, hogy létrehozza ezt az eszközt, és elérhetővé tegye aztERDDAP™közösség.
Alapvető szerkezetedatasets.xmlFile
A szükséges és opcionális címkék megengedettek egydatasets.xmlfájl (és hányszor jelenhetnek meg) alább láthatók. A gyakorlatban, a tedatasets.xmlsok lesz<adatkészlet> címkéi és csak a többi címkét használja<erddapDatasets> szükség szerint.
<?xml version="1.0" encoding="ISO-8859-1" ?>
<erddapDatasets>
<angularDegreeUnits>...</angularDegreeUnits> <!-- 0 or 1 -->
<angularDegreeTrueUnits>...</angularDegreeTrueUnits> <!-- 0 or 1 -->
<cacheMinutes>...</cacheMinutes> <!-- 0 or 1 -->
<commonStandardNames>...</commonStandardNames> <!-- 0 or 1 -->
<convertInterpolateRequestCSVExample /> <!-- 0 or more -->
<convertInterpolateDatasetIDVariableList /> <!-- 0 or more -->
<convertToPublicSourceUrl /> <!-- 0 or more -->
<decompressedCacheMaxGB>...</decompressedCacheMaxGB> <!-- 0 or 1 -->
<decompressedCacheMaxMinutesOld>...</decompressedCacheMaxMinutesOld> <!-- 0 or 1 -->
<drawLandMask>...</drawLandMask> <!-- 0 or 1 -->
<emailDiagnosticsToErdData>...</emailDiagnosticsToErdData> <!-- 0 or 1 -->
<graphBackgroundColor>...</graphBackgroundColor> <!-- 0 or 1 -->
<ipAddressMaxRequests>...</ipAddressMaxRequests> <!-- 0 or 1 -->
<ipAddressMaxRequestsActive>...<ipAddressMaxRequestsActive> <!-- 0 or 1 -->
<ipAddressUnlimited>...<ipAddressUnlimited> <!-- 0 or 1 -->
<loadDatasetsMinMinutes>...</loadDatasetsMinMinutes> <!-- 0 or 1 -->
<loadDatasetsMaxMinutes>...</loadDatasetsMaxMinutes> <!-- 0 or 1 -->
<logLevel>...</logLevel> <!-- 0 or 1 -->
<nGridThreads>...</nGridThreads> <!-- 0 or 1 -->
<nTableThreads>...</nTableThreads> <!-- 0 or 1 -->
<palettes>...</palettes> <!-- 0 or 1 -->
<partialRequestMaxBytes>...</partialRequestMaxBytes> <!-- 0 or 1 -->
<partialRequestMaxCells>...</partialRequestMaxCells> <!-- 0 or 1 -->
<requestBlacklist>...</requestBlacklist> <!-- 0 or 1 -->
<slowDownTroubleMillis>...</slowDownTroubleMillis> <!-- 0 or 1 -->
<subscriptionEmailBlacklist>...</subscriptionEmailBlacklist> <!-- 0 or 1 -->
<unusualActivity>...</unusualActivity> <!-- 0 or 1 -->
<updateMaxEvents>...</updateMaxEvents> <!-- 0 or 1 --><standardLicense>...</standardLicense> <!-- 0 or 1 -->
<standardContact>...</standardContact> <!-- 0 or 1 -->
<standardDataLicenses>...</standardDataLicenses> <!-- 0 or 1 -->
<standardDisclaimerOfEndorsement>...</standardDisclaimerOfEndorsement> <!-- 0 or 1 -->
<standardDisclaimerOfExternalLinks>...</standardDisclaimerOfExternalLinks> <!-- 0 or 1 -->
<standardGeneralDisclaimer>...</standardGeneralDisclaimer> <!-- 0 or 1 -->
<standardPrivacyPolicy>...</standardPrivacyPolicy> <!-- 0 or 1 -->
<startHeadHtml5>...</startHeadHtml5> <!-- 0 or 1 -->
<startBodyHtml5>...</startBodyHtml5> <!-- 0 or 1 -->
<theShortDescriptionHtml>...</theShortDescriptionHtml> <!-- 0 or 1 -->
<endBodyHtml5>...</endBodyHtml5> <!-- 0 or 1 --><user username="..." password="..." roles="..." /> <!-- 0 or more -->
<dataset>...</dataset> <!-- 1 or more -->
</erddapDatasets>
Lehetséges, hogy a jövőben más kódolások kerülnek engedélyezésre, de most már csak az ISO-8859-1 ajánlott.
XInclude
Az új verzió 2.25 támogatja az XInclude-t. Ez megköveteli, hogy használja a SAX parser<HasználatSaxParser> Igaz</useSaxParser> a beállításban.xml. Ez lehetővé teszi, hogy saját fájljában írjon minden adatkészletet, majd tartalmazza azokat a főbbdatasets.xmlújrahasznosítani az adatkészlet-meghatározásokat, vagy mindkettőt. Ha egy példát szeretnél látni,EDDTestDataset.javaXInclude-t állít fel a változó meghatározások újrafelhasználására.
Megjegyzések
Együttműködésdatasets.xmlA fájl nem triviális projekt. Kérjük, olvassa el ezeket a jegyzeteket gondosan. Miután kiválasztott egyadatkészlet típusKérjük, olvassa el gondosan a részletes leírást.
Az adatkészlet típusának kiválasztása
A legtöbb esetben csak egy vanERDDAP™adatkészlettípus, amely megfelelő egy adott adatforráshoz. Néhány esetben (pl.:.ncfájlok) Vannak néhány lehetőség, de általában az egyik közülük biztosan a legjobb. Az első és legnagyobb döntés, amit meg kell hozni: helyénvaló kezelni az adatkészletet, mint egy csoport multidimenzionális sorozatok (ha igen,EDDGridadatkészlet típusa) vagy adatbázisszerű adattábláként (ha igen,EDDTable adatkészlet típusok) ...
Az adatok szolgálata, mint
Általában nincs szükség az adatforrás módosítására (pl. a fájlokat más fájltípusra konvertálja) hogyERDDAP™szolgálhatja. Az egyik feltételezés aERDDAP™az, hogy az adatforrást úgy fogják használni, mint az. Általában ez jól működik. Néhány kivétel:
- Kapcsolódó adatbázisok és Cassandra -ERDDAP™közvetlenül a kapcsolati adatbázisokból és a Cassandra-ból szolgálhat adatokat. De a biztonság, a terhelés kiegyensúlyozása és a teljesítmény kérdései, úgy dönthet, hogy létrehoz egy másik adatbázist ugyanazzal az adatokkal, vagy mentse meg az adatokat, hogyNetCDFv3.ncfájlok ésERDDAP™szolgálja az adatokat az új adatforrásból. LásdEDDTableFromDatabaseésEDDTableFromCassandra...
- Nem támogatott adatforrások -ERDDAP™támogathat számos adatforrást, de a világ tele van 1000-es (milliók?) különböző adatforrások (nevezetesen az adatfájl struktúrák) ... HaERDDAP™nem támogatja az adatforrást:
- Ha az adatforrásNetCDF .ncfájlokat, használhatNcMLaz adatfájlok módosítása a repülésen vagy a használatonNCOaz adatfájlok állandó módosítása.
- Az adatokat egy adatforrástípusra írhatja,ERDDAP™támogatás.NetCDF-3.nca fájlok jó, általános ajánlás, mert bináris fájlok, hogyERDDAP™nagyon gyorsan olvashat. A tabuláris adatok esetében fontolja meg az adatok tárolását egy gyűjteményben.ncfájlok, amelyek aCF Discrete Sampling Geometries (DSG) Contiguous Ragged Array adatstruktúrák és így kezelhetőkERDDAPAEDDTableFromNcCFFiles). Ha logikailag megszervezik őket (mindegyik adat egy darab űr és idő) ,ERDDAP™nagyon gyorsan kivonhatja az adatokat tőlük.
- Kérheti, hogy az adatforrás támogatását hozzáadjukERDDAP™e-mailben Chris. John at noaa.gov.
- Hozzáadhat támogatást az adatforráshoz azáltal, hogy megírja a kódot, hogy kezelje magát. LásdaERDDAP™Programozó útmutató
- Speed -ERDDAP™olvashat adatokat néhány adatforrásból sokkal gyorsabban, mint mások. Például olvasásNetCDFv3.ncA fájlok gyorsak és az ASCII fájlok olvasása lassabb. Ha van egy nagy (>1000) vagy hatalmas (>10 000) forrásadat fájlok száma,ERDDAP™Lassan reagál néhány adatkérésre. Általában a különbség nem észrevehető az emberek számára. Ha azonban úgy gondolja,ERDDAP™lassú egy adott adatkészlet esetében, úgy dönthet, hogy megoldja a problémát az adatok hatékonyabb beállításának írásával (általában: néhány, jól strukturált,NetCDFv3.ncfájlok) ... A tabuláris adatokhoz lásd:ez a tanács...
Hint
Gyakran könnyebb generálni az XML-t egy adathalmaz számára, ha egy munkaadat-leírást készít az adatkészletben.xml-ben, majd módosítja azt.
Különleges karakterek kódolása
ótadatasets.xmlXML fájl, akkor MUST&-Ecode"&", "<"és ">" bármilyen tartalomban "&", "<és „és gt;”. Rossz:<cím> Idő és tides</title> Jobb:<cím> Time & Tides</title>
Az XML nem tolerálja a szintax hibákat
Miután szerkesztette az adatkészletet.xml fájlt, jó ötlet ellenőrizni, hogy az eredményjól kialakított XMLaz XML szöveg beillesztése egy XML-ellenőrzőbe, mintxmlvalidáció...
Hibaelhárítási tippek
- Más módszerek a problémák diagnosztizálására az adatkészletekkel
A két fő mellettEszközök, - Log.txtegy log fájl mindenERDDAPDiagnosztikai üzenetek.
- ANapi jelentéstöbb információval rendelkezik, mint a status oldal, beleértve az olyan adatkészletek listáját, amelyek nem töltöttek be, és a kivételek (hibák) termeltek.
- AStatus oldalgyors módja annak, hogy ellenőrizzeERDDAPstátusza bármilyen webböngészőtől. Ez magában foglalja az olyan adatkészletek listáját, amelyek nem töltöttek be (bár nem a kapcsolódó kivételek) és feladatHárom statisztika (bemutatni a haladástEDDGridMásolásésEDDTableCopyadatkészletek és mindenEDDGridFájlokvagyEDDTableFromFilesolyan adatkészletek, amelyekCacheFromUrl (de nem kóstol SizeGB) ) ...
- Ha megragadsz, lásd a mirész további támogatás megszerzéséről...
Különleges változók
- A hosszúság, a magasság, a magasság (vagy mélység) és idő (LLAT) változó destinationNameS különleges.
- Általában:
- LLAT változók ismertekERDDAP™ha a tengely változója (MertEDDGridadatkészletek) vagy az adatok változója (EDDTable adatkészletek) destinationName"hosszúság", "latitude", "altitude", "mélység" vagy"time"...
- Erősen arra ösztönözzük Önt, hogy használja ezeket a szabványos neveket ezekre a változókra, amikor csak lehetséges. Egyikük sem szükséges. Ha nem használja ezeket a különleges változó neveket,ERDDAP™nem fogja felismerni jelentőségüket. Például az LLAT változókat speciálisan a Make A Graph kezeli ( datasetID .gráf) : ha az X Axis változó "hosszúság", és az Y Axis változó "magasság", akkor térképet kap (egy szabványos előrejelzés, valamint egy földmaszk, politikai határok stb.) egy grafikon helyett.
- ERDDAP™automatikusan hozzáad sok metaadatot a LLAT változókhoz (Például: "ioos\_category",",egység" és számos szabványhoz kapcsolódó tulajdonság, mint a "\_CoordinateAxisType") ...
- ERDDAP™automatikusan, on-the-fly, hozzáadni sok globális metaadata kapcsolódó LLAT értékek a kiválasztott adatalkotó (Például: "geospatial\_lon\_min") ...
- Azok az ügyfelek, akik támogatják ezeket a metaadat-szabványokat, képesek lesznek kihasználni a hozzáadott metaadatot az adatok időben és térben történő elhelyezésére.
- Az ügyfelek könnyebben létrehoznak olyan lekérdezéseket, amelyek magukban foglalják a LLAT változókat, mert a változó nevek minden releváns adatkészletben azonosak.
- A "hosszúság" változó és a "latitude" változó:
- Használja adestinationNameS "hosszúság" és "latitude" csak akkor, haegységfokozatok\_east és fokozatok\_north, vagyis. Ha az adatai nem felelnek meg ezeknek a követelményeknek, használjon különböző változó neveket (Például x, y, lonRadians, latRadians) ...
- Ha hosszúságú és szélességi adatok vannak különböző egységekben, és így különböződestinationNameS, például lonRadians és latRadians, Make A Graph ( datasetID .gráf) grafikonokat készít (például az idősorozat) a térképek helyett.
- A "magasság" változó és a "mélység" változó:
- Használja adestinationName"szélesség" az adatok tengerszint feletti távolságának azonosítása (pozitív="up" értékek) ... Opcionálisan használhatja a tengerszint alatti távolságokat, ha az értékek negatívak a tenger alatt (vagy ha például használja, [[szerkesztés]]<att name="scale\_factor"típus="int"> - 1</att>] (#scale_factor) a mélységértékek magassági értékekké alakítása.
- Használja adestinationName"mély" az adatok tengerszint alatti távolságának azonosítása (pozitív="down" értékek) ...
- Az adatkészletnek nem lehet "szélessége" és "mély" változója.
- Ezeknek a változó neveknek,egység"m", "mérő" vagy "mérő". Ha az egység különbözik (például a fatomok) Használhatja [[szerkesztés]]<att name="scale\_factor">>> Néhány Érték </att>] (#scale_factor) [[[szerkesztés]]]<att name="units"> méterek</att>] (#uniták) átalakítani az egységeket méterekre.
- Ha az adatai nem felelnek meg ezeknek a követelményeknek, használjon mástdestinationName (Például a fenti csoport, távolság ToBottom) ...
- Ha ismeri a vertikális CRS-t, kérjük, adja meg a metaadatban, pl. „EPSG:5829” (azonnali magasság a tengerszint felett) EPSG:5831 (azonnali mélység tengerszint alatt) vagy "EPSG:5703" (NAVD88 magasság) ...
- Mert"time"változó:
- Használja adestinationName "time"csak olyan változók esetében, amelyek az egész dátum+time-t tartalmazzák (vagy dátum, ha ez minden ott van) ... Ha például vannak külön oszlopok a dátum és az időOfDay, ne használja a változó nevet"time"...
- Lásdegységaz idő és az időStamp változók számára jellemző egységekről.
- Az idő változó és kapcsolódóIdő Stamp változókegyediek abban, hogy mindig az adatértékeket a forrás idő formátumából alakítják át (bármi legyen is az) numerikus értékbe (másodpercek 1970-01-01T00:00Z) vagy erős érték (ISO 8601:2004 (EZ) formátum) a helyzettől függően.
- Amikor egy felhasználó időadatokat kér, akkor kérheti azt az idő meghatározásával, mint számszerű érték (másodpercek 1970-01-01T00:00Z) vagy erős érték (ISO 8601:2004 (EZ) formátum) ...
- ERDDAP™haszonnal rendelkezikKonvertáljon Numeric Idő / sztring idő...
- LásdHogyanERDDAPÜzletek az idővel...
Miért csak két alapvető adatstruktúra?
- Mivel nehéz az emberi ügyfelek és a számítógépes ügyfelek számára, hogy összetett, lehetséges adatkészlet-struktúrákat kezeljenek,ERDDAP™csak két alapvető adatstruktúrát használ:
- egyfúrt adatstruktúra (például műholdas adatok és modelladatok esetében) és
- egytabuláris adatstruktúra (például az in-situ buoy, az állomás és a pályázati adatok) ...
- Természetesen nem minden adat lehet kifejezni ezekben a struktúrákban, de sok ez képes. A táblázatok különösen nagyon rugalmas adatstruktúrák (Nézze meg a kapcsolati adatbázis-programok sikerét) ...
- Ez megkönnyíti az adatkérések építését.
- Ez teszi az adatválaszok egyszerű struktúrával rendelkeznek, ami megkönnyíti az adatok szélesebb körű, szabványos fájltípusokban történő kiszolgálását (amely gyakran csak egyszerű adatstruktúrákat támogat) ... Ez a fő oka annak, hogy felállítottukERDDAP™így.
- Ez viszont nagyon könnyű számunkra (vagy bárki) olyan ügyfélszoftvert írni, amely mindennel működikERDDAP™adatkészletek.
- Ez megkönnyíti az adatok összehasonlítását különböző forrásokból.
- Nagyon tisztában vagyunk azzal, hogy ha más adatstruktúrákban dolgozol adatokkal, akkor kezdetben úgy gondolod, hogy ez a megközelítés egyszerű vagy elégtelen. De az összes adatstruktúrának vannak szakadékai. Senki sem tökéletes. Még a do-it-all struktúrák is vannak hátrányai: a velük való együttműködés bonyolult, és a fájlokat csak speciális szoftverkönyvtárak írható vagy olvasható. Ha elfogadodERDDAP"Elég megközelítés ahhoz, hogy megpróbáljon vele dolgozni, úgy találhatja, hogy előnyei vannak (nevezetesen több fájltípus támogatása, amelyek megtarthatják az adatválaszokat) ... AERDDAP™Slide show (különösen aadatstruktúrák csúsznak) Sokat beszél ezekről a kérdésekről.
- És még akkor is, ha ez a megközelítés furcsán hangzik hozzád, a legtöbbERDDAP™Az ügyfelek soha nem fognak észrevenni - egyszerűen látni fogják, hogy az összes adatkészletnek szép egyszerű szerkezete van, és hálásak lesznek, hogy számos fájlformátumban visszatért forrásból származó adatokat kaphatnak.
Méretek
- Mi van, ha a rács változók a forrás adatkészletben nem osztoznak ugyanazon tengelyváltozatokkal?
InkábbEDDGridadatkészletek, minden adatváltozat MUST használat (Részvény) az összes tengely változó. Tehát, ha egy forrásadatnak van néhány változója az egyik dimenzióval, és más változók eltérő dimenzióval, akkor két adatkészletet kell készítenie.ERDDAP... Például, lehet, hogy egyERDDAP™„Egyes cím (felületen) - olyan változókat tartsanak, amelyek csak\[Idő\]\[magasság\]\[hosszúság\]dimenziók és egy másikERDDAP™„Egyes cím (mélységben) "megtartani azokat a változókat, amelyek\[Idő\]\[magasság\]\[magasság\]\[hosszúság\]... Vagy talán megváltoztathatja az adatforrást, hogy hozzáadjon egy dimenziót egyetlen értékkel (például altitude=0) hogy a változók következetesek legyenek.
ERDDAP™nem kezel bonyolultabb adatkészleteket (Például olyan modellek, amelyek háromszögek hálóját használják) jól. Ezeket az adatkészleteket szolgálhatjaERDDAP™két vagy több adatkészlet létrehozásávalERDDAP™ (annak érdekében, hogy minden adat változó legyen minden egyes új adatkészletben, ugyanazt a tengelyváltozatot ossza meg) De ez nem az, amit a felhasználók akarnak. Néhány adatkészlet esetében előfordulhat, hogy az adatkészlet rendszeres rúdolt verzióját készíti el, és felajánlja azt az eredeti adatok mellett. Néhány ügyfél szoftver csak egy rendszeres hálózattal foglalkozhat, így ezzel további ügyfeleket érhet el.
Projected Gridded adatok
Néhány rácsos adat komplex szerkezettel rendelkezik. Például műholdas szint 2 (dalszöveg: "along track") Az adatok nem használnak egyszerű előrejelzést. Modellek (mások) gyakran dolgoznak a különböző nem-cilindrikus előrejelzésekkel kapcsolatos hálózati adatokat (például conic, polar sztereográfia, tripolar) vagy strukturálatlan rácsokban (összetettebb adatstruktúra) ... Néhány végfelhasználó ezt az adatokat akarja, így nincs információvesztés. Ezeknek az ügyfeleknek,ERDDAP™szolgálhatja az adatokat, csak akkor, haERDDAP™Az adminisztrátor néhány adatkészletbe bontja az eredeti adatkészletet, és minden egyes részben olyan változókat tartalmaz, amelyek ugyanazokat a tengelyváltozatokat osztják meg. Igen, ez furcsának tűnik az érintett emberek számára, és különbözik a legtöbbtőlOPeNDAPszerverek. DeERDDAP™hangsúlyozza, hogy sok formátumban elérhetővé teszi az adatokat. Ez azért lehetséges, mertERDDAP™egységesebb adatstruktúrát igényel. Bár ez egy kicsit kínos (más, mint a vártnál) ,ERDDAP™eloszthatja a tervezett adatokat.
\[Igen,ERDDAP™lehetne lazább követelményeket az adatstruktúrára, de tartsa a kimeneti formátumokra vonatkozó követelményeket. De ez zavart okozna sok felhasználó, különösen az újszülött között, mivel sok látszólag érvényes adatkérés érvénytelen lenne, mert az adatok nem illeszkednének a fájltípusba. Visszatérünk a jelenlegi rendszer tervezéséhez.\]
Egyes végfelhasználók olyan lat lon-cilindrikus előrejelzést akarnak, mint az Equirectangular / lemezkarrée vagy Mercator) a könnyű használatra különböző helyzetekben. Ezekre a helyzetekre bátorítjuk aERDDAP™adminisztrátor más szoftverek használatához (NCO?Matlab? R? IDV? ...?) az adatoknak egy földrajzra való újrafeldolgozása (Equirectangular előrejelzés / lemezkarrée) vagy más cilindrikus előrejelzés, és szolgálja az adatok ilyen formájátERDDAP™mint más adatkészlet. Ez hasonló ahhoz, amit az emberek csinálnak, amikor műholdas szinten 2 adatot alakítanak át a 3. szintű adatokba. Egy ilyen eszközNCOamely kiterjesztési lehetőségeket kínál a sajnálatos adatokhoz.
GIS és reprojektív adatok
Mivel a GIS világ gyakran térképorientált, a GIS programok általában támogatást nyújtanak az adatok reprojektjéhez, azaz az adatokat egy másik előrejelzésű térképre helyezve.
Jelenleg,ERDDAP™nincs eszköze az adatok reprojekciójára. Ehelyett azt javasoljuk, hogy használjon egy külső eszközt, hogy az adatkészlet változatos legyen, ahol az adatokat eredeti formájából reprojektálták egy téglalapra. (magassági hosszúság) alkalmasERDDAP...
Véleményünk szerint a CF/DAPA világ egy kicsit más, mint a GIS világ, és kissé alacsonyabb szinten működik.ERDDAP™ezt tükrözi. Általában,ERDDAP™célja, hogy elsősorban az adatokkal dolgozzon (nem térképek) és nem akar változtatni (pl. reprojekt) az adatok. MertERDDAP™A rácsos adatok gyakran/általában/előnyösen kapcsolódnak a lat lon értékek és a cilindrikus előrejelzés, és nem néhány előrejelzés x,y értékek. Mindenesetre,ERDDAP™nem tesz semmit az adatprojektjével; csak áthalad az adatokon keresztül, mint ahogy a jelenlegi előrejelzése, azon az elméleten, hogy a reprojekció jelentős változás az adatokhoz ésERDDAP™nem akar jelentős változásokat bevonni. Továbbá a későbbi felhasználók naiv módon újraprojektezhetik az adatokat, ami nem lenne olyan jó, mint egy reprojekció. (Tehát, haERDDAP™Az adminisztrátor más előrejelzésben, bírságban kívánja felajánlani az adatokat; csak reprojektálja az offline adatokat, és felajánlja azt, hogy egy másik adatkészletkéntERDDAP... Sok műholdas adatkészletet kínálnak, mint amit a NASA 2. szintnek nevez (fürdő) és mint 3. szint (Equirectangular előrejelzés) verziók.) MikorERDDAP™térképek készítése (közvetlenül vagy keresztülWMSvagy KML) ,ERDDAP™Jelenleg csak térképeket készít az Equirectangular / tányérkarrier-projekcióval, amelyet szerencsére a legtöbb feltérképező program elfogad.
BátorítunkERDDAP™adminisztrátorok más szoftverek használatára (NCO?Matlab? R? IDV? ...?) az adatoknak egy földrajzra való újrafeldolgozása (Equirectangular előrejelzés / lemezkarrée) vagy más cilindrikus előrejelzés, és szolgálja az adatok ilyen formájátERDDAP™mint más adatkészlet. Ez hasonló ahhoz, amit az emberek csinálnak, amikor műholdas szinten 2 adatot alakítanak át a 3. szintű adatokba. Egy ilyen eszközNCOamely kiterjesztési lehetőségeket kínál a sajnálatos adatokhoz.
Reméljük, hogyERDDAP™beépített eszközöket kínálnak térképeket más előrejelzésekkel a jövőben. Reméljük, hogy a jövőben jobb kapcsolatokat ápolunk a GIS világával. (más, mint a jelenlegiWMSszolgáltatás) ... Szörnyű, hogy ebben a „modern” világban a CF//DAPA világ és a GIS világ még mindig olyan gyenge. Mindkét dolog a To Do listán van. (Ha segíteni akar, nevezetesen a csatlakozássalERDDAP™MapServer, kérlek e-mailt Chris. John at noaa.gov.)
Adattípusok
ERDDAP™támogatja a következő adattípusokat (a nevek érzékenyek;'u'prefix áll a "nem kijelölt"; a szám sok a nevek más rendszerekben a bitek száma) :
byte
- byte integrált értékeket írt alá -128 és 127 között. Más rendszerekben ezt néha int8-nak nevezik. Ezt az úgynevezett "tinyint" az SQL és a Cassandra. ERDDAP™átalakításokbooleannéhány forrásból (pl. SQL és Cassandra) b) a bytes inERDDAP™0=hamis, 1=igaz és 127=missing\_value...
Ubyte
- Ubyte 0–255 közötti számottevő értékkel rendelkezik. Más rendszerekben ezt néha uint8-nak nevezik.
rövid
- rövid integrált értékeket írt alá -32768 és 32767 között. Más rendszerekben ezt néha int16-nak nevezik. Ezt az SQL és Cassandra "smallint"-nak hívják.
Uraim
- Uraim 0-65535 közötti számtalan integrált értékkel rendelkezik. Más rendszerekben ezt néha uint16-nak nevezik.
Inkább
- Inkább integrált értékeket írt alá -2147483648 és 2147483647. Más rendszerekben ezt néha int32-nek nevezik. Ezt nevezik "integernek"|numerikus (?) "SQL és "int" Cassandra.
Uint
- Uint 0–4294967295 közötti számtalan integrált értékkel rendelkezik. Más rendszerekben ezt néha uint32-nek nevezik.
hosszú
- hosszú -9223372036854575808 és 9223372036854775807 közötti integrációs értékeket írt alá. Más rendszerekben ezt néha int64-nek nevezik. Ezt nevezik "bigint|numerikus (?) "Az SQL és a "bigint" által Cassandra. Mivel sok fájltípus nem támogatja a hosszú adatokat, használatuk elriasztott. Ha lehetséges, használja dupla helyett (lásd alább) ...
Utána
- Utána az integrációs értékek száma 0-tól 18446744073709551615 Más rendszerekben ezt néha uint64-nek nevezik. Mivel sok fájltípus nem támogatja az ulong adatokat, használatuk elriasztott. Ha lehetséges, használja dupla helyett (lásd alább) ...
Float
- Float egy IEEE 754 float körülbelül +/- 3.402823466e+38. Más rendszerekben ezt néha float32-nek nevezik. Ezt nevezik "valódi|Float (?) |decimális (?) |numerikus (?) "Az SQL és a "float" által Cassandra. A NaN különleges értéke Not-a-Number. ERDDAP™pozitív és negatív végtelen értékeket alakít ki a NaN számára.
dupla dupla
- dupla dupla egy IEEE 754 dupla, körülbelül +/- 1.7976931348623157E+308. Más rendszerekben ezt néha float64-nek nevezik. Ezt nevezik „kettős pontosságnak|Float (?) |decimális (?) |numerikus (?) "Az SQL és a "dupla" által Cassandra. A NaN különleges értéke Not-a-Number. ERDDAP™pozitív és negatív végtelen értékeket alakít ki a NaN számára.
char
- char egyetlen, 2 fehér (16 bit) Unicode UCS-2 karakterFurcsa\u0000 (#0) keresztül\uffff (#65535) ... \uffff"A definíció Not-a-Character, amely a NaN kettős értéket elemzi. A char használata elriasztott, mert sok fájltípus sem támogatja a charsot, vagy csak 1 fehér charsot támogat (lásd alább) ... Fontolja inkább a String használatát. A felhasználók a char változókat használhatják a grafikonok elkészítéséhez.ERDDAP™átalakítja a karaktereket az Unicode kódszámára, amelyet numerikus adatokként lehet használni.
Hírek
- Hírek 0 vagy több, 2 fehér sorozat (16 bit) Unicode UCS-2 karakterek... ERDDAP™Használja/értelmezi a 0 hosszúságot, mint egy hiányzó érték.ERDDAP™nem támogatja az igazi null sztringet. Az elméleti maximális sztring hossza 21473647 karakter, de valószínűleg különböző problémák vannak különböző helyeken, még valamivel rövidebb Strings. HasználatERDDAP"Az SQL karakterének, varchar, karakterváltó, bináris, varbináris, intervallum, tömör, multiset, xml és minden más adatbázis-adattípus, amely nem illik tisztán másokkalERDDAP™adattípus. HasználatERDDAPCassandra "szövege" és bármely más Cassandra adattípus, amely nem illik tisztán mássalERDDAP™adattípus.
KorábbanERDDAP™v2.10,ERDDAP™nem támogatta a nem jelentett integrált típusokat belsőleg, és korlátozott támogatást nyújtott az adatolvasók és írók számára.
Adattípus korlátozások
GondolhatszERDDAP™olyan rendszerként, amely virtuális adatkészletekkel rendelkezik, és amely az adatkészlet forrásának belső adatmodelljévé történő olvasásával működik, és adatokat ír különböző szolgáltatásokra (pl.(OPeN)DAP,WMS) és fájltípusok a felhasználói kérelmekre válaszul.
- Minden bemeneti olvasó támogatja az adattípusok aljzatát, amelyekERDDAP™támogatás. Az adatok olvasása az adatokbaERDDAPA belső adatstruktúrák nem jelentenek problémát.
- Minden kimeneti író támogatja az adattípusok alkészletét is. Ez egy probléma, mertERDDAPpéldául a hosszú adatok olyan fájltípusokba kerülnek, amelyek nem támogatják a hosszú adatokat.
Az alábbiakban a korlátozások magyarázatai (vagy nem) különböző kimeneti írók és hogyanERDDAP™foglalkozik a problémákkal. Az ilyen komplikációk egy örök részeERDDAPCélja, hogy interoperábilisá váljon az elválasztott rendszerek.
ASCII
- ASCII (.csv,.tsvstb.) szövegfájlok -
-
Minden numerikus adatot a String reprezentációján keresztül írják (hiányzó adatértékek jelennek meg 0 hosszúságú sztringek) ...
-
BárERDDAP™hosszú és hosszú értékeket ír az ASCII szövegfájljainak megfelelően, sok olvasó (pl. táblázatprogramok) nem tudja helyesen kezelni a hosszú és ulong értékeket, és ehelyett kettős értékekké alakítja őket (a pontosság elvesztése bizonyos esetekben) ...
-
Char és String adatok írt keresztül JSON Strings, amely kezeli az összes Unicode karakterek (nevezetesen az ASCII #127-en túli „szokatlan” karakterek, pl. az euró karakter „u20ac”-ként jelenik meg) ...
-
JSON
- JSON (.json,.jsonlCSVstb.) szövegfájlok -
- Minden numerikus adat a String reprezentációján keresztül van megírva.
- Char és String adatok vannak írva JSON Strings, amely kezeli az összes Unicode karakterek (nevezetesen az ASCII #127-en túli „szokatlan” karakterek, pl. az euró karakter „u20ac”-ként jelenik meg) ...
- Az összes numerikus adattípus hiányzó értéke nullnak tűnik.
.nc3 fájl
- .nc3 fájl nem natív módon támogatja a nem tervezett integrált adattípusokat. A CF v1.9 előtt a CF nem támogatta a nem aláírt integrált típusokat. ezzel foglalkozni,ERDDAP™2.10+ követi a NUG-szabványt, és mindig hozzáad egy "\_Unsigned" tulajdonságot az "igaz" vagy "hamis" értékével, hogy jelezze, hogy az adatok egy meg nem írt vagy aláírt változóból származnak. Minden integrált tulajdonságot aláírt tulajdonságként írnak (pl. byte) aláírt értékekkel (pl. ubyte)actual\_rangea 0–255 értéknek tulajdonítható, 0–1 értékkel bíró gyűlöletként jelenik meg (a két teljes értékének inverzuma). Nincs egyszerű módja annak, hogy megtudjuk, melyik (jelzett) integer tulajdonságokat kell leolvasni jelölt tulajdonságként.ERDDAP™támogatja a "\_Unsigned" tulajdonságot, amikor olvas.nc3 fájl.
- .nc3 fájl nem támogatja a hosszú vagy ulong adattípusokat.ERDDAP™ezzel foglalkozik, átmenetileg átalakítva őket, hogy kettős változó legyen. A duplák pontosan képviselhetik az összes értéket +/- 9,007,199,254,740,992 ami 2^53. Ez egy tökéletlen megoldás.Unidataelutasítja, hogy egy kisebb frissítést készítsen.nc3 kezelni ezt és kapcsolódó problémákat, idézni.nc4 4 4 (jelentős változás) mint megoldás.
- A CF specifikáció (v1.9 előtt) Azt mondta, hogy támogatja a char adattípust, de nem világos, hogy a char csak a char sasok építőelemei, amelyek hatékonyan Strings. Kérdések a levelezési listájához csak zavaró válaszokat hoztak létre. Ezeknek a komplikációknak köszönhetően a legjobb, ha elkerüljük a char változókatERDDAP™Használja a String változókat, ha csak lehetséges.
- Hagyományosan,.nc3 fájl csak az ASCII által kódolt karakterláncokat támogatta (7 bites, #0 - #127) karakterek. NUG (ésERDDAP) kiterjeszteni azt (Kezdőlap ~2017) beleértve a „\_Encoding” tulajdonságot az „ISO-8859-1” értékével (az ASCII kiterjesztése, amely minden 8 bites karakter 256 értéket meghatároz) vagy "UTF-8", hogy jelezze, hogy a String adatok kódolva. Más kódolások lehet jogi, de elriasztják.
.nc4 fájl
- .nc4 fájl támogatja az összesERDDAPAdattípusok.
NCCSV fájlok
Az NCCSV 1.0 fájlok nem támogatnak semmilyen nem aláírt integrált adattípust. NCCSV 1.1+ fájloktámogassa az összes kijelölt integrált adattípust.
DAP
- (OPeN)DAP (.das, .dds, .asc ASCII fájlok és .dods bináris fájlok) -
- (OPeN)DAPrövid, ushort, int, uint, float és dupla értékek helyes kezelése.
- (OPeN)DAP"bájt" adattípussal rendelkezik, amelyet lemondatlannak tekintenek, míg történelmileg a THREDDS ésERDDAP™bánatot kezeltek, ahogy aláírták őket(OPeN)DAPSzolgáltatások. Hogy jobban kezeljük ezt,ERDDAP™2.10+ követi az NUG szabványt, és mindig hozzáad egy "\_Unsigned" tulajdonságot az "igaz" vagy "hamis" értékével, hogy jelezze, hogy az adatok azERDDAP™byte vagy ubyte. Minden byte- és ubyte-jellemzőt úgy írják, mint „byte” tulajdonságokat, amelyek aláírt értékekkel rendelkeznek (pl. ubyte-ként).actual\_rangea 0–255 értéknek tulajdonítható, 0–1 értékkel bíró gyűlöletként jelenik meg (a két teljes értékének inverzuma). Nincs egyszerű módja annak, hogy megtudjuk, melyik "bájt" tulajdonságokat kell utódi tulajdonságként elolvasni.
- (OPeN)DAPnem támogatja az aláírt vagy nem aláírt hosszúságokat.ERDDAP™ezzel foglalkozik, átmenetileg átalakítva őket, hogy kettős változók és tulajdonságok. A duplák pontosan képviselhetik az összes értéket 9,007,199,254,740,992 ami 2^53. Ez egy tökéletlen megoldás.OPeNDAP (a szervezet) elutasítja, hogy egy kisebb frissítést készítsenDAP2.0 ezzel és a kapcsolódó problémákkal foglalkozni, idézveDAP4 4 4 (jelentős változás) mint megoldás.
- Mert(OPeN)DAPnincs külön char adattípus és technikailag csak 1 fehér ASCII karaktert támogat (#0 - #127) a Strings-ban a char data variables 1 karakter-hosszú Strings-ként jelenik meg(OPeN)DAP.das, .dds és .dods válaszok.
- Technikailag, a(OPeN)DAPspecifikáció csak az ASCII kódolt karakterekkel támogatja (#0 - #127) ... NUG (ésERDDAP) kiterjeszteni azt (Kezdőlap ~2017) beleértve a „\_Encoding” tulajdonságot az „ISO-8859-1” értékével (az ASCII kiterjesztése, amely minden 8 bites karakter 256 értéket meghatároz) vagy "UTF-8", hogy jelezze, hogy a String adatok kódolva. Más kódolások lehet jogi, de elriasztják.
Adattípus megjegyzések
- Mivel a rossz támogatás hosszú, ulong, és char adatok sok fájltípusban, elriasztjuk az ilyen adattípusok használatátERDDAP... Ha lehetséges, használja kettős helyett hosszú és ulong, és használja String helyett char.
- Metadata - Mert(OPeN)DAP.das és .dds válaszok nem támogatják a hosszú vagy ulong tulajdonságokat vagy adattípusokat (helyettük kettősnek mutatják őket) Ehelyett inkább használni akarodERDDAP"A metafora reprezentációja a metaadata, mint látható ahttp.../erddap/ Info / datasetID .html weboldal (például, https://coastwatch.pfeg.noaa.gov/erddap/info/cwwcNDBCMet/index.html ) (amely más fájltípusokban is kaphat, például .csv,.htmlTable,.itx,.json,.jsonlCSV1,.jsonlCSV,.jsonlKVP,.mat,.nc,.nccsv,.tsv,.xhtml) vagy.nccsvMetadata válasz (például, https://coastwatch.pfeg.noaa.gov/erddap/tabledap/cwwcNDBCMet.nccsvMetadata bár.nccsvA Metadata csak tabuláris adatkészletekhez érhető el) mindkettő támogatja az összes adattípust (különösen, hosszú, ulong és char) ...
Media Files
Nem minden adat számos szám vagy szöveg. Néhány adatkészlet tartalmaz vagy tartalmazza a médiafájlokat, például a képet, az audio- és videofájlokat.ERDDAP™Van néhány speciális jellemzője, hogy megkönnyítse a felhasználók számára, hogy hozzáférjenek a médiafájlokhoz. Ez egy két lépéses folyamat:
- Készítsen minden fájlt a saját URL-jén keresztül, egy olyan rendszeren keresztül, amely támogatja a byte range kéréseket. A legegyszerűbb módja ennek az, hogy a fájlokat egy könyvtárba helyezzük, hogyERDDAP™hozzáféréssel rendelkezik. (Ha egy konténerben vannak, mint egy.zipfájl, zip őket, bár lehet, hogy felajánlja a.zipfájlt a felhasználóknak is.) Ezután készíts egyEDDTableFromFileNamesadatkészlet, hogy ezeket a fájlokat hozzáférhetővé tegyékERDDAP™- nevezetesen keresztülERDDAPA"files"rendszerrendszer...
Minden fájl elérhetővé tette az EDDTableFromFileNames ésERDDAPA"files"rendszertámogatásbyte range kérések... Normális esetben, ha egy ügyfél (pl. böngésző) kérést kér egy URL-hez, az egész fájlt választ kapja. De egy byte range kéréssel a kérelem egy sor byte-t határoz meg a fájlból, és a szerver csak visszaküldi azokat a byte-eket. Ez azért releváns itt, mert a böngészők hang- és videojátékosai csak akkor működnek, ha a fájl elérhető a byte hatótávú kéréseken keresztül.
Opcionális: Ha több mint egy adatkészlete van a kapcsolódó médiafájlokkal, akkor csak egy EDDTableFromFileNames-t készíthet, amely minden egyes fájltípushoz almappát tartalmaz. Az előny az, hogy amikor új médiafájlokat szeretne hozzáadni egy új adatkészlethez, minden, amit meg kell tennie, egy új mappa létrehozása, és a fájlokat a mappába helyezi. A mappát és fájlokat automatikusan hozzáadjuk az EDDTableFromFileNames adatkészlethez.
- Opcionális: Ha van egy adatkészlet, amely magában foglalja a médiafájlokra való hivatkozásokat, add hozzáERDDAP... Például, lehet, hogy egy .csv fájl egy sor minden alkalommal, amikor valaki látott egy bálna és egy oszlop, amely magában foglalja a neve egy kép fájl kapcsolódik a látnivaló. Ha a képfájl neve csak a fájlnév, pl. Img20141024T192403Z, nem teljes URL, akkor hozzá kell adniaAccessBase Url és / vagy fájlAccessSuffixennek a metaadatnak a tulajdonságaidataVariableamely meghatározza az alapURL-t és elegendőt ezekhez a fájlnévekhez. Ha az EDDTableFromFileNames-on keresztül elérhető fájlokat készítette, az URL formában lesz alapUrl /erddap/files/ datasetID / Például,
<att name="fileAccessBaseUrl">*someBaseURL*</a>
<att name="fileAccessSuffix">.png</a>
Ha van egy.zipvagy más konténerfájl az összes adatváltozathoz kapcsolódó médiafájlmal, javasoljuk, hogy a fájl is hozzáférhető legyen a felhasználók számára (Lásd a fenti 1. lépést) Ezután azonosítsa azt egyAccessArchive Urltulajdonság.
\[KezdőlapERDDAP™v1.82\]Ha az első lépést tesszük fölött (vagy mindkét lépés) akkor, ha egy felhasználó megnézi aERDDAP™ "files"rendszer az adatkészlethez (vagy kéri, hogy az adathalmaz egy albeállítását egy.htmlTablekérés, ha megtette a második lépést) ,ERDDAP™"?" ikont mutat a fájlnév baljára. Ha a felhasználó átkapcsolja ezt az ikont, akkor egy popupot látnak, amely megmutatja a képet, vagy egy audiolejátszót, vagy egy videolejátszót. A böngészők csak korlátozott számú típusú támogatást nyújtanak
- kép (általában .gif, .jpg és .png) ,
- audio (általában .mp3, .ogg és .wav) és
- videofájlok (általában .mp4, .ogv és . webm) ...
Támogatás változatos különböző verziók különböző böngészők különböző operációs rendszerek. Tehát, ha van egy választás, hogy melyik fájltípus kínál, akkor van értelme, hogy ezeket a típusokat.
Vagy ha egy felhasználó kattint a fájlnévre, amelyet egyERDDAP™weboldal, böngészőjük a képet, az audio- vagy videofájlt külön weboldalként fogja megjeleníteni. Ez leginkább hasznos, hogy egy nagyon nagy kép vagy videó skálázott a teljes képernyő, ahelyett, hogy egy popup.
Az AWS S3 fájlokkal való együttműködés
Amazon Web szolgáltatás (AWS) egy eladójafelhő számításSzolgáltatások.S3az AWS által kínált objektumtároló rendszer. A hagyományos fájlrendszer hierarchikus rendszere és fájljai helyett (mint egy kemény meghajtó a PC-ben) Az S3 csak "bucketeket" kínál, amelyek "objekteket" tartanak (hívjuk őket"files") ...
Az ASCII fájlokhoz (pl.: .csv) ,ERDDAP™közvetlenül a vödörökben lévő fájlokkal dolgozhat. Az egyetlen dolog, amit meg kell tennie, az megadja a<fájlDir> az adatkészlethez egy adott formátumot használva az AWS bucket számára, például https://bucketName.s3.aws-region.amazonaws.com/subdirectory/ ... Nem szabad használni<cacheFromUrl> Lásd alább részleteket.
De a bináris fájlokhoz (pl.:.nc, .grib, .bufr és.hdffájlok) Használnia kell<cacheFromUrl> rendszer az alábbiakban leírt.ERDDAPNetcdf-java (melyikERDDAP™használja az adatok olvasását ezekből a fájlokból) , és más tudományos adatszoftvereket úgy terveztek, hogy egy hagyományos fájlrendszerben dolgozzanak, amely kínálblokk szinthozzáférés fájlokhoz (amely lehetővé teszi, hogy elolvassa a zsákokat egy fájlból) , de az S3 csak ajánlatokfájlszint (objektum) hozzáférés fájlokhoz (amely csak lehetővé teszi az egész fájl olvasását) ... Az AWS alternatívát kínál az S3-nak,Elastic Block áruház (EBS) ), amely támogatja a blokk szintű hozzáférést a fájlokhoz, de drágább, mint az S3, ezért ritkán használják nagy mennyiségű adatfájl tárolására. (Tehát amikor az emberek azt mondják, hogy tárolja az adatokat a felhőben (S3) olcsó, általában almák narancsok összehasonlításához.)
S3 vödör
Egy vödör tartalma. kulcsok. Objects. Delimiters.
Technikailag az S3 bucketek nem szerveződnek egy hierarchikus fájlszerkezetben, mint egy fájlrendszer egy számítógépen. Ehelyett a vödrök csak "objekteket" tartalmaznak (fájlok) Mindegyiknek van egy "key" (név) ... Egy példa arra a kulcsra, hogy a noa-goes17 bucket
ABI-L1b-RadC/2019/235/22/OR\\_ABI-L1b-RadC-M6C01\\_G17\\_s20192352201196\\_e20192352203569\\_c20192352204013.nc
A megfelelő URl ehhez a tárgyhoz
Az AWS egy kis variációt támogat abban, hogy hogyan épül fel az URL, deERDDAP™megköveteli ezt az egy adott formátumot:
https://bucketName.s3.region.amazonaws.com/key
Ez a szokásos gyakorlat, mint ez a példa, hogy a kulcsfontosságú nevek úgy néznek ki, mint egy hierarchikus út, plusz egy fájlnév, de technikailag nem. Mivel ez gyakori és hasznos,ERDDAP™kezeli a kulcsokat / úgy, mintha egy hierarchikus út plusz fájl neve, és ez a dokumentáció hivatkozik rájuk. Ha egy vödör kulcsa nem használja / (pl. egy kulcs, mint egy kulcs,
ABI-Lib.2018.052.22.OR\_ABI-L1b-RadM2-M3C10\_G16\_s201805222475), majdERDDAP™Csak az egész kulcsot kezeli hosszú fájlnévként.
Private vs Public Buckets - Az S3 bucket adminisztrátora nyilvánosságra hozhatja a vödört és tartalmát. Ha nyilvános, a vödör bármely fájlját bárki letöltheti az URL-t a fájlhoz. Az Amazonnak van egyNyitott adatokprogram, amely nyilvános adatkészleteket tárol (beleértve az adatokatNOAA, NASA és USGS) ingyen, és nem számít fel senkinek, hogy letöltse a fájlokat ezekből a vödörökből. Ha egy vödör privát, a vödörben lévő fájlok csak az engedélyezett felhasználók és az AWS díjakhoz jutnak (általában a vödör tulajdonosa által fizetett) fájlok letöltése egy nem AWS S3 számítógépre.ERDDAP™adatokat dolgozhat nyilvános és privát vödörekben.
AWS Credentials
Hogy megtegye, hogyERDDAP™elolvashatja a privát vödör tartalmát, szüksége van AWS hitelesítő anyagokra, és tárolnia kell egy hitelesítő fájlt a szabványos helyen, ígyERDDAP™megtalálhatja az információt. Lásd az AWS SDK-tJava2.x dokumentáció:Az alapértelmezett hitelesítő anyagok beállítása... (Az értékek tárolásának lehetősége, mintJavaparancssori paraméterek a\[Tomcat\]/bin/setenv.sh lehet egy jó lehetőség.)
AWS /files/
- /files/ rendszer - AERDDAP™ /files/ rendszerlehetővé teszi a felhasználók számára, hogy letöltsék a forrásfájlokat egy adatkészlethez. Javasoljuk, hogy fordítsa ezt az összes adatlapot a forrásfájlokkal, mert sok felhasználó le akarja tölteni az eredeti forrásfájlokat.
- Ha a fájlok egy privát S3 vödörben vannak, a felhasználó kérése, hogy töltse le a fájlt, akkor kezeliERDDAP™, amely elolvassa az adatokat a fájlból, majd továbbítja a felhasználónak, így növeli a terhelést az Ön számáraERDDAP™bejövő és kimenő sávszélességet használva, és (aERDDAP™adminisztrátor) fizesse ki az adatok egress díját az AWS-nek.
- Ha a fájlok nyilvános S3 bucketben vannak, a felhasználó kérése, hogy töltse le a fájlt, átirányítva lesz az AWS S3 URL-re a fájlhoz, így az adatok nem fognak keresztülmenni.ERDDAP™Így csökkenti a terheléstERDDAP... És ha a fájlok egy Amazon Open Data (szabad) nyilvános vödör, akkor te (aERDDAP™adminisztrátor) Nem kell fizetnie semmilyen adat-egészségügyi díjat az AWS-nek. Így nagy előnye van az adatok nyilvános kiszolgálása (nem privát) S3 vödör, és hatalmas előnye az adatok kiszolgálásának az Amazon Open Data (szabad) vödör.
ERDDAP™AWS S3 vödör
ERDDAP™AWS S3 vödör
Szerencsére, sok erőfeszítés után,ERDDAP™számos olyan funkcióval rendelkezik, amelyek lehetővé teszik, hogy az S3 blokkszintű hozzáféréssel ésszerűen hatékonyan kezelje a fájlokhoz való hozzáférést:
- \[Hirdető: Az AWS S3 bucketekkel való munka sok extra munka. Az AWS egy hatalmas ökoszisztéma a szolgáltatásoknak és funkcióknak. Rengeteg tanulni. Időre és erőfeszítésre van szükség, de ez megvalósítható. Légy türelmes, és kapsz dolgokat dolgozni. Nézd / kérj segítséget
()AWS dokumentációolyan weboldalak, mintStack Overflowés a rendszeres
ERDDAP™támogatási lehetőségekHa/ha megragadsz.\]
- Nehéz megtudni a fájlok könyvtári struktúráját és fájlnevét egy S3 bucketben.ERDDAP™megoldás erre a problémára: az EDDTableFromFileNames speciális\\\*fromOnTheFlyopció, amely lehetővé teszi, hogy egy EDDTableFromFileNames adatkészletet készítsen, amely lehetővé teszi a felhasználók számára, hogy böngészjenek egy S3 bucket tartalmát (fájlok letöltése) az adatkészleten keresztül"files"opció. Van egyaz alábbiakban...
- ERDDAP™olvashat adatokatkülső tömörített adatfájlok, így rendben van, ha az S3 fájlokat tárolják.gz,.gzip,.bz2, .Z, vagy más típusú külsőleg tömörített adatfájlok, amelyek drámai módon (2 - 20X) csökkentse a fájltárolási költségeket. Gyakran nincs idő büntetés külsőleg tömörített fájlok használatára, mivel az S3 és az S3 közötti kisebb fájl átvitelével mentett időERDDAPdurván egyensúlyozza a szükséges extra időtERDDAP™dekompresszálni a fájlt. Használja ezt a funkciót, csak meg kell győződnie arról, hogy az adatkészlet<fájlNameRegex> lehetővé teszi a kompressált fájltípust (pl. hozzáadásával (|.gz) a regex végére) ...
- A leggyakoribb esetben, ahol van egyERDDAP™telepítve a PC-re a teszt / fejlesztéshez, és ahol az adatkészletnek bináris adatfájlja van, amelyeket objektumként tárolnak egy S3 bucketben, egy megközelítés az adatkészlet beszerzéséhezERDDAP™az:
-
Hozzon létre egy könyvtárat a PC-n, hogy tartson néhány teszt adatfájlot.
-
Töltse le a forrásból származó két adatfájlokat az Ön által létrehozott könyvtárba.
-
HasználatGenerateDatasetsXmllétrehozni a zsákotdatasets.xmla két helyi adatfájlon alapuló adatkészlet esetében.
-
Ellenőrizze, hogy ez az adatkészlet a kívánt módon működikDasDdsés/vagy a helyiERDDAP...
A következő lépések az adatkészlet másolatát teszik ki (amely adatokat kap az S3-ból) nyilvánosanERDDAP...
-
Másolja a zsákotdatasets.xmlaz adatkészlet számáradatasets.xmla nyilvánosság számáraERDDAP™ez szolgálja az adatokat.
-
Hozzon létre egy könyvtárat a nyilvánosság számáraERDDAPHelyi merevlemez az ideiglenes fájlok gyorsítótárának megtartásához. A könyvtár nem fog sok lemezterületet használni (lásd a cacheSizeGB alul) ...
-
Változtassa meg az adatkészlet értékét<fájlDir> címke, hogy pont a könyvtár, amit csak létrehozott (még akkor is, ha a könyvtár üres) ...
-
Adj hozzá egyCacheFromUrlcímke, amely meghatározza az adatkészlet vödör nevét és opcionális előtagját (i.e., könyvtár) az adottAws S3 URL formátumERDDAP™követelmények...
-
Adj hozzá egyet<cacheSizeGB>] (#cachefromurl) címke az adatkészlet xml (pl. a 10 jó érték a legtöbb adatkészlet számára) Mondd elERDDAP™korlátozni a helyi cache méretét (i.e., ne próbálja meg az összes távoli fájlt) ...
-
Lásd, hogy ez működik-e a nyilvánosságbanERDDAP... Vegye figyelembe, hogy az első alkalommalERDDAP™terheli az adatkészletet, hosszú időt vesz igénybe a terheléshez, mertERDDAP™le kell tölteni és el kell olvasni az összes adatfájlt.
-
Ha az adatkészlet hatalmas gyűjteménye a hatalmas hálózati adatfájloknak, ez nagyon hosszú időt vesz igénybe, és gyakorlati jellegű lesz. Bizonyos esetekben a rácsos adatfájlok esetében,ERDDAP™kivonhatja a szükséges információkat (pl. az adatok időpontja egy rácsos adatfájlban) a fájl neve és elkerülje ezt a problémát. LásdAggregáció keresztül File nevek...
- Opcionálisan (de különösen az EDDTableFromFiles adatkészletek esetében) Hozzáadhatsz egynHáromtagolja meg az adatkészletet, hogy elmondjaERDDAPtöbb mint 1 szál használata a felhasználó adatkérésére. Ez minimalizálja a késés hatásait, amelyek akkor fordulnak elő, amikorERDDAP™az adatfájlokat olvassa el (távolról) AWS S3 vödör a helyi csészébe és (talán talán talán talán talán) dekompresszálja őket.
AWS S3 nyílt adatok
részekéntNOAAABig Data Program,NOAAöt szervezettel, beleértve az AWS-t is, „a kulcsfontosságú megfigyelések és modellkimenetek másolatainak tárolásának lehetséges előnyeinek felfedezése a Cloud-ban, hogy lehetővé tegye a közvetlenül az adatokon történő számítást anélkül, hogy további elosztást igényelne”. Az AWS tartalmazza az általa kapott adatkészleteketNOAAprogramjának részeként nyilvános hozzáférést biztosít a nagy gyűjteményhezNyitott adatok AWS S3bármely számítógépről, legyen szó az Amazon kompute-ről (bérelt számítógép) az AWS hálózaton vagy a saját PC-n bármely hálózaton. Az alábbi példa feltételezi, hogy nyilvánosan hozzáférhető adatkészlettel dolgozol.
Hozzáférés Files egy AWS S3 Bucket
Egy privát S3 adatcsomag esetében a vödör tulajdonosának hozzáférést kell adnia a vödörhöz. (Lásd az AWS dokumentációt.)
Minden esetben szüksége lesz egy AWS fiókra, mert az AWS SDKJava (melyikERDDAP™az információ visszaszerzése egy vödör tartalmáról) megköveteli az AWS fiók hitelesítő adatait. (többet az alábbiakban)
ERDDAP™csak az AWS S3 vödörhöz férhet hozzá, ha megadja a [<cacheFromUrl> (#cachefromurl) (vagy<fájlDir>) egy adott formátumban:
https://bucketName.s3.aws-region.amazonaws.com/prefix/
ahol
- A bucketName a vödör neve rövid formája, pl. noaa-goes17.
- Az aws-region, például a kelet-1, a "Region" oszlop egyik táblázatában található.AWS Service Endpointsahol a vödör valójában található.
- Az előtag opcionális. Ha jelen van, akkor véget kell érnie'/'...
Például, https://noaa-goes17.s3.us-east-1.amazonaws.com/ABI-L1b-RadC/
Ez az URL formátum az egyik AWS S3 ajánlás: lásdBucket hozzáféréseésaz előtagok leírása...ERDDAP™megköveteli, hogy kombinálja a vödör URL-t és az opcionális előtagot egy URL-be annak érdekében, hogy meghatározza a<cacheFromUrl> (vagy<fájlDir>), ahol a fájlok találhatók.
Test Public AWS S3 Buckets
A nyilvános vödörök számára tesztelheti és tesztelheti az AWS S3 könyvtárának vödörét a böngészőben, pl. https://noaa-goes17.s3.us-east-1.amazonaws.com Ha a vödör URL helyes és megfelelőERDDAPvisszatér egy XML dokumentumhoz, amely rendelkezik (Részleges) e vödör tartalmának felsorolása. Sajnos a teljes URL (i.e., bucket URL plus prefix) azERDDAP™egy adott adatkészletet akar, nem működik egy böngészőben. Az AWS nem kínál rendszert, hogy a böngészőben könnyen böngészhesse a vödör hierarchiáját. (Ha ez helytelen, kérjük, e-mailben Chris. John at noaa.gov. Ellenkező esetben az Amazon, kérlek, adjon támogatást ehhez!)
Egy vödör tartalmának megtekintése
Az S3 buckets gyakran tartalmaz néhány fájlkategóriát, néhány pszeudo-közvetítőt, amelyek párERDDAP™adatkészletek. Ahhoz, hogy aERDDAP™adatkészletek, tudnia kell a kezdő könyvtárat<cacheFromUrl> (vagy<fájlDir>) és a fájl nevek formátuma, amelyek azonosítják a fájlok beállítását. Ha egy böngészőben megpróbálja megtekinteni a teljes tartalmat, az S3 csak az első 1000 fájlt mutatja be, ami elégtelen. Jelenleg a legjobb módja annak, hogy megnézze az összes tartalmat egy vödör, hogy egyEDDTableFromFileNamesadatkészlet (a PC-jénERDDAP™és/vagy a nyilvánosságraERDDAP) , amely egy egyszerű módja annak, hogy böngészje a könyvtári struktúrát és letöltse fájlokat. A<fájlDir> ez lesz az URL, amit fent tett, pl. https://noaa-goes17.s3.us-east-1.amazonaws.com ...\[Miért nem kínálja az AWS S3 gyors és egyszerű módját bárkinek, aki ezt AWS fiók nélkül teszi?\]Vegye figyelembe, hogy amikor ezt a PC-n egy nem Amazon hálózaton csinálom, úgy tűnik, hogy az Amazon lelassítja a trükkre adott válaszot (körülbelül 100 (?) fájlok / chunk) az első néhány darab után (1000 fájlból darabonként) letöltve. Mivel a vödrök hatalmas számú fájlt tartalmazhatnak (Noaa-goes17 26 millióval rendelkezik) , hogy az összes tartalmát egy vödör lehet venni EDDTableFromFileNames órák (pl. 12!) befejezni.\[Az Amazon igaz?\]
EDDTable készítése FromFileNames Dataset with AWS S3 Bucket
Ha van egy vödör neve, de nem rendelkezik már egy listát a fájlok az S3 vödör vagy az előtag, amely azonosítja a helyét a vonatkozó fájlokat a vödörben, használja az utasításokat, hogy az EDDTableFileNames adatkészlet, így böngészheti a könyvtár hierarchia az S3 vödör keresztülERDDAPA"files"rendszer.
- Nyisson meg egy AWS fiókot ERDDAP™Használja aAWS SDKJavahogy vödör információt kapjon az AWS-től, így meg kelllétrehozni és aktiválni egy AWS fiókot... Ez egy elég nagy munka, sok mindent megtanulni.
- Helyezze az AWS Credentials-ot, aholERDDAP™megtalálhatja őket. Kövesse az utasításokatAz AWS Credentials és a Fejlesztési Régió létrehozásaígyERDDAP™ (kifejezetten az AWS SDKJava) képes lesz megtalálni és használni az AWS hitelesítő adatait. HaERDDAP™nem találja meg a hitelesítő anyagokat, látni fogja a java.lang. IllegalArgumentException: profilfájl nem lehet null hibaERDDAPLog.txt fájl.
Hint for Linux és Mac OS: a hitelesítő fájlnak a Tomcat futó felhasználó otthoni könyvtárában kell lennie (ésERDDAP) (e bekezdés esetében a felhasználó=tomcat) egy ~/.aws/credentials nevű fájlban. Ne feltételezzük, hogy ~ a /home/tomcat - valójában használja a cd-t -, hogy megtudja, hol gondolja az operációs rendszer - a felhasználó=tomcat. Hozzon létre a könyvtárat, ha nem létezik. Továbbá, miután elhelyezte a hitelesítő fájlt, győződjön meg róla, hogy a fájl felhasználója és csoportja tomcat, majd használja a chmod 400 hitelesítőt, hogy megbizonyosodjon arról, hogy a fájl csak a felhasználói=tomcat.
- Hozzon létre a bucket URL-tformátum,ERDDAP™követelményekpl.: https://noaa-goes17.s3.us-east-1.amazonaws.com és (nyilvános vödrökkel) tesztelni egy böngészőben, hogy megbizonyosodjon arról, hogy visszatér egy XML dokumentum, amely részlegesen felsorolja a tartalmát a bucket.
- HasználatGenerateDatasetsXmllétrehozni egyEDDTableFromFileNamesadatkészlet:
-
A Starting könyvtárhoz használja ezt a szintaxot: \\" A-tól, YourBucketUrl* például, \\\*fromOnTheFly, https://noaa-goes17.s3.us-east-1.amazonaws.com/
-
File név regex? **
-
Visszatérő? Igaz
-
újratöltés EveryNMinutes? 10080
-
intézmény?NOAA
-
összefoglaló? Nincs semmi (ERDDAP™automatikusan egy tisztességes összefoglalót hoz létre.)
-
cím? Nincs semmi (ERDDAP™automatikusan létrehoz egy tisztességes címet.) A szokásos módon szerkesztenie kell az elért XML-t, hogy ellenőrizze a korrektséget, és javítson, mielőtt az adatkészletek zsunkja használja azt.datasets.xml...
-
- Ha követi a fenti utasításokat, és betölti az adatkészletetERDDAP, létrehozott egy EDDTableFromFiles adatkészletet. Példaként, és hogy megkönnyítse bárki számára, hogy böngészjen és letöltse az AWS Open Data buckets fájlokat, létrehoztuk az EDDTableFromFileNames adatkészleteket (lásd a listát a listán az AWS Open Data buckets-ből).
https://upwell.pfeg.noaa.gov/erddap/search/index.html?searchFor=awsS3Files\_ ) szinte az összesAWS S3 Open Data buckets...
\[A kevesek, akiket nem tartalmaztunk, vagy számos fájlt tartalmaztak a gyökérkönyvtárban (több, mint letölthető ésszerű idő alatt) vagy nem engedélyezi a nyilvános hozzáférést (Nem ők mind nyilvánosak?) vagy a Requester Pays buckets (pl. Sentinel) ...\]
Ha rákattintasz a"files"link az egyik ilyen adatkészlethez, böngészheti a könyvtárfát és a fájlokat ebben az S3-ban. Az út miatt\\\*fromOnTheFly EDDTableFromFiles működik, ezek a könyvtári listák mindig tökéletesen naprakészek, mertERDDAP™a repülésen kapja meg őket. Ha rákattint a könyvtárfára egy tényleges fájlnévre, és kattintson a fájlnévre,ERDDAP™átirányítja kérését az AWS S3-ra, hogy közvetlenül letölthesse a fájlt az AWS-től. Ezután ellenőrizheti ezt a fájlt.
Hiba? Ha az EDDTableFromFiles nem tölt beERDDAP™ (vagy DasDds) Nézze meg a log.txt fájlt egy hibaüzenethez. Ha látsz egyet java.lang. IllegalArgumentException: profilfájl nem lehet null hiba, a probléma az, hogy az AWS SDKJava (használtERDDAP) nem találja meg a hitelesítő fájlt. Lásd a hitelesítő utasításokat fent.
Sajnálatos, hogy az AWS nem egyszerűen lehetővé teszi, hogy az emberek egy böngészőt használhassanak, hogy megnézzék egy nyilvános vödör tartalmát.
Aztán megtehetedERDDAP™olyan adatkészletek, amelyek hozzáférést biztosítanak a felhasználóknak az adatokhoz a fájlokban.
Lásd az utasításokatERDDAP™S3 vödör (felett) ...
A minta EDDTableFromFileNames adatkészlet, amelyet fent készített, ha egy kicsit feküdt a könyvtár és a fájl nevek a könyvtárban, egyértelművé válik, hogy a felső szintű könyvtár nevek (pl.: ABI-L1b-RadC) megfelel annak, amitERDDAP™külön adatkészleteknek neveznék. A vödör, amellyel dolgozol, hasonló lehet. Ezután külön adatkészleteket hozhat létreERDDAP™az egyes adatk észletek esetében, például,
https://noaa-goes17.s3.us-east-1.amazonaws.com/ABI-L1b-RadC/
mint<cacheFromUrl> Sajnos ebben a példában az adatkészletek a vödörben úgy tűnik, hogy az 1. vagy 2. szintű adatkészletek, amelyekERDDAP™ nem különösebben jóMivel az adatkészlet bonyolultabb változógyűjtemény, amely különböző dimenziókat használ.
NcML fájlok
NcML fájlok lehetővé teszik, hogy megadja az on-the-fly változások egy vagy több eredeti forrásNetCDF (v3 vagy v4) .nc, .grib, .bufr vagy.hdf (v4 vagy v5) fájlok, majdERDDAP™kezelni.ncml fájlok, mint a forrásfájlok.ERDDAP™Az adatkészletek elfogadják.ncml fájlok, amikor.ncA fájlok várhatóak. Az NcML fájlok MUST van a kiterjesztés.ncml. Lásd:UnidataNcML dokumentáció... NcML hasznos, mert lehet csinálni néhány dolgot vele (például különböző változásokat hozva a különböző fájlokra egy gyűjteményben, beleértve a fájlhoz adott dimenziót egy adott értékkel.) ,, hogy nem tehetsz veleERDDAPAdatasets.xml...
- Változások egy.ncml fájl utolsóModified idő okozza a fájlt, hogy újratöltsék, amikor az adatkészletet újratöltik, de az alapul szolgáló változások.ncAz adatfájlokat nem fogják közvetlenül észrevenni.
- Hint: NcML\*nagyon\*érzékeny néhány elem megrendelése az NcML fájlban. Gondolj az NcML-re, mint egy sor utasítást a megadott sorrendben, azzal a szándékkal, hogy megváltoztatja a forrásfájlokat (az állam az NcML fájl kezdetén/topján) a rendeltetési fájlokba (az állam az NcML fájl végén / alján) ...
Az NcML alternatívája azNetCDFÜzemeltetők (NCO) ... A nagy különbség az, hogy az NcML egy olyan rendszer, amely megváltoztatja a repülést (így a forrásfájlok nem változnak) , mivelNCOfelhasználhatók a változásokhoz (vagy új verziók) a fájlok. MindkettőNCOés az NcML nagyon, nagyon rugalmas, és lehetővé teszi, hogy szinte bármilyen változást gondoljon a fájlokra. Mindkét esetben kihívást jelenthet, hogy pontosan kitalálja, hogyan kell csinálni, amit szeretne csinálni - ellenőrizze az internetet hasonló példákra. Mindkettő hasznos eszköz a netCDF ésHDFfájlok használatraERDDAP- különösen, hogy a változásokat túlmutassuk azon, hogy miERDDAPA manipulációs rendszer megteheti.
Példa # 1: Idő dimenzió hozzáadása egy egységes értékkel Itt van egy.ncml fájl, amely létrehoz egy új külső dimenziót (Idő, 1 értékkel: 1041379200) és hozzáadja ezt a dimenziót a pic változójához az A2003001.L3m\_DAY\_PIC\_pic\_4km nevű fájlban.nc:
<netcdf xmlns='https://www.unidata.ucar.edu/namespaces/netcdf/ncml-2.2'>
<variable name='time' type='int' shape='time' />
<aggregation dimName='time' type='joinNew'>
<variableAgg name='pic'/>
<netcdf location='A2003001.L3m\\_DAY\\_PIC\\_pic\\_4km.nc' coordValue='1041379200'/>
</aggregation>
</netcdf>
Példa #2: A meglévő időérték megváltoztatása Néha a forrás.nca fájl már rendelkezik idő dimenzióval és időértékkel, de az érték helytelen (az Ön céljaira) ... Ez a.ncml fájl azt mondja: az "19810825230030-NCEI" nevű adatfájl esetében a dimenzió változója"time", állítsa be az egységek tulajdonságát, hogy "második 1970-01-01T00:00Z", és meghatározza az időértéket, hogy 367588800.
<netcdf xmlns='https://www.unidata.ucar.edu/namespaces/netcdf/ncml-2.2'
location="19810825230030-NCEI-L3C\\_GHRSST-SSTskin-AVHRR\\_Pathfinder-PFV5.3\\_NOAA07\\_G\\_1981237\\_day-v02.0-fv01.0.nc">
<variable name="time">
<attribute name='units' value='seconds since 1970-01-01T00:00:00Z' />
<values>367588800</values>
</variable>
</netcdf>
NetCDFÜzemeltetők (NCO)
„A netCDF üzemeltetők (NCO) tartalmaz egy tucat önálló, parancssori programokat, amelyek netCDF\[v3 vagy v4\],HDF \[v4 vagy v5\],\[.grib, .bufr,\]vagyDAPfájlok mint bemenet, majd működnek (pl. új adatok, kompute statisztikák, nyomtatás, hiperslab, manipulálja a metaadatát) és adja ki az eredményeket a szövegben, bináris vagy netCDF formátumban való képernyőre vagy fájlokra.NCOtámogatások elemzése rácsos tudományos adatok. A shell-parancs stílusaNCOlehetővé teszi a felhasználók számára, hogy interaktív módon manipulálják és elemezzék a fájlokat, vagy kifejező szkriptekkel, amelyek elkerülik a magasabb szintű programozási környezetek egy részét.” (aNCOWeboldal) ...
alternatívaNCOazNcML... A nagy különbség az, hogy az NcML egy olyan rendszer, amely megváltoztatja a repülést (így a forrásfájlok nem változnak) , mivelNCOfelhasználhatók a változásokhoz (vagy új verziók) a fájlok. MindkettőNCOés az NcML nagyon, nagyon rugalmas, és lehetővé teszi, hogy szinte bármilyen változást gondoljon a fájlokra. Mindkét esetben kihívást jelenthet, hogy pontosan kitalálja, hogyan kell csinálni, amit szeretne csinálni - ellenőrizze az internetet hasonló példákra. Mindkettő hasznos eszköz a netCDF ésHDFfájlok használatraERDDAP- különösen, hogy a változásokat túlmutassuk azon, hogy miERDDAPA manipulációs rendszer megteheti.
Például használhatóNCOhogy az idő egységei változóak legyenek egy olyan fájlcsoportban, ahol eredetileg nem voltak következetesek. Vagy használhatNCOalkalmazniscale\_factorésadd\_offsetegy olyan fájlcsoportban, aholscale\_factorésadd\_offsetkülönböző értékekkel rendelkezik a különböző forrásfájlokban. (Vagy most kezelheti ezeket a problémákatERDDAP™keresztülEDDGridFromNcFilesUnpackEz egy változataEDDGridFromNcFiles, amelyek csomagolt adatokat csomagolnak, és alacsony szinten szabványosítják az időértékeket annak érdekében, hogy kezeljék a gyűjtőfájlokat, amelyek eltérőekscale\_factorésadd\_offsetvagy különböző időegységek.)
NCOIngyenes és nyílt forráskódú szoftver, amely aGPL 3.0licenc.
Példa # 1: Egységek konzisztens készítése
EDDGridFromFiles és EDDTable A Files ragaszkodik ahhoz, hogy az egy adott változó egységei azonosak legyenek az összes fájlban. Ha néhány fájl triviálisan (nem funkcionális) másoktól eltérő (pl. időegységek
"Seconds 1970-01-01 00:00 UTC" versus
"seconds since 1970-01-01T00:00:00Z"HasználhatnádNCOANövény. megváltoztatni az egységeket az összes fájlban, hogy azonos legyen
nco/catted - egy egység, idő, o,c, másodpercek 1970-01-01T00:00Z \*.nc
\[Sok probléma, mint ez az EDDTableFrom... Files adatkészletek, most használhatjaszabványosítás AmitMondd elERDDAPszabványosítani a forrásfájlokat, ahogy olvassákERDDAP...\]
Korlátozza az adatkészlet méretét
Sok hivatkozást fogsz látni a "2 milliárd" alatt. Pontosabban, ez egy hivatkozás 2,147,483,647 (2^31-1) amely a 32 bites aláírt integrál maximális értéke. Egyes számítógépes nyelveken példáulJava (melyikERDDAP™be van írva) Ez a legnagyobb adattípus, amelyet sok adatstruktúrára lehet használni (például egy tömb mérete) ...
Erős értékek (például a változó nevek, a tulajdonság nevek, a String attribute értékek és a String adatértékek) , a legnagyobb számú karakter per String inERDDAP™2 milliárd. De szinte minden esetben kicsi vagy nagy probléma lesz, ha a String meghaladja az ésszerű méretet (pl. 80 karakter a változó nevekhez és a tulajdonságnevekhez, és 255 karakter a legerősebb tulajdonsági értékekhez és adatértékekhez) ... Például olyan weboldalak, amelyek hosszú változó neveket jelenítenek meg, kényelmetlenül szélesek lesznek, és a hosszú változó neveket kivonják, ha túllépik a válaszfájltípus határát.
A rácsos adatkészletek esetében:
- A maximális számaxisVariableS ~2 milliárd. A maximális számdataVariableS ~2 milliárd. De ha egy adatkészletnek van >100 változója, akkor nehéz lesz használni a felhasználókat. És ha egy adatkészletnek 1 millió változója van, akkor a szervernek sok fizikai memóriára van szüksége, és más problémák is lesznek.
- Az egyes dimenziók maximális mérete (axisVariable) 2 milliárd érték.
- Azt hiszem, a cellák maximális teljes száma (az összes dimenziós méret terméke) korlátlan, de lehet ~9e18.
A tabuláris adatkészletek esetében:
- A maximális számdataVariableS ~2 milliárd. De ha egy adatkészletnek van >100 változója, akkor nehéz lesz használni a felhasználókat. És ha egy adatkészletnek 1 millió változója van, akkor a szervernek sok fizikai memóriára van szüksége, és más problémák is lesznek.
- A legtöbb forrás (például fájlok) Ez összesíthető - 2 milliárd.
- Bizonyos esetekben az egyéni forrásból származó sorok maximális száma (Például egy fájl, de nem adatbázis) 2 milliárd sor.
- Nem hiszem, hogy vannak más határok.
Mind a rácsos, mind a mentő adatkészletek esetében vannak belső határértékek az aljzat méretére vonatkozóan, amelyet a felhasználó kérhet egyetlen kérelemben. (gyakran kapcsolódik a >2 milliárd valami vagy ~9e18 valami) , de sokkal valószínűbb, hogy a felhasználó eléri a fájltípusspecifikus határokat.
- NetCDFverzió 3.ncA fájlok 2GB byte-re korlátozódnak. (Ha ez valóban problémát jelent valakinek, hadd tudjam: Hozzáadhatnám a támogatástNetCDFverzió 3.nc64 bites kiterjesztés vagyNetCDFA 4. verzió, amely jelentősen növelné a határt, de nem végtelenül.)
- Böngésző összeomlik csak ~ 500 MB adat, ígyERDDAP™korlátozza a válaszot.htmlTable~400MB adatkérés.
- Számos adatelemzési program hasonló korlátokkal rendelkezik (Például a méret maximális mérete gyakran ~ 2 milliárd érték) Tehát nincs ok arra, hogy keményen dolgozzon a fájltípusspecifikus határok körül.
- A fájltípus-specifikus határok hasznosak abban, hogy megakadályozzák a naiv kérelmek valóban hatalmas mennyiségű adat (Például: "add meg nekem az összes adatkészletet", amikor az adatkészlet 20TB adatkészlettel rendelkezik) , amely heteket vagy hónapokat vesz igénybe a letöltéshez. Minél hosszabb a letöltés, annál valószínűbb, hogy sokféle ok miatt kudarcot vall.
- A fájltípus-specifikus határok hasznosak abban, hogy arra kényszerítik a felhasználót, hogy kezelje ésszerűen méretű alkatrészeket (például egy nagy hálózatú adathalmaz kezelése fájlokon keresztül, egy alkalommal adatokkal, minden alkalommal) ...
Váltás ACDD-1.3
Mi vagyunk (nevezetesenGenerateDatasetsXml) Jelenleg ajánlottACDD verzió 1.3, amelyet 2015 elején ratifikáltak, és amelyet „ACDD-1.3”-nak neveznek a globális egyezményekben. ElőzőERDDAP™verzió 1.62 (megjelent 2015 júniusában) ,ERDDAP™használt/ajánlotta az eredeti, 1.0 verziót,NetCDFAttribute Convention for Dataset Discoveryamelyet "-nak" neveztek.UnidataDataset Discovery v1.0" a globális egyezményekben ésMetadata\_Conventionstulajdonságok.
Ha az adatkészletek az ACDD korábbi verzióit használják, akkor RECOMMEND-re váltunk az ACDD-1.3-ra. Nem nehéz. Az ACDD-1.3 nagyon visszafelé kompatibilis az 1.0 verzióval. Átváltani minden adatkészletet (kivéve, kivéveEDDGridFromErddap és EDDTable FromErdp adatkészletek) :
- Távolítsa el az újonnan deprekált globálisMetadata\_Conventionsattribútum hozzáadása (vagy a meglévő megváltoztatásávalMetadata\_Conventionstulajdonság)
<att name="Metadata\\_Conventions">null</att>
az adatkészlet globális<addAttributes>. 2. Ha az adatkészlet rendelkezik a globálisan jellemző egyezményekkel<addAttributes> változtassa meg az összes "UnidataDataset Discovery v1.0" hivatkozások az "ACDD-1.3"-ra. Ha az adatkészlet nem rendelkezik a globális egyezményekkel<addAttributes> aztán hozzáadjuk az ACDD-1.3-at. Például,
<att name="Conventions">COARDS, CF-1.6, ACDD-1.3</att>
3. Ha az adatkészlet globálisstandard\_name\_vocabularyattribútum, kérjük, változtassa meg az érték formátumát, például,
<att name="standard\\_name\\_vocabulary">CF Standard Name Table v65</att>
Ha a hivatkozás egy régebbi verzióra vonatkozikCF standard névtáblázat... valószínűleg jó ötlet a jelenlegi verzióra váltani (65, ahogy ezt írjuk) Mivel az új szabványos neveket hozzáadjuk az asztalhoz a későbbi verziókkal, de a régi szabványos neveket ritkán deprekálják, és soha nem távolítják el. 4. Bár az ACDD-1.0 globális tulajdonságokat tartalmazottcreator\_name,creator\_email,creator\_url,GenerateDatasetsXmlnem tette automatikusan hozzá őket, amíg valamikor körülERDDAP™v1.50. Ez fontos információ:
- creator\_namelehetővé teszi a felhasználók számára, hogy ismerjék/meghatározzák az adatkészlet létrehozását.
- creator\_emailelmondja a felhasználóknak a preferált e-mail címet az adatkészlet létrehozásához, például, ha kérdéseik vannak az adatkészlettel kapcsolatban.
- creator\_urllehetőséget ad a felhasználóknak arra, hogy többet megtudjanak az alkotóról.
- ERDDAP™az összes információt az FGDC és az ISO 19115-2/19139 metaadat-dokumentumok generálásakor használja minden adatkészlethez. Ezeket a dokumentumokat gyakran külső keresési szolgáltatások használják.
Kérjük, adja hozzá ezeket a tulajdonságokat az adatkészlet globális<addAttributes>.
<att name="creator\\_name">NOAA NMFS SWFSC ERD</att>
<att name="creator\\_email">erd.data@noaa.gov</att>
<att name="creator\\_url">https://www.pfeg.noaa.gov</att>
Ez az. Remélem, ez nem túl nehéz.
Zarr
2.25 verzióERDDAP™olvasható helyi Zarr fájlok használatávalEDDTableFromNcFilesésEDDGridFromNcFiles...
(2019 augusztusától) Könnyen tévedhetünk, de még nem vagyunk meggyőződve arról, hogyZarrvagy hasonló rendszerek, amelyek az adatfájlokat kisebb darabokra bontják, nagyszerű megoldások a probléma aERDDAP™a felhőszolgáltatásokban tárolt adatok, mint az Amazon AWS S3. Zarr egy nagyszerű technológia, amely számos helyzetben megmutatta hasznosságát, nem vagyunk biztosak abban, hogyERDDAP+S3 lesz az egyik ilyen helyzet. Többnyire azt mondjuk: mielőtt sietnénk, hogy az összes adatot Zarrban tároljuk, végezzünk teszteket, hogy lássuk, valójában jobb megoldás.
Az adatokhoz való hozzáféréssel kapcsolatos problémák a felhőben a latencia (a lag, hogy először kap adatokat) fájlszintű hozzáférés (a blokkszintű hozzáférés helyett) ... Zarr megoldja a fájlszintű hozzáférési problémát, de semmit sem tesz a latencia. Összehasonlítva, hogy csak letöltse a fájlt (így lehet olvasni, mint egy helyi fájlt blokk szintű hozzáféréssel) Zarr még súlyosbíthatja a latencia problémát, mert Zarr-val a fájl olvasása most számos hívássorozatot tartalmaz a fájl különböző részei olvasásához (mindegyik saját laggal) ... A latenciaproblémát a kérések párhuzamosan meg lehet oldani, de ez egy magasabb szintű megoldás, nem Zarrtól függ.
Zárral (mint a kapcsolati adatbázisokkal) Elveszítjük azt a kényelmet, hogy egy adatfájl egy egyszerű, egyetlen fájl, amely könnyen ellenőrizheti az integritását, vagy letöltés egy példányt.
ERDDAP™ (mint v2) rendszerrel rendelkezik a helyi fájlok tárolására egy URL forrásból (pl. S3) (lásd)<cacheFromUrl> és<cacheMaxGB>] (#cachefromurl) ). Az új [<nThreads>] (#nthreads) minimalizálja a latencia problémát az adatátvitel magas szintű párhuzamosságával.<A cacheFromUrl> nagyon jól működik sok forgatókönyv esetében. (Nem vagyunk biztosak abban, hogy mennyire hasznosak vagyunk<nThreads> további tesztek nélkül.) Bevalljuk, hogy nem végeztünk időzítési teszteket egy AWS-en, jó hálózati kapcsolattal, de sikeresen teszteltünk különböző távoli URL-forrásokkal. ÉsERDDAPA<cacheFromUrl> bármilyen típusú adatfájllal működik (pl.:.nc,.hdf, .csv,.jsonlCSV) még akkor is, ha külsőleg tömörített (pl.:.gz) , a fájlok módosítása nélkül (pl. Zarr gyűjteményként újraírni őket) ...
Valószínű, hogy a különböző forgatókönyvek különböző megoldásokat, például csak egy fájl egy részét kell elolvasni egyszer (Zarr győzni fog) vs. egyszer el kell olvasnia az összes fájlt, vs.-nek ismételten el kell olvasnia a részét vagy az összes fájlt.<cacheFromUrl> győzni fog.
Többnyire azt mondjuk: mielőtt sietnénk, hogy az összes adatot Zarrban tároljuk, végezzünk teszteket, hogy lássuk, valójában jobb megoldás.
A típusok adatbázisainak listája
Ha segítségre van szüksége a megfelelő adatkészlet kiválasztásában, lásdAz adatkészlet típusának kiválasztása...
Az adatkészletek típusai két kategóriába tartoznak. (Miért?)
EDDGrid
- EDDGrid Az adatkészletek kezelik a hálózati adatokat.
- InkábbEDDGridadatkészletek, adatok változói többdimenziós adatsorok.
- Ott lehet egy tengely változó minden dimenzióban. Axis változók MUST van meghatározva annak érdekében, hogy az adatok változók használja őket.
- InkábbEDDGridadatkészletek, minden adatváltozat MUST használat (Részvény) az összes tengely változó. (Miért? Mi van, ha nem?)
- Osztott dimenziós értékek - MindenEDDGridadatkészletek, minden dimenzió MUST rendezett rendben (Felemelkedés vagy lesz ármazás) ... Mindegyik szabálytalanul helyet foglalhat. Nem lehetnek kapcsolatok. Ez a követelmény aCF metaadat szabvány... Ha bármely dimenzió értéke nem rendezett rendben van, az adatkészlet nem lesz betöltve ésERDDAP™azonosítja az első fel nem szorított értéket a logfájlban, bigParentDirectory[szerkesztés] /logs/log.txt .
Néhány alosztálynak további korlátozásai vannak (különösen,EDDGridAz AggregateExistingDimension megköveteli, hogy a külső (balra, első) dimenzió felemelkedjen.
A nem szorított dimenziós értékek szinte mindig problémát jelentenek a forrásadatokkal. Ez a leggyakrabban akkor fordul elő, amikor egy tévhit vagy nem megfelelő fájl szerepel a gyülekezetben, ami egy szorulatlan idő dimenzióhoz vezet. A probléma megoldásához lásd a hibaüzenetetERDDAP™log.txt fájl, hogy megtalálja a megsértő időértéket. Ezután nézze meg a forrásfájlokat, hogy megtalálja a megfelelő fájlt (vagy egy előtt vagy után) ez nem tartozik a gyülekezetbe.
- Lásd a teljesebb leírástEDDGridadatmodell...
- AEDDGridadatkészlettípusok:
- EDDGridFromAudioFilesösszesíti az adatokat egy csoport helyi audio fájlokat.
- EDDGriddalszövegkezeli a rácsos adatokatDAPszerverek.
- EDDGridFromEDDTablelehetővé teszi, hogy egy mesés adatállományt egy rácsolt adatkészletbe konvertáljon.
- EDDGridFromErdaprajtolt adatok kezelése egy távolbólERDDAP...
- EDDGridFromEtopocsak kezeli a beépített ETOPO topográfiai adatokat.
- EDDGridFájlokaz összes szuperosztályEDDGridA... Files osztályok.
- EDDGridFromMergeIRFilesösszesíti a helyi MergeIR csoport adatait.gzfájlok.
- EDDGridFromNcFilesösszesíti az adatokat egy helyi csoportbólNetCDF (v3 vagy v4) .ncés kapcsolódó fájlok.
- EDDGridFromNcFilesUnpackvariáns, haEDDGridFromNcFiles, amely adatokat is gyűjt egy helyi csoportbólNetCDF (v3 vagy v4) .ncés kapcsolódó fájlok, amelyekERDDAP™alacsony szintű csomagok.
- EDDGridLonPM180módosítja a gyermek hosszúsági értékeitEDDGridhogy a -180-180-as tartományban vannak.
- EDDGridLon0360módosítja a gyermek hosszúsági értékeitEDDGridhogy a 0-360-as tartományban vannak.
- EDDGridSideBySideaggregál két vagy többEDDGridadatkészletek oldalról oldalra.
- EDDGridAggregateExistingDimenzióaggregál két vagy többEDDGridadatkészletek, amelyek mindegyikének különböző értékei vannak az első dimenzióban, de azonos értékek a többi dimenzió számára.
- EDDGridMásoláslétrehozhat egy másik helyi másolatotEDDGridAz adatok és szolgálja az adatokat a helyi másolatból.
- MindenEDDGridAz adatkészletek támogatják az nThreads beállítást, ami azt mondjaERDDAP™hány szálat kell használni, amikor válaszol egy kérésre. Lásd:nHáromdokumentáció a részletekért.
EDDTable
- EDDTable Az adatkészletek kezelik a mesés adatokat.
- A tabuláris adatok adatbázis-szerű táblázatként szolgálhatnak sorokkal és oszlopokkal. Minden oszlop (egy adat változó) van egy név, egy sor tulajdonság, és tárol csak egy típusú adat. Minden sornak van egy megfigyelése (vagy a kapcsolódó értékek csoportja) ... Az adatforrás más adatstruktúrában, bonyolultabb adatstruktúrában és/vagy több adatfájlban is rendelkezhet, deERDDAP™képesnek kell lennie arra, hogy a forrásadatokat adatbázisszerű táblázatba helyezze annak érdekében, hogy az adatokat takaró adatkészletként jelenítse meg a felhasználók számáraERDDAP...
- Lásd a teljesebb leírástEDDTable adatmodell...
- Az EDDTable adatkészlet típusai:
-
EDDTableFromAllDatasetsegy magasabb szintű adatkészlet, amely információkkal rendelkezik az összes többi adatkészletről az ÖnbenERDDAP...
-
EDDTableFromAsciiFilesösszesíti az adatokat a comma-tól, a tab-tól, a szemicolon-tól, vagy az űrválasztott tabuláris ASCII adatfájloktól.
-
EDDTableFromAsciiServiceaz összes EDDTableFromAsciiService... osztályok szuperosztálya.
-
EDDTableFromAsciiServiceNOSadatokat kezel egyesektőlNOAANOS webszolgáltatások.
-
EDDTableFromAudioFilesösszesíti az adatokat egy csoport helyi audio fájlokat.
-
EDDTableFrom AwsXmlFilesösszesíti az adatokat egy sor Automatic Weather Station (AWS) XML fájlok.
-
EDDTableFromCassandrakezeli a mesés adatokat egy Cassandra asztalról.
-
EDDTableFromColumnarAsciiFilesösszesíti a tabuláris ASCII adatfájlok adatait rögzített szélességi adatoszlopokkal.
-
EDDTableFromDapSequencekezeli a mentő adatokatDAPSequence szerverek.
-
EDDTableFromDatabasekezeli a mentő adatokat egy adatbázis táblából.
-
EDDTableFromEDDGridlehetővé teszi, hogy létrehozzon egy EDDTable adatkészletet egyEDDGridadatkészlet.
-
EDDTableFromErddapkezeli a mesés adatokat távolrólERDDAP...
-
EDDTableFromFileNamesAdatkészletet hoz létre a szerver fájlrendszerében lévő fájlok csoportjáról, de nem szolgálja az adatokat a fájlokban.
-
EDDTableFromFilesaz összes EDDTableF felülete... Files osztályok.
-
EDDTableFromHttpGetazERDDAP„Csak az adatimport és az adatexport rendszere.
-
EDDTableFromHyraxFiók (Meghatározva) összesíti a fájlok adatait több változóval, amelyeket megosztott dimenziók szolgálnak egyHyrax OPeNDAPszerver...
-
EDDTableFromInvalidCRAFilesösszesített adatokNetCDF (v3 vagy v4) .ncfájlok, amelyek egy adott, érvénytelen, változata a CF DSG Contiguous Ragged Array (CRA) fájlok. BárERDDAP™támogatja ezt a fájltípust, ez egy érvénytelen fájltípus, amelyet senkinek nem kell használnia. Azok a csoportok, amelyek jelenleg ezt a fájltípust használják, erősen ösztönzik a használatraERDDAP™hiteles CF DSG CRA fájlok generálására, és hagyja abba ezeket a fájlokat.
-
EDDTableFromJsonlCSVFilesösszesített adatokJSON Lines CSV fájlok...
-
EDDTableFromMultidimNcFilesösszesített adatokNetCDF (v3 vagy v4) .nctöbb változóval rendelkező fájlok közös dimenziókkal.
-
EDDTableFromNcFilesösszesített adatokNetCDF (v3 vagy v4) .nctöbb változóval rendelkező fájlok közös dimenziókkal. Jó, ha továbbra is használja ezt az adatkészlettípust a meglévő adatkészletekhez, de új adatkészletek esetében inkább az EDDTableFromMultidimNcFiles használatát javasoljuk.
-
EDDTableFromNcCFFilesösszesített adatokNetCDF (v3 vagy v4) .ncfájlokat, amelyek az egyik fájlformátumot használják, amelyet aCF Discrete Sampling Geometries (DSG) egyezmények. De az egyik multidimenzionális CF DSG változatot használó fájlokhoz, használjonEDDTableFromMultidimNcFilesEhelyett.
-
EDDTableFromNccsvFilesösszesített adatokNCCSVASCII .csv fájlok.
-
EDDTableFromNOS (Meghatározva) kezeli a mentő adatokat az NOS XML szerverektől.
-
EDDTableFromOBISkezeli a mentő adatokat az OBIS szervereitől.
-
EDDTableFromParquetFilesadatok kezeléseParquet...
-
EDDTableFromSOSkezeli a mentő adatokatSOSszerverek.
-
EDDTableFromThreddsFiles (Meghatározva) összesíti a fájlok adatait több változóval, amelyeket megosztott dimenziók szolgálnak egyHírekOPeNDAPszerver...
-
EDDTableFromWFSFiók (Meghatározva) helyi másolatot készít az összes adatról egyArcGISMapServerWFSszerver, így az adatok gyorsan továbbíthatókERDDAP™felhasználók.
-
EDDTableAggregateRowsEDDTable adatkészletet készíthet egy EDDTable adatkészletből.
-
EDDTableCopyhelyi másolatot készíthet sokféle EDDTable adatkészletből, majd gyorsan megőrizheti az adatokat a helyi másolatból.
-
Adatkészlettípusok részletes leírása
EDDGriddalszöveg
EDDGriddalszöveg kezeli a hálózati változókatDAPszerverek.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Összegyűjtheti azokat az információkat, amelyekre szüksége van, hogy csípjen vagy létrehozza a saját XML-jét egyEDDGridFromDap adatkészlet a forrásadatlap DDS és DAS fájlok megtekintésével a böngészőben (.das és .dds hozzáadásasourceUrlPéldául, https://thredds1.pfeg.noaa.gov/thredds/dodsC/satellite/BA/ssta/5day.dds ) ...
- EDDGridFromDap adatokat kaphat bármilyen többdimenziós változóbólDAPadatkiszolgáló. (Korábban,EDDGridFromDap korlátozott volt a változók kijelölt "széles", de ez már nem követelmény.)
- Osztott dimenziós értékek - Az értékek minden dimenzióban MUST lehet rendezett rendben (Felemelkedés vagy leszármazás) ... Az értékek szabálytalanul helyreállhatnak. Nem lehetnek kapcsolatok. Ez a követelmény aCF metaadat szabvány... Ha bármely dimenzió értéke nem rendezett rendben van, az adatkészlet nem lesz betöltve ésERDDAP™azonosítja az első fel nem szorított értéket a logfájlban, bigParentDirectory[szerkesztés] /logs/log.txt .
A nem szorított dimenziós értékek szinte mindig problémát jelentenek a forrásadatokkal. Ez a leggyakrabban akkor fordul elő, amikor egy tévhit vagy nem megfelelő fájl szerepel a gyülekezetben, ami egy szorulatlan idő dimenzióhoz vezet. A probléma megoldásához lásd a hibaüzenetetERDDAP™log.txt fájl, hogy megtalálja a megsértő időértéket. Ezután nézze meg a forrásfájlokat, hogy megtalálja a megfelelő fájlt (vagy egy előtt vagy után) ez nem tartozik a gyülekezetbe.
EDDGridFromDap csontváz XML
<dataset type="EDDGridFromDap" datasetID\="..." active\="..." >
<sourceUrl>...</sourceUrl>
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaWMS>...</accessibleViaWMS> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1.
For EDDGridFromDap, this gets the remote .dds and then gets the new
leftmost (first) dimension values. -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<nThreads>...</nThreads> <!-- 0 or 1 -->
<dimensionValuesInMemory>...</dimensionValuesInMemory> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<axisVariable>...</axisVariable> <!-- 1 or more -->
<dataVariable>...</dataVariable> <!-- 1 or more -->
</dataset>
EDDGridFromEDDTable
EDDGridFromEDDTable lehetővé teszi, hogy egy EDDTable tabuláris adatállományt egyEDDGridmegrúgott adatkészlet. Ne feledje, hogyERDDAP™kezeli az adatkészleteket, mint akárHálózott adatkészletek (alosztályokEDDGrid) vagy mesés adatkészletek (EDDTable alosztályai) ...
- Normális esetben, ha megrúgta az adatokat, csak egyEDDGridadatkészlet közvetlenül. Néha ez nem lehetséges, például, ha van olyan adat, amelyet egy kapcsolati adatbázisban tárolnakERDDAP™csak az EDDTableFromDatabase-on keresztül érhető el.EDDGridFromEDDTable osztály lehetővé teszi, hogy orvosolja ezt a helyzetet.
- Nyilvánvaló, hogy a mögöttes EDDTable adatkészletben szereplő adatoknak az alapul szolgáló EDDTable adatkészletben kell szerepelniük. (alapvetően) fúrt adatok, de takaró formában. Például az EDDTable adatkészletnek CTD-adatai lehetnek: a keleti és északi jelenlegi mérések, több mélységben, többször. Mivel a mélységek minden alkalommal azonosak,EDDGridFromEDDTable hozhat létre egy rácsos adatkészletet egy időben és egy mélység dimenzióval, amely az adatokat az alapul szolgáló EDDTable adatkészleten keresztül éri el.
- GenerateDatasets Xml -- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Összegyűjtheti azokat az információkat, amelyekre szüksége van a durva tervezet javítására.
- Forrás tulajdonságok -- Mint minden más típusú adatkészlet esetében,EDDGridFromTable van az ötlet, hogy vannak globális forrásAttributes ésglobálisaddAttributes (meghatározottdatasets.xml) kombinálva a globális kombináltságot tulajdonságok, melyeket a felhasználók látnak. A globális forrásAttributes,EDDGridFromEDDTable használja a globális kombinált Az alapul szolgáló EDDTable adatkészlet tulajdonságai. (Ha egy percig gondolsz rá, akkor van értelme.)
Hasonlóképpen, mindenki számáraaxisVariableésdataVariableAaddAttributes,EDDGridFromEDDTable használja a változó kombinált Az alapul szolgáló EDDTable adatkészlet tulajdonságai, mintEDDGridFromEDDTable változó forrásAttributes. (Ha egy percig gondolsz rá, akkor van értelme.)
Következésképpen, ha az EDDTable jó metaadatokkal rendelkezik, azEDDGridFromEDDTable gyakran szüksége van nagyon kevésaddAttributesmetadata - csak néhány csípő itt és ott.
-
dataVariableversusaxisVariableS - A mögöttes EDDTable csakdataVariableS. EgyEDDGridFromEDDTable adatkészlet lesz néhányaxisVariables (az EDDTable közül néhánydataVariables) NéhánydataVariables (a fennmaradó EDDTabledataVariables) ...GenerateDatasetsXmlkitalálja, hogy melyik EDDTabledataVariableS váljonEDDGridFromEDDTableaxisVariableS, de csak egy kitalált. A GenerateDatasetsXml kimenetét módosítania kell annak meghatározására, hogy melyikdataVariableleszaxisVariables, és melyik sorrendben.
-
AxisValues - Nincs semmi a mögöttes EDDTable-ről, hogy elmondjaEDDGridFromEDDTable a lehetséges értékek aaxisVariables az adatkészlet rácsos változatában, így minden egyes információt megadjaaxisVariableezen tulajdonságok egyikén keresztül:
- axisValues - lehetővé teszi, hogy meghatározza az értékek listáját. Például, <att name="axisValues"dalszöveg: DoubleList2,5, 3,3.5, 4</att> Vegye figyelembe egy használatátadattípusplusz a lista szó. Szintén a lista típusa (például kettős) MUST megfelel az adatoknak A változó típusa az EDDTable ésEDDGridFromEDDTable adatkészletek.
- axisValuesStartStrideStop - lehetővé teszi, hogy megjelölje a rendszeres terhelt értékek sorozatát azáltal, hogy meghatározza a kezdetet, a szélsőséget és az értékeket. Itt van egy példa, amely egyenértékű a tengelyValues példa fent: <att name="axisValuesStartStrideStop"dalszöveg: DoubleList\>2, 0,5, 4</att> Ismét vegye figyelembe egy lista adattípus használatát. Szintén a lista típusa (például kettős) MUST megfelel az adatoknak A változó típusa az EDDTable ésEDDGridFromEDDTable adatkészletek.
Frissítések - Ahogy nincs mód arra, hogyEDDGridFromEDDTable, hogy meghatározza a tengelyValues az EDDTable kezdetben, nincs megbízható módja annak, hogy aEDDGridFromEDDTable, hogy meghatározza az EDDTable, amikor a tengelyValues változott (különösen, ha új értékek vannak az idő változójához) ... Jelenleg az egyetlen megoldás az, hogy megváltoztassa az axisValues tulajdonságátdatasets.xmlés újratöltse az adatkészletet. Például írhatsz egy forgatókönyvet
- Keresésdatasets.xmlMert datasetIDÓ ADatasetID "..." így a megfelelő adatkészlettel dolgozol.
- Keresésdatasets.xmla következő előfordulásért
AVariablesSourceName
így a helyes változóval dolgozol. - Keresésdatasets.xmla következő előfordulásért
<att name="axisValuesStartStrideStop" type="doubleList">
így ismeri a címke kezdeti pozícióját. 4. Keresésdatasets.xmla következő előfordulásért
</att>
így ismeri a tengelyértékek végső pozícióját. 5. Helyettesítse a régi indulást, merüljön fel, állítsa le az értékeket az új értékekkel. 6. Kapcsolatfelvétel azászló URLaz adatkészlet számára, hogy elmondjaERDDAP™az adatkészlet újratöltéséhez.
Ez nem ideális, de működik.
- precizitás - MikorEDDGridFromEDDTable válaszol a felhasználó kérésére az adatok, ez mozog egy sor adatot az EDDTable válasz táblába aEDDGridválasz rács. Ehhez ki kell találni, hogy az adott sorban lévő "axis" értékek egy adott sorban megfelelnek-e a tengelyértékek kombinációjának a hálózatban. Az integrált adattípusok esetében könnyen meghatározható, hogy két érték egyenlő-e. De az úszók és a duplák esetében ez felveti a lebegő pontszámok szörnyű problémájátnem egyezik pontosan... (például 0,2 versus 0.19999999996) ... Hogy (próbálkozni) foglalkozz ezzel,EDDGridFromTable lehetővé teszi, hogy meghatározza a pontos tulajdonság bármelyike számáraaxisVariables, amely meghatározza a decimális számjegyek teljes számát, amelyeknek azonosnak kell lenniük.
- Például,<att name="precision" típusú="int">5</att>
- A különböző típusú adatok változói, vannak különböző alapértelmezett pontossági értékek. Az alapértelmezések általában megfelelőek. Ha nem, meg kell határoznia a különböző értékeket.
- MertaxisVariablei.Idő vagy idő Stamp változókAz alapértelmezés teljes pontosságú (pontos mérkőzés) ...
- MertaxisVariables amelyek úszók, az alapértelmezett pontosság 5
- MertaxisVariableduplák, az alapértelmezett pontosság 9.
- MertaxisVariableaz integrált adattípusok,EDDGridAz FromEDDTable figyelmen kívül hagyja a pontosságot, és mindig teljes pontosságot használ (pontos mérkőzés) ...
- FIGYELEM! Amikor egy csomó tabuláris adatot átváltoztat egy zsúfolt adatokba, haEDDGridAz FromEDDTable nem tud egy EDDTable "axis" értéket elérni az egyik várhatóanEDDGridFromEDDTable axis értékek,EDDGridFromEDDTable csendesen (Nincs hiba) dobja el az adatokat az asztal sorából. Például lehetnek más adatok (nem a rácson) az EDDTable adatkészletben. (És ha sztride > 1, nem nyilvánvaló, hogyEDDGridA táblázatból, amely a tengelyértékek kívánt értékek, és melyek azok, akiket a törzs miatt kell kihagyni.) Tehát, ha a pontossági értékek túl magasak, a felhasználó hiányzó értékeket lát az adatválaszban, amikor az érvényes adatértékek ténylegesen léteznek.
Ezzel szemben, ha a pontossági értékek túl alacsonyak, EDDTable "axis" értékeket állítanak fel, amelyeknek nem kell megfelelniükEDDGridFromEDDTable axis értékek (tévesen) Meccs.
Ezek a potenciális problémák szörnyűek, mert a felhasználó rossz adatokat kap (vagy hiányzó értékek) ha megfelelő adatokat kell kapniuk (vagy legalább hibaüzenet) ... Ez nem egy hibásEDDGridFromTable.EDDGridFromTable nem tudja megoldani ezt a problémát. A probléma a tabuláris adatok áttérésében rejlik a rácsos adatokba (kivéve, ha más feltételezéseket lehet tenni, de nem tehetik itt) ... Ez rajtad múlik,ERDDAP™adminisztrátor, teszteljeEDDGridFromEDDTable alaposan annak biztosítása érdekében, hogy a pontossági értékek elkerüljék ezeket a potenciális problémákat.
gapThreshold
- gapThreshold- Ez egy nagyon szokatlan adatkészlet. Mivel a lekérdezések típusai, amelyeket meg lehet tenni (kezeli) egyEDDGridadatkészlet (a tartományokhoz és a merényletekhez kapcsolódóanaxisVariables) nagyon különböznek attól a típusú kérdésektől, amelyeket meg lehet tenni (kezeli) EDDTable adatkészlet (csak néhány változó tartományához kapcsolódik) , a teljesítményEDDGridAz FromEDDTable adatkészletek nagymértékben változnak attól függően, hogy milyen pontos kérésre kerül sor, és az alapul szolgáló EDDTable adatkészlet sebessége. Olyan kérelmek esetében, amelyeknek szilárd értéke van > 1,EDDGridFromEDDTable kérheti a mögöttes EDDTable egy viszonylag nagy mennyiségű adat (ha sztride=1) Ezután az eredményeken keresztül, bizonyos sorokból tartva az adatokat, és eldobva az adatokat másoktól. Ha sok adatot kell átszűrnie, hogy megkapja a szükséges adatokat, a kérés hosszabb időt vesz igénybe.
HaEDDGridFromEDDTable elmondhatja, hogy nagy hiányosságok lesznek (nem kívánt adatok sorával) a kívánt adatokkal rendelkező sorok között,EDDGridFromEDDTable úgy dönthet, hogy több albekezdést tesz az alapjául szolgáló EDDTable-nek, ahelyett, hogy egy nagy kérés lenne, ezáltal kihagyva az adatok nem kívánt sorát a nagy szakadékokban. A döntés érzékenységét a gapThreshold érték irányítja, amint azt a<gapThreshold> címke (default=1000 sor forrásadatok) ... A gapThreshold beállítása egy kisebb számhoz vezet az adatkészletkészítéshez (általában általában) további alkérdések. A gapThreshold beállítása egy nagyobb számhoz vezet az adatkészletkészítéshez (általában általában) Kevésbé kérelmek.
Ha a gapThreshold túl kicsi,EDDGridAz FromEDDTable lassabban működik, mert a többszörös kérések túlnyomó része nagyobb lesz, mint az által, hogy túlzott adatokat kapjon. Ha a gapThreshold túl nagy,EDDGridAz FromEDDTable lassan működni fog, mert az EDDTable-ből annyi túlzott adat kerül visszakerülésre, csak el kell távolítani. (Ahogy a Goldilocks felfedezte, a közép "csak helyes".) A különböző típusú EDDTable adatkészletek túlnyomórésze nagyban változik, így az egyetlen módja annak, hogy megismerje az adatkészlet tényleges legjobb beállítását kísérletezéssel. De nem fog túl rosszul ragaszkodni az alapértelmezéshez.
Egy egyszerű példa: Képzelj el egyetEDDGridTable csak egyaxisVariable (idő, mérete 100000) EgydataVariable (hőmérséklet) , és az alapértelmezett gapThreshold 1000.
- Ha egy felhasználó hőmérsékletet kér\[0💯5000\]A sztride 100, így a szakadék mérete 99, ami kevesebb, mint a gapThreshold. SzóvalEDDGridAz FromTable csak egy kérést tesz lehetővé az EDDTable számára a kérelemhez szükséges összes adatért (a hőmérséklet\[0:5000\]) és dobja el az összes adatsort, amire nincs szüksége.
- Ha egy felhasználó hőmérsékletet kér\[0:2500:5000\]Ez a sztride 2500, így a szakadék mérete 2499, ami nagyobb, mint a gapThreshold. SzóvalEDDGridA táblázat külön kéréseket tesz az EDDTable-hez, amelyek megfelelnek a hőmérsékletnek\[0 0\], hőmérséklet\[2500\], hőmérséklet\[5000\]...
A szakadék méretének kiszámítása bonyolultabb, ha több tengely van.
Minden felhasználó kérésére,EDDGridFromEDDTable nyomtatás diagnosztikai üzenetek ezzel kapcsolatban ebben aLog.txtfájl.
- [[Ha]]<logLevel>] (#loglevel) bennedatasets.xmlInfo-ra van beállítva, ez olyan üzenetet nyomtat, mint \* nOuterAxes=1 4 nOuterRequests=22 Ha az nOuterAxes=0, a gapThresholdat nem haladták meg, és csak egy kérést fognak tenni az EDDTable-hez. Ha a nOuterAxes>0, a gapThresholdat túllépték, és a nOuterRequests az EDDTable-hez kerül, amely megfelel a baloldali nOuterAxes minden kért kombinációjának. Például, ha az adatkészlet 4axisVariableésdataVariablemint kelet\[Idő\]\[magasság\]\[hosszúság\]\[mélység\]A baloldal (először) A tengely változó az idő.
- Ha<LogLevel> bennedatasets.xmlbe van állítva, további információkat írnak a log.txt fájlra.
EDDGridFromEDDTable csontváz XML
<dataset type="EDDGridFromEDDTable" datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaWMS>...</accessibleViaWMS> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1.
For EDDGridFromEDDTable, this only works if the underlying EDDTable
supports updateEveryNMillis. -->
<gapThreshold>...</gapThreshold> <!-- 0 or 1. The default is 1000. >
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<axisVariable>...</axisVariable> <!-- 1 or more -->
<dataVariable>...</dataVariable> <!-- 1 or more -->
<dataset>...</dataset> <!-- The underlying source EDDTable dataset. -->
</dataset>
ED*AERDDAP
EDDGridFromErdap rajtolt adatok kezelése egy távolbólERDDAP™szerver. EDDTableFromErddap kezeli a mesés adatokat távolrólERDDAP™szerver.
- EDDGridFromErddap és EDDTableFromErddap másképp viselkednek az összes többi adatkészletbőlERDDAP...
- Mint más típusú adatkészletek, ezek az adatkészletek információkat kapnak a forrásból származó adatkészletről, és emlékezetben tartják.
- Mint más típusú adatkészletek, amikorERDDAP™adatkészletek keresése, megjeleníti az adathozzáférési formanyomtatványt ( datasetID .html) vagy megjeleníti a Make A Graph forma ( datasetID .gráf) ,ERDDAP™a memóriában található adatkészlettel kapcsolatos információkat használja.
- EDDGridFromErddap és EDDTable FromErddap az alapjahálók/klaszterek/szövetségekaERDDAPs, amely hatékonyan terjeszti a CPU használatát (többnyire térképek készítéséhez) memóriafelhasználás, adatkészlet-tárolás és sávszélesség egy nagy adatközpont használatával.
Átirányítás
- Más típusú adatkészletekkel ellentétben, amikorERDDAP™kérelmet kap ezekből az adatokból vagy képekből,ERDDAP átirányítása távoli kérelemERDDAP™szerver. Az eredmény:
- Ez nagyon hatékony (CPU, memória és sávszélesség) mert egyébként
- A kompozitERDDAP™meg kell küldeni a kérést a másiknakERDDAP™ (amely időt vesz igénybe) ...
- A másikERDDAP™meg kell szereznie az adatokat, meg kell reformálnia, és továbbítja az adatokat az összetettnekERDDAP...
- A kompozitERDDAP™meg kell kapni az adatokat (sávszélesség) megreformálja (CPU és memória használata) és továbbítja az adatokat a felhasználónak (sávszélesség) ... A kérelem átirányításával és a másik engedélyezésévelERDDAP™a válasz közvetlenül a felhasználóra, az összetettERDDAP™lényegében nincs CPU idő, memória vagy sávszélesség a kérésre.
- Az átirányítás átlátható a felhasználó számára az ügyfélszoftvertől függetlenül (böngésző vagy más szoftver vagy parancssor eszköz) ...
- Ez nagyon hatékony (CPU, memória és sávszélesség) mert egyébként
- ElmondhatjaERDDAP™nem átirányítani minden felhasználói kérelmet a beállítással<Átirányítás>hamis</redirect>, de ez negates a legtöbb előnye a ...FromErddap adatkészlet t ípus (nevezetesen, szétszórva a terhelést a front végénERDDAP™a távoli / backendERDDAP) ...
Előfizetések
Normális esetben, ha egyEDDGridFromErddap és EDDTable FromErddap (Újra) Töltsd be magadERDDAPPróbálnak feliratot adni a távoli adatkészlethez távolrólERDDAPe-mail/URL előfizetési rendszer. Így, amikor a távoli adatkészlet megváltozik, a távoliERDDAP™Kapcsolatok asetDataset Flag URLa teERDDAP™Annak érdekében, hogy a helyi adatkészlet újratöltse az ASAP-ot, és hogy a helyi adatkészlet mindig tökéletesen naprakész legyen, és bevándorolja a távoli adatkészletet. Tehát, az első alkalommal, amikor ez megtörténik, kap egy e-mailt, amely arra kéri, hogy érvényesítse az előfizetést. Ha azonban a helyiERDDAP™nem küldhet e-mailt, vagy ha a távoliERDDAP"Az e-mail / URL előfizetési rendszer nem aktív, el kell küldenie a távoliERDDAP™adminisztrátor és kéri, hogy a s/he manuálisan adja hozzá [[szerkesztés]]]<onChange>] (#onchange) ...</onChange> címkék az összes releváns adatkészlethez, hogy felhívja az adatkészletétsetDataset Flag URL-ek... Lásd:ERDDAP™napi jelentés a setDataset listájáról zászló URL-ek, de csak küldje el aEDDGridFromErddap és EDDTableFromErddap adatkészletek a távoliERDDAP™adminisztrátor.
Ez nem működik? A helyi adatkészletek nem maradnak szinkronban a távoli adatkészletekkel? Számos dolognak helyesen kell működnie ehhez a rendszerhez ahhoz, hogy az adatkészletek naprakészek maradjanak. Ellenőrizze ezeket a dolgokat rendben:
- AERDDAP™Képesnek kell lennie e-maileket küldeni. Lásd az e-mail beállításokat a setup.xml-ben.
- Általában (de nem mindig) A teERDDAPA<alapUrl> és<baseHttpsUrl> nem rendelkezik portszámmal (pl.:8080, :8443) ... Ha igen, használjon egyProxypasstávolítsa el a kikötőt az Urltól.
- A beállításban.xml,<Az SubscribeToRemoteErddapDataset>-t igaznak kell alávetni.
- Amikor a helyi EDD... FromErddap adatkészlet újratöltése, meg kell küldeni a kérést a távoliERDDAP™feliratkozni a távoli adatkészletre. Nézze meg a log.txtot, hogy megnézze, ez megtörténik-e.
- Kell kapni egy e-mail kéri, hogy érvényesítse az előfizetési kérést.
- Kattintson az e-mailben lévő linkre az előfizetési kérelem érvényesítéséhez.
- A távoliERDDAP™Azt kell mondani, hogy az érvényesítés sikeres volt. Bármikor kérhet egy e-mailt a távolitólERDDAP™a függő és érvényes előfizetések listájával. Lásd a formát Távol-ErddapBase Url /erddap/subscriptions/list.html .
- Amikor a távoli adatkészlet megváltozik (pl. további adatokat kap) A távoliERDDAP™Próbáljon meg kapcsolatba lépni a flagURL-rel az ÖnénERDDAP... Nem ellenőrizheti ezt, de megkérdezheti a távoli adminisztrátortERDDAP™ellenőrizni ezt.
- AERDDAP™kérelmet kell kapnia annak megállapítására, hogy a flagURL. Nézze meg a log.txtot a "setDatasetFlag.txt?" kérésre (s) és nézze meg, hogy van-e hibaüzenet a kérelmekkel kapcsolatban.
- AERDDAP™meg kell próbálni újratölteni ezt az adatkészletet (talán nem azonnal, de ASAP) ...
up-to-date max (Idő) ?
EDDGrid/TableFromErddap adatkészletek csak megváltoztatja a tárolt információkat minden forrás adatkészlet, ha a forrás adatkészlet"Reload"és néhány metaadat megváltozik (pl. az idő változójaactual\_range) Ezáltal előfizetési értesítést generál. Ha a forrásadatlap olyan adatokkal rendelkezik, amelyek gyakran változnak (például minden második új adat) és használja a"frissítés"rendszer, hogy észrevegyük a gyakori változásokat az alapul szolgáló adatok,EDDGrid/TableFromErddap nem értesíti ezeket a gyakori változásokat, amíg a következő adatkészlet "reload", így aEDDGrid/TableFromErddap nem lesz tökéletesen naprakész. Ezt a problémát minimalizálhatja a forrásadatlap megváltoztatásával<ReloadEveryNMinutes> egy kisebb értékhez (60? 15?) hogy több előfizetési értesítést kapjon, hogy elmondja aEDDGrid/TableFromErddap, hogy frissítse az információt a forrás adatkészlet.
Vagy ha az adatkezelő rendszere tudja, hogy a forrásadatbázisnak új adatai vannak (pl. egy olyan forgatókönyven keresztül, amely másol egy adatfájl helyére) És ha ez nem szuper gyakori (pl. minden 5 percben, vagy kevésbé gyakori) Van egy jobb megoldás:
- Ne használja<frissítésEveryNMillis> a forrásadat naprakész tárolására.
- Állítsa be a forrásadatkészletet<ReloadEveryNMinutes> egy nagyobb számba (1440?) ...
- Vedd fel a forgatókönyvet a forrásadatkészlettelzászló URLközvetlenül, miután másol egy új adatfájl helyére.
Ez vezet a forrásadathoz, hogy tökéletesen naprakész legyen, és azt eredményezi, hogy előfizetési értesítést generáljon, amelyet elküldnekEDDGrid/TableFromErddap adatkészlet. Ez vezetni fogEDDGrid/TableFromErddap adatkészlet, hogy tökéletesen naprakész (jól, 5 másodpercen belül az új adatok hozzáadása) ... És mindez hatékonyan fog történni (felesleges adatkészlet-reloads nélkül) ...
NemaddAttributes,axisVariablevagydataVariable
Ellentétben más típusú adatkészletek, EDDTableFromErddap ésEDDGridFromErddap adatkészletek nem teszik lehetővé a globális<addAttributes>,<axisVariableGt; vagy<dataVariableGt; szakaszok adatasets.xmlaz adatkészlethez. A probléma az, hogy lehetővé tegyék, hogy ezek ellentmondásokhoz vezetjenek:
- Tegyük fel, hogy megengedett, és hozzáadott egy új globális tulajdonságot.
- Amikor egy felhasználó kériERDDAP™a globális tulajdonságok tekintetében az új tulajdonság megjelenik.
- De amikor egy felhasználó kériERDDAP™egy adatfájl, az ÖnERDDAP™átirányítja a forrás iránti kérelmetERDDAP... AzERDDAP™nem ismeri az új tulajdonságot. Tehát, ha létrehoz egy adatfájlot metaadatokkal, pl. egy.ncfájl, a metaadatnak nem lesz új tulajdonsága.
Két munkakörnyezet van:
- Konvince a forrás adminjaERDDAP™a metaadatára vonatkozó változásokat.
- Az EDDTableFromErddap helyett használjaEDDTableFromDapSequence... Vagy helyetteEDDGridFromErddap, használatEDDGriddalszöveg... Ezek az EDD típusok lehetővé teszik, hogy hatékonyan kapcsolódjon egy adatkészlethez egy távolrólERDDAP™ (de adatkérések átirányítása nélkül) és lehetővé teszik, hogy globális<addAttributes>,<axisVariableGt; vagy<dataVariableGt; szakaszok adatasets.xml... Egy másik különbség: manuálisan kell feliratkoznia a távoli adatkészletre, hogy az adatkészlet az Ön számáraERDDAP™értesülni fognak (keresztülzászló URL) amikor változások vannak a távoli adatkészletben. Így új adatkészletet hoz létre, ahelyett, hogy egy távoli adatkészlethez kapcsolódna.
Egyéb jegyzetek
- Biztonsági okokból,EDDGridFromErddap és EDDTable FromErddap nem támogatja a [[szerkesztés]]]<hozzáférhetőTo> (#Ccessibleto) címke és nem használható távoli adatkészletekkel, amelyek bejelentkezést igényelnek (mert használnak).<hozzáférhetőTo> (#Ccessibleto) ). LásdERDDAPAbiztonsági rendszerbizonyos adatkészletekhez való hozzáférés korlátozása bizonyos felhasználók számára.
- KezdőlapERDDAP™v2.10,EDDGridFromErddap és EDDTableFromErddap támogatja a [[szerkesztés]]<hozzáférhetőViaFiles>] (#Ccessibleviafiles) Tag. Ellentétben más típusú adatkészletek, az alapértelmezett igaz, de az adatkészlet fájlok lesz hozzáférhetőViaFiles csak akkor, ha a forrás adatkészlet is rendelkezik<hozzáférhetőViaFiles> az igazhoz.
- Használhatja aGenerateDatasets Xml programHogy adatasets.xmlcunk az ilyen típusú adatkészlethez. De ezeket a típusú adatkészleteket könnyen kézzel teheti meg.
EDDGridFromErddap csontváz XML
- EDDGridFromErddap csontváz Az XML adathalmaz nagyon egyszerű, mert a szándék csak a távoli adathalmazt jelenti, amely már alkalmas a használatra.ERDDAP:
<dataset type="EDDGridFromErddap" datasetID\="..." active\="..." >
<sourceUrl>...</sourceUrl>
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<accessibleViaFiles>...</accessibleViaFiles> <!-- 0 or 1, default=true. -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1
For EDDGridFromErddap, this gets the remote .dds and then gets
the new leftmost (first) dimension values. -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<nThreads>...</nThreads> <!-- 0 or 1 -->
<dimensionValuesInMemory>...</dimensionValuesInMemory> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<redirect>true(default)|false</redirect> <!-- 0 or 1; -->
</dataset>
EDDTableFromErddap csontváz XML
- A Skeleton XML egy EDDTableFromErddap adatkészlethez nagyon egyszerű, mert a szándék csak a távoli adatkészletet jelenti, amely már alkalmas a használatra.ERDDAP:
<dataset type="EDDTableFromErddap" datasetID\="..." active\="..." >
<sourceUrl>...</sourceUrl>
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<redirect>true(default)|false</redirect> <!-- 0 or 1; -->
</dataset>
EDDGridFromEtopo
EDDGridFromEtopo Csak szolgálja aETOPO1 Global 1-Minute Gridded Elevation Adatkészlet (Ice Surface, grid regisztrált, bináris, 2byte int: etopo1\_ice\_g\_i2.zip) amely szét van osztvaERDDAP...
- Csak kettődatasetIDtámogatást nyújtanakEDDGridFromEtopo, így hozzáférhet az adatokhoz a hosszúsági értékek -180-180, vagy a hosszúsági értékek 0-360.
- Soha nincsenek alcímek, mivel az adatok már leírtakERDDAP...
- Tehát a két lehetőség aEDDGridFromEtopo adatkészletek (szó szerint) :
<!-- etopo180 serves the data from longitude -180 to 180 -->
<dataset type="EDDGridFromEtopo" datasetID="etopo180" />
<!-- etopo360 serves the data from longitude 0 to 360 -->
<dataset type="EDDGridFromEtopo" datasetID="etopo360" />
EDDGridFájlok
EDDGridFájlok az összes szuperosztályEDDGridA... Files osztályok. Nem használhatodEDDGridFromFiles közvetlenül. Ehelyett használjon egy alosztálytEDDGridFromFiles kezelni az adott fájltípust:
- EDDGridFromMergeIRFileskezeli az adatokat a hálózatbólMergeIR.gzfájlok.
- EDDGridFromAudioFilesösszesíti az adatokat egy csoport helyi audio fájlokat.
- EDDGridFromNcFileskezeli az adatokat a hálózatbólGRIB .grbfájlok,HDF (v4 vagy v5) .hdffájlok,.ncml mlfájlok ésNetCDF (v3 vagy v4) .ncfájlok. Ez működhet más fájltípusokkal (Például a BUFR) Mi csak nem teszteltük - kérjük, küldjön nekünk néhány minta fájlokat, ha érdekel.
- EDDGridFromNcFilesUnpackegy változataEDDGridFromNcFiles, amely kezeli az adatokat a rácsosNetCDF (v3 vagy v4) .ncés kapcsolódó fájlok, amelyekERDDAP™alacsony szintű csomagok.
Jelenleg nem támogatnak más fájltípusokat. De általában viszonylag könnyű támogatni más fájltípusokat. Lépjen kapcsolatba velünk, ha van kérése. Vagy, ha az adatai egy régi fájlformátumban vannak, amelyet el akarsz költözni, javasoljuk, hogy a fájlok átalakítása legyenNetCDFv3.ncfájlok.NetCDFszéles körben támogatott, bináris formátum, lehetővé teszi a gyors véletlenszerű hozzáférést az adatokhoz, és már támogatottERDDAP...
Files részletekből
A következő információ az összes alosztályra vonatkozikEDDGridFromFiles.
Egy létező dimenzió aggregációja
Minden variációEDDGridFromFiles összesítheti az adatokat a helyi fájlokból, ahol minden fájl 1 (vagy többet) különböző értékek a baloldal számára (először) dimenzió, általában\[Idő\], amely összesítve lesz. Például a dimenziók lehetnek\[Idő\]\[magasság\]\[magasság\]\[hosszúság\], és a fájlok lehetnek az adatok egy (vagy néhány) Időérték (s) egy fájl. Az ebből eredő adatkészlet úgy tűnik, mintha az összes fájl adatát kombinálták volna. Az aggregáció nagy előnyei:
- Az összesített adatkészlet mérete sokkal nagyobb lehet, mint egy fájl kényelmesen (2GB) ...
- A közeli valós idejű adatokhoz könnyű új fájlt hozzáadni a legfrissebb adatcsomaggal. Nem kell újraírnia az egész adatkészletet.
Az aggregáció követelményei:
- A helyi fájloknak nem kell azonosakdataVariables (az adatkészletben meghatározottak szerintdatasets.xml) ... Az adatkészletnek leszdataVariabledefiniáltdatasets.xml... Ha egy adott fájlnak nincs egy adottdataVariable,ERDDAP™szükség szerint hozzáadja a hiányzó értékeket.
- MindendataVariableMUST ugyanazt használjaaxisVariables/dimenziók (az adatkészletben meghatározottak szerintdatasets.xml) ... A fájlokat az első alapján összesítik (baloldali) dimenzió, rendezve felemelkedő sorrendben.
- Minden fájl MAY van adatok egy vagy több értéke az első dimenzió, de nem lehet átfedés között fájlokat. Ha egy fájlnak több mint egy értéke van az első dimenzióban, a MUST értékeket felemelkedő sorrendben kell rendezni, kötelék nélkül.
- Minden fájl MUST pontosan ugyanazokat az értékeket az összes többi dimenzióban. A vizsgálat pontosságát a tesztelés határozza megAxisNDigits...
- Minden fájl MUST pontosan ugyanazegységMetaadata mindennekaxisVariableésdataVariableS. Ha ez egy probléma, akkor használható lehetNcMLvagyNCOa probléma megoldására.
Aggregáció File Names vagy Global Metadata
Minden variációEDDGridAz FromFiles is összesítheti a fájlok egy csoportját azáltal, hogy új baloldalt ad hozzá (először) dimenzió, általában idő, az egyes fájlnévből származó érték alapján, vagy az egyes fájlokban található globális tulajdonság értékétől függően. Például a fájlnév magában foglalhatja az adatok időértékét a fájlban.ERDDAP™akkor hozzon létre egy új idő dimenziót.
Ellentétben a hasonló jellemző a THREDDS,ERDDAP™mindig teremtaxisVariablenumerikus értékekkel (a CF által előírt) Soha nem erős értékek (amelyet nem engedélyeznek a CF) ... SzinténERDDAP™rendezi a fájlokat a számon alapuló összességébenaxisVariableaz egyes fájlokhoz rendelt érték, hogy a tengely változója mindig a CF által előírt értékeket rendezze. A THREDS megközelítése, hogy egy lexikográfiai fajta, amely a fájlnéveken alapul, aggregációkhoz vezet, ahol a tengelyértékek nem rendeződnek (amelyet nem engedélyeznek a CF) ha a fájl nevek másképp rendeződnek, mint amilyennek a származottaxisVariableértékek.
Az egyik ilyen aggregáció létrehozásaERDDAP™Új baloldalt fogsz meghatározni (először) axisVariablekülönleges, pseudo<sourceName>, amely azt mondjaERDDAP™hol és hogyan találjuk meg az új dimenzió értéket minden fájlból.
- A Pseudo formátumasourceNameamely megkapja az értéket egy fájlnévből (Just filename.ext) az \\" fájlName, adatok típus , KivonatRegex , ElfogadásGroupNumber*
- A Pseudo formátumasourceNameamely megkapja az értéket egy fájl abszolút útnevéről \\" PathName, adatok típus , KivonatRegex , ElfogadásGroupNumber* \[Ehhez az út neve mindig használja'/'mint a rendezői szeparátor karakter, soha nem ''.\]
- A Pseudo formátumasourceNameamely az értéket globális tulajdonságb ól szerezi, \\" globális: tulajdonság név , adatok típus , KivonatRegex , ElfogadásGroupNumber*
- Ez a pseudosourceNamemásképp működik a többiektől: ahelyett, hogy új baloldalt hoznánk létre (először) axisVariableEz helyettesíti a jelenlegi értékétaxisVariablea fájlnévből kivont értékkel (Just filename.ext) ... A formátum az \\" helyettesítő FromFileName, adatok típus , KivonatRegex , ElfogadásGroupNumber*
A megadott alkatrészek leírása:
- tulajdonság név - a globális tulajdonság neve, amely minden fájlban van, és amely tartalmazza a dimenzió értéket.
- adatok típus - Ez meghatározza azokat az adattípusokat, amelyeket az értékek tárolására használnak. Lásd a standard listátadatok típusokazERDDAP™támogatás, kivéve, hogy a String nem engedélyezett itt a tengelyváltoztatások ótaERDDAP™Nem lehet String változók.
Van egy további pseudo adattípus, időFormat= Szilárd TimeFormat Amit mondERDDAP™az érték egy sztring időStampA szigorú időkre alkalmas egységek... A legtöbb esetben a stringTimeFormat lesz egy variáció az egyik ilyen formátumban:
- yyyy-MM-ddT'HH:mm:ss.SSSZ - amely ISO 8601:2004 (EZ) dátumidő formátum. Szüksége lehet egy rövidített verzióra, például,yyyy-MM-ddT'HH:mm:ss vagyyyyy-MM-dd...
- yyyMddHHmmss.SSS - amely az ISO 8601 dátumidő formátumának kompakt verziója. Lehet, hogy szüksége van egy rövidített változata ennek, például yyyMMddHmmss vagy yyyMMMdd.
- M/d/yyyy H:mm:ss.SSS - ami az amerikai slash dátumformátum. Szükség lehet egy rövidített változata ennek, pl. M/d/yyyy.
- yyyDDHHmmssSSS - ez az év, plusz az év nulla beadott napja (pl, 001 = Jan 1, 365 = Dec 31 egy nem-levő évben; ez néha tévesen nevezik Julian dátum) ... Szüksége lehet egy rövidített változata ennek, például yyyyDD.
Ha ezt a pseudo adattípust használja, add hozzá ezt az új változóhoz<addAttributes>:
<att name="units">seconds since 1970-01-01T00:00:00Z</att>
Ha el akarja cserélni az összes időértéket, változtassa az időértéket az egységekben, pl. 1970-01-01T12:00Z.
- KivonatRegex - Ez azrendszeres kifejezés (tutorial) amely magában foglalja a rögzítő csoportot (parentheses) amely leírja, hogyan lehet kivonni az értéket a fájlnévből vagy a globális tulajdonságértékből. Például egy fájlnév, mint S19980011998031.L3b\_MO\_CHL.nc, rögzítő csoport #1, "\dtutorial„A rendszeres kifejezésben S ("\dtutorial) "\dtutorial\.L3b.\* az első 7 számjegyet a „S” után fogja megragadni: 1998001.
- ElfogadásGroupNumber - Ez a rögzítő csoport száma (egy pár parentheses) a rendszeres kifejezésben, amely tartalmazza az érdeklődésre vonatkozó információkat. Általában 1, az első rögzítő csoport. Néha a rögzítő csoportokat más célokra kell használnia a regexben, így a fontos rögzítő csoportszám 2 lesz (a második rögzítő csoport) vagy 3 (a harmadik) stb.
Teljes példa egyaxisVariableamely összesített adatkészletet hoz létre egy új idős tengelyrel, amely az egyes fájlok fájlnévből származó időértékeket kapja
<axisVariable>
<sourceName>\\*\\*\\*fileName,timeFormat=yyyyDDD,S(\\d{7})\\.L3m.\\*,1</sourceName>
<destinationName>time</destinationName>
</axisVariable>
Amikor a "timeFormat=" pseudo adatait használja típus,ERDDAP™2 tulajdonságot ad hozzáaxisVariableúgy tűnik, hogy a forrásból jönnek:
<att name="standard\\_name">time</att>
<att name="units">seconds since 1970-01-01T00:00:00Z</att>
Tehát ebben az esetben,ERDDAP™létrehoz egy új tengelyt, amelyet megneveztek"time"kettős értékekkel (másodpercek 1970-01-01T00:00Z) a 7 számjegy kivonásával a "S" után és a ".L3m" előtt a fájlnévben, és értelmezve azokat, mint az yyyyDDD formátumú időértékeket.
Felírhatja az alapértelmezett bázisidőt (1970-01-01T00:00Z) hozzáadásával egyaddAttributeamely különböző egységeket határoz meg, más alapidővel. Közös helyzet: vannak olyan adatfájlok, amelyek mindegyike egy 1 napos műholdas adatkészlettel rendelkezik, ahol azt szeretné, hogy az időértéke a fájlnévben említett nap déle legyen. (minden nap középpontjában) és szeretné a változótlong\_name"Centered Time" -nak lenni. Egy példa, ami ezt teszi:
<axisVariable>
<sourceName>\\*\\*\\*fileName,timeFormat=yyyyDDD,S(\\d{7})\\.L3m.\\*,1</sourceName>
<destinationName>time</destinationName>
<addAttributes>
<att name="long\\_name">Centered Time</att>
<att name="units">seconds since 1970-01-01T12:00:00Z</att>
</addAttributes>
</axisVariable>
Megjegyzés órák=12 az alapidőben, amely hozzáad 12 órát az eredeti alapidő 1970-01-01T00:00Z.
Teljes példa egyaxisVariableami aggregált adatállományt egy új "run" tengely segítségével teszi (int értékekkel) amely a "runID" globális tulajdonságból származó futási értékeket kapja minden fájlban (olyan értékekkel, mint a "r17\_global", ahol 17 a futó szám) az
<axisVariable>
<sourceName>\\*\\*\\*global:runID,int,(r|s)(\\d+)\\_global,2</sourceName>
<destinationName>run</destinationName>
<addAttributes>
<att name="ioos\\_category">Other</att>
<att name="units">count</att>
</addAttributes>
</axisVariable>
Vegye figyelembe a 2. számú rögzítő csoport használatát, hogy rögzítse a "r" vagy "s" után bekövetkező számjegyeket, és mielőtt "\_global". Ez a példa azt is mutatja, hogyan kell hozzáadni további tulajdonságokat (pl.:ioos\_categoryés egység) a tengely változó.
Külsőleg elnyomott fájlok
-
Adatkészletek, amelyek alkatrészeiEDDGridFromFiles és EDDTable Az FromFiles közvetlenül külsőleg tömörített adatfájlokból szolgálhat adatokat, köztük.tgz,.tar.gz,.tar.gzip,.gz,.gzip,.zip,.bz2és .Z fájlok.
-
Ez meglepően jól működik!
A legtöbb esetben a kis- és közepes méretű adatfájlokkal kapcsolatos lassulás kisebb. Ha lemezterületet kell őriznie, erősen bátorítjuk ezt a funkciót, különösen az idősebb fájlok esetében, amelyek ritkán érhetők el. -
Ments pénzt!
Ez az egyik a kevés funkciókbanERDDAP™ez lehetőséget kínál arra, hogy sok pénzt takarítson meg (bár a kissé csökkent teljesítmény költségénél) ... Ha a tömörítési arány pl. 6:1 (Néha sokkal magasabb lesz) Ezután az adatkészlet adatfájljai csak 1/6-ra lesznek szükségük a lemezterületre. Akkor lehet, hogy 1 RAID (egy adott méretből) 6 RAIDS helyett (azonos méretű) ... Ez egy hatalmas költségmegtakarítás. Remélhetőleg a képesség, hogy tömörítsen néhány fájlt egy gyűjteményben (Az idősebbek?) és ne tömöríts másokat (az újak?) , és ezt bármikor megváltoztatni, minimalizáljuk a hátrányt, hogy tömörítsünk néhány fájlt (lassabb hozzáférés) ... És ha a választás a fájlok tárolása a szalagon (és csak kérésre érhető el, késés után) vs tárolja őket egy RAID-on (és elérhetőERDDAP) , akkor van egy hatalmas előnye, hogy használja a tömörítést, hogy a felhasználók interaktív és (viszonylag) gyors hozzáférés az adatokhoz. És ha ez megmentheti Önt egy további RAID vásárlásától, ez a funkció körülbelül 300 000 dollárt takaríthat meg. -
MindenEDDGridFromFiles alosztályok, ha az adatfájlok egy kiterjesztés jelzi, hogy azok külsőleg tömörített fájlok (Jelenleg:.tgz,.tar.gz,.tar.gzip,.gz,.gzip,.zip,.bz2vagy .Z) ,ERDDAP™elnyomja a fájlokat az adatkészlet gyorsítótárának, amikor olvassa őket (ha már nem szerepelnek a cache-ban) ... Ugyanez igaz a bináris fájlra (pl.:.nc) EDDTableFromFiles alosztályai.
-
EDDTableFromFiles alosztályok nem bináris fájlok (pl.: .csv) , adatfájlok egy kiterjesztéssel jelezve, hogy külsőleg tömörített fájlokat fognak dekompresszálni, mivel a fájl olvasható.
-
KÉRDÉS: Ha a külsőleg tömörített fájl típusa (pl.:.tgzvagy.zip) több mint 1 fájlt támogat a tömörített fájlon belül, a tömörített fájlnak csak 1 fájlt kell tartalmaznia.
-
KÉRDÉS: Ez a funkció feltételezi, hogy a külsőleg tömörített fájlok tartalma nem változik, hogy egy csésze depressziós fájl újrahasznosítható. Ha néhány vagy az összes adatkészlet adatfájlja néha megváltozik, ne tömörítse ezeket a fájlokat. Ez összhangban van a közös használattal, mivel az emberek általában nem tömörítik a fájlokat, amelyeket néha meg kell változtatniuk.
-
<fájlNameRegex> Hogy ez a munka, az adatkészlet<fájlNameRegex> meg kell felelnie a tömörített fájlok nevét. Nyilvánvalóan olyan regexek, mint .\Minden fájl nevet illeszt. Ha specifikus fájltípust ad meg, pl.\↑.ncEzután módosítania kell a regexet, hogy tartalmazza a tömörítés kiterjesztését is, pl. ↑.nc↑.gz(ha az összes fájl lesz valami*.nc.gzfájlok)
-
Jó, ha az adatkészlet tartalmaz egy kompressált és nem tömörített fájlok keverékét. Ez hasznos lehet, ha úgy gondolja, hogy egyes fájlok (pl. régebbi fájlok) Kevesebbet fognak használni, ezért hasznos lenne a lemezterület megmentése azáltal, hogy tömörítené őket. Hogy ez a munka, a<f ájlNameRegex> meg kell felelnie a tömörített és nem tömörített fájlok nevét, például.\vagy .\↑.nc (|↑.gz) (ahol a rögzítő csoport ennek végén meghatározza, hogy.gzopcionális.
-
Jó, ha tömöríti vagy dekompresszálja a gyűjteményben lévő konkrét fájlokat bármikor. Ha az adatkészlet nem használja [<frissítésEveryNMillis> (#updateeverynmillis) Állítsa be az adatkészletetzászlóMondd elERDDAP™az adatkészlet újratöltéséhez, és így észreveheti a változásokat. Érdekes módon különböző tömörítő algoritmusokat és beállításokat használhat a különböző fájlokhoz ugyanazon adatkészletben (pl.:.bz2ritkán használt fájlok esetében,.gznem gyakran használt fájlok, és nem tömörítés gyakran használt fájlok) , csak győződjön meg róla, hogy a regex támogatja az összes olyan fájl kiterjesztését, amelyek használatban vannak, például .\* \.nc (|↑.gz|↑.bz2) ...
-
Természetesen a tömörítési arányok és sebességek a különböző tömörítési algoritmusok változnak a forrásfájl és a beállítások között (pl. kompressziós szint) ... Ha szeretné optimalizálni ezt a rendszert a fájlok számára, végezzen tesztet a különböző tömörítési módszerekről a fájlokkal, és számos tömörítési beállítással. Ha megbízhatóan jót akarsz (nem feltétlenül a legjobb) beállítás, kissé javasoljukgzip (.gz) ...gzipnem teszi a legkisebb tömörített fájlt (ésszerűen közel van) , de nagyon gyorsan tömöríti a fájlt és (fontosabb a fontosabbERDDAP™felhasználók) Nagyon gyorsan elnyomja a fájlt. Plusz,gzipszoftver jön szabványos minden Linux és Mac OS telepítés, és könnyen elérhető a Windows ingyenes eszközökkel, mint a 7Zip és a Linux kiegészítők, mint a Git Bash. Például, hogy tömörítsen egy forrásfájlt a.gzA fájl verziója (ugyanazon fájlnév, de.gzMegjelent) Használat (Linux, Mac OS és Git Bash)
gzip sourceName
Dekompresszálni egy.gzfájl vissza az eredeti, használat gunzip sourceName.gz
A forrásfájlok mindegyikének tömörítése a könyvtárban és az aláírókban, ismételten, használat gzip-r rendezőName
Dekompresszálni az egyeseket.gzfájlok a könyvtárban és az aláírók , ismételten, használat gunzip -r rendezőName
-
WARNING: Ne tömörítse külsőleg (gzip) olyan fájlokat, amelyek már belsőleg tömörítettek! Számos fájl már belsőleg tömörítette az adatokat. Ha te vagygzipEzek a fájlok, a kapott fájlok nem lesznek sokkal kisebbek (<5%) ésERDDAP™pazarolja az időt, hogy depressziós őket, amikor el kell olvasni őket. Például:
-
adatfájlok: pl.,.nc4 és.hdf5 fájl: Néhány fájl belső tömörítést használ; néhány nem. Hogyan lehet elmondani: a tömörített változók "\_ChunkSize" tulajdonságokkal rendelkeznek. Továbbá, ha egy csoport rácsos.ncvagy.hdfA fájlok mind különböző méretűek, valószínűleg belsőleg tömörítettek. Ha ők mind ugyanazok a méretek, nem belsőleg tömörülnek.
-
képfájlok: pl., .gif, .jpg és .png
-
audio fájlok: pl., .mp3 és .ogg.
-
videofájlok: pl. .mp4, .ogv és .webm.
-
Egy szerencsétlen furcsa eset: .wav audio fájlok hatalmasak és nem belsőleg tömörítettek. Jó lenne tömöríteni (gzip) Ezek, de általában nem szabad, mert ha megteszi, a felhasználók nem tudják játszani a kompressált fájlokat a böngészőben.
-
Test Case: tömörítés (velegzip) adatkészlet 1523 rácsos.ncfájlok.
- A forrásfájlokban szereplő adatok sparse (sok hiányzó érték) ...
- A teljes lemezterület 57 GB-ból indult, mielőtt a tömörítés 7 GB-ra kerülne.
- Az 1 időpontból származó sok adat kérése<1 s a tömörítés előtt és után.
- 1 adatpont kérése 365 időponthoz (a legrosszabb helyzet) 4-ről 71-re ment.
Számomra ez minden adatkészlet ésszerű kikapcsolása, és minden bizonnyal olyan adatkészletek esetében, amelyeket gyakran használnak.
-
Belső versus külső kompresszió - Összehasonlítva a belső fájlkompresszió által kínált.nc4 és.hdf5 fájl,ERDDAPA külsőleg tömörített bináris fájlok megközelítése előnyökkel és hátrányokkal jár. A hátrány az, hogy egy alkalommal olvassa el egy kis részét egy fájl, belső tömörítés jobb, mertEDDGridA Files csak néhány darabot kell dekompresszálni (s) a fájl, nem az egész fájl. DeERDDAPA megközelítésnek van néhány előnye:
- ERDDAP™támogatja az összes adatfájl tömörítését (bináris és nem bináris, pl..nc3 és .csv) nem csak.nc4 és.hdf4. 4.
- Ha egy fájl tömegét rövid idő alatt többször kell olvasni, akkor időt takarít meg a fájl lebontására egyszer, és sokszor olvassa el. Ez történikERDDAP™ha egy felhasználó használja a Make-A-Graph-ot az adatkészlethez, és egy sor apró változtatást tesz a grafikonra.
- Az a képesség, hogy tömörített fájlokat, és nem tömörített fájlokat ugyanabban a gyűjteményben, lehetővé teszi, hogy több ellenőrzést, amelyen a fájlok tömörülnek, és amelyek nem. És ez a hozzáadott ellenőrzés nem igazán módosítja a forrásfájlot (mivel tömöríthet egy fájlt pl..gzEzután dekompresszálja, hogy megkapja az eredeti fájlt) ...
- Az a képesség, hogy bármikor megváltoztassa, hogy egy adott fájlt tömörítenek-e, és hogyan tömörítik (különböző algoritmusok és beállítások) nagyobb ellenőrzést biztosít a rendszer teljesítménye felett. És könnyedén visszaállíthatja az eredeti elnyomatlan fájlt bármikor.
Bár a megközelítés sem győztes minden helyzetben, egyértelmű, hogyERDDAP"A külsőleg tömörített f ájlokból származó adatok kiszolgálásának képessége a külső tömörítést ésszerű alternatívá teszi a belső kompresszióval.nc4 és.hdf5. 5. 5. Ez jelentős, mivel a belső tömörítés az egyik fő oka annak, hogy az emberek használják.nc4 és.hdf5. 5. 5.
Dekompresszált Cache
ERDDAP™a tömörített bináris depressziós változata (pl.:.nc) adatfájl, ha el kell olvasnia a fájlt. A depressziós fájlokat az adatkészlet könyvtárában tartják bigParentDirectory[szerkesztés] /dekompresszált/ A nemrégiben nem használt depressziós fájlokat törölni fogják, hogy felszabadítsák a helyet, amikor a kumulatív fájlméret > 10 GB. Ezt megváltoztathatja a beállítással<DekompressedCacheMaxGB> (default=10) adatkészletekben Xml.xml, pl.
<decompressedCacheMaxGB>40</decompressedCacheMaxGB>
Továbbá, az elmúlt 15 percben nem használt depressziós fájlokat törölni fogják minden jelentős adatkészlet-visszatöltés kezdetén. Ezt megváltoztathatja a beállítással<DekompressedCacheMaxMinutesOld> (default=15) adatkészletekben Xml.xml, pl.
<decompressedCacheMaxMinutesOld>60</decompressedCacheMaxMinutesOld>
Nagyobb számok szépek, de a depressziós fájlok kumulatív mérete okozhat bigParentDirectory[szerkesztés] kifutni a lemezterületről, ami súlyos problémákat okoz.
- Mivel a fájl dekompresszálása jelentős időt vehet igénybe (0,1-10 másodpercig) A tömörített fájlokkal rendelkező adatkészletek előnyösek lehetnek az adatkészlet beállításában [<nThreads>] (#nthreads) egy magasabb szám beállítása (2? 3? 4?) ... Még magasabb számok hátrányai (pl. 5? 6? 7?) csökkenti a visszatéréseket, és az egyik felhasznál ó kérése a rendszer erőforrásainak nagy százalékát használhatja, így jelentősen lelassítja a többi felhasználó kérésének feldolgozását. Így nincs ideális nThreads beállítás, csak különböző következmények különböző helyzetekben különböző beállításokat.
Osztott dimenziós értékek
Az értékek minden dimenzióban MUST lehet rendezett rendben (felemelkedő vagy leszármazott, kivéve az elsőt (baloldali) olyan dimenzió, amelyet fel kell emelkedni) ... Az értékek szabálytalanul helyreállhatnak. Nem lehetnek kapcsolatok. Ez a követelmény aCF metaadat szabvány... Ha bármely dimenzió értéke nem rendezett rendben van, az adatkészlet nem lesz betöltve ésERDDAP™azonosítja az első fel nem szorított értéket a logfájlban, bigParentDirectory[szerkesztés] /logs/log.txt .
A nem szorított dimenziós értékek szinte mindig problémát jelentenek a forrásadatokkal. Ez a leggyakrabban akkor fordul elő, amikor egy tévhit vagy nem megfelelő fájl szerepel a gyülekezetben, ami egy szorulatlan idő dimenzióhoz vezet. A probléma megoldásához lásd a hibaüzenetetERDDAP™log.txt fájl, hogy megtalálja a megsértő időértéket. Ezután nézze meg a forrásfájlokat, hogy megtalálja a megfelelő fájlt (vagy egy előtt vagy után) ez nem tartozik a gyülekezetbe.
Rendezők
A fájlok MAY lehet egy könyvtárban, vagy egy könyvtárban és az aláírók (ismétlődően) ... Ha nagyszámú fájl van (Például:>1,000) , operációs rendszer (és ígyEDDGridFájlok) sokkal hatékonyabban fog működni, ha a fájlokat egy sor aláíróban tárolja (egy évente, vagy havonta egy adatkészletek nagyon gyakori fájlokkal) Annak érdekében, hogy soha ne legyen sok fájl egy adott könyvtárban.
<cacheFromUrl>
MindenEDDGridFromFiles és az összes EDDTableFromFiles adatkészlet támogatja egy sor címkét, amelyek elmondjákERDDAP™letölteni és fenntartani egy másolatot az összes távoli adatkészlet fájlok, vagy egy csésze néhány fájl (letöltve, amennyire szükséges) ... Ez hihetetlenül hasznos lehet. Lásd:Húsvét FromUrl dokumentáció...
Távoli könyvtárak és HTTP Range kérések
(AKA Byte Serving, Byte Range kéri, elfogadja a szabályokathttpFejlesztő)
EDDGridFromNcFiles, EDDTableFromMultidimNcFiles, EDDTableFromNcFiles és EDDTableFromNcCFFiles, can can Néha néha szolgáltatott adatok.ncfájlok távoli szervereken és a HTTP-n keresztül elérhetők, ha a szerver támogatjaByte ServingHTTP tartományi kérések (HTTP mechanizmus a byte szolgáló) ... Ez azért lehetséges, mert netcdf-java (melyikERDDAP™Használat az olvasáshoz.ncfájlok) támogatja az adatok távolról történő olvasását.ncfájlok HTTP tartomány kérések.
Ne csináld ezt! Ez szörnyen nem hatékony és lassú. Ehelyett használja a [[szerkesztés]]]<cacheFromUrl> rendszer (#cachefromurl) ...
HozzáférésERDDAP™adatkészletek, mint fájlok byte range kéréseken keresztül - Flipping ezt körül, mert lehet (elmélet) Gondolj egy adatkészletreERDDAP™mint óriás.ncfájlt a "Csak" beállításával.nc"Az OPen bázisraDAPURL egy adott adatkészlethez (pl.: https://myserver.org/erddap/griddap/datasetID.nc és egy ?query hozzáadása után is, hogy megadja az aljzatot) Talán ésszerű megkérdezni, hogy használhatja-e a netcdf-java-t,Ferretvagy másNetCDFkliens szoftver az adatok olvasásához HTTP Range kérésekERDDAP... A válasz nem, mert nincs igazán hatalmas ".nc"fájl. Ha ezt akarod csinálni, ehelyett tedd meg az egyik ilyen lehetőséget:
- Használat(OPeN)DAPügyfélszoftver, hogy csatlakozzon a griddap szolgáltatások által kínáltERDDAP... Ez az, amiDAP (és ígyERDDAP) tervezték. Nagyon hatékony.
- Vagy letöltse a forrás fájlt (s) a"files"rendszerrendszer (vagy subset fájl egy.nc? Lekérdezés) a számítógépére, és netcdf-java-t használ,Ferretvagy másNetCDFügyfél szoftver olvasni (most) helyi fájl (s) ...
Cached File Információ
Amikor egyEDDGridFromFiles adatkészlet első betöltése,EDDGridFromFiles az összes releváns fájlból olvas információt, és táblákat hoz létre (Egy sor minden fájlhoz) minden érvényes fájlról és minden "rossz" (különböző vagy érvénytelen) fájl.
- Az asztalokat is tárolják a lemezen, mintNetCDFv3.ncfájlok bigParentDirectory[szerkesztés] /dataset/ Last2CharsOfDatasetID / datasetID / fájlok neve: dirTable.nc (amely az egyedi könyvtár nevek listáját tartalmazza) , fájl táblázat.nc (amely az asztalt minden érvényes fájl információjával tartja) , rosszfiókok.nc (amely az asztalt minden rossz fájl információjával tartja) ...
- A hozzáférés gyorsítása egyEDDGridFromFiles adatkészlet (de több memóriát használva) Használhatja
true
Mondd elERDDAP™tartsa a fájlinformációs táblák másolatát az emlékezetben.
- A lemezen található fájlinformációs táblák másolata akkor is hasznos, haERDDAP™le van zárva és újraindítva: megmentEDDGridA Files-től, hogy újra kell olvasnia az összes adatfájlot.
- Amikor egy adatkészletet újratöltik,ERDDAP™csak az adatokat kell olvasni az új fájlokban és fájlokban, amelyek megváltoztak.
- Ha egy fájlnak más szerkezete van a többi fájlból (Például egy másik adattípus az egyik változó számára, vagy egy másik érték a "egység- tulajdonság) ,ERDDAPhozzáadja a fájlt a "rossz" fájlok listájához. Információk a probléma a fájl lesz írva a bigParentDirectory[szerkesztés] /logs/log.txt fájl.
- Soha nem kell törölnie vagy dolgoznia ezeket a fájlokat. Az egyik kivétel: ha még mindig megváltoztatja az adatkészletetdatasets.xmlbeállítás, lehet, hogy törölni ezeket a fájlokat kényszeríteniERDDAP™az összes fájl újraindítása, mivel a fájlokat másképp olvassák/értelmezik. Ha valaha is törli ezeket a fájlokat, akkor megteheti, haERDDAP™fut. (Ezután állítsa be azászlóaz adatkészlet újratöltése ASAP.) Azonban,ERDDAP™általában észreveszi, hogy adatasets.xmlaz információ nem egyezik a fájllal Asztalinformációk és a fájltáblák automatikusan törlése.
- Ha bátorítani akarszERDDAP™a tárolt adatkészlet információjának frissítése (például, ha csak hozzáadott, eltávolított vagy módosított néhány fájlt az adatkészlet adattárához) Használja azászlórendszerKényelemERDDAP™a csatolt fájlinformációk frissítése.
Kérések kezelése
Amikor az ügyfél adatkérelme feldolgozásra kerül,EDDGridA Files gyorsan megvizsgálhatja az asztalt az érvényes fájlinformációkkal, hogy megnézze, mely fájlok rendelkeznek a kért adatokkal.
A Cached File információ frissítése
Amikor az adatkészletet újratöltik, a csésze fájlinformációkat frissítik.
- Az adatkészletet rendszeresen újratöltik, amint azt a<reloadEveryNMinutes> az adatkészlet információibandatasets.xml...
- Az adatkészletet a lehető leghamarabb újratöltik, haERDDAP™kimutatja, hogy hozzáadott, eltávolított,touch'd (a fájl utolsó módosítása Módosított idő) vagy módosított egy adatszűrőt.
- Az adatkészlet a lehető leghamarabb újratöltődik, ha használjazászlórendszer...
Amikor az adatkészletet újratöltik,ERDDAP™összehasonlítja a jelenleg rendelkezésre álló fájlokat a csatolt fájlinformációs táblákhoz. Új fájlokat olvasnak és hozzáadnak az érvényes fájlok táblázatához. Azok a fájlok, amelyek már nem léteznek, az érvényes fájlok táblájából származnak. Azok a fájlok, ahol a fájl-időmérő változott, olvashatók, és az információjuk frissül. Az új táblák felváltják a régi táblákat a memória és a lemezen.
Bad Files
A rossz fájlok táblázata és az okok, amelyeket a fájlok rossznak nyilvánították (korrupt fájl, a változók hiánya stb.) e-mailben van az e-mailben Minden E-mail cím (valószínűleg te) Minden alkalommal, amikor az adatkészletet újratöltik. A lehető leghamarabb fel kell cserélnie vagy javítania ezeket a fájlokat.
Elhagyni a változókat
Ha néhány fájl nem rendelkezik néhányatdataVariableaz adatkészletben meghatározottdatasets.xmlcunk, ez rendben van. MikorEDDGridFromFiles elolvassa az egyik ilyen fájlt, úgy fog működni, mintha a fájl volt a változó, de minden hiányzó értékek.
FTP hiba / tanács
Ha FTP új adatfájlokat készítERDDAP™szerver,ERDDAP™fut, van esély arra, hogyERDDAP™az FTP folyamat során újratölti az adatkészletet. Gyakrabban fordul elő, mint gondolnád! Ha ez megtörténik, a fájl úgy tűnik, hogy érvényes (érvényes neve) , de a fájl még nem érvényes. HaERDDAP™megpróbálja elolvasni az adatokat ebből az érvénytelen fájlból, az ebből eredő hiba okozza a fájlt az érvénytelen fájlok táblázatához. Ez nem jó. A probléma elkerülése érdekében használjon ideiglenes fájlnévet, amikor az FTP a fájlt, például az ABC2005.nc\_TEMP . Ezután a fájlNameRegex teszt (lásd alább) jelzi, hogy ez nem releváns fájl. Miután az FTP folyamat befejeződött, nevezze át a fájlt a helyes névre. A megnevezési folyamat azt fogja okozni, hogy a fájl egy pillanat alatt releváns legyen.
"0 fájl" hibaüzenet
Ha futszGenerateDatasetsXmlvagyDasDdsvagy ha megpróbálsz betölteni egyEDDGridFiles adatkészletERDDAP™, és kap egy "0 fájl" hibaüzenetet, amely jelzi, hogyERDDAP™talált 0 megfelelő fájlokat a könyvtárban (ha úgy gondolja, hogy van egyező fájlok ebben a könyvtárban) :
- Ellenőrizze, hogy a fájlok valóban ebben a könyvtárban vannak.
- Ellenőrizze a könyvtár neve varázslatát.
- Ellenőrizze a fájlNameRegex. Valójában nagyon könnyű hibákat hibáztatni a regexekkel. Tesztcélok esetén próbálja meg a regex .\*-t, amely minden fájlnévhez illeszkedik. (Lásd eztregex dokumentációésregex bemutató...)
- Ellenőrizze, hogy a felhasználó, aki fut a program (pl. felhasználó=tomcat (?) Tomcat/ERDDAP) "olvassa" az engedélyt ezekre a fájlokra.
- Egyes operációs rendszerekben (például SELinux) és a rendszerbeállításoktól függően a felhasználónak, aki futtatja a programot, „olvassa” a könyvtárak egész láncolatát, amely a fájlokat tartalmazó könyvtárhoz vezet.
EDDGridFromFiles csontváz XML
- A csontváz XML mindenkinekEDDGridFromFiles alosztályok:
<dataset type="EDDGridFrom...Files" datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaWMS>...</accessibleViaWMS> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1. For
EDDGridFromFiles subclasses, this uses Java's WatchDirectory system
to notice new/deleted/changed files quickly and efficiently. -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<matchAxisNDigits>...</matchAxisNDigits> <!-- 0 or 1 -->
<nThreads>...</nThreads> <!-- 0 or 1 -->
<dimensionValuesInMemory>...</dimensionValuesInMemory> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<fileDir>...</fileDir> <-- The directory (absolute) with the
data files. -->
<recursive>true|false</recursive> <!-- 0 or 1. Indicates if
subdirectories of fileDir have data files, too. -->
<pathRegex>...</pathRegex> <!-- 0 or 1. Only directory names which
match the pathRegex (default=".\") will be accepted. -->
<fileNameRegex>...</fileNameRegex> <-- 0 or 1. A
regular expression (tutorial) describing valid data
file names, for example, ".\\.nc" for all .nc files. -->
<accessibleViaFiles>true|false(default)</accessibleViaFiles>
<!-- 0 or 1 -->
<metadataFrom>...</metadataFrom> <-- The file to get
metadata from ("first" or "last" (the default) based on file's
lastModifiedTime). -->
<fileTableInMemory>...</fileTableInMemory> <!-- 0 or 1 (true or
false (the default)) -->
<cacheFromUrl>...</cacheFromUrl> <!-- 0 or 1 -->
<cacheSizeGB>...</cacheSizeGB> <!-- 0 or 1 -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<axisVariable>...</axisVariable> <!-- 1 or more -->
<dataVariable>...</dataVariable> <!-- 1 or more -->
</dataset>
EDD*AudioFiles
EDDGridFromAudioFiles és EDDTableFromAudioFiles összesített adatok a helyi audiofájlok gyűjteményéből. (Ezek az első megjelentekERDDAP™v1.82.) A különbség az, hogyEDDGridAz FromAudioFiles az adatokat többdimenziós adatkészletként kezeli (általában 2 dimenzióval:\[fájl indítása Idő\]és\[elapadt Idő egy fájlon belül\]) , mivel az EDDTableFromAudioFiles az adatokat takaró adatokként kezeli (általában oszlopok a fájl indítása, az elapsedTime a fájl, és az adatok az audio csatornák) ...EDDGridFromAudioFiles megköveteli, hogy minden fájl ugyanazon számú mintával rendelkezik, így ha ez nem igaz, akkor EDDTableFromAudioFiles-t kell használnia. Ellenkező esetben az EDD-típus használatának választása teljesen a választás. Az EDDTableFromAudioFiles egyik előnye: más változókat is hozzáadhat más információkkal, példáulstationID, állomásType. Mindkét esetben az egységes időváltozat hiánya nehezebbé teszi az ilyen EDD-típusok adataival való együttműködést, de nem volt jó módja annak, hogy egységes időváltozatot hozzon létre.
Lásd ezeket az osztályokat,EDDGridFájlokésEDDTableFromFilesÁltalános információk arról, hogyan működik ez az osztály, és hogyan kell használni.
Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Mivel az audiofájlok nem rendelkeznek más metaadatokkal, mint a hangadatok kódolásával kapcsolatos információk, meg kell szerkeszteni a kimenetet a GenerateDatasets-től Xml, hogy alapvető információkat nyújtson (pl. cím, összefoglaló,creator\_name, intézmény, történelem) ...
Részletek:
- Számos audio fájlformátum létezik. Jelenleg,ERDDAP™olvashat adatokat a legtöbb .wav és .au fájlból. Jelenleg nem olvashat más típusú audio fájlokat, például .aiff vagy .mp3. Ha támogatásra van szüksége más audio fájlformátumok vagy más változatok .wav és .au, kérjük, küldje el a kérését Chris. John at noaa.gov. Vagy, mint egy munkakör, amit most használhat, átalakíthatja az audio fájlokat PCM\_ SIGNED (Integrációs adatok) PCM\_FLOAT (lebegő pont adatok) .wav fájlok, hogyERDDAP™dolgozhat velük.
- Jelenleg,ERDDAP™elolvashatja az audio fájlokat azzal, amitJava"Az AudioFormat osztály PCM\_FLOAT, PCM\_SIGNED, PCM\_UNSIGNED, ALAW és ULAW kódolásokat hív.ERDDAP™átalakítja a PCM\_UNSIGNED értékeket (pl. 0-255) aláírt értékek (pl.: 128-128) a bitek átrendezése az adatértékekben.ERDDAP™átalakítja az ALAW és az ULAW kódolt az őshonos kódolt byte formátumból rövidre (Int16) értékek. ótaJavabigEndian=igazi adatokat akar,ERDDAP™átrendezi a bigEndian=false-vel tárolt adatok byteáit (kis endian) annak érdekében, hogy helyesen olvassa el az értékeket. Minden más kódoláshoz (PCM) ,ERDDAP™olvassa el az adatokat, mint az.
- MikorERDDAP™elolvassa az adatokat az audio fájlokból, a fájl elérhető audio metaadatát globális tulajdonságokra konvertálja. Ez mindig tartalmazza (mintaértékekkel)
Hangszóró audioBigEndian "hamis"; //igaz vagy hamis Int audio Csatornák 1; Hangsúlyozva a "PCM\_SIGNED" -t; Float audioFrameRate 96000.0; //per második az audioFrameSize 2; //# adat bytes per frame Float audioSampleRate 96000.0; //per második int audioSampleSizeInBits 16; //# bits / csatorna / minta
MertERDDAPA cél, a keret szinonimája egy mintával, ami az adatok egy időben. A tulajdonságok aERDDAP™lesz az információ, amely leírja az adatokat, mivel a forrásfájlokban volt.ERDDAP™Gyakran megváltoztatta ezt az adatokat, például a PCM\_UNSIGNED, az ALAW és az ULAW kódolt adatok átalakulnak a PCM\_SIGNED-re, és a bigEndian=hamis adatok átalakulnak a bigEndian=true adatokra (Így vanJavael akarja olvasni) ... A végén az adatértékek aERDDAP™mindig lesz azPCM kódolvaadatértékek (azaz a hanghullám egyszerű digitalizált mintái) ...
- MikorERDDAP™elolvassa az adatokat az audio fájlokból, az egész fájlt olvassa el.ERDDAP™csatornánként körülbelül 2 milliárd mintát olvashat. Például, ha a mintavételi ráta másodpercenként 44.100 minta, 2 milliárd minta lefordítható körülbelül 756 percnyi hangadattal. Ha több audió fájlja van, mint ez az adatmennyiség, meg kell szakítania a fájlokat kisebb darabokra, hogyERDDAP™olvassa el őket.
- MertERDDAP™teljes audiofájlokat olvas,ERDDAP™nagy mennyiségű memóriához kell hozzáférnie ahhoz, hogy nagy audiofájlokkal dolgozzon. LásdERDDAPmemória beállítások... Ismét, ha ez egy probléma, egy munkakör, amelyet most használhat, az, hogy a fájlokat kisebb darabokra bontja, hogyERDDAP™kevesebb memóriával olvashatjuk őket.
- Egyes audiofájlokat helytelenül írtak.ERDDAP™kis erőfeszítést tesz az ilyen esetek kezelésére. De általában, ha van egy hiba,ERDDAP™dob egy kivételt (és elutasítja ezt a fájlt) vagy (ha a hiba észrevehetetlen) olvassa el az adatokat (de az adatok helytelenek lesznek) ...
- ERDDAP™nem ellenőrzi vagy megváltoztatja a hang mennyiségét. Ideális esetben az integrált audio adatok az adattípus teljes skáláját használják.
- Az Audio fájlok és az audio szereplők nem rendelkeznek rendszerrel a hiányzó értékekhez (pl. -999 vagy Float.NaN) ... Tehát az audio adatoknak nincs hiányzó értékük. Ha hiányzik az értékek (pl. ha meg kell hosszabbítani egy audio fájlt) Használjon egy 0-as sorozatot, amelyet tökéletes csendként értelmeznek.
- MikorERDDAP™adatokat olvas az audio fájlokból, mindig létrehoz egy elapsed nevű oszlopot Idő minden mintához, másodpercekben (duplákként tárolva) , az első mintához képest (kitűzött Time=0.0 s) ... EzzelEDDGridFromAudioFiles, ez lesz az elapsedTime tengely változó.
- EDDGridFromAudioFiles előírja, hogy minden fájl ugyanazt a számú mintát. Tehát ha ez nem igaz, akkor EDDTableFromAudioFiles-t kell használnia.
- MertEDDGridFromAudioFiles, javasoljuk, hogy állítsa be [[szerkesztés]]<dimenzióValuesInMemory>] (#dimenziós érzelmek) hamis (a GenerateDatasets által ajánlott Xml) Mivel az időméretnek gyakran számos értéke van.
- MertEDDGridFromAudioFiles, szinte mindig használja aEDDGridFromFiles rendszerAggregáció keresztül File nevek- szinte mindig a felvételi dátum kivonásával Idő a fájlnévből. Például,
<sourceName>\\*\\*\\*fileName,"timeFormat=yyyyMMdd'\\_'HHmmss",aco\\_acoustic\\.(\\[0-9\\]{8}\\_\\[0-9\\]{6})\\.wav,1</sourceName>
GenerateDatasets Az Xml ezt ösztönzi, és ezzel segít.
- Az EDDTableFromAudioFiles számára szinte mindig használja az EDDTableFromFiles rendszert\\\*fileName pseudosourceNamesinformáció kivonása a fájl nevét (szinte mindig az indulási dátum Idő a felvételhez) és népszerűsítse azt, hogy az adatok oszlopa legyen. Például,
<sourceName>\\*\\*\\*fileName,aco\\_acoustic\\.(\\[0-9\\]{8}\\_\\[0-9\\]{6})\\.wav,1</sourceName>
Ezután meg kell határozni az időformátumot, mint az egységeket:<att name="units" - YyMMdd'\_'HHmmss</att>
EDDGridFromMergeIRFiles
EDDGridFromMergeIRFiles összesíti a helyi adatok adatait,MergeIRfájlok, amelyek aTrópusi Rainfall mérési misszió (TRMM) , amely közös küldetés a NASA és a Japán Aerospace Exploration Agency között (JAXA) ... Merge Az IR fájlok letölthetőkNASA...
EDDGridFromMergeIRFiles.java írta és hozzájárult aERDDAP™Jonathan Lafite és Philippe Makowski R.Tech Engineering (licenc: szerzői jogi nyílt forráskód) ...
EDDGridFromMergeIRFiles egy kicsit szokatlan:
- EDDGridFromMergeIRFiles támogatja a tömörített vagy elnyomott forrásadat fájlokat, bármilyen kombinációban, ugyanazon adatkészletben. Ez lehetővé teszi például, hogy tömörítse az idősebb fájlokat, amelyek ritkán elérhetők, de az új fájlokat gyakran hozzáférnek. Vagy megváltoztathatja az eredeti tömörítés típusát. Z például,.gz...
- Ha ugyanazon adatfájlok tömörített és elnyomatlan verziói vannak ugyanabban a könyvtárban, győződjön meg róla, hogy<fájlNameRegex> az adatkészlet illeszti a fájlnéveket, hogy azt akarja, hogy megfeleljen, és nem egyezik fájlnévvel, hogy nem akarja, hogy megfeleljen.
- A nem elnyomott forrásadat fájloknak nem kell fájl kiterjesztése (i.e., nem ". a fájlnévben) ...
- A kompressált forrásadatfájloknak fájl kiterjesztéssel kell rendelkezniük, deERDDAP™meghatározza a tömörítés típusát a fájl tartalmának ellenőrzésével, nem pedig a fájl kiterjesztésének megtekintésével (Például: ".Z") ... A támogatott kompressziós típusok magukban foglalják a "gz", "bzip2", "xz", "lzma", "snappy-raw", "snappy-framed", "pack200" és "z". MikorERDDAP™tömörített fájlokat olvas, decompresses on-the-fly, írás nélkül egy ideiglenes fájlt.
- Minden forrásadatfájlnak az eredeti fájl elnevezési rendszert kell használnia: azaz a merg\_ YYYMMDHH \_4km-pixel (ahol YYYMMDHH jelzi az adatokhoz kapcsolódó időt a fájlban) , plusz egy fájl kiterjesztése, ha a fájlt tömörítik.
Lásd ezt az osztályt,EDDGridFájlokÁltalános információk arról, hogyan működik ez az osztály, és hogyan kell használni.
Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
EDDGridFromNcFiles
EDDGridFromNcFiles aggregálja az adatokat a helyi, rácsos,GRIB .grb és .grb2fájlok,HDF (v4 vagy v5) .hdffájlok,.ncml mlfájlok,NetCDF (v3 vagy v4) .ncfájlok ésZarrfájlok (2.25 verzió) ... A Zarr fájlok kissé eltérő viselkedéssel rendelkeznek, és megkövetelik a fájltNameRegex vagy az útRegex, hogy tartalmazza a "zarr".
Ez működhet más fájltípusokkal (Például a BUFR) Csak nem teszteltük - kérjük, küldjön nekünk néhány minta fájlt.
- GRIB fájlokhoz,ERDDAP™.gbx index fájlt készít, először olvassa el az összes GRIB fájlt. Tehát a GRIB-fájloknak olyan könyvtárban kell lenniük, ahol a "felhasználó", amely ran Tomcat olvasott + írásbeli engedélyt.
- Lásd ezt az osztályt,EDDGridFájlokinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- KezdőlapERDDAP™v2.12,EDDGridFromNcFiles ésEDDGridFromNcFiles A nem csomagolt adatok a "struktúrákból" olvashatók.nc4 és.hdf4 fájl. A változó azonosítása, amely egy szerkezetből származik,<sourceName> > > > használja a formátumot: fullstructureName | tagName Például a csoport1/myStruct|myMember.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
Csoportok Gridded Nc fájlokban
A Netcdf4 fájlok csoportokat tartalmazhatnak. ERDDAP™csak egy adathalmazt készít az egyik csoportban és az összes szülőcsoportban lévő változókból. Megadhat egy adott csoport nevét a GenerateDatasets-ben Xml (Elhagyni a nyomvonalat) vagy használjon "" GenerateDatasets Xml keresse meg az összes csoportot a változókhoz, amelyek a legtöbb dimenziót használják, vagy használja a "\[gyökér\]"A GenerateDatasets csak a változókat keresi a gyökércsoportban.
Az első dolog, amit a GenerateDatasetsXml tesz az ilyen típusú adatkészlethez, miután válaszol a kérdésekre, kinyomtatja a minta fájl ncdump-szerű szerkezetét. Tehát, ha belépsz néhány goofy válaszra az első hurok számára GenerateDatasets Xml, legalább látni fogja, hogyERDDAP™olvassa el a fájlt, és nézze meg, hogy milyen dimenziók és változók vannak a fájlban. Ezután jobb választ adhat a második hurok számára a GenerateDatasetsXml-en keresztül.
EDDGridFromNcFilesUnpack
EDDGridFromNcFilesUnpack egy változataEDDGridFromNcFilesamely összegyűjti az adatokat a helyi, megfogottNetCDF (v3 vagy v4) .ncés kapcsolódó fájlok. A különbség az, hogy ez az osztály minden adatfájlot kicsomagol, mielőttEDDGridFromFiles a fájlokat nézi:
- Kicsomagolja a változókat, amelyek tele vannakscale\_factorvagyadd\_offset...
- Megtéríti a \_FillValue-t ésmissing\_valueA NaN értékei (vagy MAX\_VALUE az integrált adattípusokhoz) ...
- Idő- és ütemértékeket alakít át"seconds since 1970-01-01T00:00:00Z"...
Ennek az osztálynak a nagy előnye, hogy utat biztosít a különböző értékek kezelésérescale\_factor,add\_offset\_FillValue,missing\_valuevagy időegységek különböző forrásfájlokban egy gyűjteményben. Ellenkező esetben olyan eszközt kell használnia, mintNcMLvagyNCOmódosítani minden fájlt, hogy távolítsa el a különbségeket, hogy a fájlokat lehet kezelniEDDGridFromNcFiles. Ahhoz, hogy ez az osztály megfelelően működjön, a fájloknak követniük kell a kapcsolódó tulajdonságok CF szabványait.
- Ha megpróbálsz csinálniEDDGridFromNcFiles Csomagolatlan egy olyan fájlcsoportból, amellyel korábban kipróbált és nem használtEDDGridFromNcFiles, cd to bigParentDirectory[szerkesztés] /dataset/ Last2Letters / datasetID / ahol Last2Letters az utolsó 2 betűdatasetID, és törölje az összes fájlt ebben a könyvtárban.
- KezdőlapERDDAP™v2.12,EDDGridFromNcFiles ésEDDGridFromNcFiles A nem csomagolt adatok a "struktúrákból" olvashatók.nc4 és.hdf4 fájl. A változó azonosítása, amely egy szerkezetből származik,<sourceName> > > > használja a formátumot: fullstructureName | tagName Például a csoport1/myStruct|myMember.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
A Netcdf4 fájlok csoportokat tartalmazhatnak. Lásdez a dokumentáció...
Az első dolog, amit a GenerateDatasetsXml tesz az ilyen típusú adatkészlethez, miután válaszol a kérdésekre, kinyomtatja a mintafájl ncdump-szerű szerkezetét előtte kicsomagolatlan. Teh át, ha belépsz néhány goofy válaszra az első hurok számára GenerateDatasets Xml, legalább látni fogja, hogyERDDAP™olvassa el a fájlt, és nézze meg, hogy milyen dimenziók és változók vannak a fájlban. Ezután jobb választ adhat a második hurok számára a GenerateDatasetsXml-en keresztül.
EDDGridLonPM180
EDDGridLonPM180 módosítja a gyermek hosszúsági értékeit (bezárt) EDDGridolyan adatkészlet, amely több mint 180 (például 0-360) hogy ők a tartományban -180-180 (Longitude Plus vagy Minus 180, így a név) ...
- Ez lehetőséget ad arra, hogy olyan adatkészleteket hozzanak létre, amelyeknek hosszúsági értékei nagyobbak, mint 180 megfelelnek / aOGCSzolgáltatások (PéldáulWMSszerverERDDAP) Mint mindenOGCA szolgáltatások hosszúsági értékeket igényelnek -180 és 180 között.
- A szüntelenséghez közeli munka problémákat okoz, függetlenül attól, hogy a szüntelenség hosszúságú 0 vagy hosszúságú 180. Ez az adatkészlet típus lehetővé teszi, hogy elkerülje ezeket a problémákat mindenki számára, két változata ugyanazt az adatkészletet: a 0–360 közötti tartományban lévő hosszúsági értékek ("Pacificentric"?) , az egyik hosszúsági értékek a tartományban -180-180 ("Atlanticentric"?) ...
- A 180-nál nagyobb, hosszúsági értékű gyermekadatok esetében az új hosszúsági értékek mindössze 360 fokkal alacsonyabbak. Például egy 180-240-es szélességi értékű adatkészlet az -180–120 közötti hosszúsági értékekkel rendelkező adatkészlet lesz.
- Gyermekadatkészletek, amelyek hosszúságú értékek az egész világon (durván 0-360) Az új hosszúsági érték újrarendezésre kerül, hogy (durv án) 180–180: Az eredeti 0–180 érték változatlan. Az eredeti 180-360 értékek átalakulnak -180-0-ra, és a hosszúsági sor kezdetére változnak.
- A 180-as gyermekadatok esetében, de ne fedje le a világot,ERDDAP™beilleszti a hiányzó értékeket, amelyek szükségesek ahhoz, hogy egy adatkészletet hozzanak létre, amely lefedi a világot. Például egy 140-200-as hosszúsági értékű gyermekadat az 180–180-as évek hosszúsági értékű adatkészletévé válik. A 180-200-as gyermekértékek -180-160-ra válnak. Az új hosszúsági értékek -160-tól 140-ig terjednek. A megfelelő adatértékek \_FillValues lesznek. A 140-180-as gyermekértékek változatlanok lesznek. A hiányzó értékek beillesztése furcsának tűnhet, de elkerüli számos problémát, ami azt eredményezi, hogy a hosszúsági értékek hirtelen ugranak. (pl.: -160 és 140) ...
- InkábbGenerateDatasetsXmlvan egy speciális "adatkészlet",EDDGridLonPM180FromErddapCatalog, amely lehetővé teszi, hogy létrehozza adatasets.xmlMertEDDGridLonPM180 adatkészletek mindegyikétőlEDDGridadatkészletek egyERDDAPolyan hosszúsági értékek, amelyek 180-nál nagyobbak. Ez megkönnyíti ezen adatkészletek két változatát: az eredeti, hosszúsági értékekkel a 0–360 tartományban, és az új adatkészlet, a hosszúsági értékek a -180-180 tartományban.
A gyermek adatkészlete minden egyesbenEDDGridLonPM180 adatkészlet leszEDDGridFromErddap adatkészlet, amely az eredeti adatkészletre vonatkozik. Az új adatkészletdatasetIDlesz az eredeti adatkészlet neve, plusz "\_LonPM180". Például,
<dataset type="EDDGridLonPM180" datasetID="erdMBsstdmday\\_LonPM180" active="true">
<dataset type="EDDGridFromErddap" datasetID="erdMBsstdmday\\_LonPM180Child">
<!-- SST, Aqua MODIS, NPP, 0.025 degrees, Pacific Ocean, Daytime
(Monthly Composite) minLon=120.0 maxLon=320.0 -->
<sourceUrl>https://coastwatch.pfeg.noaa.gov/erddap/griddap/erdMBsstdmday
</sourceUrl>
</dataset>
</dataset>
Tedd le aEDDGridLonPM180 adatkészlet alább az eredeti adatkészletdatasets.xml... Ez elkerüli néhány lehetséges problémát.
Alternatívaként helyettesítheti aEDDGridFromErddap gyermek adatkészlet az eredeti adatkészletteldatasets.xml... Ezután az adatkészlet csak egy verziója lesz: az egy, amelynek hosszúsági értékei vannak -180 és 180 között. Ezt azért elriasztjuk, mert vannak olyan idők, amikor az adatkészlet minden verziója kényelmesebb.
- Ha egy adatkészlet két verzióját kínálja, például egy, 0-360-as hosszúsággal, és egy hosszúsággal -180-180-as 180-as:
- Használhatja az opcionális [<hozzáférhető ViaWMS> Hamis</Csak elérhető ViaWMS>>>>>> (#Ccessibleviawms) a 0-360 adatkészlettel, amely erõsen letiltja aWMSszolgáltatás erre az adatkészletre. Ezután csak az adatkészlet LonPM180 verziója elérhető leszWMS...
- Van néhány módja annak, hogy a LonPM180 adatállomány naprakész legyen a mögöttes adatkészlet változásaival:
- Ha a gyermek adatkészlete egyEDDGridFromErddap adatkészlet, amely ugyanazon adatkészletre hivatkozikERDDAP™A LonPM180 adatkészlet közvetlenül feliratkozik az alapjául szolgáló adatkészletre, hogy mindig naprakész legyen. A közvetlen előfizetések nem generálnak olyan e-maileket, amelyek arra kérik Önt, hogy érvényesítse az előfizetést - az érvényesítést automatikusan meg kell tenni.
- Ha a gyermek adatkészlete nemEDDGridFromErddap adatkészlet, amely ugyanazonERDDAP™A LonPM180 adatkészlet megpróbálja használni a rendszeres előfizetési rendszert az alapul szolgáló adatkészletre. Ha rendelkezik az előfizetési rendszerrel az ÖnbenERDDAP™fordult, meg kell kapni e-mailek kéri, hogy érvényesítse az előfizetést. Kérlek, tedd meg!
- Ha rendelkezik az előfizetési rendszerrel az ÖnbenERDDAP™Kikapcsolva, a LonPM180 adatkészlet néha elavult metaadatokkal rendelkezhet, amíg a LonPM180 adatkészletet újratöltik. Tehát, ha az előfizetési rendszer le van kapcsolva, be kell állítania a [[szerkesztés]]<újratöltés MindenNMinutes>] (#reloadeveryn percek) a LonPM180 adatkészlet kisebb számra történő beállítása, így nagyobb valószínűséggel elkapja a gyermek adatkészletének változásait.
EDDGridLonPM180 csontváz XML
<dataset type="EDDGridLonPM180" datasetID\="..." active\="..." >
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1. For
EDDGridFromDap, this gets the remote .dds and then gets the new
leftmost (first) dimension values. -->
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaWMS>...</accessibleViaWMS> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<nThreads>...</nThreads> <!-- 0 or 1 -->
<dimensionValuesInMemory>...</dimensionValuesInMemory> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<dataset>...</dataset> <!-- The child EDDGrid dataset. -->
</dataset>
EDDGridLon0360
EDDGridLon0360 módosítja a gyermek hosszúsági értékeit (bezárt) EDDGridolyan adatkészlet, amely kevesebb, mint 0 (például -180-180) hogy a 0-360-as tartományban vannak (Ezért a neve) ...
- A szüntelenséghez közeli munka problémákat okoz, függetlenül attól, hogy a szüntelenség hosszúságú 0 vagy hosszúságú 180. Ez az adatkészlet típus lehetővé teszi, hogy elkerülje ezeket a problémákat mindenki számára, két változata ugyanazt az adatkészletet: az egyik hosszúsági értékek a tartományban -180-180 ("Atlanticentric"?) ... a 0–360 közötti tartományban lévő hosszúsági értékek ("Pacificentric"?) ,
- A gyermekek adatkészleteinél kevesebb, mint 0, az új hosszúsági értékek mindössze 360 fokkal magasabbak. Például a -180–120 közötti hosszúsági értékű adatkészlet 180–240-es szélességi értékű adatkészlet lesz.
- Gyermekadatkészletek, amelyek hosszúságú értékek az egész világon (durván -180-180) Az új hosszúsági érték újrarendezésre kerül, hogy (durván) 0-360: Az eredeti -180-0 értékek 180–360-ra változnak, és a hosszúsági sor végére változnak. Az eredeti 0–180 érték változatlan.
- A lon=0-as gyermekadatok esetében, de ne fedje le a világot,ERDDAP™beilleszti a hiányzó értékeket, amelyek szükségesek ahhoz, hogy egy adatkészletet hozzanak létre, amely lefedi a világot. Például a -40-2020 közötti hosszúsági értékű gyermekadat egy 0-360-as hosszúsági értékű adatkészlet lesz. A 0-20 éves gyermekértékek változatlanok lesznek. Az új hosszúsági értékek 20-tól 320-ig lesznek beillesztve. A megfelelő adatértékek \_FillValues lesznek. A -40-0 gyermekértékei 320-ról 360-ra válnak. A hiányzó értékek beillesztése furcsának tűnhet, de elkerüli számos problémát, ami azt eredményezi, hogy a hosszúsági értékek hirtelen ugranak. (pl. 20 és 320 között) ...
- InkábbGenerateDatasetsXmlvan egy speciális "adatkészlet",EDDGridLon0360 ErddapCatalog, amely lehetővé teszi, hogy létrehozza adatasets.xmlMertEDDGridLon0360 adatkészletek mindegyikébőlEDDGridadatkészletek egyERDDAPolyan hosszúsági értékek, amelyek 180-nál nagyobbak. Ez megkönnyíti ezen adatkészletek két változatát: az eredeti, hosszúsági értékekkel a 0–360 tartományban, és az új adatkészlet, a hosszúsági értékek a -180-180 tartományban.
A gyermek adatkészlete minden egyesbenEDDGridLon0360 adatkészlet leszEDDGridFromErddap adatkészlet, amely az eredeti adatkészletre vonatkozik. Az új adatkészletdatasetIDlesz az eredeti adatkészlet neve, plusz "\_Lon0360". Például,
<dataset type="EDDGridLon0360" datasetID="erdMBsstdmday\\_Lon0360" active="true">
<dataset type="EDDGridFromErddap" datasetID="erdMBsstdmday\\_Lon0360Child">
<!-- SST, Aqua MODIS, NPP, 0.025 degrees, Pacific Ocean, Daytime
(Monthly Composite) minLon=-40.0 maxLon=20.0 -->
<sourceUrl>https://coastwatch.pfeg.noaa.gov/erddap/griddap/erdMBsstdmday
</sourceUrl>
</dataset>
</dataset>
Tedd le aEDDGridLon0360 adatkészlet alább az eredeti adatkészletdatasets.xml... Ez elkerüli néhány lehetséges problémát.
Alternatívaként helyettesítheti aEDDGridFromErddap gyermek adatkészlet az eredeti adatkészletteldatasets.xml... Ezután az adatkészlet csak egy verziója lesz: az egy, 0-360-on belüli hosszúsági értékekkel. Ezt azért elriasztjuk, mert vannak olyan idők, amikor az adatkészlet minden verziója kényelmesebb.
- Ha egy adatkészlet két verzióját kínálja, például egy, 0-360-as hosszúsággal, és egy hosszúsággal -180-180-as 180-as:
- Használhatja az opcionális [<hozzáférhető ViaWMS> Hamis</Csak elérhető ViaWMS>>>>>> (#Ccessibleviawms) a 0–360 adatkészlettel, hogy könnyedén letiltsa aWMSszolgáltatás erre az adatkészletre. Ezután csak az adatkészlet -180–180 verziója elérhető leszWMS...
- Van néhány módja annak, hogy a Lon0360 adatállományt naprakészen tartsa a mögöttes adatállomány változásaival:
- Ha a gyermek adatkészlete egyEDDGridFromErddap adatkészlet, amely ugyanazon adatkészletre hivatkozikERDDAP™A Lon0360 adatkészlet közvetlenül feliratkozik a mögöttes adatkészletre, hogy mindig naprakész legyen. A közvetlen előfizetések nem generálnak olyan e-maileket, amelyek arra kérik Önt, hogy érvényesítse az előfizetést - az érvényesítést automatikusan meg kell tenni.
- Ha a gyermek adatkészlete nemEDDGridFromErddap adatkészlet, amely ugyanazonERDDAP™A Lon0360 adatkészlet megpróbálja használni a rendszeres előfizetési rendszert az alapul szolgáló adatkészletre. Ha rendelkezik az előfizetési rendszerrel az ÖnbenERDDAP™fordult, meg kell kapni e-mailek kéri, hogy érvényesítse az előfizetést. Kérlek, tedd meg!
- Ha rendelkezik az előfizetési rendszerrel az ÖnbenERDDAP™Kikapcsolva, a Lon0360 adatkészlet néha elavult metaadatokkal rendelkezhet, amíg a Lon0360 adatkészletet vissza nem töltik. Tehát, ha az előfizetési rendszer le van kapcsolva, be kell állítania a [[szerkesztés]]<újratöltés MindenNMinutes>] (#reloadeveryn percek) a Lon0360 adatkészlet kisebb számra történő beállítása, így nagyobb valószínűséggel fogja elkapni a gyermek adatkészletének változásait.
EDDGridLon0360 csontváz XML
<dataset type="EDDGridLon0360" datasetID\="..." active\="..." >
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1. For
EDDGridFromDap, this gets the remote .dds and then gets the new
leftmost (first) dimension values. -->
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaWMS>...</accessibleViaWMS> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<nThreads>...</nThreads> <!-- 0 or 1 -->
<dimensionValuesInMemory>...</dimensionValuesInMemory> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<dataset>...</dataset> <!-- The child EDDGrid dataset. -->
</dataset>
EDDGridSideBySide
EDDGridSideBySide aggregál két vagy többEDDGridadatkészletek (gyerekek) oldalról oldalra.
- Az ebből eredő adatkészlet minden változóval rendelkezik az összes gyermek adatkészletből.
- A szülői adatkészlet és az összes gyermek adatkészlet MUST eltérődatasetIDS. Ha a család bármely neve pontosan ugyanaz, az adatkészlet nem terheli (a hibaüzenet, hogy az összesített tengely értékei nem rendezett rendben vannak) ...
- Minden gyereknek ugyanaz a forrásértéke vanaxisVariables\[1+\] (Például a magasság, a hosszúság) ... A vizsgálat pontosságát a tesztelés határozza megAxisNDigits...
- A gyerekeknek különböző forrásértékei lehetnekaxisVariables\[0 0\] (például az idő) De általában nagyjából ugyanazok.
- A szülői adatkészlet úgy tűnik, hogy az összesaxisVariables\[0 0\]forrásértékek az összes gyermektől.
- Például ez lehetővé teszi, hogy egy forrásadatot egy vektor komponensével és egy másik forrásadatot egy vektor v-komponensével kombináljon, így a kombinált adatok szolgálhatnak.
- A módszer által létrehozott gyermekeket magántulajdonban tartják. Nem külön hozzáférhető adatkészletek (például az ügyféladatkérések vagy azzászló fájlok) ...
- A világméretű metaadat és a szülői beállítások a globális metaadatból származnak, és az első gyermek beállít ásai.
- Ha van egy kivétel az első gyermek létrehozása közben, a szülő nem jön létre.
- Ha van egy kivétel, miközben más gyerekeket hozunk létre, ez egy e-mailt küld az EverythingTo-nak. (a megadottsetup.xml) és folytatódik a többi gyerekkel.
EDDGridSideBySide csontváz XML
<dataset type="EDDGridSideBySide" datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaWMS>...</accessibleViaWMS> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<matchAxisNDigits>...</matchAxisNDigits> <!-- 0 or 1 -->
<nThreads>...</nThreads> <!-- 0 or 1 -->
<dimensionValuesInMemory>...</dimensionValuesInMemory> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<dataset>...</dataset> <!-- 2 or more -->
</dataset>
EDDGridAggregateExistingDimenzió
EDDGridAggregateExistingDimenzió aggregál két vagy többEDDGridadatkészletek, amelyek mindegyike különböző értékek az első dimenzió, de azonos értékek a többi dimenzióban.
- Például egy gyermek adatkészletnek 366 értéke lehet (2004-re) az idő dimenziója és egy másik gyermeknek 365 értéke lehet (2005-re) az idő dimenziója.
- Az összes többi dimenzió értéke (Például a magasság, a hosszúság) MUST legyen azonos minden gyermek számára. A vizsgálat pontosságát a tesztelés határozza megAxisNDigits...
- Osztott dimenziós értékek - Az értékek minden dimenzióban MUST lehet rendezett rendben (Felemelkedés vagy leszármazás) ... Az értékek szabálytalanul helyreállhatnak. Nem lehetnek kapcsolatok. Ez a követelmény aCF metaadat szabvány... Ha bármely dimenzió értéke nem rendezett rendben van, az adatkészlet nem lesz betöltve ésERDDAP™azonosítja az első fel nem szorított értéket a logfájlban, bigParentDirectory[szerkesztés] /logs/log.txt .
A nem szorított dimenziós értékek szinte mindig problémát jelentenek a forrásadatokkal. Ez a leggyakrabban akkor fordul elő, amikor egy tévhit vagy nem megfelelő fájl szerepel a gyülekezetben, ami egy szorulatlan idő dimenzióhoz vezet. A probléma megoldásához lásd a hibaüzenetetERDDAP™log.txt fájl, hogy megtalálja a megsértő időértéket. Ezután nézze meg a forrásfájlokat, hogy megtalálja a megfelelő fájlt (vagy egy előtt vagy után) ez nem tartozik a gyülekezetbe.
- A szülői adatkészlet és a gyermek adatkészlete eltérődatasetIDS. Ha a család bármely neve pontosan ugyanaz, az adatkészlet nem terheli (a hibaüzenet, hogy az összesített tengely értékei nem rendezett rendben vannak) ...
- Jelenleg a gyermek adatkészlete MUST lehet egyEDDGridFromDap adatkészlet és MUST van a legalacsonyabb értékek az összesített dimenzió (általában a legrégebbi időértékek) ... Az összes többi gyereknek szinte azonos adatkészletnek kell lennie (különbözik csak az első dimenzió értékeiben) és csak sajátjuk határozza megsourceUrl...
- Az összesített adatkészlet az első gyermektől kapja a metaadatát.
- AGenerateDatasets Xml programdurva tervezetet készíthetdatasets.xmlegyEDDGridAggregateExistingDimension egy sor fájl alapján, amelyet egyHyraxvagy THREDS szerver. Például használja ezt a bemenetet a programhoz (az URL "1988" példája gyorsabb) :
EDDType? EDDGridAggregateExistingDimension
Server type (hyrax, thredds, or dodsindex)? hyrax
Parent URL (for example, for hyrax, ending in "contents.html";
for thredds, ending in "catalog.xml")
? https://opendap.jpl.nasa.gov/opendap/ocean\\_wind/ccmp/L3.5a/data/
flk/1988/contents.html
File name regex (for example, ".\\*\\.nc")? month.\\*flk\\.nc\\.gz
ReloadEveryNMinutes (for example, 10080)? 10080
Használhatja az eredményt<sourceUrl> címkék vagy törölje őket, és kommentálja a<sourceUrl> címke (így az új fájlokat minden alkalommal észreveszik, amikor az adatkészletet újratöltik.
EDDGridAggregateExistingDimension csontváz XML
<dataset type="EDDGridAggregateExistingDimension" datasetID\="..."
active\="..." >
<dataset>...</dataset> <!-- This is a regular EDDGridFromDap dataset
description child with the lowest values for the aggregated
dimensions. -->
<sourceUrl>...</sourceUrl> <!-- 0 or many; the sourceUrls for
other children. These children must be listed in order of
ascending values for the aggregated dimension. -->
<sourceUrls serverType="..." regex="..." recursive="true"
pathRegex\=".\"
>https://someServer/someDirectory/someSubdirectory/catalog.xml</sourceUrls>
<!-- 0 or 1. This specifies how to find the other children,
instead of using separate sourceUrl tags for each child. The
advantage of this is: new children will be detected each time
the dataset is reloaded. The serverType must be "thredds",
"hyrax", or "dodsindex". An example of a regular expression (regex) (tutorial) is .\\.nc
recursive can be "true" or "false".
Only directory names which match the
<pathRegex>
(default=".\*") will be accepted.
A thredds catalogUrl MUST include "/thredds/catalog/".
An example of a thredds catalogUrl is
https://thredds1.pfeg.noaa.gov/thredds/catalog/Satellite/aggregsatMH/
chla/catalog.xml
An example of a hyrax catalogUrl is
https://opendap.jpl.nasa.gov/opendap/allData/ccmp/L3.5a/monthly/
flk/1988/contents.html
An example of a dodsindex URL is
https://opendap.jpl.nasa.gov/opendap/GeodeticsGravity/tellus/L3/mascon/RL06/JPL/v02/CRI/netcdf/contents.html
(Note the "OPeNDAP logo at the top of the page.)
When these children are sorted by filename, they must be in
order of ascending values for the aggregated dimension. -->
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaWMS>...</accessibleViaWMS> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<matchAxisNDigits>...</matchAxisNDigits> <!-- 0 or 1 -->
<nThreads>...</nThreads> <!-- 0 or 1 -->
<dimensionValuesInMemory>...</dimensionValuesInMemory> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
</dataset>
EDDGridMásolás
EDDGridMásolás létrehozza és fenntartja a másik helyi másolatátEDDGridAz adatok és szolgálja az adatokat a helyi másolatból.
- EDDGridMásolás (és a mesés adatok esetében,EDDTableCopy) nagyon könnyen használható és nagyon hatékony
megoldás néhány legnagyobb probléma az adatok távoli adatforrásból történő kiszolgálásával:
- A távoli adatforrásból származó adatokhoz való hozzáférés lassú lehet.
- Lassú lehet, mert őszintén lassú (például egy nem hatékony típusú szerver) ,
- mert túl sok kérés túlterhelt,
- vagy mert a szerver vagy a távoli szerver korlátozott a sávszélesség.
- A távoli adatkészlet néha nem elérhető (ismét, különböző okok miatt) ...
- Az adatok egyik forrására való támaszkodás nem mérlegeli jól (Például, amikor sok felhasználó és sokERDDAPHasználja) ...
- A távoli adatforrásból származó adatokhoz való hozzáférés lassú lehet.
- Hogyan működik -EDDGridA másolat ezeket a problémákat automatikusan megoldja és fenntartja az adatok helyi másolatát, és adatokat szolgáltat a helyi másolatból.ERDDAP™nagyon gyorsan szolgálhat a helyi másolatból származó adatokat. És a helyi másolat megkönnyíti a terhet a távoli szerveren. És a helyi másolat az eredeti mentés, amely hasznos abban az esetben, ha valami történik az eredeti.
Nincs semmi új az adatkészlet helyi másolatának elkészítéséről. Mi az új itt, hogy ez az osztály teszi\*könnyű\*létrehozni és létrehozni\*Fenntartás\*az adatok helyi másolata egy\*változat\*távoli adatforrások és\*Metaadat\*az adatok másolása közben.
- Adatgyűjtés -EDDGridA másolat az adatok helyi másolatát azáltal teszi, hogy a távoli adatcsomagokat kéri<adatkészlet> Lesz egy darab a baloldal minden értékére (először) axis változó.EDDGridA másolat nem támaszkodik a távoli adatkészlet indexszámára a tengelyre - ezek változhatnak.
FIGYELMEZTETÉS: Ha egy darab adat mérete olyan nagy (> > > > 2GB) ez problémákat okoz,EDDGridA másolat nem használható. (Sajnáljuk, reméljük, hogy megoldást találunk erre a problémára a jövőben.)
- \[alternatívaEDDGridMásolás - Ha a távoli adatok letölthető fájlokon keresztül érhetők el, nem webes szolgáltatás, használatHúsvét FromUrl opcióEDDGridFájlok, amely helyi másolatot készít a távoli fájlokról, és szolgálja az adatokat a helyi fájlokból.\]
- Helyi fájlok - Az adatok minden része külön tárolódikNetCDFfájl egy aláírásban bigParentDirectory[szerkesztés] /copy/ datasetID / (a megadottsetup.xml) ... A tengelyértékekből létrehozott tüzelőanyagokat módosítják, hogy fájlnév-biztonságot hozzanak létre (Például a hyphenseket "x2D" helyettesíti) - ez nem befolyásolja a tényleges adatokat.
- Új adatok - Minden alkalommalEDDGridA másolatot újratöltik, ellenőrzi a távoli<adatkészlet> megnézni, hogy milyen zsákok állnak rendelkezésre. Ha a fájl egy darab adat nem létezik, a kérés, hogy a zsákmány hozzáadott egy sor.ERDDAP„Thread feldolgozza az összes megkeresett kérelmet az adatcsomagok, egy-egy. Láthatja a statisztikákat a Thread tevékenységéhezStatus oldalés aNapi jelentés... (Igen,ERDDAP™több feladatot rendelhetne erre a folyamatra, de ez sok távoli adatforrás sávszélességét, memóriáját és CPU időt használna, és sok helyiERDDAP"Sávszélesség, memória és CPU idő, amelyek egyike sem jó ötlet.)
MEGJEGYZÉS: Az első alkalomEDDGridA másolatot betöltik, (ha minden jól megy) Számos adatkérés kerül hozzáadásra a feladathozHárom sorrendje, de nem hoztak létre helyi adatfájlokat. Tehát a konstrukció kudarcot vall, de a feladatThread továbbra is dolgozik, és létrehozza a helyi fájlokat. Ha minden jól megy, a feladatThread néhány helyi adatfájlot készít, és a következő kísérletet, hogy újratöltse az adatkészletet (~15 perc) sikeres lesz, de kezdetben nagyon korlátozott mennyiségű adattal.
MEGJEGYZÉS: A helyi adatkészlet után van néhány adat, és megjelenik az Ön adataibanERDDAPHa a távoli adatkészlet ideiglenesen vagy állandóan nem hozzáférhető, a helyi adatkészlet továbbra is működik.
WARNING: Ha a távoli adatkészlet nagy, és / vagy a távoli szerver lassú (Ez a probléma, nem?!) Hosszú időbe telik, hogy teljes helyi másolatot készítsen. Bizonyos esetekben a szükséges idő elfogadhatatlan lesz. Például 1 TB adatátvitel egy T1-es vonalon keresztül (0,15 GB/s) legalább 60 napot vesz igénybe, optimális körülmények között. Ráadásul sok sávszélességet, memóriát és CPU időt használ a távoli és helyi számítógépeken. A megoldás az, hogy kemény meghajtót küldjön a távoli adatok adminisztrátorához, hogy a s / ő készítsen egy példányt az adathalmazról, és elküldje a merevlemezt vissza. Használja ezt az adatokat kiindulópontként ésEDDGridA másolás hozzáadja az adatokat. (Ez egy módja annak, hogyAz Amazon EC2 Cloud Servicekezeli a problémát, bár rendszerüknek sok sávszélessége van.)
WARNING: Ha egy adott érték a baloldal számára (először) axis változó eltűnik a távoli adatkészletből,EDDGridA másolat nem töröli a helyi másolt fájlt. Ha akarod, törölheted magad.
Grid Copy ellenőrzés Adatok
Adatasets.xmlez az adatkészlet lehet egy opcionális címke
<checkSourceData>true</checkSourceData>
Az alapértelmezett érték igaz. Ha/ha hibáztatja, az adatkészlet soha nem fogja ellenőrizni a forrásadatlapot, hogy megnézze, van-e további adatok.
Csak
ElmondhatjaEDDGridMásolás, hogy készítsen egy másolatot a forrásadatkészlet, ahelyett, hogy a teljes forrásadat, azáltal, hogy hozzá egy címke formájában<JustSince> Néhány Érték </onlySince> az adatkészlethezdatasets.xmlcunk.EDDGridA másolat csak az első dimenzió értékeivel kapcsolatos adatértékeket fogja letölteni (általában az idő dimenziója) ami nagyobb, mint Néhány Érték ... Néhány Érték lehet:
-
A relatív idő, amelyet anow- nUnits ... Például,<JustSince>now-2 év</onlySince> azt mondja az adatkészletnek, hogy csak helyi másolatokat készítsen az adatokhoz, ahol a külső dimenzió értékei (rendszerint időértékek) az elmúlt 2 évben (amely minden alkalommal újraértékelődik, az adatkészletet újratöltik, ami az, amikor új adatokat keres másolni) ... Lásd:now- nUnits Szintax leírás... Ez akkor hasznos, ha az első dimenziónak van időadata, amit általában tesz.
EDDGridA másolat nem törli azokat a helyi adatfájlokat, amelyeknek idővel adatai vannak, idősebbek lesznek, mintnow- nUnits ... E fájlokat bármikor törölheti, ha úgy dönt. Ha igen, akkor erősen javasoljuk, hogy állítson be egyzászlóMiután törölte a fájlokat, hogy elmondjaEDDGridMásolja a csípett fájlok listájának frissítését.
-
Az ISO 8601 sztringként meghatározott időben rögzített pontyyyy-MM-ddTHH:mm:ssZ... Például,<JustSince>2000-01-01T00:00Z</onlySince> csak az adatkészletet mondja el, hogy olyan helyi adatmásolatokat készítsen, ahol az első dimenzió értéke \>=2000-01-01T00:00Z. Ez akkor hasznos, ha az első dimenziónak van időadata, amit általában tesz.
-
Egy lebegő pontszám. Például,<JustSince>946684800.0</onlySince> Az egységek lesznek az első dimenzió úti egységei. Például az idő dimenziók esetében az egységekERDDAP™mindig"seconds since 1970-01-01T00:00:00Z"... 946684800.0"seconds since 1970-01-01T00:00:00Z"egyenértékű a 2000-01-01T00:00Z. Ez mindig hasznos lehetőség, de különösen hasznos, ha az első dimenziónak nincs időadata.
EDDGridCopy Recomended használat
- Hozzon létre<adatkészlet> Belépés (az őshonos típus, nemEDDGridMásolás) a távoli adatforráshoz. Szerezd megfelelően, beleértve az összes kívánt metaadatot is.
- Ha túl lassú, add hozzá az XML kódot, hogy csomagolja be egyEDDGridMásolási adatkészlet.
- Használjon mástdatasetID (talán megváltoztatvadatasetIDa régidatasetIDkissé) ...
- Másolja a<hozzáférhető>>,<ReloadEveryNMinutes> és<onChange> távolrólEDDGridXML aEDDGridCopy XML. (ÉrtékeikEDDGridMásolási anyag; a belső adatkészlet értékei irrelevánsak.)
- ERDDAP™az adatok helyi másolatát készíti és tartsa fenn.
- WARNING:EDDGridA másolás azt feltételezi, hogy az egyes részegek adatértékei soha nem változnak. Ha / ha megteszik, manuálisan törölnie kell a chunk fájlokat bigParentDirectory[szerkesztés] /copy/ datasetID / amely megváltozott észászlóaz adatkészletet újra kell tölteni, hogy a törölt darabokat lecseréljék. Ha van egy e-mail előfizetése az adatkészlethez, akkor két e-mailt kap: az egyik, amikor az adatkészlet először újratölti és elkezdi másolni az adatokat, és egy másik, amikor az adatkészlet ismét betölti (automatikusan) és észleli az új helyi adatfájlokat.
- Minden tengelyértéknek egyenlőnek kell lennie. Minden tengelyre, kivéve a baloldalt (először) Az összes értéknek egyenlőnek kell lennie minden gyermek számára. A vizsgálat pontosságát a tesztelés határozza megAxisNDigits...
- Beállítások, Metadata, változók -EDDGridA másolat a zárt forrásadatból származó beállításokat, metaadatokat és változókat használja.
- Metadata megváltoztatása - Ha meg kell változtatniaddAttributesvagy megváltoztatja a forrásadatokkal kapcsolatos változók sorrendjét:
- Változtasd megaddAttributesa forrásadatkészlethezdatasets.xmlszükség szerint.
- Törölje az egyik másolt fájlt.
- Állj be egyzászlóaz adatkészlet azonnali újratöltéséhez. Ha egy zászlót használ, és e-mail előfizetése van az adatkészlethez, két e-mailt kap: az egyik, amikor az adatkészlet először visszatölti és elkezdi másolni az adatokat, és egy másik, amikor az adatkészlet ismét betöltődik (automatikusan) és észleli az új helyi adatfájlokat.
- A törölt fájlt az új metaadatokkal fogják regenerálni. Ha a forrásadatbázis valaha elérhető, azEDDGridA másolási adatkészlet metaadatot kap a regenerált fájlból, mivel ez a legfiatalabb fájl.
EDDGridMásolási csontváz XML
<dataset type="EDDGridCopy" datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaFiles>true|false(default)</accessibleViaFiles>
<!-- 0 or 1 -->
<accessibleViaWMS>...</accessibleViaWMS> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<matchAxisNDigits>...</matchAxisNDigits> <!-- 0 or 1 -->
<fileTableInMemory>...</fileTableInMemory> <!-- 0 or 1 (true or false
(the default)) -->
<checkSourceData>...</checkSourceData> <!-- 0 or 1 -->
<onlySince>...</onlySince> <!-- 0 or 1 -->
<dataset>...</dataset> <!-- 1 -->
</dataset>
EDDTableFromCassandra
EDDTableFromCassandra adatokat kezel egybőlCassandraasztal. A Cassandra egy NoSQL adatbázis.
- ERDDAP™Cassandra v2-vel és v3-val dolgozhat a beállítások változásai vagy különbségei nélkül. TeszteltünkCassandra v2 és v3 Apache... Valószínű, hogyERDDAP™Cassandra-val is dolgozhat a DataStax-ból.
- Aug 2019 - május 2021, baj volt, hogy Cassandra dolgozni AdoptOpenJdkJavav8. Ez egy EXCEPTION\_ACCESS\_VIOLATION-t vezetett be. De most (2021 május) Ez a probléma eltűnt: sikeresen használhatjuk a Cassandra v2.1.22-et és az AdoptOpenJdk jdk8u292-b10-et.
Egy asztal
A Cassandra nem támogatja a "joins"-t abban, ahogyan a kapcsolati adatbázisok teszik. EgyetlenERDDAP™EDDTableFromCassandra adatkészlet térképek egy (talán egy aljzat) Cassandra asztal.
Cassandradatasets.xml
- ERDDAP™jön a CassandraJavasofőr, így nem kell külön telepíteni.
- Óvatosan olvassa el a dokumentum összes információját az EDDTableFromCassandra-ról. Néhány részlet nagyon fontos.
- A CassandraJavaA sofőr az Apache Cassandra-val dolgozik (1.2+) DataStax Enterprise (3.1+) ... Ha Apache Cassandra 1.2.x-t használ, szerkesztenie kell a cassandra.yaml fájlt minden csomó számára, hogy beállítsa az induló\_transportot: igaz, majd indítsa újra az egyes csomópontokat.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti azt, hogy finomhangolja azt (különösen [<partíció KeySourceNames>] (#partitionkeysourcenames) ). Összegyűjtheti az XML létrehozásához szükséges információkat az EDDTableFromCassandra adatkészlethez, kapcsolatba lépve a Cassandra adminisztrátorral és az internet keresésével.
GenerateDatasets Az Xml-nek két speciális lehetősége van az EDDTableFromCassandra számára:
- Ha belépsz "!!!LIST!!!" (idézetek nélkül) a kulcstér számára a program megjeleníti a kulcsszók listáját
- Ha belép egy konkrét kulcstérbe, majd lépjen be a "!!!LIST!!!" (idézetek nélkül) az asztalnév számára a program megjeleníti az asztalok listáját a kulcstérben és az oszlopokban.
Eset érzékenység
- Az eset-érzékeny kulcstér és asztali nevek - Cassandra kezeli a kulcstér és az asztal nevek egy eset-érzékeny módon. Emiatt soha nem használsz fenntartott szót (más esetekkel,) Cassandra kulcstérként vagy asztali névként.
- Az eset-inszenzitív oszlop nevek - Alapértelmezés szerint Cassandra eset-érzékeny módon kezeli az oszlopneveket. Ha Cassandra egyik fenntartott szavait oszlop névként haszn álja (Kérlek, ne!) Használata
<columnNameQuotes>"<columnNameQuotes>
bennedatasets.xmla Cassandra ésERDDAP™kezelni fogja az oszlop neveket esetérzékeny módon. Ez valószínűleg egy hatalmas fejfájás lesz az Ön számára, mert nehéz meghatározni az oszlopnevek érzékeny változatait - Cassandra szinte mindig az oszlopneveket mutatja, mint az összes alacsonyabb esetet, függetlenül az igaz esettől.
- szorosan együttműködik a Cassandra adminisztrátorával, akinek releváns tapasztalatai lehetnek. Ha az adatkészlet nem terheli, olvassa elhibaüzenetalaposan megtudni, miért.
Cassandra<kapcsolat Property & Gt;
Cassandra olyan kapcsolati tulajdonságokkal rendelkezik, amelyeket meg lehet határoznidatasets.xml... Ezek közül sokan befolyásolják a Cassandra-díj teljesítményétERDDAP™kapcsolat. Sajnos a Cassandra tulajdonságokat programszerűen kell beállítaniJava, ígyERDDAP™kódot kell tartalmaznia minden ingatlan számáraERDDAP™támogatás. Jelenleg,ERDDAP™támogatja ezeket a tulajdonságokat: (Az alapértelmezettek az, amit látunk. A rendszer alapjai eltérőek lehetnek.)
- Általános lehetőségek
<kapcsolat Tulajdonos neve=" tömörítés ">>> Nem|LZ4|Snappy </összeköttetés Tulajdonság> (eset-insensitive, default=none)
(Általános tömörítési tanács: „nem” használat, ha a Cassandra ésERDDAP™helyi/gyors és használja az LZ4-et, ha a kapcsolat távoli/lassú.)
<kapcsolat Tulajdonos neve=" hitelesítő anyagok ">>> felhasználónév/password </összeköttetés Tulajdonság> (Ez egy szó szerinti'/')
<kapcsolat Tulajdonos neve=" metrikák ">>> Igaz|hamis </összeköttetés Tulajdonság> (2021-01-25 volt alapértelmezett=igaz, most figyelmen kívül hagyták és mindig hamis)
<kapcsolat Tulajdonos neve=" port ">>> anIntegrátor </összeköttetés Tulajdonság> (natív bináris protokoll alapértelmezése=9042)
<kapcsolat Tulajdonos neve=" Súgó ">>> Igaz|hamis </összeköttetés Tulajdonság> (Default=false)
(A gyors próbálkozásom, hogy a ssl sikertelen legyen. Ha sikerül, mondd el nekem, hogyan csináltad.) - Kérdés Opciók
<kapcsolat Tulajdonos neve=" következetesség Szint ">>> Minden|Minden|Minden \_quorum|helyi\_one|Helyi \_quorum|helyi\_serial|Egy|kvórum|Serial|három|kettő </összeköttetés Tulajdonság> (eset-insensitive, default=ONE)
<kapcsolat Tulajdonos neve=" fetchSize ">>> anIntegrátor </összeköttetés Tulajdonság> (default=5000)
(Ne állítsa be a fetchSize-t kisebb értékre.)
<kapcsolat Tulajdonos neve=" dalszöveg: SerialConsistencyLevel ">>> Minden|Minden|Minden \_quorum|helyi\_one|Helyi \_quorum|helyi\_serial|Egy|kvórum|Serial|három|kettő </összeköttetés Tulajdonság> (eset-insensitive, default=SERIAL) - Socket Opciók
<kapcsolat Tulajdonos neve=" connectTimeoutMillis ">>> anIntegrátor </összeköttetés Tulajdonság> (default=5000)
(Ne állítson összeköttetést TimeoutMillis egy kisebb értékre.)
<kapcsolat Tulajdonos neve=" Tartalom ">>> Igaz|hamis </összeköttetés Tulajdonság> <kapcsolat Tulajdonos neve=" dalszöveg: TimeoutMillis ">>> anIntegrátor </összeköttetés Tulajdonság> (Cassandra alapértelmezett olvasmányaTimeoutMillis 12000, deERDDAP™megváltoztatja az alapértelmezettet 120000-re. Ha Cassandra az olvasásTimeouts-ot dobja, akkor ez nem segíthet, mert Cassandra néha ezt megelőzi. A probléma valószínűbb, hogy túl sok adatot tárolsz partíciónként Kulcs kombináció.)
<kapcsolat Tulajdonos neve=" GetBufferSize ">>> anIntegrátor </összeköttetés Tulajdonság> (Nem világos, hogy mi az alapértelmezett GetBufferSize. Ne állítsa be ezt egy kis értékre.)
<kapcsolat Tulajdonos neve=" SoLinger ">>> anIntegrátor </összeköttetés Tulajdonság> <kapcsolat Tulajdonos neve=" tcpNoDelay ">>> Igaz|hamis </összeköttetés Tulajdonság> (Default=null)
Ha más kapcsolati tulajdonságokat kell beállítania, lásd a miénketrész további támogatás megszerzéséről...
A Tomcat egy adott startupja esetében a kapcsolatfeltételeket csak az első alkalommal használják, amikor egy adatkészletet hoznak létre egy adott Cassandra URL-hez. Mindezek az adatkészletek és az összes későbbi adatkészletek, amelyek ugyanazt az URL-t osztják, ezeket az eredeti kapcsolatfeltételeket fogják használni.
CQL
Cassandra Query Nyelv (CQL) felületesen olyan, mint az SQL, a hagyományos adatbázisok által használt lekérdezési nyelv. MertOPeNDAP„A mesés adatok kéréseit az SQL mesés adatok kéréseire tervezték, lehetséges, hogyERDDAP™a tabuláris adatkérelmek CQL Bound/PreparedStatements-be történő átalakítása.ERDDAP™bejelenti a nyilatkozatotLog.txtmint
szövegkénti nyilatkozat: TheStatementAsText
Az Ön által látott nyilatkozat változata a nyilatkozat szöveges képviselete lesz, és csak "?", ahol a korlátozott értékek kerülnek elhelyezésre.
Nem olyan egyszerű - Sajnos a CQL-nak számos korlátozása van, amelyen az oszlopok lekérdezhetők, például a partíciós kulcsfontosságú oszlopokat lehet korlátozni = és IN, ígyERDDAP™bizonyos korlátozásokat küld Cassandra-nak, és minden korlátozást alkalmaz, miután az adatok Cassandra-ból érkeztek. SegítségERDDAP™hatékonyan kezelje a Cassandrát, meg kell határoznia [<partíció KeySourceNames>] (#partitionkeysourcenames) [[szerkesztés]]<clusterColumnSourceNames> (#clustercolumnsourcenames) és [<indexColumnSourceNames> (#indexcolumnsourcenames) bennedatasets.xmlehhez az adatkészlethez. Ezek a legfontosabb módja annak, hogy segítsünkERDDAP™hatékonyan működik Cassandra-val. Ha nem mondodERDDAP™ez az információ, az adatkészlet fájdalmasan lassú leszERDDAP™és használjon tonna Cassandra erőforrásokat.
<partíció KeySourceNames & Gt;
Mivel a partíciós kulcsok központi szerepet játszanak a Cassandra asztalokban,ERDDAP™tudni kellsourceNames és ha releváns, egyéb információk arról, hogyan kell velük dolgozni.
- Ön MUST határozza meg a részecskék fő forráskódú oszlop nevek kombinációs elválasztott listájátdatasets.xmlkeresztül<partíció KeySourceNames>. Egyszerű példa,
<partitionKeySourceNames>station, deviceid<partitionKeySourceNames>
Összetettebb példa,
<partitionKeySourceNames>deviceid=1007, date/sampletime/1970-01-01<partitionKeySourceNames>
- TimeStamp Partition kulcsok - Ha az egyik partíciós kulcsoszlop egy olyan ütemes oszlop, amely egy másik ütemes oszlop koarser verziójával rendelkezik, ezt megadja
PartitionKeySourcName/OtherColumnSourceName/time\_precision
aholtime\_precisionaz egyik aztime\_precisionmáshol használt húrokERDDAP... A Z nyomvonal atime\_precisiona húr az alapértelmezett, így nem számít, ha atime\_precisionA sztring vége Z-ben vagy sem. Például,ERDDAP™tolmácsolja a dátumot/mintaidő/1970-01-01 "A dátumra vonatkozó korlátozásokat a mintavételi korlátozásokból lehet felépíteni, ezzeltime\_precision» A korlátok tényleges átalakítása bonyolultabb, de ez az áttekintés. Használja ezt, amikor releváns. Ez lehetővé tesziERDDAP™hatékonyan dolgozzon Cassandrával. Ha az oszlopok közötti kapcsolat létezik egy Cassandra asztalnál, és nem mondodERDDAP™Az adatkészlet fájdalmasan lassú leszERDDAP™és használjon tonna Cassandra erőforrásokat. - Egyedül Value Partition Keys - Ha akarsz egyetERDDAP™adatkészlet, hogy csak egy értékű egy partíciós kulcs, meghatározott partitionKeySourceName=érték ... Ne használjon idézeteket egy numerikus oszlophoz, például az eszközid=1007 Használjon idézeteket egy String oszlophoz, például a Stid="Point Pinos"
- Dataset Default Sort Order -- A partíciós kulcs rendje<dataVariable> adatasets.xmlmeghatározza a Cassandra eredményeinek alapértelmezett rendezését. Természetesen a felhasználók más típusú megrendelést kérhetnek egy adott eredménykészlethez a jóváhagyással ésorderBy ("..." Comma-elválasztott lista a változókról "...") lekérdezésük végére.
- Alapértelmezett, Cassandra ésERDDAP™kezelje az oszlop neveket eset-érzékeny módon. De ha beállítottadoszlopNameQuotes",ERDDAP™kezelni fogja a Cassandra oszlop neveket eset-érzékeny módon.
<partíció KeyCSV>
Ha ez meg van határozva,ERDDAP™használja, ahelyett, hogy Cassandra-t kérne a partícióra Minden alkalommal kulcsfontosságú információkat töltenek be az adatkészlet. Ez biztosítja a különálló partíciós kulcsértékek listáját, annak érdekében, hogy használják őket. Az időket 1970-01-01T00:00Z óta másodpercként kell meghatározni. De van még két különleges alternatív módja annak, hogy meghatározza az időket (minden kódolt, mint egy sztring) :
- idő (aISO8601 Idő) (MAY kódolva, mint egy sztring)
- „idők (anISO8601StartTime, strideSeconds, stopTime) "..." (MUST kódolva, mint egy sztring)
Megáll Az idő lehet ISO8601 Idő vagy egy "now-nUnits" idő (pl.: "now-3 perc”) ... Megáll Az időnek nem kell pontos mérkőzésnek lennie a kezdéshez Idő + x strideSeconds. Egy sor egy alkalommal () az érték több sorba kerül minden lekérdezés előtt, így a partíció listája A kulcsok mindig tökéletesen naprakészek lehetnek. Például,
<partitionKeyCSV>
deviceid,date
1001,"times(2014-11-01T00:00:00Z, 86400, 2014-11-02T00:00:00Z)"
1007,"time(2014-11-07T00:00:00Z)"
1008,time(2014-11-08T00:00:00Z)
1009,1.4154912E9
</partitionKeyCSV>
bővül a partíciós kulcskombinációk ebbe az asztalba:
deviceid,date
1001,1.4148E9
1001,1.4148864E9
1007,1.4153184E9
1008,1.4154048E9
1009,1.4154912E9
<clusterColumnSourceNames & gt;
Cassandra elfogadja az SQL-szerű korlátokat a klaszteroszlopokra, amelyek az elsődleges kulcs második részét képező oszlopok. (a partíciós kulcs után (s) ) ... Tehát elengedhetetlen, hogy azonosítsa ezeket az oszlopokat keresztül<clusterColumnSourceNames>. Ez lehetővé tesziERDDAP™hatékonyan dolgozzon Cassandrával. Ha vannak klaszter oszlopok, és nem mondodERDDAPAz adatkészlet fájdalmasan lassú leszERDDAP™és használjon tonna Cassandra erőforrásokat.
- Például,<clusterColumnSourceNames> myClusterColumn1, myClusterColumn2 </clusterColumnSourceNames>
- Ha egy Cassandra asztalnak nincs klaszteres oszlopa, vagy nem adja meg<clusterColumnSourceNames>, vagy úgy határozza meg, hogy nincs értéke.
- Alapértelmezett, Cassandra ésERDDAP™kezelje az oszlop neveket eset-érzékeny módon. De ha beállítottadoszlopNameQuotes",ERDDAP™kezelni fogja a Cassandra oszlop neveket eset-érzékeny módon.
<indexColumnSourceNames & gt;
Cassandra elfogadja'='a másodlagos index oszlopokra vonatkozó korlátozások, amelyek az oszlopok, amelyeket kifejezetten létrehozott indexek segítségével
CREATE INDEX *indexName* ON *keyspace.tableName* (*columnName*);
(Igen, a parentheses szükséges.)
Tehát nagyon hasznos, ha azonosítja ezeket az oszlopokat keresztül<indexColumnSourceNames> Ez lehetővé tesziERDDAP™hatékonyan dolgozzon Cassandrával. Ha vannak index oszlopok, és nem mondodERDDAPNéhány kérdésre szükségtelenül, fájdalmasan lassú leszERDDAP™és használjon tonna Cassandra erőforrásokat.
- Például,<indexColumnSourceNames> myIndexColumn1, myIndexColumn2 </indexColumnSourceNames>
- Ha egy Cassandra asztalnak nincs indexoszlopa, vagy nem adja meg<indexColumnSourceNames>, vagy úgy határozza meg, hogy nincs értéke.
- WARNING: A Cassandra indexek nem szeretik az adatbázis indexeket. Cassandra indexek csak segítenek'='korlátok. Ők csakajánlottolyan oszlopok esetében, amelyek sokkal kevesebb különböző értékkel rendelkeznek, mint a teljes értékek.
- Alapértelmezett, Cassandra ésERDDAP™kezelje az oszlop neveket eset-érzékeny módon. De ha beállítottadoszlopNameQuotes",ERDDAP™kezelni fogja a Cassandra oszlop neveket eset-érzékeny módon.
<maxRequestFraction & gt;
MikorERDDAP™ (Újra) betölti az adatkészletet,ERDDAP™Cassandra-ból származik a partíciós kulcsok különböző kombinációinak listája. Hatalmas adatkészlet esetében a kombinációk száma hatalmas lesz. Ha meg akarja akadályozni a felhasználók kérését a legtöbb vagy az összes adatkészlet kérésétől (vagy akár egy kérés, amely kérERDDAP™letölteni a legtöbbet vagy az összes adatot annak érdekében, hogy tovább szűrje) ElmondhatodERDDAP™csak olyan kérelmek engedélyezése, amelyek csökkentik a kombinációk számát valamilyen mennyiséggel<maxRequestFraction>, amely egy lebegő pontszám 1e-10 között (ami azt jelenti, hogy a kérelem nem igényelhet több mint 1 kombinációt egy milliárdban) és 1 (az alapértelmezettség, ami azt jelenti, hogy a kérés lehet az egész adatkészlet számára) ... Például, ha egy adatkészlet 10000 különböző kombinációval rendelkezik a partíciós kulcsok és a maxRequestFraction 0,1-re kerül sor, olyan kérelmek, amelyeknek 1001 vagy több kombinációra van szükségük, hibaüzenetet fognak generálni, Azok a kérések, amelyeknek 1000 vagy kevesebb kombinációból származó adatokra van szükségük.
Általában a nagyobb adatkészlet, az alacsonyabb, amit be kell hozni<maxRequestFraction>. Tehát egy kis adatkészletre, 0,1-re állíthatja be egy közepes méretű adatkészletre, 0,01-re egy nagy adatkészletre, és 0.0001-re egy hatalmas adatkészletre.
Ez a megközelítés messze nem tökéletes. Néhány ésszerű kéréshez vezet, amelyeket elutasítanak, és néhány túl nagy kérést engedélyeznek. De ez egy nehéz probléma, és ez a megoldás sokkal jobb, mint semmi.
CassandrasubsetVariables
Mint más EDDTable adatkészletekkel, megadhatja a Comma-elválasztott listáját<dataVariable> > > >destinationNames egy globális attribútumban, amelyet "subsetVariables„A változók azonosítása, amelyek korlátozott számú értékkel rendelkeznek. Az adatkészletnek ezután .subset weboldala lesz, és különböző értékek listáját jeleníti meg az e változók számára számos weboldalon.
A listán szereplő csak partíciós kulcsváltozatok és statikus oszlopok bevonása STRONGLY ENCOURAGED. Cassandra képes lesz arra, hogy a listát a különböző kombinációk nagyon gyorsan és könnyen minden alkalommal, amikor az adatkészletet újratöltik. Az egyik kivétel az időbélyegző partíciós kulcsok, amelyek más ütemű oszlop társuló verziói - valószínűleg a legjobb, ha ezeket kihagyjuk a listából.subsetVariablesMivel számos értéke van, és nem nagyon hasznosak a felhasználók számára.
Ha tartalmazza a nem partíciós kulcsot, a nem statikus változókat a listában, akkor valószínűleg nagyon számításszerűen drága Cassandra számára minden alkalommal, amikor az adatkészletet újratöltik, mertERDDAP™meg kell vizsgálnia az adatkészlet minden sorát, hogy létrehozza az információkat. Valójában a lekérdezés valószínűleg kudarcot vall. Tehát, kivéve a nagyon kis adatkészletek, ez a STRONGLY DISCOURAGED.
Cassandra DataTypes
Mert van néhány kétértelműség arról, hogy melyikCassandra adattípusoktérkép, amelyreERDDAP™adattípusok, meg kell határozni egy [<adatType>] (#datatype) Minden [[Ki]]]<dataVariable>>>>>> (#datavariable) Mondd elERDDAP™melyik adattípust kell használni. A szabványERDDAP™adatok típusok (és a leggyakoribb megfelelő Cassandra adattípusok) a következők:
- boolean (boolean) AmelyERDDAP™Ezután áruházak, mint bytes
- byte (int, ha a tartomány -128-127)
- rövid (int, ha a tartomány -32768-32767)
- Inkább (int, pult?, varint?, ha a tartomány -2147483648 és 2147483647)
- hosszú (bigint, pult?, varint?, ha a tartomány -9223372036854775808 922337203685478)
- Float (Float)
- dupla dupla (dupla, decimal (a pontosság lehetséges elvesztésével) , Timetamp)
- char (ascii vagy szöveg, ha soha nem rendelkeznek több mint 1 karakterrel)
- Hírek (ascii, szöveg, varchar, inet, uuid, timeuid, blokk, térkép, készlet, lista?)
CassandraTimetampkülönleges eset: használatERDDAPdupla adat típus.
Ha egy String adattípust határoz megERDDAP™egy Cassandra térképre, beállított vagy listára, a térképre, beállított vagy listára minden Cassandra sorban egyetlen sorra kerül átalakulásra egyetlen sorban.ERDDAP™asztal.ERDDAP™van egy alternatív rendszer a listák; lásd alább.
típus listák -ERDDAP[[szerkesztés]]<adatType>] (#datatype) Cassandra címkedataVariableS tartalmazhatja a rendszertERDDAP™adatok típusok (lásd fent) plusz számos speciális adatTypes, amely használható Cassandra lista oszlopok: booleanList, byteList, ubyteList, shortList, ushortList, intList, uintList, longList, floatList, duplaList, charList, StringList. Amikor az egyik lista oszlop az eredményeket átadjákERDDAP™A forrásadatok minden sorát kiterjesztik a listára. méret () adatok sorai az adatokbanERDDAPegyszerű adatok típusok (például int) Ebben a forrásadatsorban duplikált lista lesz. méret () Idő. Ha az eredmények több mint egy listát tartalmaznak, az összes lista egy adott adatsorban azonos méretű, és MUST "parallel" listák, vagyERDDAP™hibaüzenetet fog generálni. Például az ADCP jelenlegi méréseire, mélység\[0 0\]UCurrent\[0 0\], vCurrent\[0 0\], és zCurrent\[0 0\]minden kapcsolódik, és mélység\[1\]UCurrent\[1\], vCurrent\[1\], és zCurrent\[1\]minden kapcsolódik, ... Alternatíva, ha nem akarodERDDAP™bővíteni egy listát több sorbanERDDAP™táblázat, határozza meg a Stringet, mintdataVariableadatok Típusú, hogy az egész listát az egyik csapásként ábrázoljákERDDAP...
Cassandra TimeStamp adatok
A Cassandra időbélyegző adatai mindig tisztában vannak az időzónákkal. Ha időbélyegző adatokat ad meg anélkül, hogy meghatározná az időzónát, a Cassandra feltételezi, hogy az időbélyeget a helyi időzónát használja.
ERDDAP™támogatja az időbélyegző adatokat, és mindig bemutatja az adatokatZulu/GMT időzóna. Tehát, ha a Cassandra-i időbélyegző adatokat más időzónával adja megZulu/GMT, ne feledje, hogy minden kérdést meg kell tennie az időbélyegző adatokhozERDDAP™használjaZulu/GMT időzóna. Tehát ne lepődj meg, amikor az időbélyeg értékek jönnek kiERDDAPtöbb órával változnak a helyi időzóna átállása miattZulu/GMT idő.
- InkábbERDDAPAdatasets.xml, a<dataVariable> címke egy időbélyegző változóhoz, set
<dataType>double</dataType>
és<addAttributes> beállítás
<att name="units">seconds since 1970-01-01T00:00:00Z</att>
- Javaslat: Ha az adatok egy időtartomány, hasznos, hogy az időbélyegző értékek utalnak a központja a beágyazott időtartomány (Például, nem) ... Például, ha egy felhasználónak van adatai a 2010-03-26T13:00Z-nak egy másik adatkészletből, és szeretnének a legközelebbi adatokat ebből a Cassandra adatkészletből, amely minden nap adatokkal rendelkezik, akkor a 2010-03-26T12:00Z adatai (a Cassandra adatainak bemutatása ezen időpontban) nyilvánvalóan a legjobb (mint szemben az éjfél előtt vagy után, ahol kevésbé nyilvánvaló, hogy a legjobb) ...
- ERDDAP™haszonnal rendelkezikKonvertáljon Numeric Idő / sztring idő...
- LásdHogyanERDDAP™Üzletek az idővel...
Integer nulls
Cassandra támogatja a nullákat Cassandra intben (ERDDAP™Inkább) Nagy (ERDDAP™hosszú) oszlopok, deERDDAP™nem támogatja az igazi nullákat minden integrált adattípushoz. Alapértelmezés szerint a Cassandra integráló nullák átalakulnakERDDAP™2147483647 int oszlopok, vagy 9223372036854775807 hosszú oszlopok. Ezek „NaN”-ként fognak megjelenni bizonyos típusú szövegkimeneti fájlokban (Például .csv) , "" más típusú szövegkimeneti fájlokban (például,.htmlTable) és az adott szám (2147483647 a hiányzó int értékekért) más típusú fájlokban (például bináris fájlok, mint például.ncés mat) ... A felhasználó az ilyen típusú hiányzó értékű adatsorokat keresheti a "NaN", például " & WindSpeed=NaN" -re hivatkozva.
Ha más integrált értéket használ, hogy jelezze a hiányzó értékeket a Cassandra táblában, kérjük, azonosítsa ezt az értéketdatasets.xml:
<att name="missing\_value" type="int"\>-999</att>
A Cassandra lebegő pontoszlopok esetében a nullák áttérnek a NaN-ekreERDDAP... A Cassandra-adattípusok esetében, amelyek a Strings-be kerülnekERDDAP™A nullák megtérnek az üres vonásokra. Ez nem lehet probléma.
"WARNING: A már elkészített lekérdezés újrakészítése"
- "WARNING: A már előkészített lekérdezés újrakészítése" Tomcat /logs/catalina.out (vagy más Tomcat log fájl)
Cassandra dokumentáció szerint baj van, ha ugyanazt a lekérdezést egy PreparedStatement-be sorolják (vagy többet) ... (Lásd eztbug jelentés...) Hogy elkerüljük Cassandra őrült,ERDDAP™minden PreparedStatements-t, így újra felhasználhatja őket. Ez a gyorsaság elveszett, ha/ha Tomcat/ERDDAP™újraindításra kerül, de úgy gondolom, ez rendben van, mert az PreparedStatements egy adott üléshez kapcsolódik (közöttJavaCassandra) , ami szintén elveszett. Tehát láthatja ezeket az üzeneteket. Nem ismerek más megoldást. Szerencsére figyelmeztetés, nem hiba (Bár Cassandra fenyegeti, hogy teljesítményproblémákhoz vezethet) ...
Cassandra azt állítja, hogy a PreparedStatements örökre jó, ígyERDDAP"A Cached PreparedStatements-nek soha nem szabadna naprakész / érvénytelenné válnia. Ha ez nem igaz, és hibákat kap bizonyos PreparedStatements-ről naprakész / érvénytelen, akkor újra kell indítania.ERDDAP™tisztázniERDDAP„A PreparedStatements jegyzőkönyve.
Cassandra biztonság
Amikor Cassandra-val dolgozol, a lehető legbiztonságosabban és biztonságosan kell tennie a dolgokat, hogy elkerülje, hogy egy rosszindulatú felhasználó károsítsa a Cassandrát, vagy hozzáférést szerezzen azokhoz az adatokhoz, amelyekhez nem kell hozzáférnie.ERDDAP™megpróbálja a dolgokat biztonságos módon is csinálni.
- Bátorítunk benneteket, hogy hozzon létreERDDAP™a Cassandra-hoz, mint Cassandra-felhasználóhoz való csatlakozás, amely csak hozzáférést biztosít releváns asztal (s) és csak READ kiváltságai vannak.
- Arra bátorítunk benneteket, hogy hozzátok létre a kapcsolatotERDDAP™Cassandra, hogy
- mindig használja az SSL-t,
- csak az egyik IP-címből származó kapcsolatokat engedélyezi (vagy a címek egy blokkja) az egyiktőlERDDAP™felhasználó és
- csak átadja a jelszavakat az MD5 formanyomtatványában.
- \[KNOWN PROBLEM\]A kapcsolatfeltételek (beleértve a jelszót!) egyszerű szövegként tároljákdatasets.xml... Nem találtunk módot arra, hogy az adminisztrátor belépjen a Cassandra jelszóbaERDDAPKezdőlap Tomcatban (amely felhasználói bemenet nélkül történik) Így a jelszót egy fájlban hozzáférhetőnek kell lennie. Hogy ezt biztonságosabbá tegyük:
- Te vagy (aERDDAP™adminisztr átor) legyen a tulajdonosadatasets.xmlés van READ és WRITE hozzáférés.
- Készítsen egy csoportot, amely csak felhasználó=tomcatot tartalmaz. Használja a chgrp-t, hogy a csoport legyendatasets.xmlCsak READ kiváltságokkal.
- Használja a chmod-t az o-rwx kiváltságok hozzárendeléséhez (Nincs READ vagy WRITE hozzáférés a "másik" felhasználókhoz) Mertdatasets.xml...
- MikorERDDAP™, a jelszó és más kapcsolati tulajdonságokat "magánban" tároljákJavaváltozók.
- Az ügyfelek kéréseit a Cassandra CQL-kérelmek generálása előtt pótolják és ellenőrzik.
- A Cassandra iránti kérelmek CQL Bound/PreparedStatements-rel készülnek, hogy megakadályozzák a CQL injekciót. Mindenesetre a Cassandra kevésbé érzékeny a CQL injekcióra, mint a hagyományos adatbázisok.SQL injekció...
Cassandra Speed
A Cassandra gyors vagy lassú lehet. Van néhány dolog, amit tehetünk, hogy gyorsan:
- Általános - A CQL természete az, hogy a kérdésekdeklaratív... Pontosan meghatározzák, mit akar a felhasználó. Nem tartalmaznak specifikációt vagy utalásokat arra, hogy a lekérdezést hogyan kell kezelni vagy optimalizálni. Tehát nincs módERDDAP™a lekérdezés olyan módon történő generálása, hogy segít Cassandra optimalizálni a lekérdezést (vagy bármilyen módon meghatározza, hogyan kell kezelni a lekérdezést) ... Általában a Cassandra adminisztrátortól függ, hogy felállítsa a dolgokat (Például indexek) bizonyos típusú kérdések optimalizálása.
- Az időbélyegző oszlopok specifikálása, amelyek a coarser-precision időbélyegző partíciós kulcsokhoz kapcsolódnak [<partíció KeySourceNames>] (#partitionkeysourcenames) a legfontosabb módja annak, hogy segítsünkERDDAP™hatékonyan működik Cassandra-val. Ha ez a kapcsolat egy Cassandra asztalnál létezik, és nem mondodERDDAP™Az adatkészlet fájdalmasan lassú leszERDDAP™és használjon tonna Cassandra erőforrásokat.
- A klaszter oszlopok leírása [<clusterColumnSourceNames> (#clustercolumnsourcenames) a második legfontosabb módja annak, hogy segítsenERDDAP™hatékonyan működik Cassandra-val. Ha vannak klaszter oszlopok, és nem mondodERDDAPAz adatok lehetséges kérdéseinek nagy része szükségtelenül, fájdalmasan lassú leszERDDAP™és használjon tonna Cassandra erőforrásokat.
- Készülj felIndexekközösen konstruált változók számára - Gyorsíthat néhány kérdést azáltal, hogy indexeket hoz létre a Cassandra oszlopokhoz, amelyeket gyakran "="korlátokkal" korlátoznak.
A Cassandra nem hozhat indexeket a listára, a beállításra vagy a térképes oszlopokra.
- Az index oszlopok leírása [<indexColumnSourceNames> (#indexcolumnsourcenames) fontos módja annak, hogy segítsünkERDDAP™hatékonyan működik Cassandra-val. Ha vannak index oszlopok, és nem mondodERDDAPNéhány adatkérés szükségtelenül, fájdalmasan lassú leszERDDAP™és használjon tonna Cassandra erőforrásokat.
Cassandra Stats
- "Cassandra stats" Diagnosztikus üzenetek- MindenERDDAP™felhasználó lekérdezése egy Cassandra adatkészlethez,ERDDAP™kinyomtat egy sort a logfájlban, bigParentDirectory[szerkesztés] /logs/log.txt, a lekérdezéshez kapcsolódó statisztikákkal, például
\\* Cassandra stats: partitionKeyTable: 2/10000=2e-4 < 0.1 nCassRows=1200 nErddapRows=12000 nRowsToUser=7405
A fenti példában szereplő számok használatával ez azt jelenti:
- MikorERDDAP™utolsó (Újra) betöltötte ezt az adatkészletet, mondta CassandraERDDAP™10000 különböző kombinációja volt a partíciós kulcsoknak.ERDDAP™az összes különböző kombinációt egy fájlban.
- A felhasználó korlátozásai miatt,ERDDAP™2 kombinációt azonosított az 10000-ből, amely a kívánt adatokkal rendelkezhet. Szóval,ERDDAP™2 felhívást tesz Cassandra-ra, az egyik a partíciós kulcsok mindegyik kombinációjára. (Ez az, amit Cassandra igényel.) Nyilvánvaló, hogy nehéz, ha egy nagy adatkészletnek számos kombinációja van a partíciós kulcsoknak, és egy adott kérelem nem drasztikusan csökkenti azt. Megkövetelheti, hogy minden kérelem csökkenti a kulcsterületet a beállítással [<maxRequestFraction> (#maxrequestfraction) ... Itt 2/10000=2e-4, ami kevesebb, mint a maxRequestFraction (0.1) Ezért a kérést engedélyezték.
- a korlátozások alkalmazása a partíciós kulcsokra,Klaszter oszlopokésindex oszlopokamelyet küldtekERDDAP™Cassandra visszatért 1200 sor adathozERDDAP™a ResultSetben.
- Az eredmény A beállításnak kellett volnaadatok Type= dalszöveg listaoszlopok (átlagosan 10 tétel listánként) mertERDDAP™kibővítette a 1200 sort Cassandrából 12000 sorbaERDDAP...
- ERDDAP™mindig a felhasználó összes korlátozását alkalmazza a Cassandra adataira. Ebben az esetben a Cassandra által nem kezelt korlátozások csökkentették a sorok számát 7405-re. Ez a felhasználónak küldött sorok száma.
Ezeknek a diagnosztikai üzeneteknek a legfontosabb használata az, hogy megbizonyosodjon arról, hogyERDDAP™azt csinálja, amit úgy gondolja, hogy csinál. Ha ez nem (Például nem csökkenti a várhatóan eltérő kombinációk számát?) Ezután felhasználhatja az információkat, hogy megpróbálja kitalálni, mi történik rosszul.
- Kutatás és kísérlet a jobb megtalálásához és beállításához [<kapcsolatProperty>] (#cassandra-kapcsolati tulajdon) A.
- Ellenőrizze a Cassandra és a hálózati kapcsolat sebességétERDDAP... Ha a kapcsolat lassú, nézze meg, hogy javíthatja-e. A legjobb helyzet az, amikorERDDAP™fut egy olyan szerveren, amely ugyanazhoz kapcsolódik (Gyors) kapcsolja be, mint a kiszolgáló futtatja a Cassandra csomót, amelyhez kapcsolódik.
- Kérjük, légy türelmes! Olvassa el itt és a Cassandra dokumentációban gondosan. Tapasztalat. Ellenőrizze a munkáját. Ha a CassandraERDDAP™kapcsolat még mindig lassabb, mint várni, kérjük, vegye fel a Cassandra asztal sémáját ésERDDAP™zsákmánydatasets.xmllásd a miénketrész további támogatás megszerzéséről...
- Ha minden más kudarcot vall, fontolja meg az adatok tárolását egy gyűjteménybenNetCDFv3.ncfájlok (különösen különösen.ncfájlok, amelyek aCF Discrete Sampling Geometries (DSG) Contiguous Ragged Array adatstruktúrák és így kezelhetőkERDDAPAEDDTableFromNcCFFiles) ... Ha logikailag megszervezik őket (mindegyik adat egy darab űr és idő) ,ERDDAP™nagyon gyorsan kivonhatja az adatokat tőlük.
EDDTableFromCassandra csontváz XML
<dataset type="EDDTableFromCassandra" datasetID\="..." active\="..." >
<ipAddress>...</ipAddress>
<!-- The Cassandra URL without the port number, for example,
127.0.0.1 REQUIRED. -->
<connectionProperty name="name">value</connectionProperty>
<!-- The names (for example, "readTimeoutMillis") and values
of the Cassandra properties that ERDDAP™ needs to change.
0 or more. -->
<keyspace>...</keyspace> <!-- The name of the keyspace that has
the table. REQUIRED. -->
<tableName>...</tableName> <!-- The name of the table, default = "".
REQUIRED. -->
<partitionKeySourceNames>...<partitionKeySourceNames>
<!-- REQUIRED. -->
<clusterColumnSourceNames>...<clusterColumnSourceNames>
<!-- OPTIONAL. -->
<indexColumnSourceNames>...<indexColumnSourceNames> <!-- OPTIONAL. -->
<maxRequestFraction>...<maxRequestFraction>
<!-- OPTIONAL double between 1e-10 and 1 (the default). -->
<columnNameQuotes>...<columnNameQuotes> <!-- OPTIONAL.
Options: \[nothing\] (the default) or ". -->
<sourceNeedsExpandedFP\_EQ>true(default)|false</sourceNeedsExpandedFP\_EQ>
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<dataVariable>...</dataVariable> <!-- 1 or more.
Each dataVariable MUST include a <dataType> tag. See
Cassandra DataTypes.
For Cassandra timestamp columns, set dataType=double and
units=seconds since 1970-01-01T00:00:00Z -->
</dataset>
EDDTableFromDapSequence
EDDTableFromDapSequence a változók kezelése 1- és 2-szintű sorrendbenDAPszerverek, mint példáulDAPPER (volt https://www.pmel.noaa.gov/epic/software/dapper/ Most megszűnt) ...
-
Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt. Összegyűjtheti a szükséges információkat azáltal, hogy megvizsgálja a forrásadatlap DDS és a DAS fájlokat a böngészőben (a .das és .dds hozzáadásával asourceUrl(Egy példa volt https://dapper.pmel.noaa.gov/dapper/epic/tao\\_time\\_series.cdp.dds ).
-
A változó egyDAPsorrendben, ha a .dds válasz azt jelzi, hogy a változó adatstruktúra "sorozat" (eseti érzéketlenség) ...
-
Bizonyos esetekben, látni fogja a sorrendben, egy 2 szintű sorozat - EDDTableFromDapSequence kezeli ezeket is.
EDDTableFromDapSequence csontváz XML
<dataset type="EDDTableFromDapSequence" datasetID\="..." active\="..." >
<sourceUrl>...</sourceUrl>
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<outerSequenceName>...</outerSequenceName>
<!-- The name of the outer sequence for DAP sequence data.
This tag is REQUIRED. -->
<innerSequenceName>...</innerSequenceName>
<!-- The name of the inner sequence for DAP sequence data.
This tag is OPTIONAL; use it if the DAP data is a two level
sequence. -->
<sourceNeedsExpandedFP\_EQ>true(default)|false</sourceNeedsExpandedFP\_EQ>
<sourceCanConstrainStringEQNE>true|false</sourceCanConstrainStringEQNE>
<sourceCanConstrainStringGTLT>true|false</sourceCanConstrainStringGTLT>
<sourceCanConstrainStringRegex>...</sourceCanConstrainStringRegex>
<skipDapperSpacerRows>...</skipDapperSpacerRows>
<!-- skipDapperSpacerRows specifies whether the dataset
will skip the last row of each innerSequence other than the
last innerSequence (because Dapper servers put NaNs in the
row to act as a spacer). This tag is OPTIONAL. The default
is false. It is recommended that you set this to true for
all Dapper sources and false for all other data sources. -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<dataVariable>...</dataVariable> <!-- 1 or more -->
</dataset>
EDDTableFromDatabase
EDDTableFromDatabase az adatokat egy kapcsolati adatbázis táblából vagynézet.
Egy asztal vagy kilátás
Ha az Ön által szolgált adatok két vagy több táblában vannak (és így szüksége van egy JOIN-re, hogy egyszerre kivonja az adatokat mindkét asztalról) , meg kell tennie egyetdenormalizált (már csatlakozott) asztal vagynézet az összes olyan adattal, amelyet egyetlen adatkészletként szeretne elérhetővé tenniERDDAP...
Nagy, összetett adatbázisok számára értelme lehet, hogy több darabot denormalizált asztalként különítsenek el, mindegyik más típusú adatokkal, amelyek külön adatkészletekké válnak.ERDDAP...
Denormalizált asztal készítése a használathozERDDAP™Úgy hangzik, mint egy őrült ötlet neked. Kérlek benneteket! Több oka van annak, hogy miértERDDAP™denormalizált asztalokkal működik:
- Ez sokkal könnyebb a felhasználók számára. MikorERDDAP™bemutatja az adatkészletet, mint egy, egyszerű, denormalizált, egy táblázat, nagyon könnyű bárki számára megérteni az adatokat. A legtöbb felhasználó soha nem hallott a normalizált asztalokról, és nagyon kevesen értik a kulcsokat, a külföldi kulcsokat vagy az asztali csatlakozásokat, és szinte biztosan nem ismerik a különböző típusú csatlakozások részleteit, vagy hogyan kell meghatározni az SQL-t, hogy csatlakozzon (vagy több csatlakozó) helyesen. A denormalizált asztal használata elkerüli az összes problémát. Ez az ok egyedül igazolja a denormalizált egységes asztal használatát egy adatkészlet bemutatásáraERDDAP™felhasználók.
- Normalizált asztalok (a kulcsfontosságú oszlopok által kapcsolódó több táblázat) Nagyszerűek az adatok tárolása egy adatbázisban. De még az SQL-ben is, a felhasználóhoz visszatérő eredmény denormalizált. (csatlakozik) egyetlen asztal. Tehát ésszerűnek tűnik, hogy az adatkészletet óriási, denormalizált, egyedi táblázatként jelenítse meg, amelyből azután kérhet alkatrészeket (pl.: Mutassa meg az asztal sorait, ahol a hőmérséklet> 30.) ...
- Lehet változtatniERDDAP™anélkül, hogy megváltoztatná az asztalait. ERDDAP™van néhány olyan követelmény, amely különbözhet attól, hogy hogyan hozta létre az adatbázist. Például,ERDDAP™megköveteli, hogy az időbélyegző adatokat „időbélyegző időben” mezőkben tárolják. Egy külön asztal/nézet készítésévelERDDAP™Ezeket a változásokat akkor lehet elvégezni, ha a denormalizált asztalt készítiERDDAP... Így nem kell változtatnia az asztalaiban.
- ERDDAP™újrateremti a normalizált táblák szerkezetét. Megadhatja, hogy mely adatok oszlopai a „külső” táblákból származnak, és ezért korlátozott számú különböző értékkel rendelkeznek.ERDDAP™összegyűjti az értékek összes különböző kombinációját ezekben az oszlopokban, és bemutatja azokat a felhasználóknak egy speciális . olyan weblapot, amely segít a felhasználóknak gyorsan kiválasztani az adatkészlet alkészleteit. Az egyes oszlopok különböző értékei szintén megtalálhatók az adatkészlet többi weboldalán található legördülő listákban.
- Egy denormalizált asztal teszi az adatot kézből az Ön számáraERDDAPAz adminisztrátor egyszerű. Te vagy az adatkészlet szakértője, ezért van értelme, hogy meghozza a döntéseket arról, hogy melyik táblázat és melyik oszlop csatlakozik, és hogyan csatlakozzon hozzájuk. Szóval nem kell nekünk átadnod (vagy rosszabb, a végfelhasználók) Számos táblázat és részletes utasítás, hogy hogyan kell csatlakozni hozzájuk, csak hozzá kell férnünk a denormalizált asztalhoz.
- A denormalizált asztal lehetővé teszi az adatokhoz való hatékony hozzáférést. A denormalizált forma általában gyorsabb a hozzáféréshez, mint a normalizált forma. A csatlakozók lassúak lehetnek. Több csatlakozó nagyon lassú lehet.
Annak érdekében, hogy az adatbázisban két vagy több asztal adatait megkapja az adatbázisbanERDDAP™Három lehetőség van:
- Ajánlott opció: Képes létrehozni egy Comma- vagy tab-választott értékű fájlt a denormalizált asztal adataival. Ha az adatkészlet óriási, akkor értelme van több fájl létrehozására, mindegyik a denormalizált táblázat kohéziós helyettesítésével (például egy kisebb időtartomány adatai) ...
A nagy előny itt az, hogyERDDAP™képes lesz kezelni a felhasználói kérelmeket az adatokat anélkül, hogy további erőfeszítést az adatbázis. SzóvalERDDAP™nem lesz teher az adatbázisában vagy biztonsági kockázatban. Ez a legjobb lehetőség szinte minden körülmények között, mertERDDAP™rendszerint gyorsabban kaphat adatokat a fájlokból, mint egy adatbázisból (ha átalakítjuk az .csv fájlokat.ncCF fájlok) ... (Az ok egy része az, hogyERDDAPA +files egy olvasható rendszer, és nem kell kezelni a változásokat, miközbenACID (Atomicitás, konzisztencia, elszigeteltség, tartósság) ...) Valószínűleg nem lesz szüksége külön kiszolgálóra, mivel az adatokat az egyik RAID-n tárolhatjuk, és hozzáférhetünk egy meglévő szerverhez.ERDDAP™egy meglévő szerveren.
- Okéy Opció: Új adatbázist hoz létre egy másik számítógépen, csak a denormalizált asztallal. Mivel ez az adatbázis lehet egy ingyenes és nyílt forráskódú adatbázis, mint a MariaDB, a MySQL és a PostgreSQL, ez az opció nem kell sokba kerülnie.
A nagy előny itt az, hogyERDDAP™képes lesz kezelni a felhasználói kérelmeket az adatokra anélkül, hogy további erőfeszítéseket tenne a jelenlegi adatbázisában. SzóvalERDDAP™Nem lesz terhet a jelenlegi adatbázisában. Ez sok biztonsági aggályt is megszüntet, mivelERDDAP™nem lesz hozzáférése jelenlegi adatbázisához.
-
Bátorított opció: KapcsolatERDDAP™a jelenlegi adatbázisodhoz. Ehhez:
- Készítsen külön asztalt vagy nézetet az adatok denormalizált táblájával.
- Hozzon létre egy "erddap" felhasználót, aki csak a denormalizált táblázathoz fér hozzá (s) ...
Ez egy lehetőség, ha az adatok nagyon gyakran változnak, és szeretné adniERDDAP™a felhasználók azonnali hozzáférést ezekhez a változásokhoz; de még így is, értelme lehet használni a fájl opciót, és rendszeresen (30 percenként?) helyettesítse a fájlt, amely a mai adatok. Ennek a megközelítésnek a hatalmas hátrányai az, hogyERDDAP™A felhasználói kérelmek valószínűleg elviselhetetlenül nagy terhet jelentenek az adatbázisban, és hogyERDDAP™a kapcsolat biztonsági kockázat (Bár minimalizálhatjuk/ kezelhetjük a kockázatot) ...
A denormalizált asztal vagy nézet készítéseERDDAP™jó lehetőség, hogy néhány változást hozzon,ERDDAP™olyan módon, amely nem befolyásolja az eredeti táblákat:
- Változtassa meg a dátumot és az időmérő mezőket / oszlopokat az adattípus használatára, amelyet a Postgres hívidőbélyegző időzónával (vagy az egyenértékű az adatbázisban) ... A Timestamps időzóna információ nélkül nem működik megfelelőenERDDAP...
- Készítsen indexeket az oszlopok számára, amelyeket a felhasználók gyakran keresnek.
- Légy nagyon tisztában veleda mező/oszlop nevek esete (például használja az összes alsó esetet) amikor beírod őket.
- Ne használjon tartalék szavakat az asztalhoz és a mező/oszlop nevekhez.
Ha segítségre van szüksége a denormalizált asztal vagy nézet készítéséhez, kérjük, vegye fel a kapcsolatot az adatbáziskezelővel. Ha szeretnél beszélni erről az egész megközelítésről, vagy stratégiázni, hogyan lehet a legjobban csinálni, kérlek e-mailt Chris. John at noaa.gov.
adatbázisdatasets.xml
Nehéz létrehozni a helyesdatasets.xmlszükséges információERDDAP™kapcsolatot létesíteni az adatbázissal. Légy türelmes! Légy módszeres!
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
GenerateDatasets Az Xml három speciális opcióval rendelkezik az EDDTableFromDatabase számára:
- Ha belépsz "!!!LIST!!!" (idézetek nélkül) a katalógus neve, a program megjeleníti a katalógus nevek listáját.
- Ha belépsz "!!!LIST!!!" (idézetek nélkül) a schema neve esetében a program megjeleníti a schema nevek listáját.
- Ha belépsz "!!!LIST!!!" (idézetek nélkül) az asztalnév számára a program megjeleníti az asztalok és oszlopok listáját. Az első "!!!LIST!!!" bejegyzés, amit csinálsz, az, amit használni fognak.
- Óvatosan olvassa el a dokumentum összes információját az EDDTableFromDatabase-ről.
- Összegyűjtheti az XML létrehozásához szükséges legtöbb információt egy EDDTableFromDatabase adatkészlethez, kapcsolatba lépve az adatbáziskezelővel és az internet keresésével.
- Bár az adatbázisok gyakran kezelik az oszlopneveket és az asztali neveket eset-érzékeny módon, azok esetérzékenyek.ERDDAP... Tehát, ha egy hibaüzenet az adatbázisból azt mondja, hogy egy oszlop neve ismeretlen (Például: "Unknown azonosító= "..." oszlop\_name "") bár tudod, hogy létezik, próbáld meg használni az összes fővárost, például, COLUMN_NAME , amely gyakran az oszlop neve igazi, eset-érzékeny változata.
- szorosan együttműködik az adatbázis-adminisztrátorral, aki releváns tapasztalattal rendelkezik. Ha az adatkészlet nem terheli, olvassa elhibaüzenetalaposan megtudni, miért.
JDBC sofőr
-
[JDBC sofőr és<sofőrName>] (#jdbc-driver) - Meg kell szereznie a megfelelő JDBC 3 vagy JDBC 4 vezető .jar fájlt az adatbázishoz és Tedd be! Tomcat /webapps/erddap/WEB-INF/lib miután telepítettERDDAP... Aztán, a tedatasets.xmlehhez az adatkészlethez meg kell határoznia a<sofőrName> erre a sofőrre, ami (Sajnos) különbözik a fájlnévtől. Keressen az interneten a JDBC sofőr számára az adatbázis és a sofőrName számáraJavahasználnia kell.
- MariaDB számára próbálkozzon https://mariadb.com/kb/en/about-the-mariadb-java-client/
A<sofőrName> használnidatasets.xml (lásd alább) valószínűleg org.mariadb.jdbc. Vezető . - A MySQL és az Amazon RDS számára próbálkozzon https://dev.mysql.com/downloads/connector/j/
A<sofőrName> használnidatasets.xml (lásd alább) valószínűleg com.mysql.jdbc. Vezető . - MertOraclePróbálj ki https://www.oracle.com/database/technologies/appdev/jdbc-downloads.html ... A<sofőrName> használnidatasets.xml (lásd alább) valószínűleg oracle.jdbc.driver.OracleVezető .
- Postgresql számára megkaptuk a JDBC 4-es sofőrt https://mvnrepository.com/artifact/org.postgresql/postgresql
A<sofőrName> használnidatasets.xml (lásd alább) valószínűleg org.postgresql. Vezető . - Az SQL Server számára megkaphatja a JTDS JDBC sofőrt https://jtds.sourceforge.net ... A<sofőrName> használnidatasets.xml (lásd alább) valószínűleg net.sourceforge.jtds.jdbc. Vezető .
- MariaDB számára próbálkozzon https://mariadb.com/kb/en/about-the-mariadb-java-client/
Miután betette a JDBC vezetőjét.jarERDDAP™lib könyvtár, meg kell adni egy hivatkozást, hogy .jar fájl a .bat és / vagy .sh script fájlok a GenerateDatasets Xml, DasDds és ArchiveADataset, amelyek a Tomcat /webapps/erddap/WEB-INF/ könyvtár; különben kapsz egy ClassNotFoundException, amikor futtatod ezeket a forgatókönyveket.
Sajnos a JDBC néha a baj forrása. A szerepe, mint közvetítő közöttERDDAP™és az adatbázis, néha finom változásokat hoz az SQL szabványos/generikus adatbázis kéréséreERDDAP™létrehozza, ezáltal problémákat okozva (például, amelyhez kapcsolódikfelső/alacsonyabb azonosítókés kapcsolódikdátum / időzónák) ... Kérjük, légy türelmes, olvassa el az információkat itt gondosan, ellenőrizze a munkáját, és nézze meg a miénketrész további támogatás megszerzéséről...
Adatbázis<kapcsolat Property & Gt;
- [[szerkesztés]]<kapcsolatProperty>] (#database-kapcsolat) - Adatasets.xmlaz adatkészletéhez több kapcsolatot kell meghatároznia Tulajdonos címkék mondaniERDDAP™Hogyan kapcsolódjon az adatbázishoz (például a felhasználó nevét, jelszót, ssl kapcsolatot ésfetch méret) ... Ezek különbözőek minden helyzetben, és egy kicsit nehéz kitalálni. Keresse meg az internetet például egy JDBC sofőr használatával, hogy csatlakozzon az adatbázishoz. A<kapcsolatProperty> nevek (Például: "felhasználó", "password" és "ssl") , és néhány a kapcsolatProperty értékek megtalálhatók a keresés az interneten a "JDBC kapcsolat tulajdonságok adatbázis típus "..." (például,OracleMySQL, Amazon RDS, MariaDB, PostgreSQL) ...
Névek és esetérzékenységi idézetek
- Field/Kolumn nevek idézetei; esetérzékenység- Az alapértelmezett, EDDTableFromDatabase ANSI-SQL-standard dupla idézeteket ír elő a SELECT nyilatkozataiban, ha egy tartalék szót, mint egy mező / oszlop neve, vagy egy speciális karakter egy mező / oszlop neve. A kettős idézetek az SQL injekciós támadások bizonyos típusait is megnyomják. ElmondhatjaERDDAP™",", vagy nincs idézet<oszlopNameQuotes> bennedatasets.xmlehhez az adatkészlethez.
Számos adatbázis esetében, bármilyen típusú idézet használata miatt az adatbázis olyan érzékeny módon működik a mező/oszlopnevekkel. (az alapértelmezett adatbázis eset helyett érzéketlen módon) ... Az adatbázisok gyakran jelennek meg fájl / oszlop nevek, mint az összes felső eset, amikor a valóságban az eset érzékeny formája más. InkábbERDDAP™Kérjük, mindig kezelje az adatbázis oszlop neveket, mint érzékeny.
-
Mária DB, futtatnia kell az adatbázist\-sql-mode=ANSI\_QUOTES...
-
A MySQL és az Amazon RDS számára az adatbázist kell futtatnia\-sql-mode=ANSI\_QUOTES...
-
Oracletámogatja az ANSI-SQL-standard kettős idézeteitáltal default...
-
A PostgreSQL támogatja az ANSI-SQL szabványos kettős idézeteket az alapértelmezés szerint.
Ne használjon tartalék szót egy adatbázishoz, katalógushoz, schema-hoz vagy asztal nevehez.ERDDAP™nem tesz idézeteket körülöttük.
Ha lehetséges, használja az adatbázis, katalógus, schema, asztali nevek és mezőnevek összes alsó esetét az adatbázis táblázat létrehozásakor (vagy nézet) és amikor a mező/oszlop nevekre utaldatasets.xmlbenneERDDAP... Ellenkező esetben hibaüzenetet kaphat, amely szerint az adatbázis, a katalógus, a schema, az asztal és/vagy a mező nem található meg. Ha megkapja ezt a hibaüzenetet, próbálja meg használni az esetérzékeny verziót, az összes felső esetű verziót, és a név összes alsó esetű verzióját a névbenERDDAP... Egyikük dolgozhat. Ha nem, meg kell változtatni az adatbázis neve, katalógus, schema és / vagy táblázat az összes alacsonyabb esetre.
Adatbázis<adatok Type & gt;
- Adatbázis[[szerkesztés]]<adatType>] (#datatype) Tagok - Mert van néhány kétértelműség arról, hogy melyikadatbázis adattípusoktérkép, amelyreERDDAP™adattípusok, meg kell határozni egy [<adatType>] (#datatype) Minden [[Ki]]]<dataVariable>>>>>> (#datavariable) Mondd elERDDAP™melyik adattípust kell használni. A probléma egy része az, hogy a különböző adatkészletek különböző kifejezéseket használnak a különböző adattípusokhoz - így mindig próbálják meg megfelelni a meghatározásoknak, nem csak a neveknek. Lásd a leírástszabványERDDAP™adatok típusok, amely a megfelelő SQL adattípusokra hivatkozik.Dátum és időmérőspeciális esetek: használatERDDAPdupla adat típus.
Adatbázis dátuma Idő adatok
Néhány adatbázis-idő oszlopnak nincs kifejezett időzónája. Az ilyen oszlopok bajokERDDAP... Az adatbázisok támogatják a dátum fogalmát (vagy anélkül egy idő) időzóna nélkül, megközelítő időtartományként. DeJava (és ígyERDDAP) csak azonnali dátum+időkkel foglalkozik egy időzónával. Tehát lehet, hogy tudja, hogy a dátumidő adatai helyi időzónán alapulnak (nappali megtakarítási idővel) vagy a GMT/Zuluidőzóna, deJava (ésERDDAP) ne. Eredetileg azt gondoltuk, hogy dolgozhatunk ebben a problémában (pl. az oszlop időzónájának meghatározásával) , de az adatbázis + JDBC+Javaaz interakciók ezt megbízhatatlan megoldássá tették.
- Szóval,ERDDAP™megköveteli, hogy az adatbázis táblázatban tárolja az összes dátumot és dátumidő adatait olyan adatbázis-adattípussal, amely megfelel a JDBC típusú "időjármű-időzónával" (ideális, hogy használja a GMT /ZuluIdőzóna) ...
- InkábbERDDAPAdatasets.xml, a<dataVariable> címke egy időbélyegző változóhoz, set
és<addAttributes> beállítás
<att name="units">seconds since 1970-01-01T00:00:00Z</att>
- Javaslat: Ha az adatok egy időtartomány, hasznos, hogy az időbélyegző értékek utalnak a központja a beágyazott időtartomány (Például, nem) ... Például, ha egy felhasználónak van adatai a 2010-03-26T13:00Z-nak egy másik adatkészletből, és szeretnének a legközelebbi adatokat egy adatbázis-adatbázisról, amely minden nap adatokkal rendelkezik, akkor a 2010-03-26T12:00Z adatbázisadatai (az adott dátumra vonatkozó adatok képviselete) nyilvánvalóan a legjobb (mint szemben az éjfél előtt vagy után, ahol kevésbé nyilvánvaló, hogy a legjobb) ...
- ERDDAP™haszonnal rendelkezikKonvertáljon Numeric Idő / sztring idő...
- LásdHogyanERDDAPÜzletek az idővel...
Integer nulls
Az adatbázisok támogatják a nullákat az integrálóban (Int, kicsiny, tinyint) oszlopok, deERDDAP™nem támogatja az igazi nullákat. Adatbázis nulls lesz átalakítvaERDDAP™127 byte oszlopok esetében, 255 az ubyte oszlopok esetében, 32767 rövid oszlopok esetében, 65535 az utólagos oszlopok esetében, 2147483647 int oszlopok esetében, 4294967295 az oszlopok esetében, 9,223,372,036,854,775,807 a hosszú oszlopok esetében, vagy 1844674407551615 az ulong oszlopok esetében. Ha ezeket az alapokat használja, kérjük azonosítsa azokatmissing\_values az adatkészlet felhasználói számára azERDDAP™vele
<att name="\_FillValue" type="int"\>2147483647</att>
vagy
<att name="\_FillValue" type="short"\>32767</att>
Alternatívaként használhatja a " "missing\_value"A "\_FillValue" helyett tulajdonítható. GenerateDatasets Az Xml automatikusan hozzáadja ezeket a \_FillValue tulajdonságokat, amikor létrehozza a javasoltdatasets.xmladatbázis adatkészletek.
Az adatbázis lebegő pont oszlopok esetében a nullák áttérnek a NaN-ekreERDDAP... Az adatbázis-adattípusok esetében, amelyek a Strings-be kerülnekERDDAP™A nullák megtérnek az üres vonásokra.
Adatbázisbiztonság
- Amikor adatbázisokkal dolgozol, a lehető legbiztonságosabban és biztonságosan kell elvégeznie a dolgokat, hogy elkerülje, hogy egy rosszindulatú felhasználó károsítsa az adatbázist, vagy hozzáférést szerezzen azokhoz az adatokhoz, amelyekhez nem kell hozzáférnie.ERDDAP™megpróbálja a dolgokat biztonságos módon is csinálni.
- Fontolja meg a más számítógépen történő replikációt, az adatbázist és az adatbázis táblákat az Ön által kívánt adatokkalERDDAP™szolgálni. (Igen, olyan kereskedelmi adatbázisok esetében, mintOracleEz további engedélyezési díjakat tartalmaz. De a nyílt forráskódú adatbázisok, például a PostgreSQL, a MySQL, az Amazon RDS és a MariaDB esetében ez semmibe kerül.) Ez magas szintű biztonságot nyújt, és megakadályozzaERDDAP™kérelmek az eredeti adatbázis lelassításától.
- Bátorítunk benneteket, hogy hozzon létreERDDAP™az adatbázishoz való csatlakozás adatbázis-felhasználóként, amely csak hozzáférést biztosít az adatbázishoz releváns adatbázis (s) és csak READ kiváltságai vannak.
- Arra bátorítunk benneteket, hogy hozzátok létre a kapcsolatotERDDAP ™az adatbázisba, hogy
- mindig használja az SSL-t,
- csak az egyik IP-címből származó kapcsolatokat engedélyezi (vagy a címek egy blokkja) az egyiktőlERDDAP™felhasználó és
- csak átadja a jelszavakat az MD5 formanyomtatványában.
- \[KNOWN PROBLEM\]A kapcsolatfeltételek (beleértve a jelszót!) egyszerű szövegként tároljákdatasets.xml... Nem találtunk módot arra, hogy az adminisztrátor belépjen az adatbázis-jelszóbaERDDAPKezdőlap Tomcatban (amely felhasználói bemenet nélkül történik) Így a jelszót egy fájlban hozzáférhetőnek kell lennie. Hogy ezt biztonságosabbá tegyük:
- Te vagy (aERDDAP™adminisztrátor) legyen a tulajdonosadatasets.xmlés van READ és WRITE hozzáférés.
- Készítsen egy csoportot, amely csak felhasználó=tomcatot tartalmaz. Használja a chgrp-t, hogy a csoport legyendatasets.xmlCsak READ kiváltságokkal.
- Használja a chmod-t az o-rwx kiváltságok hozzárendeléséhez (Nincs READ vagy WRITE hozzáférés a "másik" felhasználókhoz) Mertdatasets.xml...
- MikorERDDAP™, a jelszó és más kapcsolati tulajdonságokat "magánban" tároljákJavaváltozók.
- Az ügyfelek kéréseit elválasztják és ellenőrizik az érvényességet, mielőtt létrehozzák az SQL kérelmeit az adatbázishoz.
- Az adatbázis iránti kérelmeket az SQL PreparedStatements-el készítik, hogy megakadályozzákSQL injekció...
- Az adatbázisra vonatkozó kérelmeket végrehajtottan nyújtják be Irányítás (Nem executeState) korlátozni a kérelmeket, hogy csak olvassák (így próbálta meg az SQL injekciót, hogy megváltoztassa az adatbázist, szintén kudarcot vall.) ...
SQL
- MertOPeNDAP„A mesés adatok kéréseit az SQL mesés adatok kéréseire tervezték, könnyűERDDAP™a tabuláris adatkérések egyszerű SQL PreparedStatements-be való átalakítása. Például,ERDDAP™kérés
time,temperature&time>=2008-01-01T00:00:00Z&time<=2008-02-01T00:00:00Z
Az SQL PreparedStatementbe kerül
SELECT "time", "temperature" FROM *tableName*
WHERE "time" >= 2008-01-01T00:00:00Z AND "time" <= 2008-02-01T00:00:00Z
ERDDAP™kérések &distinct () és/vagyorderBy ( változók ) hozzáadja a DISTINCT-t és/vagy ORDER BY-t változók az SQL elkészített nyilatkozatára. Általában ez nagymértékben lelassítja az adatbázis válaszát. ERDDAP™a PreparedStatement bejegyzéseLog.txtmint
statement=*thePreparedStatement*
Ez az előkészítés szöveges ábrázolása lesz, amely kissé különbözhet a tényleges PreparedStatementtől. Például az PreparedStatementben az időket különleges módon kódolják. De a szöveges képviseletben úgy tűnik, mint az ISO 8601-es dátumidő.
Adatbázis sebesség
- Az adatbázisok lassúak lehetnek. Van néhány dolog, amit tehetsz:
- Általános - Az SQL jellege az, hogy a kérdésekdeklaratív... Pontosan meghatározzák, mit akar a felhasználó. Nem tartalmaznak specifikációt vagy utalásokat arra, hogy a lekérdezést hogyan kell kezelni vagy optimalizálni. Tehát nincs módERDDAP™a lekérdezés oly módon történő létrehozása, hogy segít az adatbázis optimalizálni a lekérdezést (vagy bármilyen módon meghatározza, hogyan kell kezelni a lekérdezést) ... Általában az adatbázis-adminisztrátortól függ, hogy felállítsa a dolgokat (Például indexek) bizonyos típusú kérdések optimalizálása.
Állítsa be a Fetch méretét
Az adatbázisok visszatérnek az adatokhozERDDAP™zsarukban. Alapértelmezés szerint a különböző adatbázisok különböző sorokat térnek vissza a zsákokban. Gyakran ez a szám nagyon kicsi és nagyon hatástalan. Például az alapértelmezésOracle10! Olvassa el az adatbázis JDBC dokumentációját az adatbázis JDBC sofőrjéhez, hogy megtalálja a kapcsolatot, hogy ezt növelje, és add hozzá ezt az adatkészlet leírásáhozdatasets.xml... Például, A MySQL és az Amazon RDS esetében használjon
<connectionProperty name="defaultFetchSize">10000</connectionProperty>
A MariaDB esetében jelenleg nincs mód a fetch méret megváltoztatására. De ez egy kért funkció, így keresse meg az internetet, hogy megnézze, hogy ez végrehajtott-e. MertOracleHasználat
<connectionProperty name="defaultRowPrefetch">10000</connectionProperty>
PostgreSQL, használat
<connectionProperty name="defaultRowFetchSize">10000</connectionProperty>
de úgy érzi, szabad megváltoztatni a számot. A túl nagy szám beállítása okozzaERDDAP™sok memóriát használni, és valószínűbb, hogy kifut a memóriából.
ConnectionSzövetségek
Minden adatbázisnak más kapcsolati tulajdonságai vannak, amelyeket meg lehet adnidatasets.xml... Ezek közül sokan hatással lesznek az adatbázis teljesítményéreERDDAP™kapcsolat. Kérjük, olvassa el a dokumentációt az adatbázis JDBC vezetője számára, hogy lássa a lehetőségeket. Ha olyan kapcsolati tulajdonságokat talál, amelyek hasznosak, küldjön e-mailt a részletekkelerd dot data at noaa dot gov...
- Készítsen asztalt - Valószínűleg gyorsabb válaszokat kap, ha rendszeresen (Mindennap? bármikor új adatok vannak?) létrehoz egy tényleges asztalt (Hasonlóképpen, hogyan generálta a VIEW-t) és mondjaERDDAP™adatokat szerezni az asztalról a VIEW helyett. Mivel az asztal iránti kérelmet ezután be lehet tölteni anélkül, hogy JOINing egy másik asztal, a válasz sokkal gyorsabb lesz.
- Vákuum a táblázat - MySQL és Amazon RDS sokkal gyorsabban reagál, ha használjaOPTIMIZE TABLE... Maria A DB sokkal gyorsabban reagál, ha használjaOPTIMIZE TABLE... A PostgreSQL sokkal gyorsabban reagál, haVACUUMaz asztal. Oraclenincs, vagy nincs szükség analóg parancsra.
- Készülj felIndexekközösen konstruált változók számára - Felgyorsíthat sok / legtöbb kérdést azáltal, hogy indexeket hoz létre az adatbázisban a változók számára (amelyet az adatbázisok "oszlopoknak" neveznek) gyakran korlátozzák a felhasználó lekérdezését. Általánosságban elmondható, hogy ezek ugyanazok a változók, amelyeket [a [a]<subsetVariables>>>>>> (#subsetvariables) és/vagy a magasság, a hosszúság és az idő változók.
Connection Pooling használata
Általában,ERDDAP™külön kapcsolatot teremt az adatbázissal minden kérésre. Ez a legmegbízhatóbb megközelítés. A gyorsabb alternatíva egy DataSource használata, amely támogatja a kapcsolatfelvételt. Hogy felállítsuk, megadjuk (például)
<dataSourceName>java:comp/env/jdbc/postgres/erddap</dataSourceName>
jobb mellett<sourceUrl>,<sofőrName> és<kapcsolat Tulajdonság>. és Tomcat /conf/context.xml, definiálja az erőforrást ugyanazokkal az információkkal, például
<Resource
name="jdbc/postgres/erddap" auth="Container" type="javax.sql.DataSource"
driverClassName="org.postgresql.Driver"
url="*jdbc:postgresql://somehost:5432/myDatabaseName*"
username="*myUsername*" password="*myPassword*"
initialSize="0" maxActive="8" minIdle="0" maxIdle="0" maxWait="-1"/>
Általános információk a DataSource használatáról https://docs.oracle.com/javase/tutorial/jdbc/basics/sqldatasources.html ... LásdTomcat DataSource információésTomcat DataSource példákvagy keresse meg az internetet például az adatszolgáltatások más alkalmazásszerverekkel történő használatával.
- Ha minden más kudarcot vall, fontolja meg az adatok tárolását egy gyűjteménybenNetCDFv3.ncfájlok (különösen különösen.ncfájlok, amelyek aCF Discrete Sampling Geometries (DSG) Contiguous Ragged Array adatstruktúrák és így kezelhetőkERDDAPAEDDTableFromNcCFFiles) ... Ha logikailag megszervezik őket (mindegyik adat egy darab űr és idő) ,ERDDAP™nagyon gyorsan kivonhatja az adatokat tőlük.
EDDTableFromDatabase csontváz XML
<dataset type="EDDTableFromDatabase" datasetID\="..." active\="..." >
<sourceUrl>...</sourceUrl>
<!-- The format varies for each type of database, but will be
something like:
For MariaDB: jdbc:mariadb://xxx.xxx.xxx.xxx:3306/databaseName
For MySql jdbc:mysql://xxx.xxx.xxx.xxx:3306/databaseName
For Amazon RDS: jdbc:mysql://xxx.xxx.xxx.xxx:3306/databaseName
For Oracle: jdbc:oracle:thin:@xxx.xxx.xxx.xxx:1521:databaseName
For Postgresql: jdbc:postgresql://xxx.xxx.xxx.xxx:5432/databaseName
where xxx.xxx.xxx.xxx is the host computer's numeric IP address
followed by :PortNumber (4 digits), which may be different for your
database. REQUIRED. -->
<driverName\>...</driverName>
<!-- The high-level name of the database driver, for example,
"org.postgresql.Driver". You need to put the actual database
driver .jar file (for example, postgresql.jdbc.jar) in
tomcat/webapps/erddap/WEB-INF/lib. REQUIRED. -->
<connectionProperty name="name">value</connectionProperty>
<!-- The names (for example, "user", "password", and "ssl")
and values of the properties needed for ERDDAP™ to establish
the connection to the database. 0 or more. -->
<dataSourceName>...</dataSourceName> <!-- 0 or 1 -->
<catalogName>...</catalogName>
<!-- The name of the catalog which has the schema which has the
table, default = "". OPTIONAL. Some databases don't use
this. -->
<schemaName>...</schemaName> <!-- The name of the
schema which has the table, default = "". OPTIONAL. -->
<tableName>...</tableName> <!-- The name of the
table, default = "". REQUIRED. -->
<columnNameQuotes><columnNameQuotes> <!-- OPTIONAL. Options:
" (the default), ', \[nothing\]. -->
<orderBy>...</orderBy> <!-- A comma-separated list of
sourceNames to be used in an ORDER BY clause at the end of the
every query sent to the database (unless the user's request
includes an &orderBy() filter, in which case the user's
orderBy is used). The order of the sourceNames is important.
The leftmost (first) sourceName is most important; subsequent
sourceNames are only used to break ties. Only relevant
sourceNames are included in the ORDER BY clause for a given user
request. If this is not specified, the order of the returned
values is not specified. Default = "". OPTIONAL. -->
<sourceCanOrderBy>no(default)|partial|yes</sourceCanOrderBy>
<!-- 0 or 1 -->
<sourceCanDoDistinct>no(default)|partial|yes</sourceCanDoDistinct>
<!-- 0 or 1 -->
<sourceNeedsExpandedFP\_EQ>true(default)|false</sourceNeedsExpandedFP\_EQ>
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<dataVariable>...</dataVariable> <!-- 1 or more.
Each dataVariable MUST include a <dataType> tag.
See Database DataTypes.
For database date and timestamp columns, set dataType=double and
units=seconds since 1970-01-01T00:00:00Z -->
</dataset>
EDDTableFromEDDGrid
EDDTableFromEDDGrid lehetővé teszi, hogy létrehozzon egy EDDTable adatkészletet bármelyikbőlEDDGridadatkészlet.
- Néhány gyakori oka ennek:
- Ez lehetővé teszi az adatkészlet lekérésétOPeNDAPkiválasztási korlátok, amelyek egyfajta "kérdezés érték szerint" (melyik felhasználó kérhette) ...
- Az adatkészlet eredetileg tabuláris adatkészlet.
- A globális tulajdonság „maxAxis0” értéke (általában a Type="int") , (az alapértelmezett 10) használni fogják a tengelyek számának korlátozását\[0 0\] (általában"time"axis) a bezárt értékekEDDGridolyan adatkészlet, amely adatok kérése esetén elérhető. Ha nem akarja, hogy legyen bármilyen határ, adja meg a 0 értéket. Ez a beállítás azért fontos, mert különben túl könnyű lenne egy felhasználónak kérni az EDDTableF-tEDDGridáttekinteni az összes rácsos adatkészlet adatait. Ez hosszú időt vesz igénybe, és szinte biztosan kudarcot vallana egy kiütési hiba miatt. Ez az a beállítás, amely biztonságossá teszi az EDDTableF-tEDDGridadatkészletek az Ön adataibanERDDAPFélelem nélkül, hogy a számítási erőforrások ésszerűtlen használatához vezetnek.
- Ha a bezártEDDGridegyEDDGridFromErdapésERDDAP™ugyanazERDDAPEzután EDDTableFromEDDGridmindig közvetlenül használja a hivatkozott adatkészlet jelenlegi verzióját. Ez egy nagyon hatékony módja az EDDTableF-nekEDDGrida rácsos adatokhoz való hozzáféréshez.
- Ez az osztály [<újratöltés MindenNMinutes>] (#reloadeveryn percek) az, ami számít. A bezártEDDGridA<reloadEveryNMinutes> figyelmen kívül hagyják.
- Ha érték [<frissítésEveryNMillis> (#updateeverynmillis) ez az adatkészlet, figyelmen kívül hagyják. A bezártEDDGridA<frissítésEveryNMillis> az, ami számít.
- GenerateDatasetsXmllehetősége van az adatkészlet típusára=EDDTableFromEDDGridamely egy URL-t kérERDDAP (általában ugyanazERDDAP) („/erddap/”) rendszeres kifejezés. GenerateDatasets Az Xml az XML-t egy EDDTableF-re fogja generálniEDDGridadatkészlet minden egyes rácsos adatkészlethezERDDAP™amelynek van egydatasetIDamely megfelel a rendszeres kifejezésnek (Használjon .\*-t, hogy megfeleljen az összesdatasetIDs a rácsos adatkészletekért) ...
Az XML darabja, amelyet a GenerateDatasetsXml generál minden adatkészlethez:
- AdatasetIDami azEDDGridAdatasetIDplusz "\_Asatable".
- Egy új összefoglaló globális tulajdonság, amely aEDDGridösszefoglaló plusz egy új első bekezdés, amely leírja, hogy mi ez az adatkészlet.
- Egy új cím globális tulajdonság, amely aEDDGriddalszöveg: 's cím plus', (Mint asztal) "..."
- Egy új maxAxis0 globális tulajdonság 10 értékkel.
EDDTableFromEDDGridSkeleton XML
<dataset type="EDDTableFromEDDGrid" datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1.
For EDDTableFromEDDGrid, this calls lowUpdate() of the underlying
EDDGrid. -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<dataset>...</dataset> <!-- 1
Any type of EDDGrid dataset. You can even use an
EDDGridFromERDDAP™ to access an independent EDDGrid dataset on
this server. -->
</dataset>
EDDTableFromFileNames
EDDTableFromFileNames adatkészletet hoz létre a szerver fájlrendszerében lévő fájlok csoportjáról, beleértve az egyes fájlok URL-jét, hogy a felhasználók letölthessék a fájlokat aERDDAPA"files"rendszerrendszer... Ellentétben az összesEDDTableFromFilesalosztályok, ez az adatkészlet típus nem szolgálja az adatokat a fájlokon belül.
- EDDTableFromFileNames hasznos, ha:
- Van egy olyan fájlok csoportja, amelyeket egész fájlként szeretne elosztani, mert nem tartalmaznak „adatot” ugyanúgy, ahogyan a rendszeres adatfájlok adatokkal rendelkeznek. Például képfájlok, videofájlok, Word dokumentumok, Excel táblázatok, PowerPoint prezentációs fájlok vagy szövegfájlok strukturálatlan szöveggel.
- Van egy olyan fájlok csoportja, amelyek olyan formátumban adatokkal rendelkeznek,ERDDAP™Még nem olvasható. Például egy projektspecifikus, egyedi, bináris formátum.
EDDTableFromFileNames adatok
- Az adatok egy EDDTableFromFileNames adatkészletbenegy asztal, amelyERDDAP™on-the-fly információt hoz létre a helyi fájlok csoportjáról. Az asztalnál van egy sor minden fájlhoz. Négy különleges tulajdonság adatasets.xmlez az adatkészletmeghatározza, hogy mely fájlokat fognak tartalmazni ebben az adatkészletben:
fájl Dir
- <fájlDir> - Ez meghatározza a szerver fájlrendszerének forráskönyvtárát az adatkészlethez tartozó fájlokkal. Azok a fájlok, amelyek valójában a szerver fájlrendszerében találhatók<fájlDir> jelenik meg az adatkészlet url oszlopában egy virtuális könyvtáron belül https://serverUrl/erddap/files/datasetID/ ... Például, hadatasetIDjplMURSST, és<fájlDir> /home/data/mur/ és ez a könyvtár egy jplMU nevű fájlt tartalmazRSST20150103000000.png, Ezután az URL, amely a felhasználók számára jelenik meg, hogy ez a fájl lesz https://serverUrl/erddap/jplMURSST/jplMURSST20150103000000.png ...
Amellett, hogy egy helyi könyvtárat használunk<fájlDir>, akkor is megadhatja az URL egy távoli, könyvtári-szerű weboldal. Ez működik:
- A nem összesített adatkészletek a THREDDS-ben, például https://data.nodc.noaa.gov/thredds/catalog/aquarius/nodc\\_binned\\_V3.0/monthly/ \[2020-10-21 Ez a szerver már nem megbízhatóan elérhető.\]
- A nem összesített adatkészletekHyraxpl.: https://podaac-opendap.jpl.nasa.gov/opendap/allData/ccmp/L3.5a/monthly/flk/
- A legtöbb Apache-szerű könyvtári lista, például https://www1.ncdc.noaa.gov/pub/data/cmb/ersst/v5/netcdf/
dalszöveg: OnTheFly
\\\*fromOnTheFly- Néhány hatalmas S3 vödör (mint a noaa-goes17, amely 26 millió fájlt tartalmaz) Lehet, hogyERDDAP™legfeljebb 12 óra, hogy letöltse az összes információt a tartalmát a vödör (vannak más problémák) ... Ahhoz, hogy körül ezt, van egy speciális módja annak, hogy használja<fájlDir> az EDDTableFromFileNames-ben, hogy adathalmazt készítsen az AWS S3 bucket könyvtárával és fájlneveivel. Az adatkészletnek nem lesz az összes S3 bucket könyvtárának és fájlnevének listája, amelyet a felhasználó kereshet az adatkészlet iránti kérelmeken keresztül. De az adatkészlet megkapja a könyvtárak és fájlok nevét, ha a felhasználó átlépi a könyvtári hierarchiát az adatkészlettel"files"opció. Így ez lehetővé teszi a felhasználók számára, hogy böngészjenek az S3 bucket fájlhierarchiájával és fájlokkal az adatkészleten keresztül"files"rendszer. Ehhez, ahelyett, hogy meghatározná az URL-t az S3 bucket számára, mint a "Starting Directory" (a GenerateDatasets Xml) vagy<fájlDir> (bennedatasets.xml) Használat:
\\*\\*\\*fromOnTheFly,*theS3BucketUrl*
Például:
\\*\\*\\*fromOnTheFly,https://noaa-goes17.s3.us-east-1.amazonaws.com/
Lásd a dokumentációtS3 Buckets-szel dolgozunkERDDAP™, nevezetesen a specifikus formátum leírása, amelyet az S3 bucket URL-hez kell használni. És nézd meg ezek a részletek és példákhasználat\\\*fromOnTheFly.
ismétlődő
- <visszatérő> - Files in Subdirectors of the<fájlDir> olyan nevekkel, amelyek megfelelnek<fájlRegex> ugyanazon albizottságokban jelenik meg"files"URL, ha<Az ismétlődő> igaz. Az alapértelmezés hamis.
- [[szerkesztés]]<PaintRegex>] (#pathregex) - Ha visszatérő=igaz, csak a könyvtár nevek, amelyek megfelelnek az útvonalnakRegex (default=".\*") elfogadják. Ha visszatérő=hamis, ezt figyelmen kívül hagyják. Ezt ritkán használják, de nagyon hasznos lehet a szokatlan körülmények között. (Lásd eztregex dokumentációésregex bemutató...)
fájlkezelő
- <fileRegex> - Csak a fájlnév, ahol az egész fájlnév (nem tartalmazza a könyvtár nevét) Meccs<A fájlRegex> szerepel ebben az adatkészletben. Például a jplMURSST.{14.png . (Lásd eztregex dokumentációésregex bemutató...)
File nevek Adattáblázat Tartalmak
Az asztalnál oszlopok lesznek:
-
url - Az URL, amelyet a felhasználók használhatnak a fájl letöltéséhezERDDAPA"files"rendszerrendszer...
-
név - A fájl neve (könyvtári név nélkül) ...
-
Utolsó módosítás - Az idő, amikor a fájlt legutóbb módosították (duplákként tárolva"seconds since 1970-01-01T00:00:00Z") ... Ez a változó azért hasznos, mert a felhasználók láthatják, hogy egy adott fájl tartalma megváltozott-e. Ez a változó egyIdő Stamp változóÍgy az adatok numerikus értékként jelenhetnek meg (másodpercek 1970-01-01T00:00Z) vagy erős érték (ISO 8601:2004 (EZ) formátum) a helyzettől függően.
-
méret - A fájl mérete byte-ben, duplaként tárolva. Duplán tárolják őket, mert egyes fájlok nagyobbak lehetnek, mint a betűk lehetővé teszik, és a hosszúságokat nem támogatják valamilyen válaszfájltípusban. A duplák pontos méretet adnak, még nagyon nagy fájlokat is.
-
kiegészítő oszlopok, amelyeket aERDDAP™adminisztrátor a fájlnévből kivont információkkal (Például az adatokhoz kapcsolódó idő a fájlban) két tulajdonság alapján, amelyet minden további oszlop/dataVariable:
- ExtractRegex - Ez egyrendszeres kifejezés (tutorial) ... Az egész regexnek meg kell felelnie az egész fájlnévnek (nem tartalmazza a könyvtár nevét) ... A regexnek tartalmaznia kell legalább egy rögzítő csoportot (a parentézisek által bezárt rendszeres kifejezés egy része) melyikERDDAP™azon felhasználások, amelyek meghatározzák, hogy a fájlnév melyik része kivonja az adatokat.
- Kivonat Csoport -- Ez a rögzítő csoport száma (# 1 az első rögzítő csoport) rendszeres kifejezésben. Az alapértelmezett 1 A rögzítő csoport egy olyan rendszeres kifejezés része, amelyet a parentheses zár.
Íme két példa:
<dataVariable>
<sourceName>time</sourceName>
<destinationName>time</destinationName>
<dataType>String</dataType>
<addAttributes>
<att name="extractRegex">jplMURSST(.{14})\\.png</att>
<att name="extractGroup" type="int">1</att>
<att name="units">yyyyMMddHHmmss</att>
</addAttributes>
</dataVariable>
<dataVariable>
<sourceName>day</sourceName>
<destinationName>day</destinationName>
<dataType>int</dataType>
<addAttributes>
<att name="extractRegex">jplMURSST.{6}(..).{6}\\.png</att>
<att name="extractGroup" type="int">1</att>
<att name="ioos\\_category">Time</att>
</addAttributes>
</dataVariable>
Abban az esetben, ha egy fájl van a neve jplMURSST20150103000000.png, a kivonatRegex megfelel a fájlnévnek, kivonja azokat a karaktereket, amelyek megfelelnek az első rögzítő csoportnak ("20150103000000") adatType=String, majd használja aA szigorú időkre alkalmas egységeka sztrájkok időbeli adatértékekbe való felosztása (2015-01-03T00:00Z) ...
A nap változója esetén, ha egy fájl rendelkezik a jplMU névvelRSST20150103000000.png, a kivonatRegex megfelel a fájlnévnek, kivonja azokat a karaktereket, amelyek megfelelnek az első rögzítő csoportnak ("03") [[szerkesztés]]<adatType>] (#datatype) \=int, a 3. adatérték elszámolása
Egyéb információk
- [[szerkesztés]]<frissítésEveryNMillis> (#updateeverynmillis) - Ez a fajta adatkészlet nem igényel és nem tudja használni<frissítésEveryNMillis> címke, mert az EDDTableFromFileNames által szolgáltatott információk mindig tökéletesen naprakészek, mertERDDAP™kéri a fájlrendszert annak érdekében, hogy válaszoljon minden adatkérésre. Még akkor is, ha számos fájl létezik, ez a megközelítésnek ésszerűen jól kell működnie. A válasz lassú lehet, ha számos fájl van, és az adathalmazt egy ideig nem kérték. De néhány perc múlva az operációs rendszer tartsa az információt egy gyorsítótárban, így a válaszoknak nagyon gyorsnak kell lenniük.
- Használhatja aGenerateDatasets Xml programHogy adatasets.xmlcunk az ilyen típusú adatkészlethez. További oszlopokat adhat hozzá / definiálhat a fájlnévből kivont információkkal, amint azt fentebb mutatják.
EDDTableFromFileNames csontváz XML
<dataset type="EDDTableFromFileNames" datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<fileDir>...</fileDir>
<recursive>...</recursive> <!-- true or false (the default) -->
<pathRegex>...</pathRegex> <!-- 0 or 1. Only directory names which
match the pathRegex (default=".\*") will be accepted. -->
<fileNameRegex>...</fileNameRegex>
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<dataVariable>...</dataVariable> <!-- 1 or more.
Each dataVariable MUST include <dataType> tag. -->
</dataset>
EDDTableFromFiles
EDDTableFromFiles az összes EDDTableF felülete... Files osztályok. Nem használhatja az EDDTableFromFiles-t közvetlenül. Ehelyett használja az EDDTableFromFiles alosztályát, hogy kezelje az adott fájltípust:
- EDDTableFromAsciiFilesösszesíti az adatokat a comma-tól, a tab-tól, a szemicolon-tól, vagy az űrválasztott tabuláris ASCII adatfájloktól.
- EDDTableFromAudioFilesösszesíti az adatokat egy csoport helyi audio fájlokat.
- EDDTableFrom AwsXmlFilesösszesíti az adatokat egy sor Automatic Weather Station (AWS) XML fájlok.
- EDDTableFromColumnarAsciiFilesösszesíti a tabuláris ASCII adatfájlok adatait rögzített szélességi adatoszlopokkal.
- EDDTableFromHyraxFiók (Meghatározva) összesíti az adatokat több változóval, mindegyik közös dimenzióval (Például, idő, magasság (vagy mélység) , magasság, hosszúság) és szolgált egyHyrax OPeNDAPszerver...
- EDDTableFromInvalidCRAFilesösszesített adatokNetCDF (v3 vagy v4) .ncfájlok, amelyek egy adott, érvénytelen, változata a CF DSG Contiguous Ragged Array (CRA) fájlok. BárERDDAP™támogatja ezt a fájltípust, ez egy érvénytelen fájltípus, amelyet senkinek nem kell használnia. Azok a csoportok, amelyek jelenleg ezt a fájltípust használják, erősen ösztönzik a használatraERDDAP™hiteles CF DSG CRA fájlok generálására, és hagyja abba ezeket a fájlokat.
- EDDTableFromJsonlCSVFilesösszesített adatokJSON Lines CSV fájlok...
- EDDTableFromMultidimNcFilesösszesített adatokNetCDF (v3 vagy v4) .nc (vagy.ncml ml) több változóval rendelkező fájlok, mindegyik közös dimenzióval (Például, idő, magasság (vagy mélység) , magasság, hosszúság) ...
- EDDTableFromNcFilesösszesített adatokNetCDF (v3 vagy v4) .nc (vagy.ncml ml) több változóval rendelkező fájlok, mindegyik közös dimenzióval (Például, idő, magasság (vagy mélység) , magasság, hosszúság) ... Jó, ha továbbra is használja ezt az adatkészlettípust a meglévő adatkészletekhez, de új adatkészletek esetében inkább az EDDTableFromMultidimNcFiles használatát javasoljuk.
- EDDTableFromNcCFFilesösszesített adatokNetCDF (v3 vagy v4) .nc (vagy.ncml ml) fájlokat, amelyek az egyik fájlformátumot használják, amelyet aCF Discrete Sampling Geometries (DSG) egyezmények. De az egyik multidimenzionális CF DSG változatot használó fájlokhoz, használjonEDDTableFromMultidimNcFilesEhelyett.
- EDDTableFromNccsvFilesösszesített adatokNCCSVASCII .csv fájlok.
- EDDTableFromParquetFilesadatok kezeléseParquet...
- EDDTableFromThreddsFiles (Meghatározva) összesíti a fájlok adatait több változóval, amelyeket megosztott dimenziók szolgálnak egyHírekOPeNDAPszerver...
- EDDTableFromWFSFiók (Meghatározva) helyi másolatot készít az összes adatról egyArcGISMapServerWFSszerver, így az adatok gyorsan továbbíthatókERDDAP™felhasználók.
Jelenleg nem támogatnak más fájltípusokat. De általában viszonylag könnyű támogatni más fájltípusokat. Lépjen kapcsolatba velünk, ha van kérése. Vagy, ha az adatai egy régi fájlformátumban vannak, amelyet el akarsz költözni, javasoljuk, hogy a fájlok átalakítása legyenNetCDFv3.ncfájlok (és különösen.ncfájlok aCF Discrete Sampling Geometries (DSG) Contiguous Ragged Array adatstruktúra -ERDDAP™nagyon gyorsan kivonhatja az adatokat) ...NetCDFszéles körben támogatott, bináris formátum, lehetővé teszi a gyors véletlenszerű hozzáférést az adatokhoz, és már támogatottERDDAP...
FromFiles részletek
A következő információ az EDDTableFromFiles összes alosztályára vonatkozik.
Aggregáció
Ez az osztály összesíti az adatokat a helyi fájlokból. Minden fájl tart egy (viszonylag) kis adattáblázat.
- Az ebből eredő adatkészlet úgy tűnik, mintha az összes fájl tábláját kombinálták volna (az adatok összes sora a #1 fájlból, plusz az összes sor a #2 fájlból, ...) ...
- A fájloknak nem mindegyiküknek rendelkeznie kell a megadott változókkal. Ha egy adott fájl nem rendelkezik meghatározott változóval,ERDDAP™szükség szerint hozzáadja a hiányzó értékeket.
- A változók az összes fájl MUST ugyanazokat az értékeket aadd\_offset,missing\_value,\_Töltés Érték,scale\_factorésegységtulajdonságok (ha valaki) ...ERDDAP™ellenőrzések, de ez egy tökéletlen teszt - ha különböző értékek vannak,ERDDAPnem tudja, melyik helyes, ezért milyen fájlok érvénytelenek. Ha ez egy probléma, akkor használható lehetNcMLvagyNCOa probléma megoldására.
Elnyomott fájlok
A forrásadat fájlok az összes EDDTableFromFiles alosztály számára külsőleg tömöríthetők (pl.:.tgz,.tar.gz,.tar.gzip,.gz,.gzip,.zip,.bz2vagy .Z) ... Lásd:Külsőleg elnyomott fájldokumentáció...
Cached File Információ
- Amikor az EDDTableFromFiles adatkészletet először töltik be, az EDDTableFromFiles az összes releváns fájlból olvas információkat, és táblázatokat hoz létre (Egy sor minden fájlhoz) minden érvényes fájlról és minden "rossz" (különböző vagy érvénytelen) fájl.
- Az asztalokat is tárolják a lemezen, mintNetCDFv3.ncfájlok bigParentDirectory[szerkesztés] /dataset/ Last2CharsOfDatasetID / datasetID / fájlok neve: dirTable.nc (amely az egyedi könyvtár nevek listáját tartalmazza) , fájl táblázat.nc (amely az asztalt minden érvényes fájl információjával tartja) , rosszfiókok.nc (amely az asztalt minden rossz fájl információjával tartja) ...
- Az EDDTableFromFiles adatkészlethez való hozzáférés felgyorsítása (de több memóriát használva) Használhatja
[[szerkesztés]]<fájlTableInMemory> Igaz</fileTableInMemory>] (#filetableinmemory)
Mondd elERDDAP™tartsa a fájlinformációs táblák másolatát az emlékezetben. - A lemezen található fájlinformációs táblák másolata akkor is hasznos, haERDDAP™le van zárva és újraindítva: megmenti az EDDTable-t A Files-től, hogy újra kell olvasnia az összes adatfájlot.
- Amikor egy adatkészletet újratöltik,ERDDAP™csak az adatokat kell olvasni az új fájlokban és fájlokban, amelyek megváltoztak.
- Ha egy fájlnak más szerkezete van a többi fájlból (Például egy másik adattípus az egyik változó számára, vagy egy másik érték a "egység- tulajdonság) ,ERDDAPhozzáadja a fájlt a "rossz" fájlok listájához. Információk a probléma a fájl lesz írva a bigParentDirectory[szerkesztés] /logs/log.txt fájl.
- Soha nem kell törölnie vagy dolgoznia ezeket a fájlokat. Az egyik kivétel: ha még mindig megváltoztatja az adatkészletetdatasets.xmlbeállítás, lehet, hogy törölni ezeket a fájlokat kényszeríteniERDDAP™az összes fájl újraindítása, mivel a fájlokat másképp olvassák/értelmezik. Ha valaha is törli ezeket a fájlokat, akkor megteheti, haERDDAP™fut. (Ezután állítsa be azászlóaz adatkészlet újratöltése ASAP.) Azonban,ERDDAP™általában észreveszi, hogy adatasets.xmlaz információ nem egyezik a fájllal Asztalinformációk és a fájltáblák automatikusan törlése.
- Ha bátorítani akarszERDDAP™a tárolt adatkészlet információjának frissítése (például, ha csak hozzáadott, eltávolított vagy módosított néhány fájlt az adatkészlet adattárához) Használja azászlórendszerKényelemERDDAP™a csatolt fájlinformációk frissítése.
Kérések kezelése
- ERDDAP™A tabuláris adatkérések korlátozódhatnak bármilyen változóra.
- Amikor az ügyfél adatkérelme feldolgozásra kerül, az EDDTableFromFiles gyorsan megtekintheti az asztalt az érvényes fájlinformációkkal, hogy megnézze, mely fájlok lehetnek releváns adatok. Például, ha minden forrásfájl rendelkezik az adatok egy rögzített elhelyezkedésű buoy, EDDTableFromFiles nagyon hatékonyan meghatározhatja, hogy mely fájlok lehetnek adatok egy adott hosszúsági tartományban és a szélességi tartományban.
- Mivel az érvényes fájlinformációs táblázat tartalmazza az összes változó minimális és maximális értéket minden érvényes fájl esetében, az EDDTableFromFiles gyakran képes kezelni más kérdéseket meglehetősen hatékonyan. Például, ha néhány buoys nem rendelkezik levegőnyomás-érzékelővel, és az ügyfél kéri az adatokat a AirPressure!=NaN, EDDTableFromFiles hatékonyan meghatározhatja, hogy melyik buoys légnyomás-adatokkal rendelkezik.
A Cached File információ frissítése
Amikor az adatkészletet újratöltik, a csésze fájlinformációkat frissítik.
- Az adatkészletet rendszeresen újratöltik, amint azt a<reloadEveryNMinutes> az adatkészlet információibandatasets.xml...
- Az adatkészletet a lehető leghamarabb újratöltik, haERDDAP™kimutatja, hogy hozzáadott, eltávolított,touch'd (a fájl utolsó módosítása Módosított idő) vagy módosított egy adatszűrőt.
- Az adatkészlet a lehető leghamarabb újratöltődik, ha használjazászlórendszer...
Amikor az adatkészletet újratöltik,ERDDAP™összehasonlítja a jelenleg rendelkezésre álló fájlokat a csatolt fájlinformációs táblázathoz. Új fájlokat olvasnak és hozzáadnak az érvényes fájlok táblázatához. Azok a fájlok, amelyek már nem léteznek, az érvényes fájlok táblájából származnak. Azok a fájlok, ahol a fájl-időmérő változott, olvashatók, és az információjuk frissül. Az új táblák felváltják a régi táblákat a memória és a lemezen.
Bad Files
A rossz fájlok táblázata és az okok, amelyeket a fájlok rossznak nyilvánították (korrupt fájl, hiányzó változók, helytelen tengelyértékek stb.) e-mailben van az e-mailben Minden E-mail cím (valószínűleg te) Minden alkalommal, amikor az adatkészletet újratöltik. A lehető leghamarabb fel kell cserélnie vagy javítania ezeket a fájlokat.
Elhagyni a változókat
Ha néhány fájl nem rendelkezik néhányatdataVariableaz adatkészletben meghatározottdatasets.xmlcunk, ez rendben van. Amikor az EDDTableFromFiles elolvassa az egyik ilyen fájlt, úgy fog működni, mintha a fájl volt a változó, de minden hiányzó érték.
Közel valós idejű adatok
- Az EDDTableFromFiles a legutóbbi adatok iránti kérelmeket különleges esetként kezeli. A probléma: Ha az adatkészletet készítő fájlokat gyakran frissítik, valószínűleg az adatkészletet nem frissítik minden alkalommal, amikor egy fájlt változnak. Tehát az EDDTableFromFiles nem fogja tudni a módosított fájlokat. (Használhatja azászlórendszerDe ez vezethetERDDAP™az adatkészlet újratöltése szinte folyamatosan. Tehát a legtöbb esetben nem ajánljuk.) Ehelyett az EDDTableFromFiles a következő rendszerrel foglalkozik: MikorERDDAP™kérelmet kap az adatokat az elmúlt 20 órában (például 8 órával ezelőtt, egészen mostanáig) ,ERDDAP™Minden olyan fájlt keres, amely az elmúlt 20 órában adatokkal rendelkezik. Így,ERDDAP™nem kell tökéletesen naprakész adatokat tartalmaznia az összes fájl számára, hogy megtalálja a legújabb adatokat. Még mindig meg kell határozni [<újratöltés MindenNMinutes>] (#reloadeveryn percek) ésszerűen kicsi érték (például 60) de nem kell kicsinek lennie (Például 3) ...
-
Nem ajánlott a közeli valós idejű adatok szervezése a fájlokban: Ha például van olyan adatkészleted, amely számos állomásra tárol adatokat (vagy buoy, vagy trajectory, ...) Sok éven át rendezheti a fájlokat, hogy például van egy fájl állomásonként. De akkor minden alkalommal, amikor új adatok érkeznek egy állomásra, el kell olvasnia egy nagy régi fájlt, és írnia kell egy nagy új fájlt. És mikorERDDAP™visszatölti az adatkészletet, észreveszi, hogy néhány fájlt módosítottak, így teljesen elolvassa ezeket a fájlokat. Ez nem hatékony.
-
Ajánlott a közeli valós idejű adatok szervezése a fájlokban: Tárolja az adatokat a zsákokban, például az összes adatot egy állomásra/buoy/trajectory egy évig (vagy egy hónap) ... Aztán, amikor egy új datum érkezik, csak a fájl az idei (vagy hónap) Az adatokat érintik.
-
Legjobb: HasználatNetCDFv3.nckorlátlan dimenzióval rendelkező fájlok (Idő) ... Ezután, új adatok hozzáadásához csak módosíthatja az új adatokat anélkül, hogy el kell olvasnia és újraírnia az egész fájlt. A változás nagyon hatékonyan és lényegében atomikusan történik, így a fájl nem mindig egy következetlen állapotban van.
-
Egyébként: Ha nem / nem használ.nckorlátlan dimenzióval rendelkező fájlok (Idő) Ezután, ha új adatokat kell hozzáadnia, el kell olvasnia és újraírnia az egész érintett fájlt (remélhetőleg kicsi, mert csak egy éve van (vagy hónap) adatok értéke) ... Szerencsére az előző évek összes fájlja (vagy hónap) mert az állomás változatlan marad.
-
mindkét esetben, amikorERDDAP™visszatölti az adatkészletet, a legtöbb fájl változatlan; csak néhány, kis fájlok változott, és olvasni kell.
Rendezők
A fájlok lehetnek egy könyvtárban, vagy egy könyvtárban és az aláírókban (ismétlődően) ... Ha nagyszámú fájl van (Például:>1,000) , operációs rendszer (és így az EDDTableFromFiles) sokkal hatékonyabban fog működni, ha a fájlokat egy sor aláíróban tárolja (egy évente, vagy havonta egy adatkészletek nagyon gyakori fájlokkal) Annak érdekében, hogy soha ne legyen sok fájl egy adott könyvtárban.
Távoli könyvtárak és HTTP Range kérések
-
Távoli könyvtárak és HTTP Range kérések (AKA Byte Serving, Byte Range kérések) - EDDGridFromNcFiles, EDDTableFromMultidimNcFiles, EDDTableFromNcFiles és EDDTableFromNcCFFiles, néha szolgálhat adatokat.ncfájlok távoli szervereken és a HTTP-n keresztül elérhetők, ha a szerver támogatjaByte ServingHTTP tartományi kérések (HTTP mechanizmus a byte szolgáló) ... Ez azért lehetséges, mert netcdf-java (melyikERDDAP™Használat az olvasáshoz.ncfájlok) támogatja az adatok távolról történő olvasását.ncfájlok HTTP tartomány kérések.
Ne csináld ezt!
Ehelyett használja a [[szerkesztés]]]<cacheFromUrl> rendszer (#cachefromurl) ...
CacheFromUrl
- [[szerkesztés]] ** <cacheFromUrl> ** ] (#cachefromurl) -
MindenEDDGridFromFiles és az összes EDDTableFromFiles adatkészlet támogatja egy sor címkét, amelyek elmondjákERDDAP™letölteni és fenntartani egy másolatot az összes távoli adatkészlet fájlok, vagy egy csésze néhány fájl (letöltve, amennyire szükséges) ... Ez egy hihetetlenül hasznos funkció.
-
A<cacheFromUrl> címke lehetővé teszi, hogy megadja az URL-t egy távoli adatkészlet fájlainak listájával egy távoli fájllistából.
- A nem összesített adatkészletek a THREDDS-ben, például https://data.nodc.noaa.gov/thredds/catalog/aquarius/nodc\\_binned\\_V3.0/monthly/ \[2020-10-21 Ez a szerver már nem megbízhatóan elérhető.\]
- A nem összesített adatkészletekHyraxpl.: https://podaac-opendap.jpl.nasa.gov/opendap/allData/ccmp/L3.5a/monthly/flk/
- A legtöbb Apache-szerű könyvtári lista, például https://www.ncei.noaa.gov/data/global-precipitation-climatology-project-gpcp-daily/
- S3 vödör, pl.
https://noaa-goes17.s3.us-east-1.amazonaws.com/
Ez azonban AWS-fiókot és több beállítást igényelhet. LásdS3 Buckets-szel dolgozunkERDDAP™... Továbbá, általában nem kell használni a cache FromUrl fájlokkal S3 buckets, ha a fájlok ASCII fájlok (pl.: .csv) mertERDDAP™hatékonyan olvassa el az adatokat a vödörről közvetlenül egy patakon keresztül.
ERDDAP™lemásolja vagy lekapcsolja ezeket a fájlokat az adatkészletben<fájlDir> könyvtár. Ha szüksége van egy másik típusú távoli fájllistára (pl. FTP) Kérjük, küldje el a kérését Chrisnek. John at noaa.gov.
- Az alapértelmezett érték a<cacheFromUrl> címke null. Ha nem adja meg az értéket<cacheFromUrl> címke, a copy/cache rendszer nem használható az adatkészlethez.
- Ha az adatkészlet<fileRegex> a beállítás valami más, mint .\*,ERDDAP™csak letölteni fájlokat, amelyek megfelelnek a fájlRegex.
- Ha az adatkészlet<visszaszerző> beállítás igaz, és a távoli fájlok közvetettek,ERDDAP™olyan távoli előirányzatokban fog megjelenni, amelyek megfelelnek az adatkészletnek [<PaintRegex>] (#pathregex) , hozzon létre ugyanazt a könyvtári struktúrát helyileg, és helyezze a helyi fájlokat ugyanabban az alirányítókban.
- A GenerateDatasets Xml, ha megadja a<cacheFromUrl> érték, Generáció Adatkészletek Xml létrehozza a helyi<fájlDir> könyvtár és másoljon 1 távoli fájlt. GenerateDatasets Az Xml ezután generáljadatasets.xmlcunk ezen mintafájl alapján (minta meghatározása File=nem) ...
- Ha az adatforrás távoliERDDAP™HasználatEDDGridFromErdapvagyEDDTableFromErddaphelyette<cacheFromUrl>. Így, a helyiERDDAP™Úgy tűnik, hogy az adatkészlet, de nem kell tárolni az adatokat helyileg. Az egyetlen ok a használatra<cacheFromUrl> az adatok távolrólERDDAP™akkor van, ha van más oka annak, hogy miért akarja az adatfájlok helyi másolatát. Ebben az esetben:
- Ez az adatkészlet megpróbálja feliratkozni a távoli adatkészletreERDDAPhogy az adatkészlet változásai ezt az adatkészlet zászlaját fogják hívni Url, ezzel a helyi adatkészlettel, hogy újratöltse és letöltse a módosított távoli fájlokat. Így a helyi adatkészlet hamarosan naprakész lesz, miután a változások a távoli adatkészlethez kerülnek.
- E-mailt kell küldenie a távoli adminisztrátornakERDDAP™Kérdezd megdatasets.xmla távoli adathalmaz számára, hogy az adathalmazt a helyiERDDAP™Úgy néz ki, mint a távoli adatkészletERDDAP...
- Ha az adatforrás távoliERDDAP™A helyi adatkészlet megpróbálja feliratkozni a távoli adatkészletre.
- Ha az előfizetés sikerül, bármikor a távoliERDDAPreloads és új adatokkal rendelkezik, felveszi a kapcsolatot a flagURL-rel az adatkészlethez, ami lehetővé teszi az új és/vagy megváltozott adatfájlok újratöltését és letöltését.
- Ha az előfizetés kudarcot vall (bármilyen okból) vagy ha egyszerűen azt szeretnénk biztosítani, hogy a helyi adatkészlet naprakész legyen, beállíthat egyzászlóa helyi adatkészlet esetében, így újratöltődik, így ellenőrizni fogja az új és/vagy módosított távoli adatfájlokat.
- Ha az adatforrás nem egy távoliERDDAP: az adatkészlet ellenőrzi az új és/vagy módosított távoli fájlokat, amikor visszatölti. Normális esetben ezt ellenőrzi [a]<újratöltés MindenNMinutes>] (#reloadeveryn percek) ... De ha tudod, mikor vannak új távoli fájlok, beállíthatsz egyzászlóa helyi adatkészlet esetében, így újratölti és ellenőrizi az új és/vagy módosított távoli adatfájlokat. Ha ez rutinszerűen történik egy bizonyos napon (pl.: 7 órakor) Cron munkát végezhet a használathozcurlKapcsolatba lépni a zászlóval Üdvözöljük ezt az adatkészletet, ezért újratölti és ellenőrizi az új és/vagy módosított távoli adatfájlokat.
-
A<cacheSizeGB> címke meghatározza a helyi cache méretét. Valószínűleg csak akkor kell használnia, ha olyan felhőtároló rendszerekkel dolgozol, mint példáulAmazon S3amely egy általánosan használt tárolórendszer, amely részeAmazon Web Services (AWS) ... Az alapértelmezettség -1.
- Ha az érték<=0 (pl. az -1 alapértelmezett értéke) ,
ERDDAP™letölteni és fenntartani egy Teljes másolat az összes távoli adatkészlet fájlja az adatkészletben<fájlDir>.
- Ez az a beállítás, amelyet bármikor ajánlott.
- Minden alkalommal, amikor az adatkészletet újratöltik, összehasonlítja a távoli fájlok és a helyi fájlok neveit, méreteit és LastModified időit, és letölti az új vagy megváltozott távoli fájlokat.
- Ha egy távoli szerveren lévő fájl eltűnik,ERDDAP™nem törli a megfelelő helyi fájlt (egyébként, ha valami átmenetileg rossz volt a távoli szerverrel,ERDDAP™törölhet néhány vagy az összes helyi fájlt!) ...
- Ezzel a beállítással általában beállítja<frissítésEveryNMillis> -1-re, mivel az adatkészlet tisztában van azzal, hogy új adatfájlokat telepített be.
- Ha az érték >0,
ERDDAP™letölti a távoli adatkészletből származó fájlokat, amennyire szükséges egy helyi Húsvét (az adatkészletben<fájlDir>) a megadott számú GB küszöbértékével.
- A gyorsítótárnak elég nagynak kell lennie ahhoz, hogy legalább több adatfájlot tartson.
- Általában a nagyobb a gyorsaság, annál jobb, mert a következő kért adatfájl nagyobb valószínűséggel lesz a gyorsaságban.
- Caching csak akkor használható, haERDDAP™fut egy felhő számítástechnikai szerveren (pl. egy AWS-kompatippus) és a távoli fájlok felhőtároló rendszerben (pl.: AWS S3) ...
- Amikor a helyi fájlok által használt lemezterület meghaladja a cache-t SizeGB,ERDDAP™hamarosan (Lehet, hogy nem azonnal) törleszteni néhány csésze fájlt (jelenleg a legkevésbé használt legutóbbi (LRU) algoritmus) amíg a helyi fájlok által használt lemezterület nem<0.75\*cacheSizeGB (A "goal") ... Igen, vannak olyan esetek, amikor az LRU nagyon rosszul teljesít – nincs tökéletes algoritmus.
- ERDDAP™Soha nem próbálja törölni egy csésze fájltERDDAP™az utolsó 10 másodpercben kezdtek használni. Ez egy tökéletlen rendszer, amely kezeli a cache rendszert, és az adatfájl-olvasó rendszert csak lazaan integrálják. E szabály miatt,ERDDAP™Lehet, hogy nem tudja törölni elég fájlokat, hogy elérje a célját, amely esetben a WARNING-t nyomtatja a log.txt fájlba, és a rendszer sok időt veszteget, hogy megpróbálja megdönteni a gyorsítótárat, és lehetséges, hogy a fájlok mérete a cacheSizeGB-t nagymértékben meghaladhatja. Ha ez megtörténik, használjon nagyobb cacheSizeGB beállítást az adatkészlethez.
- Jelenleg,ERDDAP™Soha nem ellenőrzi, hogy a távoli szerver rendelkezik-e egy olyan fájl új verziójával, amely a helyi cache-ban van. Ha szüksége van erre a funkcióra, kérjük, e-mailben Chris. John at noaa.gov.
- Bár ugyanazok a címke nevek használata azt jelenti, hogy a másolatrendszer és a cache rendszer ugyanazt az alaprendszert használja, ami nem helyes.
- A másolatrendszer proaktívan indítja el a feladatotHárom feladatot, hogy minden alkalommal letöltse az új és megváltozott fájlokat, amikor az adatkészletet újratöltik. Csak olyan fájlok, amelyek ténylegesen másoltak a helyi könyvtárban, elérhetők aERDDAP™adatkészlet.
- A cache rendszer minden alkalommal megkapja a távoli fájllistát, amikor az adatkészletet újratöltik, és úgy tesz, hogy ezek a fájlok mindegyike elérhető.ERDDAP™adatkészlet. Érdekes, hogy az összes távoli fájl még az adatkészlet /files / weboldalakon is megjelenik, és letölthető (Bár talán csak késés után, míg a fájlt először letöltik a távoli szerverről a helyi gyorsítótárba.)
- Azok az adatok, amelyek a cacheSizeGB-t használják, előnyösek lehetnek egynHáromnagyobb beállítás, mint 1, mert ez lehetővé teszi, hogy az adatkészlet több mint 1 távoli fájl egy időben.
- Ha az érték<=0 (pl. az -1 alapértelmezett értéke) ,
ERDDAP™letölteni és fenntartani egy Teljes másolat az összes távoli adatkészlet fájlja az adatkészletben<fájlDir>.
-
A<cachePartialPathRegex> címke egy ritkán használt címke, amely meghatározhatja az adatkészlet alternatíváját [<PaintRegex>] (#pathregex) ... Az alapértelmezettség null.
- Csak akkor használja ezt, ha az egész adatkészletet az alapértelmezésen keresztül másolja<cacheSizeGB> érték -1. With<cacheSizeGB> értékek >1, ez figyelmen kívül hagyják, mert ez nem érzéki.
- Lásd [a dokumentációt]<PaintRegex>] (#pathregex) útmutatásért, hogyan építsük fel a regexet.
- Ha ez meg van határozva, akkor minden alkalommal felhasználják az adatkészletet, kivéve, ha az adatkészletet egy hónap elején újratöltik.
- Ez akkor hasznos, ha a távoli adatkészletet labirintusban tárolják, és amikor ezeknek a fájloknak a túlnyomó többsége ritkán változik, ha valaha is megváltozik. ()<köhögés> NASA<Kemény>) Például meg lehet határozni egy<cachePartialPathRegex> amely csak megfelel a jelenlegi évnek vagy a jelenlegi hónapnak. Ezek a regexek nagyon trükkösek, hogy meghatározzák, mert az összes részleges és teljes úti neveknek meg kell felelniük a<cachePartialPathRegex> és mert<A cachePartialPathRegexnek a távoli URL-ekkel és a helyi könyvtárakkal kell dolgoznia. Az igazi élet példa:
-
<cacheFromUrl>https://data.nodc.noaa.gov/ghrsst/GDS2/L4/GLOB/JPL/MUR/v4.1/</cacheFromUrl>
\\>!-- \\[2020-10-21 This server is no longer reliably available.\\] For most types of remote directories, omit the filename (e.g., contents.html for Hyrax). -->
<fileDir>/u00/satellite/MUR41/</fileDir>
<fileNameRegex>\\*\\.nc</fileNameRegex>
<recursive>true</recursive>
<pathRegex>.\\*</pathRegex>
<cachePartialPathRegex>.\\*/v4\\.1/(|2018/(|01./))</cachePartialPathRegex>
A fentebbi minta fájlokat tartalmaz az év alapján (pl. 2018) az év napja (pl. 001, 002, 365 vagy 366) ... Vegyük észre, hogy a<cachePartialPathRegex> kezdődik .\*, akkor van egy konkrét aláírás, amely gyakori a távoli URL-ek és a helyi könyvtárak, például /v4.1/ Ezután van egy sor fészkes rögzítő csoport, ahol az első lehetőség semmi és a második lehetőség egy adott érték.
A fenti példának csak 2018 második 10 napján kell megfelelnie a könyvtáraknak, pl.
https://data.nodc.noaa.gov/ghrsst/GDS2/L4/GLOB/JPL/MUR/v4.1/2018/010/ \[2020-10-21 Ez a szerver már nem megbízhatóan elérhető.\]
nap 011, 012, ..., 019.
(Lásd eztregex dokumentációésregex bemutató...)
Ha segítségre van szüksége<cachePartialPathRegex>, kérlek e-mailt<cacheFromUrl> Chrishez. John at noaa.gov.
- Közös megközelítés: Ha használni akar<cachePartialPathRegex>, ne használja eredetileg, mert akarjaERDDAP™Először letölteni az összes fájlt. UtánaERDDAP™letöltötte az összes fájlt, hozzáadta az adatkészlet csomójátdatasets.xml...
Több ezer fájl
Ha az adatkészlet több ezer fájlt tartalmaz,ERDDAP™lassú lehet reagálni az adatkészletből származó adatok kérésére. Itt két kérdés van:
- A fájlok száma könyvtáronként. Internally,ERDDAP™ugyanazon sebességgel működik, függetlenül attól, hogy az n fájlok egy könyvtárban vannak-e, vagy több könyvtárban vannak-e szétszórva. De van egy probléma: Minél több fájl egy adott könyvtárban, annál lassabb az operációs rendszer a fájlok listájának visszatérése a könyvtárban (Fájl) aERDDAP... A válaszidő lehet O (n log n) ... Nehéz megmondani, hogy az egyik könyvtárban hány fájl túl sok, de 10.000 valószínűleg túl sok. Tehát, ha a beállítás sok fájlt generál, itt lehet egy ajánlás: tegye be a fájlokat logikailag szervezett alirányítókba (pl. állomás vagy állomás/év) ...
Egy másik ok az aláírók használatára: ha egy felhasználó használni akarERDDAPA"files"rendszer, amely megtalálja a X állomás legrégebbi fájljának nevét, gyorsabb és hatékonyabb, ha a fájlok állomáson / év alatti előirányzatokban vannak, mert sokkal kevesebb információt kell átadni.
- A fájlok teljes száma.
mesés adatkészletek esetében,ERDDAP™nyomon követi az értékek tartományát minden egyes fájlban. Amikor egy felhasználó kérést tesz,ERDDAP™el kell olvasnia az összes adatot az összes olyan fájlból, amely adatot tartalmazhat a felhasználó kérésére. Ha a felhasználó korlátozott ideig kéri az adatokat (pl. egy nap vagy egy hónap) AztánERDDAP™Nem kell túl sok fájlt nyitnia az adatkészletében. De vannak szélsőséges esetek, ahol szinte minden fájlnak megfelelnie kell az adatoknak (pl. amikor a vízTemperature=13.2C) ... Mivel eltartERDDAP™egy kis idő (részben a keresési idő a HDD-n, részben az idő, hogy elolvassa a fájl fejlécét) Csak egy adott fájl megnyitása (Sőt, ha sok fájl van a könyvtárban) Jelentős időbüntetés van, ha a fájlok teljes számaERDDAP™nyitottnak kell lennie, nagyon nagy. Még az 1000 fájl megnyitása is jelentős időt vesz igénybe. Tehát vannak előnyök, hogy rendszeresen konszolidálja a napi fájlokat nagyobb darabokra (pl. 1 állomás 1 évig) ... Megértem, hogy nem akarod ezt különböző okokból megtenni, de sokkal gyorsabb válaszokhoz vezet. szélsőséges esetekben (pl. egy GTSPP adatkészlettel foglalkozom, amely ~35 millió forrásfájltal rendelkezik) Számos forrásfájlból származó adatok kiszolgálása gyakorlati, mertERDDAP"Az egyszerű kérdésekre adott válasz órákat vehet igénybe, és tonna memóriát használhat. A forrásfájlok kisebb számba történő konszolidálása (a GTSPP-hez, most 720-as, havonta 2) ,ERDDAP™ésszerűen gyorsan reagálhat. LásdFiles milliói
N.B. Solid State Drives nagyszerű! A leggyorsabb, legkönnyebb, legolcsóbb módja annak, hogy segítsenERDDAP™ügyeljen egy hatalmas számú (kicsi) A fájlok szilárd állami meghajtót használnak. LásdA Solid State Drives nagyszerű!
Files milliói
-
Néhány adatkészletnek több millió forrásfájlja van.ERDDAP™képes kezelni ezt, de vegyes eredményekkel.
- Olyan kérelmek esetében, amelyek csak a változókat tartalmazzák [a]<subsetVariables>>>>>> (#subsetvariables) ,ERDDAP™az összes szükséges információ már kivont az adatokból és tárolt egy fájlban, így nagyon, nagyon gyorsan reagálhat.
- egyéb kérések esetén,ERDDAP™szkennelheti az adatkészletetcached fájl információés kitalálja, hogy csak néhány fájlnak lehetnek olyan adatok, amelyek relevánsak a kérésre, és így gyorsan reagálnak.
- De más kérések esetén (Például a vízTemperature=18 fok\_C) ha bármilyen fájlnak releváns adatai lehetnek,ERDDAP™számos fájlt kell megnyitnia, hogy megnézze, hogy minden fájlnak van-e olyan adatai, amelyek relevánsak a kérelemhez. A fájlokat sorozatosan nyitották meg. Bármely operációs rendszer és bármilyen fájlrendszer (más, mint a szilárd állami meghajtók) Ez sokáig tart (ígyERDDAP™Lassan reagál) és valóban összekapcsolja a fájlrendszert (ígyERDDAP™lassan reagál más kérésekre) ...
Szerencsére van megoldás.
- Állítsa be az adatkészletet egy nem nyilvánosERDDAP™ (Személyes számítógépe?) ...
- Hozzon létre és futtassa a forgatókönyvet, amely sorozatot kér.ncCF fájlok, mindegyik nagy darab adatkészlet, általában egy idő (például az összes adat egy adott hónapra) ... Válassza ki az időt, hogy az összes kapott fájl kevesebb, mint 2GB (de remélhetőleg nagyobb, mint 1 GB) ... Ha az adatkészlet közeli idejű adataival rendelkezik, futtassa a forgatókönyvet, hogy regenerálja a fájlt a jelenlegi időszakra (pl. ez a hónap) gyakran (10 percenként? Minden órában?) ... KérésekERDDAP™Mert.ncA CF fájlok létrehoznak egyNetCDFv3.ncfájl, amely használja aCF Discrete Sampling Geometries (DSG) Contiguous Ragged Array adatstruktúrák).
- Állj fel egyEDDTableFromNcCFFilesadatkészlet a nyilvánosság számáraERDDAP™amely adatokat kap.nc (CF) fájlok.ERDDAP™nagyon gyorsan kivonhatja az adatokat ezekből a fájlokból. És mivel most több tucat vagy száz (milliók helyett) fájlok, még akkor is, haERDDAP™ki kell nyitnia az összes fájlt, ezt gyorsan megteheti.
Igen, ez a rendszer némi időt és erőfeszítést igényel, de nagyon jól működik. A legtöbb adatkérés 100-szor gyorsabban kezelhető, mint korábban. \[Bob tudta, hogy ez egy lehetőség, de Kevin O'Brien volt, aki először ezt tette, és megmutatta, hogy jól működik. Most, A Bob ezt a GTSPP adatkészletre használja, amelynek mintegy 18 millió forrásfájlja van, és amelyekERDDAP™most körülbelül 500-on keresztül szolgál.nc (CF) fájlok.\]
N.B. Solid State Drives nagyszerű! A leggyorsabb, legkönnyebb, legolcsóbb módja annak, hogy segítsenERDDAP™ügyeljen egy hatalmas számú (kicsi) A fájlok szilárd állami meghajtót használnak. LásdA Solid State Drives nagyszerű!
Hatalmas fájlok
- Egyetlen hatalmas adatfájl (nevezetesen hatalmas ASCII adatfájlok) lehet okozni egy OutOfMemoryError. Ha ez a probléma, nyilvánvalónak kell lennie, mertERDDAP™nem fogja betölteni az adatkészletet. A megoldás, ha megvalósítható, a fájlt több fájlba osztja. Ideális esetben a fájlt logikai darabokra oszthatja. Például, ha a fájl 20 hónapos adatértékkel rendelkezik, 20 fájlra osztja, mindegyik 1 hónapos adatértékkel. De vannak előnyök még akkor is, ha a fő fájlt önkényesen osztják fel. Ennek a megközelítésnek több előnye van: a) Ez csökkenti az adatfájlok 1/20. elolvasásához szükséges memóriát, mert csak egy fájl olvasható egy időben. b) Gyakran,ERDDAP™sokkal gyorsabban kezelheti a kérelmeket, mert csak egy vagy néhány fájlban kell megnéznie, hogy megtalálja az adatokat egy adott kérésre. c) Ha az adatgyűjtés folyamatban van, akkor a meglévő 20 fájl változatlan maradhat, és csak egy, kis, új fájlt kell módosítania, hogy hozzáadja a következő hónapi adatértéket az adatkészlethez.
FTP hiba / tanács
- Ha FTP új adatfájlokat készítERDDAP™szerver,ERDDAP™fut, van esély arra, hogyERDDAP™az FTP folyamat során újratölti az adatkészletet. Gyakrabban fordul elő, mint gondolnád! Ha ez megtörténik, a fájl úgy tűnik, hogy érvényes (érvényes neve) , de a fájl nem érvényes. HaERDDAP™megpróbálja elolvasni az adatokat ebből az érvénytelen fájlból, az ebből eredő hiba okozza a fájlt az érvénytelen fájlok táblázatához. Ez nem jó. A probléma elkerülése érdekében használjon ideiglenes fájlnévet, amikor az FTP a fájlt, például az ABC2005.nc\_TEMP . Ezután a fájlNameRegex teszt (lásd alább) jelzi, hogy ez nem releváns fájl. Miután az FTP folyamat befejeződött, nevezze át a fájlt a helyes névre. A megnevezési folyamat azt fogja okozni, hogy a fájl egy pillanat alatt releváns legyen.
File Name Extracts
\[Ez a funkció DEPRECATED. Kérjük, használja\\\*fileName pseudosourceNameEhelyett.\]
Az EDDTableFromFiles rendszerrel rendelkezik egy String kivonására minden fájlnévből, és arra használja, hogy a pseudo adat változó legyen. Jelenleg nincs rendszer arra, hogy ezeket a Hangokat dátumként/időként értelmezzük. Számos XML-címke van, hogy létrehozza ezt a rendszert. Ha nincs szüksége részre vagy egész rendszerre, csak ne határozza meg ezeket a címkéket, vagy használja a "" értékeket.
- PreExtractRegex egyrendszeres kifejezés (tutorial) használt szöveg azonosítására, amelyet eltávolítanak a fájlnév kezdetétől. A eltávolítás csak akkor fordul elő, ha a regex egyezik. Ez általában a "^"-val kezdődik, hogy megfeleljen a fájlnév kezdetének.
- Hozzászólás ExtractRegex egy rendszeres kifejezés, amelyet a szöveg eltávolítására használnak a fájlnév végétől. A eltávolítás csak akkor fordul elő, ha a regex egyezik. Ez általában a "$"-vel ér véget, hogy megfeleljen a fájlnév végének.
- KivonatRegex Ha jelen van, ezt a rendszeres kifejezést a preExtractRegex és a postExtractRegex után használják, hogy azonosítsák a karakterláncot, amelyet kivonnak a fájlnévből (Például,stationID) ... Ha a regex nem egyezik, az egész fájlnévet használják (mínusz preExtract és poszt Kivonat) ... Használja a ".\*"-t, hogy megfeleljen az egész fájlnévnek, amely a PreExtractRegex és a PostExtractRegex után marad.
- oszlop A NameForExtract az adatoszlop forrás neve a kivont Strings számára. AdataVariableezzelsourceNamebe kell tartani adataVariableS lista (bármilyen adattípussal, de általában String) ...
Például, ha egy adatkészlet olyan nevekkel rendelkezik, mint a XYZAble.ncXYZBaker.ncXYZCharlie.nc... és új változót akarsz létrehozni (stationID) ha minden fájl olvasható, amely állomása ID értékek (Able, Baker, Charlie, ...) kivont a fájlnév, lehet használni ezeket a címkéket:
- <PreExtractRegex ^XYZ</preExtractRegex> A kezdeti ^ egy rendszeres kifejezés speciális karakter, amely erőkERDDAP™keresni XYZ elején a fájlnév. Ez okozza a XYZ-t, ha a fájlnév elején találják, eltávolítható (Például a XYZAble fájlnév.ncAble lett.nc) ...
- <posztExtractRegex> \.nc$ €postExtractRegex> A végén egy rendszeres kifejezés speciális karakter, amely erőkERDDAP™keresni.nca fájlnév végén. Mivel . egy rendszeres kifejezés speciális karakter (amely megfelel minden karakternek) , ez kódolt, mint \. itt (mert a 2E a hexadecimális karakterszám egy időszakra) ... Ez okozza.nc, ha a fájlnév végén található, eltávolítható (Például a részleges fájlnév Able.ncAble lett) ...
- <ExtractRegex>.\</extraRegex> A .\ rendszeres kifejezés megfelel az összes fennmaradó karakternek (Például a részleges fájlnév Able az első fájl kivonatává válik) ...
- <oszlopNameForExtract>stationID</columnNameForExtract> Ez azt mondjaERDDAP™létrehozni egy új forrás oszlop úgynevezettstationIDminden fájl olvasásakor. Minden adatsor egy adott fájlra lesz kivonva a fájlnévből (például, Able) mint érték astationIDoszlop.
A legtöbb esetben számos értéke van ezeknek a kivonat címkéknek, amelyek ugyanazokat az eredményeket hozzák - a rendszeres kifejezések nagyon rugalmasak. De néhány esetben csak egy módja van a kívánt eredmények elérésére.
PseudosourceNames
Minden változó minden adatkészletbenERDDAP™[[Ki]]]<sourceName>>>>>> (#sourcename) amely meghatározza a forrás neve változó. Az EDDTableFromFiles néhány pszeudót támogatsourceNamekivonat értéket más helyről (pl. a fájl neve vagy a globális tulajdonság értéke) és támogassa ezt az értéket, hogy állandó értékek oszlopa legyen az adott részes adatok számára (pl. a fájl adatainak táblázata) ... Ezen változók esetében meg kell határoznia a változó adattípusát [a változó adattípusát] keresztül.<adatType>] (#datatype) Tag. Ha a kivont információ egy dátumTime sztring, megadja a formátumot a dátumTime sztring aegység tulajdonság... PseudosourceNameopciók:
globális:sourceNames
Egy globális metaadat tulajdonsága minden forrásadat fájl lehet előmozdítani, hogy egy oszlop az adatok. Ha egy változó<sourceName> rendelkezik formátummal
<sourceName>global:*attributeName*</sourceName>
akkor, amikorERDDAP™az adatokat egy fájlból olvassa el,ERDDAP™globális jelleget fog keresni ebből a névből (Például PI) és hozzon létre egy oszlopot, amely tele van a tulajdonság értékével. Ez akkor hasznos, ha a tulajdonságnak különböző értékei vannak a különböző forrásfájlokban, mert máskülönben a felhasználók csak az egyik értéket látnák az egész adatkészlet számára. Például,
<sourceName>global:PI</sourceName>
Amikor egy tulajdonságot hirdet, hogy adatok legyenek,ERDDAP™eltávolítja a megfelelő tulajdonságot. Ez azért helyénvaló, mert az érték feltehetően különbözik minden fájlban; mivel az összesített adatkészletbenERDDAP™csak egy értéke lesz. Ha akarja, hozzáadhat egy új értéket az egész adatkészlet tulajdonságához azáltal, hogy hozzáad<att name=" tulajdonság név ">>> új Érték </att> az adatkészlet globális részére [<addAttributes>>>>>> (#addattributes) ... A globális tulajdonságokért, amelyekERDDAP™megköveteli például az intézménytől, hogy új értéket adjon hozzá a tulajdonsághoz.
változó:sourceNames
A változó metaadata tulajdonsága minden fájlban elősegíthető az adatok oszlopának. Ha egy változó<sourceName\> a formátum
<sourceName>variable:*variableName*:*attributeName*<sourceName>
akkor, amikorERDDAP™az adatokat egy fájlból olvassa el,ERDDAP™keresni fogja a meghatározott tulajdonságot (Például ID) a meghatározott változó (például instrumentum) és hozzon létre egy oszlopot, amely tele van a tulajdonság értékével. A szülői változó (például instrumentum) nem kell az egyikdataVariableaz adatkészlet meghatározásában foglaltERDDAP... Például,
<sourceName>variable:instrument:ID</sourceName>
Ez akkor hasznos, ha a tulajdonságnak különböző értékei vannak a különböző forrásfájlokban, mert máskülönben a felhasználók csak az egyik értéket látnák az egész adatkészlet számára.
Amikor egy tulajdonságot hirdet, hogy adatok legyenek,ERDDAP™eltávolítja a megfelelő tulajdonságot. Ez azért helyénvaló, mert az érték feltehetően különbözik minden fájlban; mivel az összesített adatkészletbenERDDAP™csak egy értéke lesz. Ha akarja, hozzáadhat egy új értéket az egész adatkészlet tulajdonságához azáltal, hogy hozzáad<att name=" tulajdonság név ">>> új Érték </att> a változó [<addAttributes>>>>>> (#addattributes) ... A tulajdonságokért, hogyERDDAP™például megköveteliioos\_category (a beállítástól függően) Hozzá kell adni egy új értéket a tulajdonsághoz.
fájlNamesourceNames
Kivonhatja a fájl fájlja részét, és elősegítheti, hogy az adatok oszlopa legyen. A Pseudo formátuma [<sourceName>>>>>> (#sourcename) az
<sourceName>\\*\\*\\*fileName,*regex*,*captureGroupNumber*</sourceName>
Például,
<sourceName>\\*\\*\\*fileName,A(\\d{12})\\.slcpV1.nc,1</sourceName>
Amikor az EDDTableFromFiles egy fájlból olvassa el az adatokat, megbizonyosodik arról, hogy a fájlName (Például az A201807041442.slcpV1.nc) megfelel a meghatározott rendszeres kifejezésnek ("regex") és kivonja a megadott (Ebben az esetben az első) rögzítő csoport (amely a parentheses által körülvéve) Például: "201807041442". (Lásd eztregex dokumentációésregex bemutató...) A regex lehet meghatározni, mint egy húr, vagy anélkül, hogy környező idézetek. Ha a regexet a környező idézetekkel húrként határozzák meg, a húrnak kell lennieJSON stílusú sztring (speciális karakterekkel elmenekült \ karakterekkel) ... A rögzítő csoport száma általában 1 (az első rögzítő csoport) De lehetnek számok.
dalszövegsourceNames
Kivonhatja a fájl teljes útját név (/directories/fileName.ext) és előmozdítja ezt az adatoszlopnak. A Pseudo formátuma [<sourceName>>>>>> (#sourcename) az
<sourceName>\\*\\*\\*pathName,*regex*,*captureGroupNumber*<sourceName>
Például,
<sourceName>\\*\\*\\*pathName,/data/myDatasetID/(\\[A-Z0-9\\]\\*)/B(\\d{12}).nc,1</sourceName>
Amikor az EDDTableFromFiles egy fájlból olvassa el az adatokat, megbizonyosodik arról, hogy a teljes útvonal Name (Például /data/myDatasetID/BAY17/B201807041442.nc... Ehhez a teszthez a könyvtári elválasztó mindig lesz'/'Sohasem » "...") megfelel a meghatározott rendszeres kifejezésnek ("regex") és kivonja a megadott (Ebben az esetben az első) rögzítő csoport (amely a parentheses által körülvéve) Például: "BAY17". (Lásd eztregex dokumentációésregex bemutató...) A regex lehet meghatározni, mint egy húr, vagy anélkül, hogy környező idézetek. Ha a regexet a környező idézetekkel húrként határozzák meg, akkor a húrnak kell lennieJSON stílusú sztring (speciális karakterekkel elmenekült \ karakterekkel) ... A rögzítő csoport száma általában 1 (az első rögzítő csoport) De lehetnek számok.
"0 fájl" hibaüzenet
- Ha futszGenerateDatasetsXmlvagyDasDdsvagy ha megpróbálsz betölteni egy EDDTableF-et... Files adatkészletERDDAP™, és kap egy "0 fájl" hibaüzenetet, amely jelzi, hogyERDDAP™talált 0 megfelelő fájlokat a könyvtárban (ha úgy gondolja, hogy van egyező fájlok ebben a könyvtárban) :
- Ellenőrizze, hogy a fájlok valóban ebben a könyvtárban vannak.
- Ellenőrizze a könyvtár neve varázslatát.
- Ellenőrizze a fájlNameRegex. Valójában nagyon könnyű hibákat hibáztatni a regexekkel. Tesztcélok esetén próbálja meg a regex .\*-t, amely minden fájlnévhez illeszkedik. (Lásd eztregex dokumentációésregex bemutató...)
- Ellenőrizze, hogy a felhasználó, aki fut a program (pl. felhasználó=tomcat (?) Tomcat/ERDDAP) "olvassa" az engedélyt ezekre a fájlokra.
- Egyes operációs rendszerekben (például SELinux) és a rendszerbeállításoktól függően a felhasználónak, aki futtatja a programot, „olvassa” a könyvtárak egész láncolatát, amely a fájlokat tartalmazó könyvtárhoz vezet.
szabványosítás Amit
- Ha az EDDTableFromFiles bármely alosztálya egy sor forrásfájlot tartalmaz, egy adott változó esetében az összes forrásfájlnak azonos tulajdonságai vannak több tulajdonság számára:scale\_factor,add\_offset, \_Unsigned,missing\_value, \_FillValue és egység). Gondolj bele: ha egy fájl WindSpeed units=knots és egy másik szélSpeed units=m/s, akkor a két fájl adatértékeit nem kell ugyanabban az aggregált adatkészletben tartalmazni. Tehát, amikor az EDDTableFromFiles először létrehozza az adatkészletet, elolvassa az egyik fájltól származó tulajdonságértékeket, akkor elutasítja az összes olyan fájlt, amely különböző értékekkel rendelkezik az említett fontos tulajdonságok számára. A legtöbb fájlgyűjtemény esetében ez nem probléma, mert az összes változó tulajdonságai következetesek. Azonban más fájlgyűjtések esetében ez 1%, 10%, 50%, 90% vagy akár 99% -os fájlhoz vezethet, amelyeket "rossz" fájlként utasítanak el. Ez baj.
Az EDDTableFrom fájloknak van egy rendszere, amely kezeli ezt a problémát: szabványosítani Mi. A szabványosítás A beállítás azt mondja, hogy az EDDTableFromFiles szabványosítja a fájlokat, amint olvassa őket, mielőtt az EDDTableFromFiles megnézi a tulajdonságokat, hogy lássa, következetes-e.
A flip oldal: ha az adatkészlet nem rendelkezik ezzel a problémával, ne használjon szabványosítást Mi. szabványosítás Milyen potenciális kockázatokkal jár (az alábbiakban tárgyalt) és hiányosságok. Tehát, ha nem igazán kell a szabványosítás jellemzői Ami, nem kell szembenéznie a potenciális kockázatokkal és a hatékonysággal. A legnagyobb hatékonyság: ha különböző szabványosítás Milyen lehetőségeket használnak egy adatkészlet, azt jelenti, hogy a forrásfájlok tárolják az adatokat jelentősen eltérő módon (pl. különbözőscale\_factorésadd\_offsetvagy időhúrokkal különböző formátumokat használ) ... Így egy adott korlátozott felhasználói kérelem esetén nincs mód arra, hogyERDDAP™egyetlen forrásszintű korlátozás létrehozása, amely minden forrásfájlra alkalmazható. SzóvalERDDAP™csak magasabb szinten alkalmazhatja az érintett korlátozásokat. SzóvalERDDAP™el kell olvasnia az adatokat több fájlból, mielőtt a magasabb, célszintű korlátozásokat alkalmazná. Ezért kéri az olyan adatkészleteket, amelyek szabványosítással rendelkeznek Mi tart tovább feldolgozni.
Ennek a rendszernek a használatához meg kell határoznia
<standardizeWhat>*standardizeWhat*</standardizeWhat>
adatasets.xmlaz EDDTableFrom... Files adatkészlet(azonnal<adatkészlet> címke).
A szabványosítás Amit az érték meghatározza, hogy mely változásokat EDDTableFromFiles kell próbálni alkalmazni. A változások a következő kombináció összege:
- Unpack
Ez sok közös és biztonságos műveletet tesz a számszerű oszlopok szabványosítására a fájlokban:
- Hascale\_factorvagyadd\_offsetattribútumok jelen vannak, távolítsa el őket, és alkalmazza őket az adatértékek kicsomagolására.
- Unpack csomagolt tulajdonságok (pl. tényleges\_min, tényleges\_max,actual\_range,data\_min,data\_max, adat\_range,valid\_min,valid\_max,valid\_range) , ha jelen van, ha a változót csomagolták, és ha az attribútum értékeit csomagolták (ez trükkös, de ésszerűen megbízható) ...
- Ha \_FillValue és/vagymissing\_valuejelen vannak, átalakítják ezeket az adatértékeketERDDAP"standard" hiányzó értékek: MAX\_VALUE az integrált típusokhoz (pl.: 127 bytes, 32 767 rövid és 2,147,483,647 ints, 922337203685478 Hosszúság) NaN a duplák és a úszók számára.
- Távolítsa el a régi \_FillValue és/vagymissing\_valuetulajdonságok (ha valaki) , és cserélje őket csak \_FillValue=\[aERDDAP™standard hiányzó érték\]...
- Szabványosítsa a numerikus időket Ha egy numerikus oszlop rendelkezik CF-stílusú numerikus időegységekkel ("..." IdőEgységek óta alapTim ", pl. "napok 1900-01-01 óta") Ez megtéríti a dátumot Időértékek be"seconds since 1970-01-01T00:00:00Z"értékek és változások az egységek tulajdonsága, hogy jelezze. Ha ezt kiválasztják, és van esély arra, hogy ez a változóscale\_factorvagyadd\_offset# 1 MUST is választható.
- Apply Stringmissing\_value
Ha egy sztring oszlop \_FillValue és/vagymissing\_valueattribútumok, ez átalakítja ezeket az értékeket "", és eltávolítja a tulajdonságokat. - Keressen Numericmissing\_value
Ha egy numerikus oszlopnak nincs \_FillValue vagymissing\_valueattribútumok, ez megpróbálja azonosítani a nem meghatározott numerikusmissing\_value (-999, 9999, 1e37f) és átformálja az eseteket a "szabványos" értékekre (MAX\_VALUE az integrált típusokhoz, és NAN a dupla és úszókhoz) ... Ez az opció kockázattal jár: ha a legnagyobb vagy legkisebb érvényes adatérték hiányzó értéknek tűnik (pl. 999) Ezután ezek az érvényes adatértékek megtérülnek a hiányzó értékekre (pl. NaN) ... - Változtasd meg a "N/A"-t " Minden sztring oszlopban több sztringet konvertáltak, amelyek általában arra használják, hogy jelezzék a hiányzó String értéket ". Jelenleg ez "", "...", "-", "?", "??", "N/A", "na", "nem alkalmazható", "null", "nem", "nem", "nem", "nem ismert", "különbözetlen". A sztringkeresés eset-érzékeny, és a húrok után alkalmazott trim'd. "és" és "más" kifejezetten nem szerepel a listán. Ez az opció kockázattal jár: Hangsúlyozza, hogy érvényes értékeknek tekinthető, ""-re váltható.
- Szabványosítani ISO 8601 DateTimes Minden egyes sztring oszlopban próbálja meg átalakítani a nem pusztán-numerikus String dátumotTimes („Jan 2, 2018”) ISO 8601 String dátumTimes ("2018-01-02") ... Megjegyzés hogy az oszlop összes adatértékének ugyanazt a formátumot kell használnia, különben ez az opció nem változtat egy adott oszlopban. Ez az opció kockázattal jár: Ha van egy oszlop a szigorú értékekkel, amelyek csak úgy néznek ki, mint egy közös dátum Időformátum, átalakítják az ISO 8601 String dátumTimes.
- Kompakt dátumok szabványosítása ISO 8601 dátumhoz Minden egyes String vagy integráló típusú oszlop esetében próbálja meg a tisztán-numerikus String dátumot (pl.: „20180102”) ISO 8601 String dátumTimes ("2018-01-02") ... Megjegyzés hogy az oszlop összes adatértékének ugyanazt a formátumot kell használnia, különben ez az opció nem változtat egy adott oszlopban. Ez az opció kockázattal jár: Ha van egy oszlop olyan értékekkel, amelyek nem kompakt dátum Az idők, de úgy néznek ki, mint a kompakt dátumTimes, átalakítják az ISO 8601 String dátumTimes.
- Szabványosítsa az egységek Ez megpróbálja szabványosítani az egyes változó egységeket. Például: "mérő másodpercenként", "mérő/második","m.s^-1","m s-1""m.s-1" minden "m.s-1-re" fog átalakulni. Ez nem változtatja meg az adatértékeket. Ez jól működik érvényesnekUDUNITSegység húrok, de lehet problémák érvénytelen vagy összetett húrok. A problémákkal foglalkozhat, specifikus From-to pairs in<szabványosításUdunits> benneERDDAPA \[Tomcat\]/webapps/erddap/WEB-INF/classes/gov/noa/pfel/erddap/util/messages.xml fájl. Kérjük, küldjön e-mailt bármilyen változást, amit Chris-nek teszel. John at noaa.gov, így beépülhetnek az alapértelmezett üzenetekbe.xml. Ez az opció kockázattal jár: Ez összetett vagy érvénytelen egységeket ölelhet fel; azonban a fent leírt munkakört használhatja a problémák megkerülésére, ha előfordulnak.
A szabványosítás alapértelmezett értéke Mi a 0, ami nem csinál semmit.
Ha/ha megváltoztatod a szabványosítás értékét Mi, a következő alkalommal, amikor az adatkészletet újratöltik,ERDDAP™újraindítja az összes adatfájlot az adatkészlethez, hogy újraépítse a mini-adatbázist az egyes fájlokkal kapcsolatos információkkal. Ha az adatkészlet sok fájlt tartalmaz, ez hosszú időt vesz igénybe.
Megjegyzések:
- Egy trükkös dolog - A szabványosítás Milyen beállítást használnak a forrásfájl összes oszlopához. Így például a #2048 használata sikeresen konvertálhat egy kompakt String dátumotTimes-t az ISO 8601 String dátumTimes-be, de tévesen átalakíthat egy oszlopot olyan Strings-szal, amely csak úgy néz ki, mint a kompakt dátumTimes.
- datasets.xmlés a GenerateDatasets Xml -
Különösen trükkös, hogy a beállítások helyesek legyenekdatasets.xmlhogy az adatkészleted úgy működjön, ahogyan akarod. A legjobb megközelítés (mint mindig) az:
- HasználatGenerateDatasetsXmlés meghatározza a szabványosítás értékét Mit szeretne használni.
- HasználatDasDdsannak biztosítása, hogy az adatkészlet helyesen terheljen, és tükrözze a szabványosítást Milyen beállítás, amit megadott.
- Tesztelje meg az adatkészletet kézzel, haERDDAP™annak biztosítása érdekében, hogy az érintett változók a várt módon működjenek.
- Kockázat - A #256 és a fenti lehetőségek kockázatosabbak, azaz nagyobb esély van arra, hogyERDDAP™változtatni fog, amit nem szabad tenni. Például a #2048 opció véletlenül változhat az állomás ID-csíkokkal, amelyek mind csak az ISO 8601 "kompakt" dátumok megjelenésével történnek (pl. 20180102) ISO 8601"extended"dátumok ("2018-01-02") ...
- Lassú egy változás után - Mivel a szabványosítás értéke Milyen változtatja meg az EDDTableFromFiles adatait, ha módosítja a szabványosítást Milyen beállítás, az EDDTableFromFiles eldobja az összes csípős információt minden fájlról (amely magában foglalja a bányát és a maxot az egyes fájlokban változó adatokhoz) és újraolvassa az egyes adatfájlokat. Ha egy adatkészlet nagyszámú fájlt tartalmaz, ez nagyon időigényes lehet, ezért hosszú időt vesz igénybe az adatkészlet újratöltéséhez.ERDDAP™újratölti azt, miután meghozza a változást.
- Heurisztika - Opciók #256 és fent használja a heurisztika, hogy a változásokat. Ha olyan helyzetben találkozol, ahol a heurisztika rossz döntést hoz, kérjük, írja le a problémát Chrisnek. John at noaa. Gov így javíthatjuk a heurisztikát.
- alternatívák - Ha az egyik szabványosítás Milyen lehetőségeket nem old meg egy adott adatkészlet számára, akkor képes lehet megoldani a problémát azáltal, hogy egy.ncml fájlpárhuzamosan minden adatfájl és meghatározza a dolgok változásait a fájlokban, hogy a fájlok következetesek legyenek. Ezután mondja el az EDDTableF-et... Files adatkészlet aggregálásához.ncml fájlok.
Vagy használjNCOa fájlok tényleges megváltoztatása, hogy a fájlok következetesek legyenek.
Külön oszlopok évre, hónapra, dátumra, órára, percre, másodpercre
Ez meglehetősen gyakori a mesés adatfájlok, hogy külön oszlopokat évente, hónap, dátum, óra, perc, második. KorábbanERDDAP™v2.10, az egyetlen megoldás az adatfájl szerkesztése volt, hogy egyesítse ezeket az oszlopokat egy egységes időoszlopba. EzzelERDDAP™2.10+, használhatja a [[szerkesztés]]<sourceName>= kifejezés <sourceName>>>>>> (#sourcename) Mondd elERDDAP™Hogyan lehet kombinálni a forrás oszlopokat, hogy egységes idő oszlop, így már nem kell szerkeszteni a forrás fájlt.
<skipHeaderToRegex & gt;
- [[szerkesztés]]<skipHeaderToRegex> (#skipheadertoregex) -
VÁLASZTÓ. (EDDTableFromAsciiFiles és EDDTableFromColumnarAsciiFiles adatkészletek csak.)
Amikor az EDDTableFromAsciiFiles egy adatfájlot olvas, figyelmen kívül hagyja az összes sort, és beleértve azt a vonalat, amely megfelel a rendszeres kifejezésnek. Az alapértelmezett "", amely nem használja ezt a lehetőséget. Egy példa
<skipHeaderToRegex>\\\*\\\*\\\* END OF HEADER.\\*<skipHeaderToRegex>
amely figyelmen kívül hagyja az összes sort, és beleértve azt a vonalat, amely a "\*\** END OF HEADER.
Ha ezt a címkét használja,<oszlopNamesRow> és<Az elsőDataRow> úgy működik, mintha a fejléc eltávolításra került volna, mielőtt a fájl olvasható. Például oszlopNamesRow=0-t használnál, ha az oszlop nevek a fejléc után közvetlenül a sorban vannak.
Ha szeretné használni a generációt Adatkészletek Xml egy adatkészlettel, amely szüksége van erre a címkére:
- Készítsen egy új, ideiglenes, minta fájlt egy meglévő fájl másolásával és eltávolítva a fejléct.
- Run generáció Adatkészletek Xml és megadja a minta fájlt.
- Kézzel add hozzá a<skipHeaderToRegex> címke adatasets.xmlcunk.
- Törölje az ideiglenes, minta fájlt.
- Használja az adatkészletetERDDAP...
<skipLinesRegex & gt;
VÁLASZTÓ. (EDDTableFromAsciiFiles és EDDTableFromColumnarAsciiFiles adatkészletek csak.)
Amikor az EDDTableFromAsciiFiles egy adatfájlot olvas, figyelmen kívül hagyja az összes sort, amely megfelel ennek a rendszeres kifejezésnek. Az alapértelmezett "", amely nem használja ezt a lehetőséget. Egy példa
<skipLinesRegex>#.\\*<skipLinesRegex>
amely figyelmen kívül hagyja az összes olyan vonalat, amely "#"-vel kezdődik.
Ha ezt a címkét használja,<oszlopNamesRow> és<Az elsőDataRow> úgy működik, mintha az összes megfelelő sort eltávolították volna, mielőtt a fájl olvasható. Például használná az oszlopNamesRow=0-t, még akkor is, ha több sor kezdődne, például „#” a fájl elején.
EDDTableFromFiles csontváz XML
<dataset type="EDDTableFrom...Files" datasetID\="..." active\="..." >
<nDimensions>...</nDimensions> <!-- This was used prior to ERDDAP™
version 1.30, but is now ignored. -->
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1. For
EDDTableFromFiles subclasses, this uses Java's WatchDirectory system
to notice new/deleted/changed files quickly and efficiently. -->
<standardizeWhat>...</standardizeWhat> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<nThreads>...</nThreads> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<specialMode>mode</specialMode> <-- This rarely-used, OPTIONAL tag
can be used with EDDTableFromThreddsFiles to specify that special,
hard-coded rules should be used to determine which files should
be downloaded from the server. Currently, the only valid mode
is SAMOS which is used with datasets from
https://tds.coaps.fsu.edu/thredds/catalog/samos to download only the
files with the last version number. -->
<sourceUrl>...</sourceUrl> <-- For subclasses like
EDDTableFromHyraxFiles and EDDTableFromThreddsFiles, this is where
you specify the base URL for the files on the remote server.
For subclasses that get data from local files, ERDDAP™ doesn't use
this information to get the data, but does display the
information to users. So I usually use "(local files)". -->
<fileDir>...</fileDir> <-- The directory (absolute) with the data
files. -->
<recursive>true|false</recursive> <!-- 0 or 1. Indicates if
subdirectories of fileDir have data files, too. -->
<pathRegex>...</pathRegex> <!-- 0 or 1. Only directory names which
match the pathRegex (default=".\") will be accepted. -->
<fileNameRegex>...</fileNameRegex> <-- 0 or 1. A regular expression
(tutorial) describing valid data file names, for example,
".\\.nc" for all .nc files. -->
<accessibleViaFiles>true|false(default)</accessibleViaFiles>
<!-- 0 or 1 -->
<metadataFrom>...</metadataFrom> <-- The file to get metadata
from ("first" or "last" (the default) based on file's
lastModifiedTime). -->
<charset>...</charset>
<!-- (For EDDTableFromAsciiFiles and EDDTableFromColumnarAsciiFiles
only) This OPTIONAL tag specifies the character set (case
sensitive!) of the source files, for example, ISO-8859-1
(the default) and UTF-8. -->
<skipHeaderToRegex>...</skipHeaderToRegex>
<skipLinesRegex>...</skipLinesRegex>
<columnNamesRow>...</columnNamesRow> <-- (For EDDTableFromAsciiFiles
only) This specifies the number of the row with the column
names in the files. (The first row of the file is "1".
Default = 1.) If you specify 0, ERDDAP™ will not look for
column names and will assign names: Column#1, Column#2, ... -->
<firstDataRow>...</firstDataRow>
<-- (For EDDTableFromAsciiFiles and EDDTableFromColumnarAsciiFiles
only) This specifies the number of the first row with data in the
files. (The first row of the file is "1". Default = 2.) -->
<dimensionsCSV>...</dimensionsCSV> <-- (For EDDTableFromNcFiles
and EDDTableFromMultidimNcFiles only) This is a comma-separated
list of dimension fullNames. If specified, ERDDAP™ will only read
variables in the source files which use some or all of these
dimensions, plus all of the scalar variables. If a dimension
is in a group, you must specify its fullName,
e.g., "groupName/dimensionName". -->
<-- The next four tags are DEPRECATED. For more information, see
File Name Extracts. -->
<preExtractRegex>...</preExtractRegex>
<postExtractRegex>...</postExtractRegex>
<extractRegex>...</extractRegex>
<columnNameForExtract>...</columnNameForExtract>
<sortedColumnSourceName>...</sortedColumnSourceName>
<-- The sourceName of the numeric column that the data files are
usually already sorted by within each file, for example, "time".
Don't specify this or use an empty string if no variable is
suitable. It is ok if not all files are sorted by this column.
If present, this can greatly speed up some data requests.
For EDDTableFromHyraxFiles, EDDTableFromNcFiles and
EDDTableFromThreddsFiles, this must be the leftmost (first) axis variable.
EDDTableFromMultidimNcFiles ignores this because it has a better
system. -->
<sortFilesBySourceNames>...</sortFilesBySourceNames>
<-- This is a space-separated list of sourceNames
which specifies how the internal list of files should be sorted
(in ascending order), for example "id time".
It is the minimum value of the specified columns in each file
that is used for sorting.
When a data request is filled, data is obtained from the files
in this order. Thus it determines the overall order of the data
in the response. If you specify more than one column name, the
second name is used if there is a tie for the first column; the
third is used if there is a tie for the first and second
columns; ... This is OPTIONAL (the default is
fileDir+fileName order). -->
<sourceNeedsExpandedFP\_EQ>true(default)|false</sourceNeedsExpandedFP\_EQ>
<fileTableInMemory>...</fileTableInMemory> <!-- 0 or 1 (true or
false (the default)) -->
<cacheFromUrl>...</cacheFromUrl> <!-- 0 or 1 -->
<cacheSizeGB>...</cacheSizeGB> <!-- 0 or 1 -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<dataVariable>...</dataVariable> <!-- 1 or more -->
<-- For EDDTableFromHyraxFiles, EDDTableFromMultidimNcFiles,
EDDTableFromNcFiles, EDDTableFromNccsvFiles, and
EDDTableFromThreddsFiles, the source's axis variables (for
example, time) needn't be first or in any specific order. -->
</dataset>
EDDTableFromAsciiService
EDDTableFromAsciiService lényegében egy képernyőkép. Olyan adatforrásokkal kell foglalkozni, amelyek egyszerű webszolgáltatással rendelkeznek az adatok kérésére (gyakran HTML forma egy weboldalon) és amely visszaállíthatja az adatokat egyes strukturált ASCII formátumban (például egy képzett értékű vagy oszlop ASCII szövegformátum, gyakran más információkkal az adatok előtt és/vagy után) ...
EDDTableFromAsciiService az összes EDDTableFromAsciiService... osztályok szuperosztálya. Nem használhatja az EDDTableFromAsciiService-t közvetlenül. Ehelyett használja az EDDTableFromAsciiService alosztályát a szolgáltatások bizonyos típusainak kezelésére:
- EDDTableFromAsciiServiceNOSadatokat kapNOAANOS ASCII szolgáltatásai.
Jelenleg semmilyen más szolgáltatástípus nem támogatott. De általában viszonylag könnyű támogatni más szolgáltatásokat, ha hasonló módon működnek. Lépjen kapcsolatba velünk, ha van kérése.
Részletek
A következő információ az EDDTableFromAsciiService valamennyi alosztályára vonatkozik.
- Következtetések -ERDDAP™A tabuláris adatkérések bármilyen változóra korlátozódhatnak. A mögöttes szolgáltatás megengedheti vagy nem engedélyezheti a korlátozásokat minden változóban. Például sok szolgáltatás csak támogatja az állomás nevek, a szélesség, a hosszúság és az idő korlátozásait. Tehát, ha az EDDTableFromAsciiService alosztálya kérést kap egy adatkészlet aljzatához, akkor a forrásadat-szolgáltatáshoz a lehető legtöbb korlátozást éri el, majd a szolgáltatás által visszatért adatokra a fennmaradó korlátozásokat alkalmazza, mielőtt az adatokat átadja a felhasználónak.
- Valid Range - Ellentétben sok más adatkészlet típusok, EDDTableFromAsciiService általában nem ismeri az adatok körét minden változó, így nem lehet gyorsan elutasítani a kérelmek az adatok kívül az érvényes tartományban.
- Az ASCII szöveges válasza - Amikor az EDDTableFromAsciiService választ kap egy ASCII Text Service-tól, igazolnia kell, hogy a válasz a várható formátum és információ, majd kivonja az adatokat. Megadhatja a formátumot különböző speciális címkékkel az XML zsákmányában az adatkészlethez:
- <előttData1> keresztül<ElőzőData10> címkék - Megadhat egy sor szöveget (amennyit csak akarsz, akár 10) az EDDTableFromAsciiService-nek meg kell keresnie az ASCII szöveg vezetőjét, amelyet a szolgáltatás visszaküldött<előttData1> keresztül<ElőzőData10> Például ez hasznos annak ellenőrzéséhez, hogy a válasz magában foglalja a várható változókat a várt egységekkel. Az utolsó előttData-címke, amelyet megad, azonosítja a szöveget, amely közvetlenül történik, mielőtt az adatok elkezdődnek.
- <AfterData> - Ez meghatározza azt a szöveget, amelyet az EDDTableFromAsciiService az ASCII szövegben keres, amelyet az adatok végét jelezi.
- <noData> - Ha az EDDTableFromAsciiService megtalálja ezt a szöveget az ASCII szövegében, amelyet a szolgáltatás visszaküldött, arra a következtetésre jut, hogy nincs adat, amely megfelel a kérelemnek.
EDDTableFromAsciiService Skeleton XML
<dataset type="EDDTableFromAsciiService..." datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<sourceUrl>...</sourceUrl>
<beforeData1>...<beforeData1> <!-- 0 or 1 -->
...
<beforeData10>...<beforeData10> <!-- 0 or 1 -->
<afterData>...<afterData> <!-- 0 or 1 -->
<noData>...<noData> <!-- 0 or 1 -->
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<dataVariable>...</dataVariable> <!-- 1 or more -->
</dataset>
EDDTableFromAsciiServiceNOS
EDDTableFromAsciiServiceNOS EDDTable adatkészleteket készít az ASCII szöveges adatszolgáltatásaibólNOAAANemzeti Ocean Service (NOS) ... Információk arról, hogyan működik ez az osztály, és hogyan kell használni, lásd ezt az osztály szuperosztályátEDDTableFromAsciiService... Nem valószínű, hogy bárki más, mint Bob Simons kell használni ezt az alosztályt.
Mivel a NOS szolgáltatás válaszain belüli adatok egy oszlop ASCII szövegformátumot használnak, a szélességtől és a hosszúságtól eltérő adatoknak különleges tulajdonságot kell tartalmazniuk, amely meghatározza az egyes adatok vonalának melyik karakterét, például a változó adatait tartalmazza,
<att name="responseSubstring">17, 25</att>
EDDTableFromAllDatasets
EDDTableFromAllDatasets egy magasabb szintű adatkészlet, amely információkat tartalmaz az összes többi adatkészletről, amelyeket jelenleg betöltöttekERDDAP... Más típusú adatkészletekkel ellentétben nincs specifikáció aallDatasetsadatkészletdatasets.xml...ERDDAP™automatikusan létrehoz egy EDDTableFromAllDatasets adatkészletet (veledatasetID=allDatasets) ... Így, egyallDatasetsaz adatkészletet minden egyesben létrehozzákERDDAP™telepítés és ugyanazt a munkát minden egyesbenERDDAP™telepítés.
AallDatasetsAz adatkészlet egy tabuláris adatkészlet. Minden adatkészlet számára tartalmaz egy sor információt. Minden adatkészlettel kapcsolatos információkkal rendelkezik, példáuldatasetID, hozzáférhető, intézmény, cím, minLongitude, maxLongitude, minLatitude, maxLatitude, minTime, maxTime stb. MertallDatasetsegy mesés adatkészlet, lehet kérni, ugyanúgy, ahogy lehet kérni bármely más tabuláris adatkészletERDDAP™, és megadhatja a fájltípust a válaszhoz. Ez lehetővé teszi a felhasználók számára, hogy nagyon erős módon keressék az érdekeltségeket.
EDDTableFromAsciiFiles
EDDTableFromAsciiFiles összesíti az adatokat a comma-tól, a tab-tól, a szemicolon-tól, vagy az űrválasztott tabuláris ASCII adatfájloktól.
- Leggyakrabban a fájlok oszlopneveket kapnak az első sorban, és a második sorban kezdődő adatok. (Itt a fájl első sorát az 1. sorszámnak hívják.) De használható<oszlopNamesRow> és<elsőDataRow> az Öndatasets.xmlfájl egy másik sorszám megadásához.
- ERDDAP™lehetővé teszi az adatok sorát, hogy különböző számú adatértékekkel rendelkezzenek.ERDDAP™feltételezi, hogy a hiányzó adatértékek a végleges oszlopok a sorban.ERDDAP™hozzárendeli a hiányzó értékek standard hiányzó értékét a hiányzó adatértékekhez. (hozzáadott v1.56)
- Az ASCII fájlok könnyen működnek, de nem a leghatékonyabb módja az adatok tárolásának / visszaszerzésének. A nagyobb hatékonyság érdekében mentse meg a fájlokat, mintNetCDFv3.ncfájlok (egy dimenzióval, "sorral", amelyet minden változó oszt meg) Ehelyett. LehetHasználatERDDAP™az új fájlok létrehozása...
- Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Mivel a teljes hiánya metaadata ASCII fájlok, akkor mindig meg kell szerkeszteni az eredményeket GenerateDatasetsXml.
- WARNING: AmikorERDDAP™olvassa el az ASCII adatfájlokat, ha egy adott sorban hibát talál (pl. helytelen számú elem) figyelmeztető üzenetet jelent ("WARNING: Bad sor (s) adatok” ... a rossz vonalak listája a későbbi sorokon) alog.txt fájlEzután továbbra is olvassa el az adatfájl többi részét. Így a te felelősséged rendszeresen nézni (vagy írjon egy forgatókönyvet, hogy ezt tegye) az üzenet a logban. txt, hogy rögzítse a problémákat az adatfájlokban.ERDDAP™így van beállítva, hogy a felhasználók továbbra is elolvassák az összes rendelkezésre álló érvényes adatot, még akkor is, ha a fájl egyes vonalak hibái vannak.
EDDTableFrom AwsXmlFiles
EDDTableFrom AwsXmlFiles összesíti az adatokat egy sor Automatic Weather Station (AWS) XML adatfájlok az WeatherBug Rest XML API használatával (amely már nem aktív) ...
- Ez a fajta fájl egy egyszerű, de nem hatékony módja annak, hogy tárolja az adatokat, mert minden fájl általában úgy tűnik, hogy tartalmazza a megfigyelést csak egy alkalommal. Tehát nagyszámú fájl lehet. Ha szeretné javítani a teljesítményt, fontolja meg a megfigyelések konszolidáló csoportjait (egy hét megéri?) benneNetCDFv3.ncfájlok (legjobb:.ncfájlok aCF Discrete Sampling Geometries (DSG) Contiguous Ragged Array formátum) és használatEDDTableFromMultidimNcFiles (vagyEDDTableFromNcCFFiles) szolgálja az adatokat. LehetHasználatERDDAP™az új fájlok létrehozása...
- Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
EDDTableFromColumnarAsciiFiles
EDDTableFromColumnarAsciiFiles összesíti a tabuláris ASCII adatfájlok adatait rögzített szélességi oszlopokkal.
-
Leggyakrabban a fájlok oszlopneveket kapnak az első sorban, és a második sorban kezdődő adatok. Az első vonal / sor a fájlban hívják row # 1. De használható<oszlopNamesRow> és<elsőDataRow> az Öndatasets.xmlfájl egy másik sorszám megadásához.
-
A<addAttributes> minden<dataVariable> ezeknek az adatkészleteknek MUST tartalmazza ezt a két különleges tulajdonságot:
- <att name="startColumn"> Integráció <att> - meghatározza a karakter oszlopot minden sorban, amely az adatok kezdete változó.
- <att name="stopColumn"> Integráció <att> - meghatározza a karakter oszlop minden sorban, amely az 1 után a végén az adatok változó.
Az első karakteroszlopot oszlopnak nevezik #0. Például ez a fájl, amely időértékekkel rendelkezik a hőmérséklet-értékek visszaállítása:
0 1 2 <-- character column number 10's digit
0123456789012345678901234567 <-- character column number 1's digit
time temp
2014-12-01T12:00:00Z12.3
2014-12-02T12:00:00Z13.6
2014-12-03T12:00:00Z11.0
az időadatok változója lett volna
<att name="startColumn">0<att>
<att name="stopColumn">20<att>
és az időadatok változója lett volna
<att name="startColumn">20<att>
<att name="stopColumn">24<att>
Ezek az attribútumok MUST meg kell határozni minden változó, kivévefix értékésfájlnév-source-namesváltozók.
- Az ASCII fájlok könnyen működnek, de nem hatékony módja az adatok tárolásának / visszaküldésének. A nagyobb hatékonyság érdekében mentse meg a fájlokat, mintNetCDFv3.ncfájlok (egy dimenzióval, "sorral", amelyet minden változó oszt meg) Ehelyett. LehetHasználatERDDAP™az új fájlok létrehozása...
- Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Mivel a nehéz meghatározni a kezdeti és vége pozíciók minden adatoszlop és a teljes hiánya metaadata ASCII fájlok, akkor mindig meg kell szerkeszteni az eredményeket a GenerateDatasetsXml.
EDDTableFromHttpGet
EDDTable FromHttpGet különbözik az összes többi adatkészlettőlERDDAP™abban a rendszerben, ahol specifikus "a szerzők" hozzáadhatnak adatokat, felülvizsgálhatják az adatokat, vagy rendszeresen törölhetik az adatokat az adatkészletbőlHTTP GETvagyPOSTszámítógépes program, szkript vagy böngésző kérései. Az adatkészletet ugyanúgy kéri a felhasználóktól, hogy minden más EDDTable adatkészlet lekérhető legyenERDDAP... Lásd az osztály szuperosztályának leírását,EDDTableFromFiles, hogy olvassa el azokat a funkciókat, amelyek örököltek ebből a szuperosztályból.
Az EDDTableFromHttpGet egyedi jellemzőit az alábbiakban írják le. El kell olvasnia ezt a kezdeti szakaszt, és meg kell értenie; különben irreális elvárásaid vannak, vagy bajba kerülhetsz, ami nehéz megoldani.
Intelligens felhasználás
Ez a rendszer célja:
- Tabular (Situ) adatok, nem hálózott adatok.
- valós idejű adatok - A cél az, hogy engedélyezze a szerző (pl. az érzékelő, egy automatizált QC forgatókönyv, vagy egy adott emberi) változtatni az adatkészleten (egy.insert vagy .delete parancs) és ez lehetővé teszi a változástERDDAP™a felhasználók kevesebb mint 1 másodperc alatt, és valószínűleg sokkal gyorsabbak. Az 1 másodperc nagy része hálózati idő.ERDDAP™feldolgozhatja a kérelmet körülbelül 1 ms, és az adatok azonnal hozzáférhetőek a felhasználók számára. Ez egyGyors,robusztusésmegbízható rendszer...
- Szinte minden adat frekvenciája - Ez a rendszer elfogadhatja a gyakori adatokat (pl. napi) nagyon gyakori adatok (pl. 100 Hz adat) ... Ha optimalizálja a rendszert, képes kezelni a magasabb frekvenciaadatokat (Talán 10 KHz adat, ha szélsőségekbe megy) ...
- Adatok egy érzékelőből vagy hasonló érzékelők gyűjteményéből.
- Verzió/Reprodukálható tudomány/DOIS - Szituációk, ahol meg kell tudni változtatni az adatok (pl. a minőségellenőrzési zászló megváltoztatása) Tudja, hogy melyik szerző tett minden változást, tudja, hogy mikor a szerző változtatott, és (kérés) látni az eredeti adatokat a változás előtt. Így ezek az adatkészletek jogosultakDOIs... mert találkoznakDOIkövetelmény, hogy az adatkészlet nem változik, kivéve az aggregáció. Általában a valós idejű adatkészletek közelében nem jogosultakDOImert az adatok gyakran visszamenőlegesen változnak (pl. QA/QC célokra) ...
Miután az adatok egy EDDTableFromHttpGet adatkészletben vannak, minden felhasználó kérhet adatokat ugyanúgy, hogy adatokat kérjen bármely más EDDTable adatkészlettől.
Kísérlet: Legyen óvatos
Mivel ez a rendszer új, és mivel az elveszett környezeti adatokat nem lehet kielégíteni, kísérleti EDDTableFromHttpGet-t kell kezelnie. Ha átalakul egy másik rendszerből, kérjük, futtassa a régi rendszert és az új rendszert párhuzamosan, amíg nem biztos benne, hogy az új rendszer jól működik (hetek vagy hónapok, nem csak órák vagy napok) ... Minden esetben kérjük, győződjön meg róla, hogy a rendszer külön archiválja a .insert és .delete URL-eket, amelyeket az EDDTableFromHttpGet adatkészlethez küldenek (még akkor is, ha csak az Apache és / vagy Tomcat logs) legalább egy ideig. És minden esetben győződjön meg róla, hogy az EDDTableFromHttpGet adatkészlete rutinszerűen támogatja a külső adattároló eszközöket. (Vegyük észre, hogyrsync. támogatja az EDDTableFromHttpGet által létrehozott adatfájlokat nagyon hatékonyan.)
.insert és .delete
Minden adatkészlethezERDDAP™, ha küld egy kérést, hogyERDDAP™az adatok egy adathalmazban történő aljzatához megadja a fájltípust, amelyet a válaszra szeretne, például .csv,.htmlTable,.nc,.json... EDDTableFromHtp Get kiterjeszti ezt a rendszert, hogy támogassa a két további "szűrőtípust", amely beillesztheti (vagy változás) vagy törölje az adatokat az adatkészletben:
- .insert
- A kérés úgy formázódik, mint egy standard HTML-forma válasz, a kulcs=érték párok, elválasztva a '&'. Például,
https://some.erddap.url/erddap/tabledap/myDataset**.insert**?stationID=46088&time=2016-03-30T12:37:55Z&latitude=10.1&longitude=-150.1&airTemp=17.23&waterTemp=12.3&author=JohnSmith\_someKey1
MegjegyzésERDDAP™hozzáadni vagy megváltoztatni az adatokatstationID=46088 a megadott időre. - Ennek a változásnak a szerzője JohnSmith, és a kulcs néhányKey1.
- Az URL-nek tartalmaznia kell az érvényes értékeket (nem hiányzó értékek) az egészethttpGetRequiredVariables
- Ha az értékekhttpGetRequired Változók a kérelemben (pl.:stationIDés idő) az értékek egy sorban már az adatkészletben, az új értékek hatékonyan felülírják a régi értékeket (bár a régi értékek még mindig elérhetőek, ha a felhasználó adatokat kér egy korábbitólverzióaz adatkészlet) ...
- A .insert URL-nek soha nem kell tartalmaznia ×tamp= (ERDDAP™generálja ezt az értéket) vagy &command= (Ezt a .insert határozza meg (Ez a parancs = 0) vagy .delete (a parancs = 1) ) ...
- Ha az .insert URL nem határozza meg az adatkészletben található egyéb oszlopok értékeit, akkor feltételezik, hogy az őshonos hiányzó értékek. (MAX\_VALUE az integrált adattípusokhoz, a NaN for Floats and dupls, és a "" a Strings számára) ...
- .delete
- A kérés úgy formázódik, mint egy standard HTML-forma válasz, a kulcs=érték párok, elválasztva a '&'. Például,
https://some.erddap.url/erddap/tabledap/myDataset**.delete**?stationID=46088&time=2016-03-30T12:37:55Z&author=JohnSmith\_someKey1
MegjegyzésERDDAP™törölni az adatokatstationID= 46088 a megadott időpontban. - Ennek a változásnak a szerzője JohnSmith, és a kulcs néhányKey1.
- Az URL-nek meg kell határozniahttpGetRequiredVariableskérelemben (pl.:stationIDés idő) ... Ha ezek az értékek már az adatkészletben megfelelnek az értékeknek (melyeket általában) A régi értékek hatékonyan törlődnek (bár a régi értékek még mindig elérhetőek, ha egy felhasználó kéri az adatokat egy korábbiverzióaz adatkészlet) ...
- Nincs szükség a nem HttpGetRequiredVariables értékeinek megadására, kivéve a szerzőt, amelyre szükség van a kérelem hitelesítéséhez.
- A kérés úgy formázódik, mint egy standard HTML-forma válasz, a kulcs=érték párok, elválasztva a '&'. Például,
https://some.erddap.url/erddap/tabledap/myDataset**.delete**?stationID=46088&time=2016-03-30T12:37:55Z&author=JohnSmith\_someKey1
- A kérés úgy formázódik, mint egy standard HTML-forma válasz, a kulcs=érték párok, elválasztva a '&'. Például,
https://some.erddap.url/erddap/tabledap/myDataset**.insert**?stationID=46088&time=2016-03-30T12:37:55Z&latitude=10.1&longitude=-150.1&airTemp=17.23&waterTemp=12.3&author=JohnSmith\_someKey1
Részletek:
- .insert és .delete kéréseket formáznak, mint a standard HTML válaszok, a kulcsfontosságú=érték párok, elválasztva a "&". Az értékeknek kell lenniükszázalék kódolva... Így speciális karaktereket kell kódolni a %HH formába, ahol a HH a karakter 2 számjegyes hexadecim ális értéke. Általában csak néhány punctuációs karaktert kell átalakítania: %-25, és %26, "- %22,<%3C, = %3D, > %3E, + %2B,|%7C,\[%5B,\]%5D, tér %20, és átalakítani minden karakter felett #127 a saját UTF-8 formában, majd százaléka kódolja minden byte az UTF-8 formában a %HH formátum (kérjen programozót segítségért) ...
- .insert és .delete kéréseknek tartalmazniuk kell ahttpGetRequiredVariablespl.:stationIDIdő. Mert .insert kérések, változók, amelyek nem meghatározott a kérelem feltételezik, hogy hiányzó értékek (MAX\_VALUE az integrált változókhoz, a NaN for Float and dupla változókhoz, és egy üres String for String változókhoz) ... For .delete kérések, értékek a non-HttpGetRequired Variables (más, mint szerző, amire szükség van) figyelmen kívül hagyják.
- .insert és .delete kéréseknek tartalmazniuk kell a szerző nevét és a szerző kulcsát a szerző formanyomtatványában; szerzői_key a kérelem utolsó paramétereként. Következésképpen ez a végső biztosíték, hogy az egész kérést megkaptaERDDAP... Csak a szerző (nem a kulcs) az adatfájlban tárolódik. Meg kell határoznia a megengedett listát szerzői_key A globális tulajdonságon keresztülhttpGetKeys
- .insert és .delete paraméterek lehetnek szkalár (Egyetlen) bármilyen hosszúság értékei vagy sorai a formában\[érték1,érték2,érték3,...,értékN\]... Egy adott kérelemhez minden változónak meg kell szereznie a sorokat ugyanazon értékekkel. (más ez egy hiba) ... Ha egy kérelem skalár- és tömör értékeket tartalmaz, a skalár értékeket megismételik, hogy ugyanolyan hosszúságúak legyenek, mint a meghatározott tömbök, pl. &stationID=46088 kezelhető ésstationID=\[46088,46088,46088\]... Az Arrays a kulcs amagas teljesítmény... Szerkesztés nélkül kihívást jelent a .insert vagy .delete több mint 8 sor adat másodpercenként egy távoli szerzőtől (a hálózat egésze miatt) ... A sorozatokkal könnyű lesz .insert vagy .deletet több mint 1000 sor adat másodpercenként távoli érzékelőből.
- .insert és .delete elfogadja (hibaüzenet nélkül) úszópontszámok, amikor az integrálók várhatóak. Ezekben az esetekben az adatkészlet az integrálók értékeit kerekíti.
- .insert és .delete elfogadja (hibaüzenet nélkül) integráló és lebegő pontszámok, amelyek a változó adattípusának határán kívül vannak. Ezekben az esetekben az adatkészlet az értékeket tárolja, mintERDDAPnatív hiányzó értékek az adattípushoz (MAX\_VALUE az integrált típusokhoz és a NaN-hez floatokhoz és duplákhoz) ...
Válasz
Ha a .insert vagy .delete URL sikerül, a HTTP válaszkód 200 lesz (OK) a válasz szöveg lesz egy.jsontárgy, pl.
{
"status":"success",
"nRowsReceived":1,
"stringTimestamp":"2018-11-05T22:12:19.517Z",
"numericTimestamp":1.541455939517+E9
}
Vegye figyelembe, hogy az időbélyegzők milliszekundus precizitásúak.
Ha a .insert vagy .delete URL nem sikerül, akkor kap egy HTTP válaszkódot, amely 200-nál más, mint 200 (Okéy) , pl. hiba 403 Tilos, ha egy helytelen szerzői kulcsértéket nyújt be.ERDDAP™küldi a HTTP válaszkódot (nem, pl..jsonformázott hiba) mert így történik a dolgok az interneten, és mivel a hibák bárhol előfordulhatnak a rendszerben (pl. a hálózatban, amely visszatér egy HTTP hiba) ... Ha a hiba aERDDAP™A válasz tartalmazhat néhány szöveget (nem.json) részletesebb magyarázattal, hogy mi rosszul ment, de a HTTP válaszkód (200=Oké, bármi más baj) a megfelelő módja annak, hogy ellenőrizze, hogy a .insert vagy .delete sikerült-e. Ha a HTTP válaszkód ellenőrzése nem lehetséges, vagy kényelmetlen, keresse meg a "status": "siker" a válaszszövegben, amely megbízható jelzése a sikernek.
Bejelentkezési fájlok
Amikor az EDDTableFromHttpGet .insert és .delete parancsokat kap, egyszerűen módosítja az információkat a releváns fájlhoz egy sor naplófájlban, amelyek mindegyike egy táblázat, amelyet egy táblázat tároltJSON Lines CSV fájl... Amikor egy felhasználó kéri az adatokat,ERDDAP™gyorsan elolvassa a releváns naplófájlokat, alkalmazza az adatkészlet módosításait az általuk készített sorrendben, majd szűri a kérelmet a felhasználó korlátain keresztül, mint bármely másERDDAP™adatkérés. Az adatok felosztása különböző logfájlokba, különböző információs darabok tárolása (pl. a parancs üteme, és hogy a parancs .insert vagy .delete volt-e) , és az adatkészlet különböző aspektusai, mindez lehetővé tesziERDDAPaz adatok tárolása és az adatok visszaszerzése ezen adatkészletből nagyon gyorsan és nagyon hatékonyan.
Biztonsági és Szerző
Minden .insert és .delete parancsnak tartalmaznia kell &author= szerzői_key mint az utolsó paraméter, ahol a szerző_key a szerző azonosítójából áll (Választott: neve, kezdetek, pseudonym, szám) , egy alpont és egy titkos kulcs. AERDDAP™Az adminisztrátor együttműködik a szerzőkkel, hogy létrehozza az érvényes szerző\_key értékek listáját, amely bármikor megváltoztatható. Amikor az EDDTableFromHttpGet kap egy .insert vagy .delete parancsot, győződjön meg róla, hogy az autoID\_key az utolsó paraméter és érvényes. Mert ez az utolsó paraméter, azt jelzi, hogy az egész parancssor elérteERDDAP™és nem trunkáltak. A titkos kulcs biztosítja, hogy csak specifikus szerzők lehet beilleszteni vagy törölni adatokat az adatkészletben.ERDDAP™Ezután kivonja a szerzői jogot, és megmenti azt a szerzői változóban, hogy bárki láthassa, aki felelős az adatkészlet egy adott változásáért. .insert és .delete parancsokat csak keresztül lehet tennihttps: (biztonságos) ERDDAP™URL. Ez biztosítja, hogy az átadott információt a tranzit során titokban tartsák.
Timetamp
A log rendszer részeként az EDDTableFromHttpGet egy időbélyegzőt ad hozzá (az idő,ERDDAPmegkapta a kérést) minden parancsra, amelyet a logfájlokban tárol. MertERDDAP™generálja az időbélyeget, nem a szerzők, nem számít, hogy a különböző szerzők változtatásokat tesznek-e a számítógépek óráival, amelyek kissé eltérőek. Az időbélyegző megbízhatóan jelzi azt az időt, amikor a változás az adatkészletbe került.
HTTP POST
- Mi a helyzet a HTTP POST-val?
HTTP[POST](https://en.wikipedia.org/wiki/POST_(HTTP)A jobb alternatíva (összehasonlítvaHTTP GET) információ küldése egy ügyféltől egy HTTP szerverre. Ha lehet, vagy ha tényleg javítani akar a biztonságot, használja a POST-t a GET helyett, hogy elküldje az információkatERDDAP... A POST biztonságosabb, mert: GET éshttpsAz URL-t biztonságos módon továbbítják, de az egész URL (beleértve a paramétereket, köztük a szerző\_key) Az Apache, Tomcat ésERDDAP™naplófájlok, ahol valaki elolvashatja őket, ha a fájlokat nem megfelelően biztosítják. A POST segítségével a paramétereket biztonságos módon továbbítják, és nem írják a naplófájlokra. A POST egy kicsit nehezebb az ügyfelek számára, hogy együttműködjenek, és nem támogatja az ügyfélszoftverek széles körét, de a programozási nyelvek támogatják azt. A GET-en vagy POST-on keresztül küldött adatkészlet tartalma ugyanaz lesz, csak más módon formázva.
httpGetRequired Globális tulajdonságok
Az egész rendszer működésének alapvető része a szükséges globális tulajdonsághttpGetRequired Variables, amely egy képregény-választott listájadataVariableforrás nevek, amelyek egyedülállóan azonosítják az adatok sorát. Ez a lehető legkisebb, és szinte mindig magában foglalja az idő változóját. Például itt vannak az ajánlotthttpGetRequired Variables minden egyesCF Discrete Sampling Geometries (DSG) (Természetesen az azonosító nevek eltérőek lehetnek az adatkészletben.) :
-
TimeSeries:stationIDIdő
-
Trajectory: trajectoryID, idő
-
Profilhoz: idő (feltételezési idő a profil\_id) , mélység
-
A TimeSeries Profil:stationIDIdő (feltételezési idő a profil\_id) , mélység
-
Trajektor Profil: trajectoryID, idő (feltételezési idő a profil\_id) , mélység
A TimeSeries mint példa: Tekintettel egy .insert parancsra, amely magában foglaljastationID=46088 és idő=2016-06-23T19:53:00Z (egyéb értékek más változók számára) :
- Ha nincs meglévő adat az állomásra, és ez az idő, akkor a hatás az adatkészlethez hozzáadódik.
- Ha az állomás és az adott idő meglévő adatai vannak, akkor a hatás az lesz, hogy felváltsa az adatok meglévő sorát ezzel az új adatokkal. (Természetesen, mivelERDDAP™megtartja minden parancs naplóját, amelyet kap, a régi adatok még mindig a naplóban vannak. Ha egy felhasználó az adatkészlet egy verziójából kéri az adatokat, mielőtt ez a változás megtörténik, akkor meglátják a régebbi adatokat.)
httpGetDirectorySzerkesztés
-
httpGetDirectory Struktúra globális tulajdonság és adatok (Bejelentkezés) File nevek
Az, ami ezt az egész rendszert hatékonyan teszi, az az, hogyERDDAP™létrehoz egy sor adatot (Napló) fájlok, mindegyik az adatkészlet egy másik darabjával. Ha ezeket jól állítják,ERDDAP™képes lesz gyorsan reagálni az adatok legtöbb kérésére. Ezt a beállítást ahttpGetDirectoryStructure globális tulajdonság, amely egy String, amely úgy néz ki, mint egy relatív fájlnév, pl.:stationID/10 év", de valójában a könyvtári struktúra specifikációja. Ennek a részei jelzik, hogy a könyvtár és a fájlnév az adatokhoz (Napló) fájlokat építenek.- Ha egy rész egy integráló (>= 1) plusz egy időPeriod (millisecond, második, perc, óra, dátum, hónap, év vagy plurális) , például 10 év, majd az EDDTableFromHttpGet adatkészlet időt vesz igénybe az adatok sorára (pl. 2016-06-23T19:53:00Z) kiszámítja az időt erre a pontosságra (pl. 2010) Készítsen egy mappát vagy fájltName-t ebből.
A cél az, hogy minden fájlba ésszerűen nagy mennyiségű adatot kapjunk, de sokkal kevesebb, mint 2 GB.
- Ellenkező esetben a specifikáció része a specifikációnak kell lenniedataVariableAsourceNamepl.:stationID... Ebben az esetben az EDDTableFromHttpGet mappát vagy fájlnévet készít az adatok új sorára változó értékéből. (pl.: "46088") ...
Mivel a .insert és a .delete parancsadatok bizonyos adatokban tárolódnak (Napló) fájlok, EDDTableFromHttpGet általában csak meg kell nyitni egy vagy néhány adat (Napló) fájlokat, hogy megtalálja az adatokat egy adott felhasználói kérésre. És mivel minden adat (Napló) A fájlnak minden releváns információja van az adatkészlet zsúfjára, gyors és egyszerű az EDDTableFromHttpGet számára, hogy egy adott verziót készítsen (vagy a jelenlegi verzió) az adatkészlet az adott fájlban (és nem kell generálni a teljes adatkészlet kért verzióját) ...
Az általános iránymutatások az adatok mennyiségén és gyakoriságán alapulnak. Ha 100 byte-ot veszünk fel az adatok soránként, akkor ...
| Frequency <br>of measurements | Recommended <br>httpGetDirectoryStructure |
| --- | --- |
| \\>=1 per second | *featureID*/1year/1day |
| \\>=1 per minute | *featureID*/2months |
| \\>=1 per hour | *featureID*/10years |
| \\>=1 per day | *featureID* |
Például, ha a könyvtár szerkezetestationID/2 hónap, és beilleszti az adatokat két állomásról (46088 és 46155) időértékekkel 2015 decemberétől 2016 májusáig, EDDTableFromHttp Létrehozza a 46088 és a 46155 nevű könyvtárakat, és fájlokat hoz létre a 2015–11-es néven..jsonl, 2016-01.jsonl, 2016-03.jsonl, 2016-05.jsonL (minden 2 hónapos adatot tartalmaz az érintett állomás számára) ... A jövőben bármikor, ha használja .insert vagy .delete, hogy megváltoztassa vagy törölje az adatokat, például állomás 46088 2016-04-05T14:45:00Z, EDDTableFromHtp Szerezd meg ezt a parancsot 46088/2016-03.jsonl, a releváns adatok (Napló) fájl. És egyértelmű, hogy a jövőben bármikor hozzáadhat adatokat más állomásokhoz, mivel az adatkészlet egyszerűen további könyvtárakat hoz létre az új állomások adatainak megtartásához.
httpGetKeys
Minden EDDTable FromHtp Az adatkészletnek globális tulajdonsággal kell rendelkezniehttpGetKeys, amely meghatározza a listát engedélyezett szerzők és a titkos kulcsok, mint egy Comma-választott lista a szerzői_key pl.: JohnSmith\_someKey1, HOBOLogger\_someKey2, QCScript59\_someKey3.
- szerző\_key esetérzékeny, és teljesen ASCII karaktereknek kell lennie (#33 - #126, és bármilyen komma nélkül, " vagy" karaktereknek
- A kulcsok olyanok, mint a jelszavak, így lehetnek >=8 karakterek, nehéz kitalálni, és belső szótári szavak nélkül. Meg kell kezelni őket, ahogy kezelni a jelszavakat - tartsa őket privát.
- Az első "\" karakter elválasztja a szerzőt a kulcstól, így a szerző neve nem tartalmazhat "\" karaktert (de egy kulcs lehet) ...
- Bármely adott szerzőnek lehet egy vagy több szerző\_key, például JohnSmith\_some Key1, JohnSmith\_some Key7, stb.
- Ezt a tulajdonságot bármikor megváltoztathatja. A változások a következő alkalommal lépnek hatályba, amikor az adatkészletet betöltik.
- Ez az információ eltávolításra kerül az adatkészlet globális tulajdonságaiból, mielőtt nyilvánosságra kerül.
- Az adatkészlet beillesztésére vagy törlésére vonatkozó minden kérelemnek tartalmaznia kell egy &author= szerzői_key paraméter. A kulcs érvényességének ellenőrzése után,ERDDAP™csak mentse meg a szerző részt (nem a kulcs) az adatfájlban.
Beállítás
Íme az ajánlott lépések az EDDTableFromHttpGet adatkészlet létrehozásához:
-
Készítse el a fő könyvtárat, hogy tartsa ezt az adatkészletet. Például használjuk /data/testGet/ . A felhasználó fut GenerateDatasetsXml és a felhasználó futERDDAP™Mindkettőnek olvasható írásbeli hozzáférése van ehhez a könyvtárhoz.
-
Használjon egy szövegszerkesztőt, hogy egy mintát készítsen.jsonl CSV fájl a kiterjesztéssel.jsonl ebben a könyvtárban. A név nem fontos. Például hívhatja mintát.jsonL Készítsen egy 2 vonalat.jsonl CSV fájl, oszlop nevekkel az első sorban és dummy/tipikus értékekkel (a helyes adattípus) a második sorban. Itt egy mintafájl, amely alkalmas egy gyűjteményrefeatureType=TimeSeries adatok, amelyek mért levegő és víz hőmérséklet. \[MertfeatureType= Tárgy, változhatstationIDtrajectoryID.\]
\[MertfeatureType= profil, meg lehet változtatnistationIDprofilid legyen, és mélységváltozatot adjon hozzá.\]\["..."stationID-,"time""latitude", "hosszúság", "airTemp", "waterTemp", "timestamp", "author", "parancsnok"\] \["myStation", "2018-06-25T17:00Z", 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, "SomeBody", 0\]
Megjegyzés:
- A tényleges adatértékek nem számítanak, mert végül törölni fogja ezt a fájlt, de a megfelelő adattípusnak kell lenniük. Figyelemre méltó, hogy az idő változónak ugyanazt a formátumot kell használnia, amelyet a forrásból származó tényleges adatok fognak használni.
- Minden változó esetében asourceNameegyenlő leszdestinationName, így használja a helyes / végleges változó nevek most, beleértve az időt, a szélességet, a hosszúságot, és néha mélységet vagy a magasságot, ha az információval változók szerepelnek.
- Szinte mindig lesz egy változó elnevezésű idő, amely rögzíti a megfigyelést. Lehet adatType String withA szigorú időkre alkalmas egységek (pl.:yyyy-MM-ddT'HH:mm:ss.SSSZ) vagy adat Type dupla,numerikus időkre alkalmas egységek (pl. másodpercek 1970-01-01T00:00Z óta, vagy más bázisidő) ...
- Három oszlop (általában az utolsó három) Időbélyegzőnek, szerzőnek, parancsnak kell lennie.
- Az időbélyegző oszlopot az EDDTableFromHttpGet fogja használni, hogy hozzáadjon egy időbélyeget, amely jelzi, amikor egy adott adatsorot adott az adatfájlhoz. Adattípus kettős és egységek másodpercek óta 1970-01-01T00:00Z.
- A szerző oszlop az adatType String lesz felhasználva, hogy rögzítse, melyik engedélyezett szerző adott ezt a vonaladat. Az engedélyezett szerzőket ahttpGetKeys globális tulajdonsága... Bár a kulcsokat úgy határozzák meg, mint szerzői_key és ebben a formában a "kérés" URL-ben vannak, csak a szerzői rész mentésre kerül az adatfájlban.
- A parancs oszlop az adatType byte jelzi, ha az adatok ezen a vonalon egy beillesztés (0 0) vagy törlés (1) ...
-
Run GenerateDatasets Xml és mondja el
- Az adatkészlet típusa EDDTableFromHttpGet
- A könyvtár a (erre a példára) /data/test Get/
- A minta fájl (erre a példára) /data/testGet/startup.jsonL
- AhttpGetRequired A változók (erre a példára) stationIDIdő Lásd a leírásthttpGetRequiredVariablesalá.
- Ha az adatokat 5 percenként gyűjtik, azhttpGetDirectorySzerkesztés erre a példárastationID/2 hónap . Lásd a leírásthttpGetDirectorySzerkesztésalá.
- AhttpGetKeys
Add hozzá a kimenetet (A zsákdatasets.xmlaz adatkészlethez) adatasets.xml... 4. Editdatasets.xmlcunk ehhez az adatkészlethez, hogy helyes és teljes legyen. Valószínűleg cserélje ki az összes ??? megfelelő tartalommal. 5. Mert<fájlTableInMemory> beállítás:
- Állítsa be ezt igaznak, ha az adatkészlet általában gyakori .insert és / vagy .delete kéréseket kap (pl. gyakrabban, mint 10 másodpercenként) ... Ez segít az EDDTableFromHttpGet gyorsabban reagálni .insert és / vagy .delete kérésekre. Ha ezt igaznak állítja, az EDDTableFromHttpGet továbbra is megmenti a fájlTable és a kapcsolódó információkat a lemezre rendszeresen (szükség szerint nagyjából 5 másodpercenként) ...
- Állítsd ezt hamisnak (az alapértelmezett) ha az adatkészlet általában gyakori .insert és / vagy .delete kéréseket kap (pl. kevesebb, mint 10 másodpercenként) ...
- Megjegyzés: Használható<cacheFromUrl> és kapcsolódó beállításokdatasets.xmlEDDTable FromHtp Szerezzen adatkészleteket, mint egy módja annak, hogy egy távoli EDDTableFromHttpGet adatkészletet készítsen és tartsa fenn egy másik oldalonERDDAP... Ebben az esetben azonban ez a helyi adatkészlet elutasít minden .insert és .delete kérést.
Az EDDTable használatával FromHttpGet Adatkészletek
- A szerzők "kérelmeket" tehetnek, amelyeketadatok beillesztése vagy az adatok törlése az adatkészletből...
- Miután a valós adatokat beillesztették az adatkészletbe, törölheti és törölheti az eredeti mintaadat fájlt.
- A felhasználók adatokat kérhetnek az adatkészlettől, mivel bármilyen más EDDTable adatkészletet tesznekERDDAP... Ha a kérelem nem tartalmazza az időbélyegző oszlop korlátozását, akkor a kérelem az adatkészlet jelenlegi verziójából származik. (a naplófájl az összes beilleszkedési és törlési parancs feldolgozása után, és ahttpGetRequiredVariables) ...
- A felhasználók olyan kéréseket is tehetnek, amelyek specifikusak az EDDTableFromHttpGet adatkészletekhez:
- Ha a kérelem tartalmaz egy<vagy<= az időbélyegző oszlop korlátozása, majdERDDAP™folyamatok sorai a napló fájl felfelé, amíg a megadott ütemterv. Valójában ez az időnként törli az adatkészlettel kapcsolatos összes változást, mivel ez az időmérő érték. További információért lásdVerzió...
- Ha a kérelem tartalmaz egy >, >= vagy = az időbélyegző oszlop korlátozását, például ×tamp<=0, akkorERDDAP™visszaküldi az adatfájlok adatait, mivel a beillesztési és törlési parancsok feldolgozása nélkül.
- A jövőben azt látjuk, hogy az eszközök épülnek (ugye? Te?) az ilyen adatkészletekkel való együttműködéshez. Például lehet egy forgatókönyv, amely elolvassa a nyers logófájlokat, más kalibrációs egyenleteket alkalmaz, és más adatállományt generál/frissít az adott származtatott információval. Vegye figyelembe, hogy a forgatókönyv megkaphatja az eredeti adatokat kérésselERDDAP™ (amely az adatokat a fájl formátumban kapja, amely a legkönnyebb a forgatókönyvnél dolgozni) és frissítse az új adatkészletet .insert "kérések" segítségévelERDDAP... A forgatókönyvnek nincs szüksége közvetlen hozzáférésre az adatfájlokhoz; bármely engedélyezett szerző számítógépén lehet.
Részletes információk az EDDTableFromHttpGet-ről
A témák:
- Ne változtassa meg a beállítást!
- CRUD
- InvalidRequests
- Speed
- Robuszt
- Rendszermegbízhatóság
- Verzió
- Mi a helyzet a HTTP PUT és a DELETE?
- Megjegyzések
- A CHORDS-nek köszönhetően az alapvető ötletért.
Itt van a részletes információ:
Ne változtassa meg a beállítást!
Miután létrehozták az adatkészletet, és hozzáadta az adatokat:
- Ne add hozzá vagy távolítsd eldataVariableS.
- Ne változtassa meg asourceNamevagydestinationNameAdataVariableS.
- Ne változtassa meg az adatokat típusadataVariableS. De megváltoztathatja adataVariableMetaadata.
- Ne változtassa meg ahttpGetRequired Variables globális tulajdonság.
- Ne változtassa meg ahttpGetDirectoryStructure globális tulajdonság.
Ha ezen dolgok bármelyikét meg kell változtatnia, hozzon létre egy új adatkészletet, és adja át az összes adatot az új adatkészletre.
CRUD
A számítógépes tudományban az adatkészlettel való munka négy alapvető parancsaCREATE, READ, UPDATE, DELETE (CRUD) ... Az SQL, a kapcsolati adatbázisokkal való együttműködés nyelve egyenértékű az INSERT-ben, az SELECT-ben, az UPDATE-ban és a DELETE-ben. EDDTableFromHttpGet,
- .insert a CREATE és az UPDATE kombinációja.
- .delete DELETE.
- Az adatkészletek kérésére szolgáló rendszer READ.
Így az EDDTableFromHttpGet támogatja az összes alapvető parancsot egy adatkészlettel való munkavégzéshez.
- .insert vagy .delete kérések hiba nélkül visszatér HTTP status code=200 és egy JSON objektum, pl.
{
"status":"success",
"nRowsReceived":1,
"stringTimestamp":"2018-03-26T15:34:05.552Z",
"numericTimestamp":1.522078445552E9
}
A két ütemű értékek ugyanazon milliszekundumra utalnak, amely a milliszekundum, amelyet az időbélyegben tárolnak, változóvá válnak azok az adatok sorai, amelyeket beillesztettek vagy töröltek.ERDDAP™nem fogja megváltoztatni e kulcsfontosságú értékű párok nevét és formázását a jövőben.ERDDAP™további kulcsfontosságú értékű párokat adhat hozzá a JSON objektumhoz a jövőben.
InvalidRequests
Érvénytelen .insert vagy .delete kérések visszatérnek egy HTTP hiba státusz kódot más, mint a status=200, és nem lesz változás az adatkészlet. Ez magában foglalja a helytelen szerzői információkkal kapcsolatos kérelmeket, helytelen változó neveket, különböző tömbhosszokat különböző változók számára, a szükséges változók hiánya, a szükséges változó értékek hiánya stb. Ha a kérelem egynél több adatfájlot tartalmaz, lehetséges, hogy a kérelem egy része sikeres lesz, és a rész kudarcot vall. Ez azonban nem jelent problémát, ha a kérelem küldése hibát teljes kudarcnak tekint. Például, ha mondodERDDAP™Insert (vagy törlés) ugyanazok az adatok kétszer egy sorban, a legrosszabb esetben az, hogy az információt kétszer tárolják, zárva a logfájlban. Nehéz meglátni, hogy ez hogyan okozhat bajt.
HttpGet sebesség
For .insert vagy .delete kérések (nem számíthttpFelső) , ballpark számozza a sebességet .insert vagy .delete
1ms / .insert 1 sor adattal
2ms / .insert 10 sor adatsorban (\[\])
3ms / .insert 100 sor adatot tartalmaz a sorozatokban (\[\])
13ms / .insert 1000 sor adatot tartalmaz a sorozatokban (\[\])
Nyilvánvalóan a sorok a kulcsokmagas teljesítmény... Szerkesztés nélkül kihívást jelent a .insert vagy .delete több mint 8 sor adat másodpercenként egy távoli szerzőtől (a hálózat egésze miatt) ... A sorozatokkal könnyű lesz .insert vagy .deletet több mint 1000 sor adat másodpercenként távoli érzékelőből.
Nagyon nagy mennyiségű adat kérésre, meg fogja találni Tomcat határát a maximális lekérdezés hossza (Az alapértelmezett 8KB?) Ez azonban növelhető a maxHttpHeaderSize beállítás szerkesztésével Tomcat /conf/server.xml HTTP/1.1 Connector belép.
MikorERDDAP™olvassa el a JSON Lines CSV adatait (Napló) fájlok, van egy kis időbüntetés, összehasonlítva a bináris adatfájlok olvasásával. Úgy éreztük, hogy ez az idő büntetés, amikor az olvasás ésszerű ár, hogy fizetni a sebesség és a robusztus a rendszer írása adatok (amely elsődleges fontosságú) ...
SSD
Nagyobb sebességgel,HasználjonSzilárd állami vezetés (SSD) tárolni az adatokat. Sokkal gyorsabb hozzáférési idővel rendelkeznek (<0,1ms) a kemény lemezmeghajtóknál (3 - 12 ms) ... Gyorsabb adatátviteli arányuk is van (200 - 2500 MB/s) mint a kemény lemez meghajtók (200 MB/s) ... Költségük jelentősen leállt az elmúlt években. Bár a korai SSD-nek problémái voltak egy adott blokkra írt nagyszámú írás után, ez a probléma most nagymértékben csökkent. Ha csak az SSD-t használja, hogy egyszer írja az adatokat, akkor sokszor olvassa el, még egy fogyasztói minőségű SSD-t is. (ami jelentősen olcsóbb, mint egy vállalati szintű SSD) Hosszú ideig kell tartani.
Robuszt
Megpróbáltuk ezt a rendszert a lehető legegyszerűbbé tenni és robusztusabbá tenni.
- A rendszer célja, hogy több szál legyen (pl. az érzékelő, egy automatizált QC forgatókönyv és egy emberi) egyidejűleg ugyanazon adatkészleten dolgozunk, és még ugyanazon fájlon is. Ennek nagy része lehetséges azáltal, hogy egy log fájl megközelítést használ az adatok tárolására és egy nagyon egyszerű fájltípus használatával,JSON Lines CSV fájlokAz adatok tárolására.
- Egy másik hatalmas előnye a JSON Lines CSV, hogy ha egy fájl valaha is sérült (pl., érvénytelen egy vonal hibája miatt) Könnyű megnyitni a fájlt egy szövegszerkesztőben, és rögzíteni a problémát.
- Egy másik előny, ha hiba van egy sorban egy fájlban, a rendszer még mindig elolvashatja az összes adatot a sorok előtt és után a hibavonalat. És a rendszer még naplózhat további .insert és .delete információt.
- Hatalmas előnye az admin-hozzáférhető szabványfájlok használatának (egy kapcsolati adatbázishoz vagy Cassandra-hoz vagy más szoftverhez képest) : Nincs más szoftver, amelyet fenn kell tartani, és aminek futnia kell az adatok tárolás ához vagy visszaküldéséhez. És könnyen visszaállíthatja a szabványos fájlokat bármikor, és rendkívüli módon, mert az adatok zsunkban vannak (egy idő után, csak az egyes állomások jelenlegi idejű fájlja változik) ... Ezzel szemben jelentős erőfeszítést és rendszert igényel, hogy külső biztonsági fájlokat készítsenek adatbázisokból és Cassandra-ból.
Rendszermegbízhatóság
Ésszerű elvárni egy kiszolgálótERDDAP™99,9% uptime - ez körülbelül 9 óra leállás évente (Bár ezt egy rossz éjszakában használhatja!) ... Ha szorgalmas vagy szerencsés, akkor 99,99%-os uptime-t kaphat (53 perces leállás évente) Mivel a frissítések csak néhány újraindítása sok időt vesz igénybe. Szélsőséges intézkedéseket kell tenned (külön backup szerver, megszakíthatatlan energiaellátás, backup légkondicionálás, 24x7x365 személyzet a helyszín nyomon követésére stb.) vékony esély 99,999% uptime (5.25 perces leállás évente) ... Még akkor is, rendkívül valószínűtlen, hogy eléri a 99,999% uptime (vagy akár 99,99%) mert a problémák gyakran az irányításán kívül vannak. Például az Amazon Web Service és a Google csodálatosan megbízható webszolgáltatásokat kínál, de a nagy részeket néha órákig levonják.
Arcra, mindenki akarERDDAP™100%-os felállás, vagy legalábbis a vadon élő "hat kilences" (99,999% uptime egyenlő 32 másodpercnyi leállás évente) De nincs mód arra, hogy megszerezd, függetlenül attól, hogy mennyi időt, erőfeszítést és pénzt költesz.
DeERDDAP™Az uptime nem az igazi cél itt. A cél az, hogy megbízhatóan építsünk rendszerrendszer Az egyik, amely nem veszít el semmilyen adatot. Ez egy megoldható probléma.
A megoldás: hiba toleranciát építeni a számítógépes szoftverbe, amely az adatokat elküldiERDDAP... Pontosabban, hogy a szoftvernek fenntartania kell az adatok sorát, amelyek arra várnak, hogy menjenERDDAP... Amikor az adatok hozzáadódik a sorhoz, a szoftvernek ellenőriznie kell a válaszotERDDAP... Ha a válasz nem tartalmazza a kapott adatokat. Nincs hiba, akkor a szoftvernek el kell hagynia az adatokat a sorban. Ha több adat keletkezik és hozzáadódik a sorhoz, a szoftvernek újra meg kell próbálnia beállítani az adatokat a sorban (talán a\[\]rendszerrendszer) ... Sikeres vagy kudarcot vall. Ha nem sikerül, később megpróbálja. Ha így írja a szoftvert, és ha a szoftver készen áll arra, hogy néhány napos adatkérést végezzen, akkor valójában jó esélye van az érzékelő adatainak 100%-os feltöltésére.ERDDAP... És megtette, anélkül, hogy nagy erőfeszítést vagy költséget tenne.
\[Háttér: Nem gondoltuk ezt.Így érik el a számítógépes hálózatok a megbízhatóságot. A számítógépes hálózatok teljesen megbízhatatlanok. Tehát, ha egy fájlt egy számítógépről a másikra továbbít, a küldő szoftver tudja / várja, hogy néhány csomag elveszett. Ha nem kap megfelelő elismerést egy adott csomaghoz a vevőtől, akkor újraküldi az elveszett csomagot. Ezzel a megközelítéssel viszonylag egyszerű küldő és vevő szoftver megbízható fájlátviteli rendszert építhet a megbízhatatlan hálózat tetején.\]
Miért a JSON Lines CSV fájlokat?
EDDTableFromHttpGet használataJSON Lines CSV fájlok. az adatok tárolására. Az okok:
- A fő oka: A JSON Lines CSV fájlok egyszerűsége gyors, egyszerű és megbízható módja annak, hogy több szálat írjon egy adott fájlra (pl. a fájlnév szinkronizálásával) ...
- Ha egy JSON Lines CSV fájl valaha lett korrupt (pl., érvénytelen egy vonal hibája miatt) Az EDDTableFromFromHttpGet még mindig elolvashatta az összes adatot a hibavonal előtt és után. És a .insert és a .delete rendszer továbbra is új adatokat adhat az adatfájlhoz.
- Mivel a JSON Lines CSV fájlok ASCII fájlok, ha egy fájl valaha is korrupt lett, könnyű lenne rögzíteni (egy szövegszerkesztő) ...
- A JSON Lines CSV támogatja Unicode húrok.
- A JSON Lines CSV támogatja a változó hosszadalmakat (nem korlátozott néhány max hossza) ...
- A JSON Lines CSV 64 bites integrálót támogat (hosszúság) ...
- A JSON Lines CSV formális jellege és extra szintaxisa (vs régi iskola CSV) biztosítékot biztosít, hogy egy adott vonal nem sérült meg.
Kezdetben megpróbáltuk használni.nc3 fájl korlátlan dimenzióval. Azonban voltak problémák:
- A fő probléma az volt: Nincs megbízható módja annak, hogy több szálat írjon egy.nc3 fájl, még akkor is, ha a szálak együttműködnek az írások szinkronizált módon.
- Ha egy.nc3 fájl korrupt, a .insert és .delete rendszer nem tudja továbbra is használni a fájlt.
- Mert.nc3 fájl bináris, ha egy fájl sérült (amit a többszörös probléma miatt csinálnak) túl kemények vagy lehetetlenek a javításhoz. Nincs eszköz a javításhoz.
- A CF-nek nincs módja a sztringek kódolásának meghatározására, így nincs hivatalos módja annak, hogy támogassa az Unicode-t, például az UTF-8 kódolást. Megpróbáltuk megszerezni a CF-t, hogy támogassunk egy \_Encoding tulajdonságot, de képtelenek voltak bármilyen előrelépést elérni. (UnidataA hitelükre a \_Encoding tulajdonságot támogatja.)
- .nc3 fájl csak a rögzített hosszadalmakat támogatja. Ismét megpróbáltuk elérni a CF-t ésUnidataa változó hosszadalmak támogatása, de nem tudtak bármilyen előrehaladást elérni.
- .nc3 fájl nem támogat egyszerű módja annak, hogy megkülönböztetje az egységes karakter változókat a String változóktól. Ismét megpróbáltuk elérni a CF-t ésUnidataa két adattípus megkülönböztetésére szolgáló rendszer támogatása, de nem tudtak semmilyen előrelépést elérni.
- .nc3 fájl csak 8 bites karaktereket támogat egy meghatározott kódolás. Ismét megpróbáltuk elérni a CF-t ésUnidataa kódolás meghatározására szolgáló rendszer támogatása, de nem tudtak semmilyen előrelépést elérni.
- .nc3 fájl nem támogatja a 64 bites integrálókat (hosszúság) ... Ismét megpróbáltuk elérni a CF-t ésUnidataegy hosszú rendszer támogatása, de nem tudtak előrehaladni.
Verzió
Mert EDDTable FromHtp Szerezzen naplót az adatkészlet minden változásáról az időbélyegzővel és az egyes változások szerzőjével, gyorsan újra létrehozhatja ezt az adatkészletet, mint bármikor. Bizonyos értelemben van egy verzió bármely pontra időben. Ha egy felhasználó adatkérése tartalmaz egy ütemtervet<= korlátozott, pl. ×tamp<= 2016-06-23T16:32:22.128Z (vagy bármikor pont) , de nem korlátozza a szerzőt vagy parancsot,ERDDAP™válaszolni fog a kérésre, először generálja az adatkészlet egy verzióját, mint az adott időpontban. Aztán,ERDDAP™alkalmazza a felhasználó más korlátozásait, mint bármely más adatkérelmetERDDAP... Az EDDTableFromHttpGet azért van felállítva, hogy ez a folyamat nagyon gyors és hatékony legyen, még nagyon nagy adatkészletek esetében is.
Hasonlóképpen, a felhasználó megtudhatja, mikor az adatkészletet a legutóbbi frissítéssel frissítette ...?timestamp ×tamp=max (Timetamp) Ésdistinct ()
És minden adatkéréshez, az adatkészlet bármely verziójához a felhasználók láthatják, hogy melyik szerző változtatott, és mikor tették őket.
Ez a verziórendszer lehetővé tesziReprodukálható tudományMivel bárki bármikor kérheti az adatkészlet verzióját bármikor. Ez a finomított változatlás nem lehetséges más rendszerrel, amiről tudjuk. A mögöttes mechanizmus nagyon hatékony, abban az esetben, ha nincs szükség extra tárolóhelyre, és a feldolgozófelület valóban minimális.
Nem mindenkinek van szüksége az ilyen típusú finomított változatozásra, de rendkívül hasznos, talán szükséges, egy nagy adatkezelő szervezet keretében. (OOI, Earth Cube, Data One ésNOAANCEI) ahol egy adatkészlet több szerzővel rendelkezhet (pl. az érzékelő, egy automatizált QC forgatókönyv és egy emberi szerkesztő) ...
\[Történelem: Az ilyen típusú verziók szükségessége először rám jött (Bob) amikor az OOI-ról olvasunk és beszélünk 2008-ban. Abban az időben, OOI volt egy nehéz, lassú, nem hatékony rendszer változatlan Git. A Git nagyszerű azért, amit terveztek, de nem ez. 2008-ban, míg egy OOI-beszélgetésen egy kiterjedt, hatékony alternatív-OOI rendszert terveztem az adatkezeléshez, beleértve számos olyan funkciót is, amelyet hozzáadtam.ERDDAP™azóta, és beleértve ezt a verziórendszert is. Abban az időben és azóta az OOI elkötelezett a verziórendszerük iránt, és nem érdekelt az alternatívák iránt. 2016-ban a terv más aspektusai bevezettek, és elkezdtem végrehajtani. Mivel sok megszakítás történt más projekteken, 2018-ig nem fejeztem be. Még most sem tudom, hogy bármely más tudományos adatrendszer olyan gyors és egyszerű hozzáférést biztosít az adatok bármely pontjáról, gyakran változó adatkészletek esetében. Az egyszerű fájlrendszerek nem kínálják ezt. A kapcsolati adatbázisok nem. Cassandra nem.\]
HTTPS Put és törlés
- Mi a helyzet a HTTPS PUT és a DELETE?
Hypertext Transfer protokoll (HTTP) a World Wide Web alapja, és az oka annak, hogy a weboldal URL-jei " http://" vagy " https://" ... A HTTPS a HTTP egy további biztonsági réteggel. Minden nap, a böngészők, a szkriptek és a számítógépes programok teszik több milliárd HTTP (Súgó) GET kéri a távoli forrásokból származó információkat. HTTP (Súgó) más isverbs, nevezetesen PUT (adatokat tolni a szerverre) DELETE (DELETE adatok a szerverről) ... Igen, a PUT és a DELETE a megfelelő módja az adatok beillesztésének, és az adatok törlésének, a HTTP segítségével (Súgó) ... A GET-t minden olyan szoftver támogatja, amely együttműködhet a HTTP-vel (Súgó) ... A GET nagyon könnyű dolgozni. Mindenki már tudja, hogyan kell dolgozni a GET és sokan tudják, hogyan kell használni a POST (amely lényegében ugyanúgy használható, mint a GET) Így az EDDTableFromHttpGet a GET és a POST segítségével dolgozott. Nagyon kevés ember (még kevés számítógépes programozó) valaha is dolgozott a PUT és a DELETE. A PUT és a DELETE-t általában csak számítógépes nyelvek támogatják, így a használatukhoz ügyes programra van szükség. Tehát a PUT és a DELETE általában sokkal több égető megközelítés, mivel az eszközök fejlődtek.
HttpGet Notes
- Megjegyzések
- NemdataVariableLehet, hogy adatType=char. Használja az adatType=String helyett. Ha valóban szüksége van adatType=char, e-mail Chris. John at noaa.gov.
Köszönöm
- A CHORDS-nek köszönhetően az alapvető ötletért.
Az EDDTableFromHttpGet alapgondolata (azaz egyHTTP GETadatok hozzáadása egy adatkészlethez) az UCAR-tól (NCAR?) Cloud-Host valós idejű adatszolgáltatások (CHORDS) projekt. A paraméterek formátuma a kérelemben (ismétlődő név=érték Elválasztva &’s) ugyanaz a szabványos formátum, amelyet a HTML űrlapok használnak a weboldalakon. Ez egy egyszerű és ragyogó ötlet, és még inkább azért, mert olyan tökéletesen összeomlikERDDAPmeglévő rendszer a mesés adatok kezeléséhez. Az ötlet nyilvánvaló a hindukban, de én (Bob) nem gondolt rá. EDDTableFromHtp Használja ezt az alapvető ötletet, kombinálva az elképzeléseinket, hogyan kell végrehajtani, hogy rendszert készítsenERDDAP™az adatok feltöltéséhez. Más, mint az alapvető ötlet, hogy használja a GET-t, hogy nyomja az adatokat a rendszerbe, az EDDTableFromHttpGet végrehajtás teljesen más és teljesen független a CHORDS-től, és különböző jellemzőkkel rendelkezik (pl. naplófájlok, adatgyűjtés, különböző biztonsági rendszer, CRUD támogatás, reprodukálható adatok) ... A CHORDS-nek való kitettségünk csak webinárium volt. Nem néztük meg a kódjukat, vagy olvastunk a projektjükről, mert azonnal tudtuk, hogy a rendszert másképp akarjuk végrehajtani. De hálásak vagyunk nekik az alapvető ötletért. A CHORDS-re való teljes hivatkozás Daniels, M. D., Kerkez, B., Chandrasekar, V., Graves, S., Stamps, D. S., Martin, C., Dye, R., Bartos, M., Jones, J., Keiser, K. (2014.) ... Cloud-Host valós idejű adatszolgáltatások a geosciences számára (CHORDS) szoftver. UCAR/NCAR - Föld megfigyelő laboratórium. https://doi.org/10.5065/d6v1236q
EDDTableFromHyraxFiók
EDDTableFromHyraxFiók (detektáltak) összesíti az adatfájlokat több változóval, mindegyik egy vagy több megosztott dimenzióval (Például, idő, magasság (vagy mélység) , magasság, hosszúság) és szolgált egyHyrax OPeNDAPszerver...
- Ez az adatkészlet típusa Meghatározva ... Az új és általánosabb megoldás az, hogy használja aHúsvét FromUrl opció az EDDTable számára Fájlok (vagy változat) , amely helyi másolatot készít a távoli fájlokról, és szolgálja az adatokat a helyi fájlokból. A<cacheFromUrl> opció bármilyen típusú tabuláris adatfájlhoz használható. **
Ha nem tudja elvégezni ezt a munkát valamilyen okból, e-mailben Chris. John at noaa.gov. Ha 2020 előtt nincs panasz, ez az adatkészlet típusa eltávolítható. ** - Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
- A legtöbb esetben minden fájlnak több értéke van a baloldal számára (először) A dimenzió például az idő.
- A fájlok gyakran (de nem kell) egyetlen értéke van a többi dimenziónak (például magasság (vagy mélység) , magasság, hosszúság) ...
- A fájlok lehetnek karakter változók egy további dimenzióval (Például az nCharacters) ...
- Hyraxa szervereket az URL "/dods-bin/nph-dods/" vagy "/opendap/" azonosíthatja.
- Ez az osztály képernyője aHyraxweboldalak a fájlok listáival az egyes könyvtárban. Emiatt nagyon specifikus a jelenlegi formátumban.Hyraxweboldalak. Megpróbáljuk alkalmazkodniERDDAP™ha/ha a jövőbeli verziókHyraxmódosítsa, hogy a fájlok hogyan szerepelnek.
- A<fájlDir> beállítás figyelmen kívül hagyva. Mivel ez az osztály letöltése és minden távoli adatfájl helyi másolata,ERDDAP™erők a fájl Dir, hogy bigParentDirectory[szerkesztés] /copy/ datasetID /.
- Mert<sourceUrl> az adatkészlet alapkönyvtárának URL-jét használjaHyraxszerver, például <sourceUrl> > > > http://edac-dap.northerngulfinstitute.org/dods-bin/nph-dods/WCOS/nmsp/wcos/ </sourceUrl> > > > (de tedd egy sorba) (sajnálatos, hogy a szerver már nem áll rendelkezésre) ... AsourceUrlweboldal általában "OPeNDAPServer Index\[DirectoryName\]A tetején.
- Mivel ez az osztály mindig letölti és helyi másolatot készít minden távoli adatfájlról, soha ne csomagolja be ezt az adatkészletetEDDTableCopy...
- Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- Lásd az 1D, 2D, 3D és 4D példákatEDDTableFromNcFiles...
EDDTableFromInvalidCRAFiles
EDDTableFromInvalidCRAFiles összesített adatokNetCDF (v3 vagy v4) .ncfájlok, amelyek egy adott, érvénytelen, változata a CF DSG Contiguous Ragged Array (CRA) fájlok. BárERDDAP™támogatja ezt a fájltípust, ez egy érvénytelen fájltípus, amelyet senkinek nem kell használnia. Azok a csoportok, amelyek jelenleg ezt a fájltípust használják, erősen ösztönzik a használatraERDDAP™hiteles CF DSG CRA fájlok generálására, és hagyja abba ezeket a fájlokat.
Részletek: Ezek a fájlok több row\_size változóval rendelkeznek, mindegyik minta\_dimenziós tulajdonsággal rendelkezik. A fájlok nem szabványos fájlok, mert a több minta (Emberek) A méreteket le kell dekódolni és egymáshoz kapcsolódni ezzel a kiegészítő szabálylal és ígéretgel, amely nem része a CF DSG specifikációnak: „Egy adott pl. hőmérséklet-értéket társíthatsz (Temp\_obs dimenzió) egy adott mélységértékkel (z\_obs dimenzió, a dimenzió a legtöbb értékkel) Mert: a hőmérséklet row_size (egy adott cast) 0 vagy egyenlő a megfelelő mélységi row\_size-val (az övé) (Ez a szabály) ... Tehát, ha a hőmérséklet row\_size nem 0, akkor a n hőmérséklet-értékek az öntötthez közvetlenül kapcsolódnak a n mélységértékekhez. (Ez az ígéret) »
Egy másik probléma ezekkel a fájlokkal: a Principal\_Investigator row\_size változónak nincs minta\_dimenziós tulajdonsága, és nem követi a fenti szabályt.
A mintafájlok az adatkészlet típusához megtalálhatók https://data.nodc.noaa.gov/thredds/catalog/ncei/wod/ \[2020-10-21 Ez a szerver már nem megbízhatóan elérhető\]...
Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
Az első dolog, amit GenerateDatasets Az Xml ilyen típusú adatkészletet tesz, miután válaszol a kérdésekre, kinyomtatja a mintafájl ncdump-szerű szerkezetét. Tehát, ha belépsz néhány goofy válaszra az első hurok számára GenerateDatasets Xml, legalább látni fogja, hogyERDDAP™olvassa el a fájlt, és nézze meg, hogy milyen dimenziók és változók vannak a fájlban. Ezután jobb választ adhat a második hurok számára a GenerateDatasetsXml-en keresztül.
EDDTableFromJsonlCSVFiles
EDDTableFromJsonlCSVFiles összesített adatokJSON Lines CSV fájlok... Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- Ahogy a jsonlines.org mondja, ez a formátum "Better, mint CSV" (és legálisan, mint szövetségi alkalmazott, nem értek egyet vagy nem értenek egyet velük - hogy milyen őrült ez?) ... A CSV-t soha nem határozták meg hivatalosan, és akadályozza az eredeti táblázatprogramokhoz kapcsolódó történelmi poggyász. A JSON Lines CSV-t összehasonlítva teljes mértékben definiálják és előnyökkel jár a széles körben használt JSON szabványhoz való kapcsolatából, amely viszont előnyökkel jár a kapcsolatából a kapcsolatból aJavaScript ésJava... Figyelemre méltó, hogy teljes támogatást nyújt a hosszú integrációk és az Unicode karakterek számára a karakterláncokban, és egyértelmű módja annak, hogy más speciális karaktereket is tartalmazzon (nevezetesen lapok és hírvonalak) húrokon belül.
Ez a formátum különösen jó az adatkészletek számára, ahol rendszeresen kiegészítő sorokat kell hozzáadnia egy adott adatfájl végéhez. Emiatt és mások (lásd fent) ,EDDTableFromHttpGetJson Lines CSV fájlokat használ az adattároláshoz.
- A bemeneti fájlokat UTF-8 kódolják. Mindazonáltal, tekintettel a \u dddd formátum különleges karakterek kódolásához (pl.: \u20ac az euró karakter kódolása) Lehetősége van a fájlok írására, hogy csak 7 bites ASCII karaktereket tartalmazzon \u használatával dddd kódolni minden karakter felett #127.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
Az első dolog, amit a GenerateDatasetsXml tesz az ilyen típusú adatkészlethez, miután válaszol a kérdésekre, kinyomtatja a minta fájl ncdump-szerű szerkezetét. Tehát, ha belépsz néhány goofy válaszra az első hurok számára GenerateDatasets Xml, legalább látni fogja, hogyERDDAP™olvassa el a fájlt, és nézze meg, hogy milyen dimenziók és változók vannak a fájlban. Ezután jobb választ adhat a második hurok számára a GenerateDatasetsXml-en keresztül.
- WARNING: AmikorERDDAP™dalszöveg: JSON Lines CSV adatfájlok, ha hibát talál egy adott sorban (pl. helytelen számú elem) figyelmeztető üzenetet jelent ("WARNING: Bad sor (s) adatok” ... a rossz vonalak listája a későbbi sorokon) alog.txt fájlEzután továbbra is olvassa el az adatfájl többi részét. Így a te felelősséged rendszeresen nézni (vagy írjon egy forgatókönyvet, hogy ezt tegye) az üzenet a logban. txt, hogy rögzítse a problémákat az adatfájlokban.ERDDAP™így van beállítva, hogy a felhasználók továbbra is elolvassák az összes rendelkezésre álló érvényes adatot, még akkor is, ha a fájl egyes vonalak hibái vannak.
EDDTableFromMultidimNcFiles
EDDTableFromMultidimNcFiles összesített adatokNetCDF (v3 vagy v4) .nc (vagy.ncml ml) fájlok több változóval, mindegyik egy vagy több megosztott dimenzióval. A fájlok lehetnek karakter változók, vagy anélkül, hogy egy további dimenzió (például, STRING14) ... Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- Ha a fájlok többdimenziós CF DSG változatok, használja ezt az adatkészlet típus helyettEDDTableFromNcCFFiles...
- Új tabuláris adatkészletek számára.ncfájlok, használja ezt a lehetőséget, mielőtt megpróbálja az idősebbEDDTableFromNcFiles... Néhány előnye ennek az osztálynak:
- Ez az osztály több változót olvashat a fájlszerkezetek szélesebb köréből. Ha megadja DimensionsCSV (egy Comma-választott lista a dimenzió nevekről) a GenerateDatasets Xml (vagy<dimenziókCSV> adatasets.xmlinfo az egyik ilyen adatkészlethez), majdERDDAP™csak azokat a változókat olvassa el a forrásfájlokban, amelyek valamilyen vagy mindegyik dimenziót használnak, plusz minden skalárváltozatot. Ha egy dimenzió egy csoportban van, meg kell határoznia a teljes nevet, például: " csoportName/dimenzióName "..."
- Ez az osztály gyakran nagyon gyorsan visszautasíthatja a fájlokat, ha nem felel meg a kérés korlátozásainak. Így a nagy gyűjteményekből származó adatok gyakran sokkal gyorsabban mennek.
- Ez az osztály kezeli az igazi char változókat (non-String változók) helyesen.
- Ez az osztály megpróbálhatja a String változókat, amikor a Teremtő nem használta a Netcdf-java írásait (amely a char #0-t támogatja a sztring végére) ...
- Ez az osztály jobban kezeli az egyes fájlokat, amelyek hiányoznak bizonyos változók vagy dimenziók.
- Ez az osztály eltávolíthatja a hiányzó értékekkel rendelkező sorok blokkját, amint azt meghatározottaknak nevezikCF Discrete Sampling Geometries (DSG) Teljes többdimenziós Array fájlok
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
Az első dolog, amit a GenerateDatasetsXml tesz az ilyen típusú adatkészlethez, miután válaszol a kérdésekre, kinyomtatja a minta fájl ncdump-szerű szerkezetét. Tehát, ha belépsz néhány goofy válaszra az első hurok számára GenerateDatasets Xml, legalább látni fogja, hogyERDDAP™olvassa el a fájlt, és nézze meg, hogy milyen dimenziók és változók vannak a fájlban. Ezután jobb választ adhat a második hurok számára a GenerateDatasetsXml-en keresztül.
Csoport -- GenerateDatasets Az Xml egy "csoportot" kér. Beléphetsz "", hogy bármilyen / minden csoportot keress, " Néhány Csoport " vagy " SomeGroup / SomeSubGroup "Egy adott csoportot keresni, vagy "\[gyökér\]"hogy csak a gyökércsoportot keressük. A "Group" szúró válik<csoport> adatasets.xmlInfo az adatkészlethez (Bár "\[gyökér\]"" lesz "") ...
DimensionsCSV - GenerateDatasets Az Xml egy "DimensionsCSV" sztringet kér. Ez egy különválasztott értékű lista egy sor dimenzió forrás neveiről. GenerateDatasets Az Xml csak az adatok változóit olvassa el a mintában.ncfájlok, amelyek valamilyen vagy az összes ilyen dimenziót használnak (és nem más dimenziók) , valamint az összes skalárváltozat a fájlban, és az adatkészletet ezekből az adatok változóiból készítik. Ha egy dimenzió egy csoportban van, meg kell határoznia a teljes nevet, például: " csoportName/dimenzióName "..." Ha nincs megadva (üres sztring) , GenerateDatasets Az Xml a legtöbb dimenzióval keresi a változókat az elméletben, hogy ők lesznek a legérdekesebbek, de lehetnek olyan idők, amikor adatkészletet szeretne készíteni néhány más adatváltozatból, amelyek más dimenziókat használnak. Ha csak egy olyan dimenziós nevet határoz meg, amely nem létezik (NO\_MATCH) ,ERDDAP™csak megtalálja az összes skalár változót. A "DimensionsCSV" húrrá válik<dimenziókCSV> adatasets.xmlInfo az adatkészlethez.
ADimensions
Van egy kategória érvénytelen.ncfájlok (mert nem követik a CF szabályokat) több dimenzióval rendelkezik (pl. lat, lon, idő) amikor csak egy dimenziót kellett volna használni (pl. idő) Például:
dimensions:
time = UNLIMITED ; // (1437 currently)
depth = 10;
lat = 1437 ;
lon = 1437 ;
variables:
double time(time) ;
double lat(lat) ;
double lon(lon) ;
float temperature(time, depth) ;
Az EDDTableFromMultidimNcFiles speciális funkcióval rendelkezik, hogy kezelje ezeket a fájlokat: ha hozzáadja a globális tulajdonságot "treatDimensionsAs" az adatkészletekhez a globálisaddAttributesElmondhatodERDDAP™bizonyos dimenziók kezelésére (pl. lat és lon) ha ők egy másik dimenziók (pl. idő) ... Az attribútumértéknek egy olyan vőlegénynek kell lennie, amely a "től" dimenziókat határozza meg, majd a "től" dimenziót, pl.
AztánERDDAP™olvassa el a fájlt, mintha:
dimensions:
time = UNLIMITED ; // (1437 currently)
depth = 10;
variables:
double time(time) ;
double lat(time) ;
double lon(time) ;
float temperature(time, depth) ;
Természetesen a listán szereplő dimenziók jelenlegi méretének azonosnak kell lennie; különben,ERDDAP™A fájlt "Bad File"-ként kezeli.
Ne feledje, hogy ezek a fájlok érvénytelenek, mert nem követik a CF szabályokat. még akkor is, haERDDAP™olvassa el őket, erősen javasoljuk, hogy ne hozzon létre olyan fájlokat, mint ez, mert más CF-alapú szoftvereszközök nem tudják helyesen olvasni őket. Ha már rendelkezik ilyen fájlokkal, határozottan javasoljuk, hogy a lehető leghamarabb cserélje ki őket érvényes fájlokkal.
EDDTableFromNcFiles
EDDTableFromNcFiles összesített adatokNetCDF (v3 vagy v4) .nc (vagy.ncml ml) fájlok ésZarrfájlok (2.25 verzió) több változóval, mindegyik közös dimenzióval (például az idő) vagy több, mint egy közös dimenzió (Például, idő, magasság (vagy mélység) , magasság, hosszúság) ... A fájloknak ugyanolyan dimenziós nevekkel kell rendelkezniük. Egy adott fájlnak több értéke lehet az egyes dimenziókban, és az értékek eltérőek lehetnek különböző forrásfájlokban. A fájlok lehetnek karakter változók egy további dimenzióval (például, STRING14) ... Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
A Zarr fájlok kissé eltérő viselkedéssel rendelkeznek, és megkövetelik a fájltNameRegex vagy az útRegex, hogy tartalmazza a "zarr".
- Ha.ncA fájlok az egyiket használjákCF Discrete Sampling Geometries (DSG) fájlformátumok, próbálja meg használniEDDTableFromNcCFFilesmielőtt kipróbálná ezt.
- Új tabuláris adatkészletek számára.ncfájlok, próbálja meg az újabbatEDDTableFromMultidimNcFileselőször.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
Az első dolog, amit a GenerateDatasetsXml tesz az ilyen típusú adatkészlethez, miután válaszol a kérdésekre, kinyomtatja a minta fájl ncdump-szerű szerkezetét. Tehát, ha belépsz néhány goofy válaszra az első hurok számára GenerateDatasets Xml, legalább látni fogja, hogyERDDAP™olvassa el a fájlt, és nézze meg, hogy milyen dimenziók és változók vannak a fájlban. Ezután jobb választ adhat a második hurok számára a GenerateDatasetsXml-en keresztül.
DimensionsCSV - GenerateDatasets Az Xml egy "DimensionsCSV" sztringet kér. Ez egy különválasztott értékű lista egy sor dimenzió forrás neveiről. GenerateDatasets Az Xml megtalálja az adatok változóit a.ncolyan fájlok, amelyek valamilyen vagy az összes ilyen dimenziót használnak, plusz minden skalár változót, és az adatkészletet ezekből az adatok változóiból készítik. Ha nincs megadva (üres sztring) , GenerateDatasets Az Xml a legtöbb dimenzióval keresi a változókat az elméletben, hogy ők lesznek a legérdekesebbek, de lehetnek olyan idők, amikor adatkészletet szeretne készíteni néhány más adatváltozatból, amelyek más dimenziókat használnak.
- 1D példa: 1D fájlok kissé különböznek a 2D, 3D, 4D, ... fájloktól.
- Lehet, hogy van egy sor.ncadatfájlok, ahol minden fájlnak egy hónapos adatértéke van egy sodródó buoy-ból.
- Minden fájlnak 1 dimenziója lesz, például idő (méret =\[sokan\]) ...
- Minden fájlnak egy vagy több 1D változója lesz, amelyek ezt a dimenziót használják, például az idő, a hosszúság, a szélesség, a levegő hőmérséklet, ....
- Minden fájlnak 2D karakterváltozatai lehetnek, például dimenziókkal. (Idő, NCharacters) ...
- 2D példa:
- Lehet, hogy van egy sor.ncadatfájlok, ahol minden fájlnak egy hónapos adatértéke van egy sodródó buoy-ból.
- Minden fájlnak 2 dimenziója lesz, például idő (méret =\[sokan\]) és id (méret = 1) ...
- Minden fájlnak 2 1D-s változója lesz ugyanazokkal a nevekkel, mint a méretek és ugyanazon név dimenziók használatával, például az idő (Idő) , id (id) ... Ezeket az 1D-s változókat be kell vonni a listába<dataVariable> az adatkészlet XML.
- Minden fájlnak egy vagy több 2D változója lesz, például hosszúság, magasság, levegő hőmérséklet, vízhőmérséklet, ...
- Minden fájlnak 3D karakterváltozatai lehetnek, például dimenziókkal. (Idő,id,nCharacters) ...
- 3D példa:
- Lehet, hogy van egy sor.ncadatfájlok, ahol minden fájlnak egy hónapos adatértéke van az egyik állomásos buoy-tól.
- Minden fájlnak 3 dimenziója lesz, például az idő (méret =\[sokan\]) , lat (méret = 1) , és lon (méret = 1) ...
- Minden fájlnak 3 1D-s változója lesz ugyanazokkal a nevekkel, mint a méretek és ugyanazon név dimenziók használatával, például az idő (Idő) , lat (lat) , lon (london) ... Ezeket az 1D-s változókat be kell vonni a listába<dataVariable> az adatkészlet XML.
- Minden fájlnak egy vagy több 3D változója lesz, például levegő hőmérséklet, vízhőmérséklet, ...
- Minden fájlnak 4D karakterváltozatai lehetnek, például dimenziókkal (Idő,lat,lon,nCharacters) ...
- A fájl neve lehet a bója nevét a fájl nevében.
- 4D példa:
- Lehet, hogy van egy sor.ncadatfájlok, ahol minden fájlnak egy hónapos adatértéke van egy állomásról. Minden alkalommal, amikor az állomás olvasmányokat készít egy sor mélységben.
- Minden fájlnak 4 dimenziója lesz, például idő (méret =\[sokan\]) , mélység (méret =\[sokan\]) , lat (méret = 1) , és lon (méret = 1) ...
- Minden fájlnak 4 1D változója lesz ugyanazokkal a nevekkel, mint a méretek és ugyanazon név dimenziók használatával, például az idő (Idő) , mélység (mélység) , lat (lat) , lon (london) ... Ezeket az 1D-s változókat be kell vonni a listába<dataVariable> az adatkészlet XML.
- Minden fájlnak egy vagy több 4D változója lesz, például levegő hőmérséklet, vízhőmérséklet, ...
- Minden fájlnak lehet 5D karakterváltozata, például dimenziókkal (Idő, mélység,lat,lon,nCharacters) ...
- A fájl neve lehet a bója nevét a fájl nevében.
EDDTableFromNcCFFiles
EDDTableFromNcCFFiles aggregált adatok összesítik az adatokatNetCDF (v3 vagy v4) .nc (vagy.ncml ml) fájlokat, amelyek az egyik fájlformátumot használják, amelyet aCF Discrete Sampling Geometries (DSG) egyezmények. Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
Az egyik multidimenzionális CF DSG változatot használó fájlok esetében használjonEDDTableFromMultidimNcFilesEhelyett.
A CF DSG egyezmények több tucat fájlformátumot határoznak meg, és számos kisebb variációt tartalmaznak. Ez az osztály foglalkozik az összes variációval, amit ismerünk, de lehet, hogy hiányzott egy (vagy többet) ... Tehát, ha ez az osztály nem tudja elolvasni a CF DSG fájlokat, kérlektovábbi támogatás elérése...
Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
EDDTableFromNccsvFiles
EDDTableFromNccsvFiles összesített adatokNCCSVASCII .csv fájlok. Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
Az első dolog, amit a GenerateDatasetsXml tesz az ilyen típusú adatkészlethez, miután válaszol a kérdésekre, kinyomtatja a minta fájl ncdump-szerű szerkezetét. Tehát, ha belépsz néhány goofy válaszra az első hurok számára GenerateDatasets Xml, legalább látni fogja, hogyERDDAP™olvassa el a fájlt, és nézze meg, hogy milyen dimenziók és változók vannak a fájlban. Ezután jobb választ adhat a második hurok számára a GenerateDatasetsXml-en keresztül.
- WARNING: AmikorERDDAP™Olvassa el az NCCSV adatfájlokat, ha egy adott sorban hibát talál (pl. helytelen számú elem) figyelmeztető üzenetet jelent ("WARNING: Bad sor (s) adatok” ... a rossz vonalak listája a későbbi sorokon) alog.txt fájlEzután továbbra is olvassa el az adatfájl többi részét. Így a te felelősséged rendszeresen nézni (vagy írjon egy forgatókönyvet, hogy ezt tegye) az üzenet a logban. txt, hogy rögzítse a problémákat az adatfájlokban.ERDDAP™így van beállítva, hogy a felhasználók továbbra is elolvassák az összes rendelkezésre álló érvényes adatot, még akkor is, ha a fájl egyes vonalak hibái vannak.
EDDTableFromNOS
EDDTableFromNOS (Meghatározva) adatokat kezel egyNOAA NOSforrás, amely használjaSOAP+XMLkérések és válaszok. Nagyon specifikusNOAANOS XML. Lásd a minta EDDTableFromNOS adatkészletet az adatkészletekben2.xml.
EDDTableFromOBIS
EDDTableFromOBIS adatokat kezel egy Ocean Biogeographic Information System (OBIS) szerver (volt http://www.iobis.org ) ... Lehetséges, hogy nincs olyan aktív szerver, amely ezt a mostantól naprakész OBIS szerverrendszert használja.
- Az OBIS szerverek egy XML kérést várnak el, és visszatérnek egy XML válaszhoz.
- Mert minden OBIS-kiszolgáló ugyanazokat a változókat szolgálja, mint (volt http://iobis.org/tech/provider/questions ) Nem kell sokat megadnia egy OBIS adatkészlet létrehozásáhozERDDAP...
- Ön is tartalmaz egy "creator\_email"A globális tulajdonságaddAttributesMivel az információt a licencben használják. Egy megfelelő e-mail cím megtalálható az XML válasz elolvasásával a forrásURL-től.
- Lehet, vagy nem lehet képes a globális tulajdonságot elérni [<subsetVariables>>>>>> (#subsetvariables) egy adott OBIS-kiszolgálóval dolgozni. Ha megpróbálja, csak próbálja ki az egyik változót (Például ScientificName vagy Genus) ...
EDDTableFromOBIS Skeleton XML
<dataset type="EDDTableFromOBIS" datasetID\="..." active\="..." >
<sourceUrl>...</sourceUrl>
<sourceCode>...</sourceCode>
<!-- If you read the XML response from the sourceUrl, the
source code (for example, GHMP) is the value from one of the
<resource><code> tags. -->
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<-- All ...SourceMinimum and Maximum tags are OPTIONAL -->
<longitudeSourceMinimum>...</longitudeSourceMinimum>
<longitudeSourceMaximum>...</longitudeSourceMaximum>
<latitudeSourceMinimum>...</latitudeSourceMinimum>
<latitudeSourceMaximum>...</latitudeSourceMaximum>
<altitudeSourceMinimum>...</altitudeSourceMinimum>
<altitudeSourceMaximum>...</altitudeSourceMaximum>
<-- For timeSource... tags, use yyyy-MM-dd'T'HH:mm:ssZ format. -->
<timeSourceMinimum>...</timeSourceMinimum>
<timeSourceMaximum>...</timeSourceMaximum>
<sourceNeedsExpandedFP\_EQ>true(default)|false</sourceNeedsExpandedFP\_EQ>
<!-- 0 or 1 -->
<addAttributes>...</addAttributes> <!-- 0 or 1. This MUST include
"creator\_email" -->
</dataset>
EDDTableFromParquetFiles
EDDTableFromParquetFiles adatok kezeléseParquet... Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- A Parquet célja, hogy nagyon hatékonyan tömörítse, így kisebb fájlméreteket adhat, mint más formátumok.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
- WARNING: AmikorERDDAP™olvassa el a Parquet adatfájlokat, ha egy adott sorban hibát talál (pl. helytelen számú elem) figyelmeztető üzenetet jelent ("WARNING: Bad sor (s) adatok” ... a rossz vonalak listája a későbbi sorokon) alog.txt fájlEzután továbbra is olvassa el az adatfájl többi részét. Így a te felelősséged rendszeresen nézni (vagy írjon egy forgatókönyvet, hogy ezt tegye) az üzenet a logban. txt, hogy rögzítse a problémákat az adatfájlokban.ERDDAP™így van beállítva, hogy a felhasználók továbbra is elolvassák az összes rendelkezésre álló érvényes adatot, még akkor is, ha a fájl egyes vonalak hibái vannak.
EDDTableFromSOS
EDDTableFromSOS adatokat kezel egy Sensor Observation Service (SWE/SOS) szerver.
- Ez az adatkészlet típus összesíti az adatokat egy csoport állomások, amelyek mindegyik szolgáltatja egySOSszerver.
- Az állomások mind ugyanazokat a változókat szolgálják (Bár az egyes állomások forrásának nem kell minden változót szolgálnia) ...
- SOSA szerverek egy XML kérelmet várnak el, és visszatérnek egy XML válaszhoz.
- Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt. Nem könnyű létrehozni az XML adatkészletetSOSadatkészletek kézzel. Ahhoz, hogy megtalálja a szükséges információkat, meg kell látogatniasourceUrl+? Szolgáltatás=SOS&request=GetCapabilities"Egy böngészőben; nézze meg az XML-t; készítsen egy GetObservation kérelmet kézzel; és nézze meg az XML válaszát a kérésre.
- Az új típusok alkalmi kiegészítésévelSOSszerverek és változások a régi szerverek, egyre nehezebbERDDAP™a szerver típusának automatikusan felismerése a szerver válaszaiból. Használata<SosServerType> (az IOOS\_NDBC, IOOS\_NOS értékével,OOSTethysvagy WHOI) Mostanra szigorúan elismert. Ha problémái vannak az ilyen típusú adatkészletekkel, próbálja meg újra futtatni a GenerateDatasets-t Xml aSOSszerver. Generáció Adatkészletek Xml lehetővé teszi, hogy kipróbálja a különböző<sosServerType> opciók, amíg megtalálja a megfelelőt egy adott szerver számára.
- SOSÁttekintés:
-
SWE (Sensor Web Enablement) ésSOS (Érzékelő megfigyelő szolgálat) vannakOpenGIS® szabványok... Ez a weboldal rendelkezik a szabványos dokumentumokkal.
-
AOGCWeb Services Common Specification 1.1.0 (OGC06-121r3) fedezi a GET és a POST lekérdezések építését (lásd a 7.2.3. szakaszt és a 9. szakaszt) ...
-
Ha GetCapabilities xml kérést küld egySOSszerver (sourceUrl+ "?service=SOS&request=GetCapabilities"...") , kap egy xml eredmény egy listát az állomások és a megfigyelt Tulajdonságok, amelyekre adatuk van.
-
A megfigyeltProperty egy hivatalos URI hivatkozás egy ingatlanra. Például:ogc:phenomenon:longitude:wgs84 vagy https://mmisw.org/ont/cf/parameter/sea\\_water\\_temperature
-
A megfigyeltProperty nem változó.
-
Egynél több változó lehet ugyanaz a megfigyelt Tulajdonság (Például: belülTemp és kívül A tempó mindkettő megfigyelhető Tulajdonság https://mmisw.org/ont/cf/parameter/air\\_temperature ) ...
-
Ha GetObservation xml kérést küld egySOSszerver, kap egy xml eredmény leírása mező nevek a válasz, mezőegységek, és az adatok. A mező nevek tartalmazzák a hosszúságot, a szélességet, a mélységet (talán talán talán talán talán) és az idő.
-
MindendataVariableEDDTableFromSOStartalmaznia kell egy „megfigyelt területet” tulajdonságot, amely azonosítja a megfigyelt tulajdonságot, amelyet a kiszolgálótól kell kérni, hogy megkapja ezt a változót. Gyakran, többdataVariableS fogja felsorolni ugyanazt a kompozit megfigyeltTermészet.
-
Az adattípus minden egyes számáradataVariableelőfordulhat, hogy a szerver nem határozza meg. Ha igen, akkor meg kell néznie az XML adatválaszait a szerverről, és megfelelőnek kell lennie [<adatType> (#datatype) aERDDAP™adatkészletdataVariabledefiníciók.
-
(Ez írásakor) NéhánySOSszerverek válaszolnak a GetObservation kérésekre egynél több megfigyelt Tulajdonképpen csak visszatérő eredményeket az első megfigyeltProperties. (Nincs hibaüzenet!) Lásd a konstruktor paraméter kérését MegfigyeltTermészetekKülönösen.
-
- EDDTableFromSOSautomatikusan hozzáadódik
station\_id, longitude, latitude
az adatkészlet globális tulajdonságaihoz, amikor az adatkészlet jön létre. - SOSszerverek általában expresszegységaUCUMrendszer. LegtöbbERDDAP™szerverek expressz egységekkelUDUNITSrendszer. Ha át kell alakítani a két rendszer között, használhatjaERDDAP„Hálózati szolgáltatás az UCUM-egységek átalakítására / aUDUNITS...
EDDTableFromSOSSkeleton XML
<dataset type="EDDTableFromSOS" datasetID\="..." active\="..." >
<sourceUrl>...</sourceUrl>
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<sosServerType>...</sosServerType> <!-- 0 or 1, but STRONGLY
RECOMMENDED. This lets you specify the type of SOS server
(so ERDDAP™ doesn't have to figure it out).
Valid values are: IOOS\_NDBC, IOOS\_NOS, OOSTethys, and WHOI. -->
<responseFormat>...</responseFormat> <!-- 0 or 1. Use this only if
you need to override the default responseFormat for the
specified sosServerType. -->
<stationIdSourceName>...</stationIdSourceName> <!-- 0 or 1.
Default="station\_id". -->
<longitudeSourceName>...</longitudeSourceName>
<latitudeSourceName>...</latitudeSourceName>
<altitudeSourceName>...</altitudeSourceName>
<altitudeSourceMinimum>...</altitudeSourceMinimum> <!-- 0 or 1 -->
<altitudeSourceMaximum>...</altitudeSourceMaximum> <!-- 0 or 1 -->
<altitudeMetersPerSourceUnit>...</altitudeMetersPerSourceUnit>
<timeSourceName>...</timeSourceName>
<timeSourceFormat>...</timeSourceFormat>
<!-- timeSourceFormat MUST be either
\* For numeric data: a UDUnits\-compatible string (with the format
"units since baseTime") describing how to interpret
source time values (for example,
"seconds since 1970-01-01T00:00:00Z"), where the
base time is an ISO 8601:2004(E) formatted date time
string (yyyy-MM-dd'T'HH:mm:ssZ).
\* For String date time data: specify
units suitable for string times
describing how to interpret string times (for example, the
ISO8601TZ\_FORMAT "yyyy-MM-dd'T'HH:mm:ssZ"). -->
<observationOfferingIdRegex>...</observationOfferingIdRegex>
<!-- Only observationOfferings with IDs (usually the station names)
which match this regular expression (tutorial) will be included
in the dataset (".+" will catch all station names). -->
<requestObservedPropertiesSeparately>true|false(default)
</requestObservedPropertiesSeparately>
<sourceNeedsExpandedFP\_EQ>true(default)|false</sourceNeedsExpandedFP\_EQ>
<addAttributes>...</addAttributes> <!-- 0 or 1 -->
<dataVariable>...</dataVariable> <!-- 1 or more.
\* Each dataVariable MUST include the dataType tag.
\* Each dataVariable MUST include the observedProperty attribute.
\* For IOOS SOS servers, \every\ variable returned in the text/csv
response MUST be included in this ERDDAP™ dataset definition. -->
</dataset>
EDDTableFromThreddsFiles
EDDTableFromThreddsFiles (detektáltak) összesíti az adatfájlokat több változóval, mindegyik egy vagy több megosztott dimenzióval (Például, idő, magasság (vagy mélység) , magasság, hosszúság) és szolgált egyHírekOPeNDAPszerver...
- Ez az adatkészlet típusa Meghatározva ... Az új és általánosabb megoldás az, hogy használja aHúsvét FromUrl opció az EDDTable számára Fájlok (vagy változat) , amely helyi másolatot készít a távoli fájlokról, és szolgálja az adatokat a helyi fájlokból. A<cacheFromUrl> opció használható bármilyen típusú tabuláris adatfájl bármilyen webes forrásból, amely közzéteszi a könyvtári típusú fájlokat. **
Ha nem tudja elvégezni ezt a munkát valamilyen okból, e-mailben Chris. John at noaa.gov. Ha 2020 előtt nincs panasz, ez az adatkészlet típusa eltávolítható. ** - Erősen ajánljuk a használatátGenerateDatasets Xml programegy durva tervezetet készítenidatasets.xmlcunk ehhez az adatkészlethez. Ezután szerkesztheti ezt, hogy finomhangolja azt.
- A legtöbb esetben minden fájlnak több értéke van a baloldal számára (először) A dimenzió például az idő.
- A fájlok gyakran (de nem kell) egyetlen értéke van a többi dimenziónak (például magasság (vagy mélység) , magasság, hosszúság) ...
- A fájlok lehetnek karakter változók egy további dimenzióval (Például az nCharacters) ...
- A THREDS-kiszolgálókat az URL-ekben a „szelvények/” azonosíthatja. Például,
https://www.ncei.noaa.gov/thredds/catalog/uv/6h\\_strs\\_agg/catalog.html
- A THREDS szerverek különböző helyeken katalógusokkal rendelkeznek. Ez az osztály REQUIRES, hogy az URL magában foglalja a "/tizedek/katalógus/". Általában ezt a változót megtalálhatja a gyökér katalógus böngészőjében, majd a kívánt alkatalógusra kattintva.
- Ez az osztály elolvassa a THREDDS által szolgált katalógus.xml fájlokat a listákkal<katalógusRefs> (hivatkozások további katalógus.xml sub-files) és<adatkészlet> (adatfájlok) ...
- A<fájlDir> beállítás figyelmen kívül hagyva. Mivel ez az osztály letöltése és minden távoli adatfájl helyi másolata,ERDDAP™erők a fájl Dir, hogy bigParentDirectory[szerkesztés] /copy/ datasetID /.
- Mert<sourceUrl> használja a THREDDS szerver adatkészletének URL-jét, például: ehhez az URL-hez, amelyet egy webböngészőben lehet használni, https://data.nodc.noaa.gov/thredds/catalog/nmsp/wcos/catalog.html \[2020-10-21 Ez a szerver már nem megbízhatóan elérhető.\], Használat<sourceUrl> > > > https://data.nodc.noaa.gov/thredds/catalog/nmsp/wcos/catalog.xml </sourceUrl> > > > (de tedd egy sorba) ...
- Mivel ez az osztály mindig letölti és helyi másolatot készít minden távoli adatfájlról, soha ne csomagolja be ezt az adatkészletetEDDTableCopy...
- Ez az adatkészlet típus támogatja az OPTIONAL, ritkán használt, speciális címkét,<SpecialMode> mód </specialMode> amely arra használható, hogy meghatározza, hogy a speciális, kemény kódolt szabályokat kell használni annak meghatározására, hogy melyik fájlokat kell letölteni a szerverről. Jelenleg az egyetlen érvényes mód a SAMOS, amelyet adatkészletekkel használnak https://tds.coaps.fsu.edu/thredds/catalog/samos letölteni csak a fájlokat az utolsó verziószámmal.
- Lásd ezt az osztályt,EDDTableFromFilesinformáció arról, hogyan működik ez az osztály, és hogyan kell használni.
- Lásd az 1D, 2D, 3D és 4D példákatEDDTableFromNcFiles...
EDDTableFromWFSFiók
EDDTableFromWFSFiók (Meghatározva) helyi másolatot készít az összes adatról egyArcGISMapServerWFSszerver, így az adatok gyorsan továbbíthatókERDDAP™felhasználók.
- Meg kell határoznia egy speciálisan formázottsourceUrlglobális tulajdonság, hogy elmondjaERDDAP™Hogyan kérjen szolgáltatási információkat a szervertől. Kérjük, használja ezt a példát mint egy sablont:
<att name="sourceUrl">http://*someUrl/dir1/dir2*/MapServer/WFSServer?request=GetFeature&service=WFS&typename=aasg:BoreholeTemperature&format="text/xml;%20subType=gml/3.1.1/profiles/gmlsf/1.0.0/0"</att>
(de tedd az egészet egy sorra)
- Hozzá kell adni egy speciális globális tulajdonságot, hogy elmondjaERDDAP™Hogyan azonosítsuk a le kell tölteni a le kell tölteni az adatcsomagok nevét. Ez valószínűleg minden EDDTableF-re fog működniWFSFiles adatkészletek:
<att name="rowElementXPath">/wfs:FeatureCollection/gml:featureMember</att>
- Mivel ez az osztály mindig letölti és helyi másolatot készít minden távoli adatfájlról, soha ne csomagolja be ezt az adatkészletetEDDTableCopy...
- Lásd ezt az osztályt,EDDTableFromFilesTovábbi információkért, hogyan működik ez az osztály, és hogyan kell használni.
EDDTableAggregateRows
EDDTableAggregateRows EDDTable adatkészletet készíthet egy "gyermek" EDDTable adatkészletből.
- Íme néhány felhasználás az EDDTableAggregateRows számára:
- Lehet, hogy egy EDDTableAggregateRows adatkészlet két különböző típusú fájlok vagy adatforrások, például egy adatkészlet a múlt hónap végéig tárolt adatok a múlt hónapban tárolt.ncCF-fájlok és adatkészlet a jelenlegi hónaphoz, amelyet egy kapcsolati adatbázisban tároltak.
- Lehet, hogy egy EDDTableAggregateRows adatkészlet, hogy foglalkozzon a változás a forrásfájlok (például az időformátum megváltozott vagy változó név megváltozott, vagy adatok típus/scale\_factor/add\_offsetmegváltozott) ... Ebben az esetben egy gyermek adatot kapna a változás előtt készült fájlokból, és a másik gyermek a változást követően adatokat kapna. Az EDDTableAggregateRows használata alternatívaNcMLvagyNCO... Hacsak nincs megkülönböztető funkció a fájlnévben (ezt használhatja).<fájlNameRegex> annak meghatározásához, hogy melyik fájl tartozik a gyermek adatkészletéhez), valószínűleg tárolnia kell a fájlokat a két gyermek adatkészlethez különböző könyvtárakban.
- Lehet, hogy egy EDDTableAggregateRows adatkészlet, amely egy vagy több hasonló, de különböző adatkészletek közös alkészlete, például egy olyan adatkészlet, amely Profil adatkészletet készít egy Profil adatkészlet kombinációjából, egy TimeSeriesProfile adatkészletből és egy TrajectoryProfile adatkészletből (amelyek különböző változók és néhány változók közös - ebben az esetben meg kell tenni speciális változatokat a gyermek adatkészletek, csak a közös változók) ...
- Lehet, hogy több önálló adatkészlet, mindegyik azonos típusú adat, de egy másik állomás. Elhagyhatja ezeket az adatkészleteket, de létrehozhat egy EDDTableAggregateRows adatkészletet, amely az összes állomás adataival rendelkezik - minden gyermek adatkészlet egyszerű lehetEDDTableFromErddap, amely az egyik meglévő állomás adatkészletre utal. Ha ezt megteszi, adjon meg minden EDDTableFromErddap adatkészletet máskéntdatasetIDmint az eredeti önálló adatkészletek, például az eredeti „gyermek” beállításávaldatasetID...
- Minden gyermek<Az adatkészlet> meghatározottnak teljes adatkészletnek kell lennie, mintha egy önálló adatkészlet lenne. Mindegyiknek azonosnak kell lenniedataVariablesugyanabban a sorrendben, ugyanazzal adestinationNames,adatok típusok,missing\_values,FillValuesésegység... Az EDDTableAggregateRows adatkészlet minden variálható metaadata az első gyermekadatban változókból származik, de az EDDTableAggregateRows frissíti aactual\_rangeA metaadat az összes gyermek számára a tényleges tartomány.
- Ajánlás: Szerezzen minden gyermek adatkészletet, amely önálló adatkészletként működik. Ezután próbálja meg az EDDTableAggregateRows adatkészletet azáltal, hogy csökkenti és lezárja adatasets.xmlzsúfolt mindegyik az új EDDTableAggregate Rows adatkészlet.
- Dataset Default Sort Order -- A gyermekadatok megrendelése meghatározza az eredmények általános alapértelmezett rendezését. Természetesen a felhasználók más típusú megrendelést kérhetnek egy adott eredménykészlethez a jóváhagyással ésorderBy ("..." Comma-elválasztott lista a változókról "...") lekérdezésük végére.
- A "forrás"globális tulajdonságokAz EDDTableAggregateRows az első gyermek adatkészletből származó kombinált globális tulajdonságok. Az EDDTableAggregate Rows lehet egy globális<addAttributes> további globális tulajdonságok biztosítása vagy a forrás globális tulajdonságainak felülírása.
EDDTableAggregátum Rows csontváz XML
<dataset type="EDDTableAggregateRows" datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaFiles>true|false(default)</accessibleViaFiles>
<!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<updateEveryNMillis>...</updateEveryNMillis> <!-- 0 or 1. -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<dataset>...</dataset> <!-- 1 or more -->
</dataset>
EDDTableCopy
EDDTableCopy helyi másolatot készíthet sokféle EDDTable adatkészletből, majd gyorsan megőrizheti az adatokat a helyi másolatból.
- EDDTableCopy (és a hálózati adatokhoz,EDDGridMásolás) nagyon könnyen használható és nagyon hatékony megoldás néhány legnagyobb probléma a távoli adatforrásokból származó adatok kiszolgálásával:
- A távoli adatforrásból származó adatokhoz való hozzáférés lassú lehet.
- Lassúak lehetnek, mert örökre lassúak (például egy nem hatékony típusú szerver) ,
- mert túl sok kéréssel túlterhelik őket,
- vagy mert a szerver vagy a távoli szerver korlátozott a sávszélesség.
- A távoli adatkészlet néha nem elérhető (ismét, különböző okok miatt) ...
- Az adatok egyik forrására való támaszkodás nem mérlegeli jól (Például, amikor sok felhasználó és sokERDDAPHasználja) ...
- A távoli adatforrásból származó adatokhoz való hozzáférés lassú lehet.
- Hogyan működik - az EDDTableCopy ezeket a problémákat automatikusan megoldja és fenntartja az adatok helyi másolatát, és adatokat szolgáltat a helyi másolatból.ERDDAP™nagyon gyorsan szolgálhat a helyi másolatból származó adatokat. És egy helyi másolat készítése és használata megkönnyíti a terhet a távoli szerveren. És a helyi másolat az eredeti mentés, amely hasznos abban az esetben, ha valami történik az eredeti.
Nincs semmi új az adatkészlet helyi másolatának elkészítéséről. Mi az új itt, hogy ez az osztály teszi\*könnyű\*létrehozni és létrehozni\*Fenntartás\*az adatok helyi másolata egy\*változat\*távoli adatforrások és\*Metaadat\*az adatok másolása közben.
EDDTableCopy vs<cacheFromUrl>
<A cacheFromUrl> az EDDTableCopy alternatívája. Másképp dolgoznak.
- EDDTable A másolat úgy működik, hogy távoli szolgáltatásból származó adatokat kér, és ezeket a zsákokat tárolja a helyi fájlokban. Így az EDDTableCopy bizonyos esetekben hasznos, amikor az adatok távoli szolgáltatáson keresztül elérhetők.
- [[szerkesztés]]<cacheFromUrl> (#cachefromurl) letölti a meglévő fájlokat egy távoli weboldalon.<A cacheFromUrl> könnyebben használható és megbízhatóbb, mivel könnyen elmondható, hogy van egy új távoli adatfájl, vagy amikor egy távoli adatfájl megváltozott, és így le kell tölteni.
Ha vannak olyan helyzetek, ahol az EDDTableCopy vagy<cacheFromUrl> használható, használat<cacheFromUrl> mert könnyebb és megbízhatóbb.
<ExtractDesztináció Névek & gt;
EDDTable A másolat az adatok helyi másolatát azáltal teszi, hogy a távoli adatkészletből származó adatokat kéri. EDDTable A másolat meghatározza, hogy melyik zsákot kéri az &distinct kérésével () értékek a<ExtractDestinationNames> (megadottdatasets.xmllásd alább) , amelyek a távoli adatkészletben a változók űrelválasztott rendeltetési nevei. Például,
<extractDestinationNames>drifter profile</extractDestinationNames>
Lehet, hogy a drifter=tig17,profil=1017, drifter=tig17,profil=tig17,profil=1095, ... drifter=une12,profil=1223, drifter=une12,profil=1251, ....
Olyan helyzetekben, ahol egy oszlop (például profil) lehet, hogy mindaz, amire szükség van, hogy egyedileg azonosítsa az adatok sorát, ha van egy nagyon nagyszámú, például profilok, hasznos lehet egy további kivonatot is megadni Desztináció név (Például, sodró) amely a profilok felosztására szolgál. Ez kevesebb adatfájlhoz vezet egy adott könyvtárban, ami gyorsabb hozzáférést eredményezhet.
Helyi fájlok
Az adatok minden része külön tárolódikNetCDFfájl egy aláírásban bigParentDirectory[szerkesztés] /copy/ datasetID / (a megadottsetup.xml) ... Van egy közvetett szint minden, de az utolsó kivonatDestinationName. Például a tig17+1017 adatait tárolják bigParentDirectory[szerkesztés] /copy/sampleDataset/tig17/1017.nc... Például az une12+1251 adatait tárolják bigParentDirectory[szerkesztés] /copy/sampleDataset/une12/1251.nc... Az adatértékekből létrehozott könyvtárak és fájlnévek módosítottak, hogy fájlnév-biztonságot hozzanak létre (Például a helyeket „x20” váltja fel.) - ez nem befolyásolja a tényleges adatokat.
Új adatok
Minden alkalommal EDDTable A másolatot újratöltik, ellenőrzi a távoli adatkészletet, hogy lássa, milyen különböző részek állnak rendelkezésre. Ha a fájl egy darab adat nem létezik, a kérés, hogy a zsákmány hozzáadott egy sor.ERDDAP„Thread feldolgozza az összes megkeresett kérelmet az adatcsomagok, egy-egy. Láthatja a statisztikákat a Thread tevékenységéhezStatus oldalés aNapi jelentés... (Igen,ERDDAP™több feladatot rendelhetne erre a folyamatra, de ez sok távoli adatforrás sávszélességét, memóriáját és CPU időt használna, és sok helyiERDDAP"Sávszélesség, memória és CPU idő, amelyek egyike sem jó ötlet.)
MEGJEGYZÉS: Az első alkalommal, amikor egy EDDTableCopy be van töltve, (ha minden jól megy) Számos adatkérés kerül hozzáadásra a feladathozHárom sorrendje, de nem hoztak létre helyi adatfájlokat. Tehát a konstrukció kudarcot vall, de a feladatThread továbbra is dolgozik, és létrehozza a helyi fájlokat. Ha minden jól megy, a feladatThread néhány helyi adatfájlot készít, és a következő kísérletet, hogy újratöltse az adatkészletet (~15 perc) sikeres lesz, de kezdetben nagyon korlátozott mennyiségű adattal.
MEGJEGYZÉS: A helyi adatkészlet után van néhány adat, és megjelenik az Ön adataibanERDDAPHa a távoli adatkészlet ideiglenesen vagy állandóan nem hozzáférhető, a helyi adatkészlet továbbra is működik.
WARNING: Ha a távoli adatkészlet nagy, és / vagy a távoli szerver lassú (Ez a probléma, nem?!) Hosszú időbe telik, hogy teljes helyi másolatot készítsen. Bizonyos esetekben a szükséges idő elfogadhatatlan lesz. Például 1 TB adatátvitel egy T1-es vonalon keresztül (0,15 GB/s) legalább 60 napot vesz igénybe, optimális körülmények között. Ráadásul sok sávszélességet, memóriát és CPU időt használ a távoli és helyi számítógépeken. A megoldás az, hogy kemény meghajtót küldjön a távoli adatok adminisztrátorához, hogy a s / ő készítsen egy példányt az adathalmazról, és elküldje a merevlemezt vissza. Használja ezt az adatokat kezdő pontként, és az EDDTableCopy hozzáadja az adatokat. (Így használt az Amazon EC2 Cloud Service a probléma kezelésére, annak ellenére, hogy rendszerük sok sávszélességgel rendelkezik.)
WARNING: Ha az értékek egy adott kombinációja eltűnik egy távoli adatkészletből, az EDDTableCopy nem törli a helyi másolt fájlt. Ha akarod, törölheted magad.
TableCopy<CheckSourceData & gt;
Adatasets.xmlez az adatkészlet lehet egy opcionális címke
<checkSourceData>true</checkSourceData>
Az alapértelmezett érték igaz. Ha/ha hibáztatja, az adatkészlet soha nem fogja ellenőrizni a forrásadatlapot, hogy megnézze, van-e további adatok.
Ajánlott felhasználás
- Hozzon létre<adatkészlet> Belépés (natív típus, nem EDDTableCopy) a távoli adatforráshoz. Szerezd megfelelően, beleértve az összes kívánt metaadatot is.
- Ha túl lassú, add hozzá az XML kódot, hogy csomagolja egy EDDTableCopy adatkészletben.
- Használjon mástdatasetID (talán megváltoztatvadatasetIDa régidatasetIDkissé) ...
- Másolja a<hozzáférhető>>,<ReloadEveryNMinutes> és<onChange> a távoli EDDTable XML-től az EDDTableCopy XML-ig. (Az EDDTableCopy anyag értékei; a belső adatkészlet értékei nem relevánsak.)
- Hozzon létre<ExtractDestinationNames> címke (lásd fent) ...
- <rendExtractBy> egy OPTIONAL űr elválasztott lista a cél változó nevek a távoli adatkészletben. Amikor minden egyes darab adatot letöltenek a távoli szerverről, a zsákot ezeket a változókat rendezik (az első változó, majd a második változó, ha az első változó kötődik, ...) ... Bizonyos esetekben,ERDDAP™képes lesz gyorsabban kivonni az adatokat a helyi adatfájlokból, ha a listán szereplő első változó numerikus változó ("time"számít numerikus változónak) ... De válassza ki ezeket a változókat olyan módon, amely megfelelő az adatkészlethez.
- ERDDAP™az adatok helyi másolatát készíti és tartsa fenn.
- FIGYELMEZTETÉS: Az EDDTableCopy feltételezi, hogy az egyes részek adatértékei nem változnak. Ha / ha megteszik, manuálisan törölnie kell a chunk fájlokat bigParentDirectory[szerkesztés] /copy/ datasetID / amely megváltozott észászlóaz adatkészletet újra kell tölteni, hogy a törölt darabokat lecseréljék. Ha van egy e-mail előfizetése az adatkészlethez, akkor két e-mailt kap: az egyik, amikor az adatkészlet először újratölti és elkezdi másolni az adatokat, és egy másik, amikor az adatkészlet ismét betölti (automatikusan) és észleli az új helyi adatfájlokat.
- Metadata megváltoztatása - Ha meg kell változtatniaddAttributesvagy megváltoztatja a forrásadatokkal kapcsolatos változók sorrendjét:
- Változtasd megaddAttributesa forrásadatkészlethezdatasets.xmlszükség szerint.
- Törölje az egyik másolt fájlt.
- Állj be egyzászlóaz adatkészlet azonnali újratöltéséhez. Ha egy zászlót használ, és e-mail előfizetése van az adatkészlethez, két e-mailt kap: az egyik, amikor az adatkészlet először visszatölti és elkezdi másolni az adatokat, és egy másik, amikor az adatkészlet ismét betöltődik (automatikusan) és észleli az új helyi adatfájlokat.
- A törlesztett fájlt az új metaadata regenerálja. Ha a forrásadatkészlet valaha elérhető, az EDDTableCopy adatkészlet metaadatot kap a regenerált fájlból, mivel ez a legfiatalabb fájl.
- EDDGridMásolásnagyon hasonlít az EDDTableCopy-hoz, de a hálózati adatkészletekkel működik.
EDDTableCopy csontváz XML
<dataset type="EDDTableCopy" datasetID\="..." active\="..." >
<accessibleTo>...</accessibleTo> <!-- 0 or 1 -->
<graphsAccessibleTo>auto|public</graphsAccessibleTo> <!-- 0 or 1 -->
<accessibleViaFiles>true|false(default)</accessibleViaFiles>
<!-- 0 or 1 -->
<reloadEveryNMinutes>...</reloadEveryNMinutes> <!-- 0 or 1 -->
<defaultDataQuery>...</defaultDataQuery> <!-- 0 or 1 -->
<defaultGraphQuery>...</defaultGraphQuery> <!-- 0 or 1 -->
<addVariablesWhere>...</addVariablesWhere> <!-- 0 or 1 -->
<fgdcFile>...</fgdcFile> <!-- 0 or 1 -->
<iso19115File>...</iso19115File> <!-- 0 or 1 -->
<onChange>...</onChange> <!-- 0 or more -->
<extractDestinationNames>...</extractDestinationNames> <!-- 1 -->
<orderExtractBy>...</orderExtractBy> <!-- 0 or 1 -->
<fileTableInMemory>...</fileTableInMemory> <!-- 0 or 1 (true or false
(the default)) -->
<checkSourceData>...</checkSourceData> <!-- 0 or 1 -->
<dataset>...</dataset> <!-- 1 -->
</dataset>
Részletek
Íme a közös címkék és tulajdonságok részletes leírása.
<angularDegreeUnits & Gt;
- [[szerkesztés]] ** <angularDegreeUnits> ** ] (#angulardegreeunits) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlamely tartalmaz egy képregény-elválasztott listát az egyesületekről, amelyekERDDAP™Angular fokos egységként kell kezelni. Ha egy változónak van egy ilyen egysége,tabledapAorderByMeanA szűrő kiszámítja az eszközöket különleges módon, majd jelentést tesz az -180 és 180 közötti értéknek. LásdERDDAPEDStatic.java forráskód fájl a jelenlegi alapértelmezett listához. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
<angularDegreeTrueUnits & gt;
- [[szerkesztés]] ** <Angol DegreeTrueUnits> ** ] (#angulardegreetrueunits) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlamely tartalmaz egy képregény-elválasztott listát az egyesületekről, amelyekERDDAP™kell kezelni, mint egy rövid fokozatú igaz egységek. Ha egy változónak van egy ilyen egysége,tabledapAorderByMeanA szűrő kiszámítja az eszközt egy speciális módon, majd jelentse az összeget 0-tól 360-ig. LásdERDDAPEDStatic.java forrásfájl a jelenlegi alapértelmezett listához. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
<gyakoriStandardNames & Gt;
- [[szerkesztés]] ** <gyakoriStandardNames> ** ] (#commonstandardnames) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlhogy megadja a Comma-elválasztott listájátCF szabvány neve... E. pl.
<commonStandardNames>air\\_pressure, ..., wind\\_to\\_direction</commonStandardNames>
Ezt a listát az DataProviderForm3.html-ben használják, mint a felhasználók kényelme. Ha ezt az információt szeretné megadnidatasets.xmlKezdje a jelenlegi alapértelmezett lista másolásával<DEFAULT\_commonStandardNames> benneERDDAPA \[Tomcat\]/webapps/erddap/WEB-INF/classes/gov/noa/pfel/erddap/util/messages.xml fájl.
<cacheMinutes & Gt;
- [[szerkesztés]] ** <cacheMinutes> ** ] (#cache percek) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlaz életkor meghatározása (perc) amelyen a cache fájlokat törölni kell (default=60) ... E. pl.
<cacheMinutes>60</cacheMinutes>
Általában csak képfájlok (mert ugyanazokat a képeket gyakran ismételten kérik) és.ncfájlok (mert teljes mértékben létre kell hozni, mielőtt elküldik a felhasználót) csésze. Bár úgy tűnhet, mintha egy adott kérés mindig ugyanazt a választ adja vissza, ami nem igaz. Például egytabledapkérelem, amely tartalmazza az időt> Néhány Idő megváltozik, amikor új adatok érkeznek az adatkészlethez. És egy griddap kérelem, amely magában foglalja\[utolsó\]Az idő dimenziója megváltozik, amikor új adatok érkeznek az adatkészlethez. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló... KorábbanERDDAP™v2.00, ezt a setup.xml-ben határozták meg, amely még megengedett, de elriasztott.
<átalakításInterpolateRequestCSVExample & gt;
- [[szerkesztés]] ** <átalakításInterpolateRequestCSVExample ** ] (# Convertinterpolaterequestcsvexample) egy OPTIONAL tag egy<erddapDatasets> tagdatasets.xml \[KezdőlapERDDAP™v2.10\]amely olyan példát tartalmaz, amelyet az Interpolate átalakító weboldalán mutatnak be. Az alapértelmezett érték: jplMURSST41/analylylyed\_sst/Bilinear/4 .
<átalakításInterpolateDatasetIDVariableList & Gt;
- [[szerkesztés]] ** <átalakításInterpolateDatasetIDVariableList> ** ] (# Convertinterpolatedatasetidvariablelist) egy OPTIONAL tag egy<erddapDatasets> tagdatasets.xml \[KezdőlapERDDAP™v2.10\]amely CSV listát tartalmazdatasetID/ változó Névi példák, amelyeket az Interpolate konverter weboldalának javaslataiként fognak használni. Az alapértelmezett érték: jplMURSST41/analylylyed\_sst...
<átalakításToPublicSourceUrl & gt;
- [[szerkesztés]] ** <átalakításToPublicSourceUrl> ** ] (#konverttopublicsourceurl) egy OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlamely magában foglalja a "törzsből" és a "to" tulajdonságot, amely meghatározza, hogyan lehet egy megfelelő helyiséget átalakítanisourceUrl (rendszerint IP-szám) nyilvánossourceUrl (domain név) "A" formának kell lennie "\[valami\]//\[valami\]» Ezek közül a címkék közül 0 vagy több lehet. További információkért lásd [<sourceUrl>>>>>> (#sourceurl) ... Például,
<convertToPublicSourceUrl from="https://192.168.31.18/" to="https://oceanwatch.pfeg.noaa.gov/" />
egy megfelelő helyiséget okozsourceUrl (mint például https://192.168.31.18/thredds/dodsC/satellite/BA/ssta/5day )
nyilvánossourceUrl ( https://oceanwatch.pfeg.noaa.gov/thredds/dodsC/satellite/BA/ssta/5day ) ...
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
De az előfizetési rendszerhez kapcsolódó biztonsági okokból és okokból, Ne kövessétek ezt a lépést!
Ehelyett mindig használja a nyilvános domain nevet a<sourceUrl> címke és használja a/etc/hosts táblázata szerverén, hogy a helyi domain neveket IP-számokra konvertálja anélkül, hogy DNS-kiszolgálót használna. Megpróbálhatja, ha egy domain nevet megfelelően konvertálnak IP-számra a használatával:
ping Some.domain.name
adatok:image/png;base64,
- Amikor egy felhasználó kér egy.htmlTableválaszERDDAP™, ha a String cellában szereplő adatok adatot tartalmaznak:image/png;base64, amelyet egy base64 kódolt .png kép k övet,ERDDAP™megjelenik egy ikon (így a felhasználó láthatja a képet, ha lebegnek rajta) és gombok menteni a szöveget vagy a képet a vágólapra. Ezt a funkciót hozzáadtákERDDAP™V2.19 Marco Alba.
drawLandMask
-
drawLandMask meghatározza az alapértelmezett beállítást, amely ellenőrzi, mikor és hogyan kell a hulladékot levonni, amikorERDDAP™térképet készít. Három különböző helyen lehet meghatároznidatasets.xml (a legalacsonyabbtól a legmagasabb prioritásig) :
- HadrawLandMaskmeg van határozva belül<erddapDatasets> (nem kapcsolódik semmilyen konkrét adatkészlethez) Ezután meghatározza az alapértelmezett értékétdrawLandMaskminden változó minden adatkészletben. Például,
<drawLandMask>under</drawLandMask>
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAPolvasódatasets.xml... Ha ez a címke nem jelenik meg, az alapértelmezett érték alul van. 2. HadrawLandMaskegy adott adatkészlet globális tulajdonságaként van meghatározva, majd meghatározza az alapértelmezett értékétdrawLandMaskminden változó az adott adatkészletben, felülírva minden alacsonyabb prioritási beállítást. Például,
<att name="drawLandMask">under</att>
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™visszatölti ezt az adatkészletet. 3. HadrawLandMaskegy adott adatkészletben a változó tulajdonságaként van meghatározva, majd meghatározza az alapértelmezett értékétdrawLandMaskaz adott adatkészletben ez a változó, felülírva minden alacsonyabb prioritási beállítást. Például,
<att name="drawLandMask">under</att>
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™visszatölti ezt az adatkészletet.
A felhasználó felülírhatja az alapértelmezést (bárhol is van megadva) azáltal, hogy kiválaszt egy értéket a "Draw földmaszk" egy ledobott listáról az adatkészlet Make A Graph honlapján, vagy beleértve &.land= érték az URL-ben, amely térképet kérERDDAP...
Minden helyzetben 4 lehetséges érték van a tulajdonsághoz:
- "under" vonzza a földmaszkot, mielőtt adatokat gyűjt a térképen. A rácsos adatkészletek esetében a föld állandó fényszürke színként jelenik meg. A mesés adatkészletek esetében a "nyilatkozat" a föld és az óceánok feletti topográfiai adatokat mutatja.
- "túl" - A rácsos adatkészletek esetében a "tovább" felhívja a hulladékot, miután adatokat gyűjt a térképekre, hogy bármilyen adatot lehessen a föld felett. A mesés adatkészletek esetében a "túl" az óceán fürdőmetriáját mutatja, és egy állandó fényszürkét, ahol szárazföld van, mind az adatok alapján.
- "outline" csak a táj, a politikai határok, tavak és folyók körvonalát vonja le.
- "off" nem húz semmit.
<e-mailDiagnosticsToErdData & gt;
- [[szerkesztés]] ** <e-mailDiagnosticsToErdData ** ] (#emaildiagnosticstoerddata) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xml... A címke értéke igaz lehet (az alapértelmezett) vagy hamis. Ha igaz,ERDDAP™e-mailt küld a zsákút Chrisnek. John at noaa. Gov (aERDDAP™Fejlesztő csapat) ... Ez biztonságosnak és biztonságosnak kell lennie, mivel nincs bizalmas információ (pl. a kérésUrl) az e-mailben szerepel. Ennek lehetővé kell tennie, hogy bármilyen homályos, teljesen váratlan hibát elkapjon, amely a NullPointerExceptionshez vezet. Ellenkező esetben a felhasználó látja a kivételeket, de aERDDAP™fejlesztési csapat nem (így nem tudjuk, hogy van olyan probléma, amelyet rögzíteni kell) ...
<graphBackgroundColor & gt;
- [[szerkesztés]] ** <graphBackgroundColor ** ] (#grafbackgroundcolor) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlaz alapértelmezett háttérszín meghatározása a grafikonokon. Ez szinte minden grafikont érint. Néhány helyzet nem érintett. A színt 8 számjegyű hexadecimális értéknek tekintik a 0xAARRGGBB formájában, ahol az AA, RR, GG és BB az opacitás, a vörös, a zöld és a kék összetevők. "0x" érzékeny, de a hexadecimális számjegyek nem érzékenyek. Például egy teljesen opaque (ff) zöldes-kék szín vörös = 22, zöld = 88, blue = ee lenne 0xff2288ee. Az Opaque White 0xffffff. Az alapértelmezés az opaque fénykék (0xffccff) , amely előnye, hogy különbözik a fehér, ami egy fontos szín számos paletta használt adatok gyűjtése. Például,
<graphBackgroundColor>0xffffffff</graphBackgroundColor>
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
<ipAddressMaxRequests & gt;
- [[szerkesztés]] ** <ipAddressMaxRequests> ** ] (#ipaddressmaxrequeststs) ritkán használt opcionális címke (először támogatottERDDAP™v2.12) belül<erddapDatasets> tagdatasets.xmlez egy olyan rendszer része, amely korlátozza a túlzottan agresszív legitim felhasználók és a rosszindulatú felhasználók képességét, hogy nagyszámú egyidejű kérést készítsenek, amelyek lerombolják a rendszer teljesítményét más felhasználók számára. ipAddress A MaxRequests meghatározza az egyidejű kérések maximális számát, amelyeket bármely specifikus IP-címről fogadnak el. További kérések kap egy HTTP 429 hiba: túl sok kérés. A kis, statikus fájlok erddap / letöltés / és erddap / képek / nem mentesülnek ebből a számból. Az alapértelmezett 15. A megengedett maximum 1000, ami őrült magas - ne csináld!ERDDAP™nem fogad el kevesebbet, mint 6, mert sok törvényes felhasználó (nevezetesen webes böngészők ésWMSügyfelek) Legyen akár 6 kérés egy időben. AERDDAP™A Daily Report és a log.txt fájlhoz írt hasonló információk mindegyik Major Dataset Reload rendszerrel, most tartalmazzák a "Requester's IP Address" cím szerinti kéréseket. (Túl sok kérés) "..." A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
A status.html "Major LoadDatasets Time Series" szakasza tartalmaz egy "tooMany" oszlopot, amely felsorolja azokat a kéréseket, amelyek meghaladták a felhasználó ipAddressMaxRequests beállítását, és így látta a "Too Sok kérés" hiba. Ez lehetővé teszi, hogy könnyedén láthassa, ha aktív túlzottan agresszív legitim felhasználók és rosszindulatú felhasználók, így lehet (Opcionálisan) Nézze meg a log.txt fájlt, és döntse el, hogy szeretné-e feketelistázni ezeket a felhasználókat.
Nincs semmi különösképpen helytelen, ha ezt magasabb számra állítjuk. Ez rajtad múlik. De ez lehetővé teszi / ösztönzi az embereket, hogy olyan rendszereket hozzanak létre, amelyek nagyszámú szálat használnak a projekteken való munkához, majd nem ad visszajelzést arról, hogy mit csinálnak, nem kapnak hasznot.
<ipAddressMaxRequestsActive & gt;
- [[szerkesztés]] ** <ipAddressMaxRequestsActive> ** ] (#ipaddressmaxrequestive) ritkán használt opcionális címke (először támogatottERDDAP™v2.12) belül<erddapDatasets> tagdatasets.xmlez egy olyan rendszer része, amely korlátozza a túlzottan agresszív legitim felhasználók és a rosszindulatú felhasználók képességét, hogy nagyszámú egyidejű kérést készítsenek, amelyek lerombolják a rendszer teljesítményét más felhasználók számára. Az ipAddressMaxRequestsActive meghatározza az egyidejű kérések maximális számát, amelyeket aktívan kezelnek bármely specifikus IP-címből. További kérések leülnek egy sorban, amíg az előző kérelmeket feldolgozták. A kis, statikus fájlok erddap/download/ és erddap/images/ ARE mentesülnek ebből a számból és a kapcsolódó rothadásból. Az alapértelmezett 2 A megengedett maximum 100, ami őrült magas - nem csinálja! Ezt beállíthatja az 1-re, hogy szigorú legyen, különösen, ha túlságosan agresszív vagy rosszindulatú felhasználók vannak. A felhasználók még mindig gyorsan megkapják az összes kért adatot (ipAddressMaxRequests) De nem lesznek képesek a rendszer erőforrásait befogadni. Nem javasoljuk, hogy ezt nagyobb számba állítsuk, mert lehetővé teszi, hogy túlságosan agresszív legitim felhasználók és rosszindulatú felhasználók uralkodjanak.ERDDAPfeldolgozási kapacitás. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
<ipAddressUnlimited & gt;
- [[szerkesztés]] ** <ipAddressUnlimited> ** ] (#ipaddressunlimited) ritkán használt opcionális címke (először támogatottERDDAP™v2.12) belül<erddapDatasets> tagdatasets.xmlez egy olyan rendszer része, amely korlátozza a túlzottan agresszív legitim felhasználók és a rosszindulatú felhasználók képességét, hogy nagyszámú egyidejű kérést készítsenek, amelyek lerombolják a rendszer teljesítményét más felhasználók számára. ipAddressUnlimited egy képregény-elválasztott lista az IP címekről, amelyek lehetővé teszik a korlátlan hozzáférést az Ön számáraERDDAP... Nézd meg a naplódat! txt fájl, hogy melyik formátumot használja a szerver az IP címek. Egyes szervereken az IP címek a #.#.#.# formátumban lesznek. (ahol a # 0 és 255 közötti integrátor) ; mivel másokon ez lesz a formátumban { { } ... A listán szereplő kérelmek nem tartoznak a ipAddressMaxRequests vagy az ipAddressMaxRequestsActive beállítások alá. Ez lehet másodlagosERDDAP™vagy bizonyos felhasználók vagy szerverek számára a rendszerben.ERDDAP™mindig hozzáteszi: " (Ismeretlen IPAddress) - amelyERDDAP™ha a kérő IP-címét nem lehet meghatározni, pl. az ugyanazon szerveren futó egyéb folyamatok esetében. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
Ha valamilyen oknál fogva az összes felhasználó kérése megkapja a hibaüzenetet "Emlékezve várni a többi kérelmet feldolgozni", akkor megoldhatja a problémát, ha hozzáadja a felhasználó IP-címét az ipAddressUnlimited listához, alkalmazva ezt a változást, majd eltávolítja azt a listából.
<loadDatasetsMinMinutes & gt;
- [[szerkesztés]] ** <loadDatasetsMinMinutes> ** ] (#loaddatasetsmin percek) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlmeghatározni a minimális időt (perc) nagy terhelés között Adatkészletek (mikorERDDAP™reprocesszorokdatasets.xml, beleértve az egyes adatkészletek ellenőrzését, hogy megnézze, újra kell-e tölteni a reload szerint MindenNMinutes beállítás, default=15) ... E. pl.
<loadDatasetsMinMinutes>15</loadDatasetsMinMinutes>
Ha egy adott rakományDatasets kevesebbet vesz igénybe, mint ez az idő, a rakomány ismételten megnézi a zászlós könyvtárat és / vagy alszik, amíg a fennmaradó idő eltelt. Az alapértelmezett 15 perc, aminek szinte mindenki számára jónak kell lennie. Az egyetlen hátránya annak, hogy ezt kisebb számba helyezzük, az, hogy növeli a frekvenciátERDDAP™olyan adatkészletek, amelyek olyan hibákkal rendelkeznek, amelyek megakadályozzák őket, hogy betöltsék őket (pl. egy távoli szerver leáll) ... Ha sok ilyen adatkészlet van, és gyakran ismétlődnek, az adatforrás a pestering / agresszív viselkedést tekintheti. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló... KorábbanERDDAP™v2.00, ezt a setup.xml-ben határozták meg, amely még megengedett, de elriasztott.
<loadDatasetsMaxMinutes & gt;
- [[szerkesztés]] ** <loadDatasetsMaxMinutes> ** ] (#loaddatasetsmax percek) egy OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlmeghatározni a maximális időt (perc) Nagy terhelés Az adatkészletek erőfeszítése megengedett (a terhelés előtt Adatkészletek szál kezelt "megoldott" és megszakadt) (default=60) ... E. pl.
<loadDatasetsMaxMinutes>60</loadDatasetsMaxMinutes>
Általában ezt legalább kétszer kell beállítani, amíg ésszerűen úgy gondolja, hogy az összes adatkészlet újratöltése (Kumulatív módon) kell venni (mivel a számítógépek és hálózatok néha lassabbak, mint a várt) Ez mindig sokkal hosszabb, mint a loadDatasetsMinMinutes. Az alapértelmezés 60 perc. Néhány ember ezt hosszabbra fogja beállítani. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló... KorábbanERDDAP™v2.00, ezt a setup.xml-ben határozták meg, amely még megengedett, de elriasztott.
<logLevel>
- [[szerkesztés]] ** <LogLevel> ** ] (#loglevel) egy OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlannak meghatározására, hogy hány diagnosztikai üzenetet küldenek a log.txt fájlba. Beállítható a "háborúba" (a legkisebb üzenetek) , "info" (az alapértelmezett) vagy "minden" (a legtöbb üzenet) ... E. pl.
<logLevel>info</logLevel>
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló... KorábbanERDDAP™v2.00, ezt a setup.xml-ben határozták meg, amely még megengedett, de elriasztott.
<partialRequestMaxBytes & gt; és<PartialRequestMaxCells & Gt;
- [[szerkesztés]] ** <PartialRequestMaxBytes> ] (#partialrequestmaxbytes-and-partialrequestmaxcells) [[[szerkesztés]]] <PartialRequestMaxCells> ** ] (#partialrequestmaxbytes-and-partialrequestmaxcells) ritkán használják az OPTIONAL címkéket egy<erddapDatasets> tagdatasets.xml... Ha lehetséges (és nem mindig lehetséges) ,ERDDAP™megtöri a nagy adatkérelmeket a darabokra, hogy megőrizze a memóriát.
32 bitJavaegyszerű értelemben a maximális számú egyidejű nagy a kérelmek nagyjából a rendelkezésre álló memória 3/4 (a -Xmx érték átadta Tomcat) osztva a zsák mérete (pl. 1200 MB / 100 MB => 12 kérés) ... Más dolgok memóriát igényelnek, így a tényleges kérések száma kevésbé lesz. A gyakorlatban a zsúfolás nem mindig lehetséges. Tehát egy hatalmas vagy néhány nagyon nagy egyidejű, nem zsúfolt kérés 32 bites problémát okozhatJava...
64 bitJavaA -Xmx érték sokkal nagyobb lehet. Tehát a memória sokkal kevésbé valószínű, hogy korlátozott.
Fedezheti az alapértelmezett darab méretét azáltal, hogy ezeket a címkéket határozza megdatasets.xml (különböző értékekkel, mint itt) : Hálók számára:<PartialRequestMaxBytes>100000000</partialRequestMaxBytes> Az asztalokhoz:<PartialRequestMaxCells>1000000</partialRequestMaxCells>
PartialRequestMaxBytes az előnyben részesített legnagyobb számú bytes egy részleges hálózati adatkéréshez (a teljes kérelem egy része) ... default=100000000 (10 ^8) ... A nagyobb méretek nem feltétlenül jobbak (és ne menj át 500 MB, mert ez a THREDDS alapértelmezett határaDAPválaszok) ... De a nagyobb méretek kevesebb tonna fájlhoz való hozzáférést igényelhetnek (Gondolj beleERD"s műholdas adatok minden egyes alkalommal egy különálló fájlban - jobb, ha minden egyes fájlból több adatot kapunk) ...
PartialRequestMaxCells az előnyben részesített maximális számú sejt (nRows \* nColumns az adattáblában) Részleges TABLE adatkérés (a teljes kérelem egy része) ... Alapértelmezett = 100000. A nagyobb méretek nem feltétlenül jobbak. Ezek egy hosszabb várakozást eredményeznek az adatok kezdeti tételére a forrásból.
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló... KorábbanERDDAP™v2.00, ezeket a setup.xml-ben határozták meg, amely még mindig megengedett, de elriasztott.
<Blacklist>
- [[szerkesztés]] ** <Blacklist> ** ] (#requestblacklist) OPTIONAL címkebelül<erddapDatasets> tagdatasets.xmlamely a numerikus IP címek egy különálló listáját tartalmazza, amelyeket feketelistáznak. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
- Ezt lehet használni, hogy lemond egyA szolgáltatási támadás elutasításaTúlságosan nullawebes robotvagy bármilyen más típusú gondos felhasználó.
- Hibaelmés felhasználó - HaERDDAP™lassú egy nyers vagy fagyaszt / megállók, az ok gyakran egy problémás felhasználó, aki egyszerre több mint egy forgatókönyvet fut, és / vagy nagyszámú nagyon nagy, rendkívül hatékony vagy érvénytelen kérés, vagy egyidejű kérés. Nézd megLog.txtlátni, hogy ez a helyzet, és megtalálni a numerikus IP címet a problémás felhasználó. Ha ez a probléma, akkor valószínűleg feketelistát kell használnia a felhasználónak.
MikorERDDAP™kérelmet kap egy feketelistás IP-címről, visszatér a HTTP hiba 403: Tilos. A kísérő szöveges hibaüzenet arra ösztönzi a felhasználót, hogy e-mailt küldjön Önnek,ERDDAPadminisztrátor, hogy dolgozzon ki a problémákat. Ha időt vesz igénybe a hibaüzenet olvasására (sok látszólag nem) és lépjen kapcsolatba veled, akkor dolgozhat velük, hogy egyszerre csak egy szkriptet futtassanak, hatékonyabb kéréseket készítsen, rögzítse a szkriptjeikben lévő problémákat (például egy távoli adatkészletből származó adatok kérése, amelyek nem válaszolhatnak az időzítés előtt) vagy bármi más volt a baj forrása.
A felhasználók gyakran egyszerűen nem tudják, hogy kéréseik problémásak. Gyakran nincsenek tudatában a hibáknak, a bruttó hatékonyságnak, vagy más problémáknak a forgatókönyvükkel. Gyakran gondolják, mert a tiédERDDAP™ingyenes adatot kínál, hogy annyi adatot kérjenek, amennyit csak akarnak, például több szkript futtatásával, vagy több szál használatával egyszerre.
- Elmagyarázhatja őket, hogy mindegyikERDDAP™Most számít, mennyire nagy és erős, véges erőforrásokkal rendelkezik (CPU idő, hard drive I/O, hálózati sávszélesség stb.) és nem tisztességes, ha egy felhasználó kéri az adatokat oly módon, hogy más felhasználókat vagy túlburdenseket zsúfolERDDAP...
- Miután egy felhasználó tudja, hogyan kell két egyidejű kérést készíteni, gyakran nem látnak okot arra, hogy nem készítsenek 5, 10 vagy 20 egyidejű kérést, mivel a további kérések semmit sem fizetnek. Olyan, mint aszimmetrikus hadviselés: itt a támadó fegyverek hatalmas előnyökkel rendelkeznek (nulla költség) a védekező fegyverek felett (véges telepítés valódi költségekkel) ...
- Nézd meg őket, hogy csökkenő visszatérések egyre több egyszerű kérések; a további kérések csak további blokkolja más felhasználó kéréseit; nem hoznak létre egy hatalmas javulást számukra.
- Emlékeztesse őket arra, hogy vannak más felhasználók (mind az alkalmi felhasználók, mind a többi felhasználó scripteket futtat) Ezért nem tisztességes, hogy mindnyájatokat megöljenekERDDAPforrások.
- Érdemes megjegyezni, hogy a technológiai óriások arra ösztönözték a felhasználókat, hogy végtelen erőforrásokat várjanak el a webszolgáltatástól. Míg vannak módok létrehozásárahálók/klaszterek/szövetségekERDDAPsHogy egyERDDAP™rendszer több erőforrással, a legtöbbERDDAP™Az adminisztrátoroknak nincs pénzük vagy a manifesztumuk az ilyen rendszerek létrehozásához, és egy ilyen rendszer még mindig véges lesz. AERDPéldául van egy személy (Engem) írásERDDAP™2 adminisztrációERDDAPs (Segítségével a főnököm) , és kezeli több adatforrások, mind egy éves hardver költségvetés $0 (alkalmi támogatásokra támaszkodunk a hardverért való fizetéshez) ... Ez nem a Google, a Facebook, az Amazon stb. 100 mérnökökkel, és több millió dolláros bevétel újrahasznosítása egyre nagyobb rendszerekbe. És nem tudunk csak mozogniERDDAP™Például az Amazon AWS, mert az adattárolási költségek nagyok, és az adatátviteli díjak nagyok és változóak, míg a külső szolgáltatásokra vonatkozó költségvetésünk 0 dollár.
- A felhasználók iránti kérésem: a nem-idős érzékeny kérések esetében (ami messze a leggyakoribb eset) A rendszerüknek csak egy kérést kell tennie egy időben. Ha a kérések érzékenyek (pl. több .png egy weboldalon, több csempe egy weboldalonWMSügyfél, stb.) Talán 4 egyidejű kérésnek kell lennie a max (és csak nagyon rövid ideig) ...
- Ha elmagyarázza a helyzetet a felhasználónak, a legtöbb felhasználó megérti és hajlandó a szükséges változtatásokat, hogy eltávolítsa IP-címét a feketelistáról.
- A felhasználó Blacklistához add hozzá számszerű IP-címüket az IP-címek comma-elválasztott listájához<kérésBlacklist> az Öndatasets.xmlfájl. Ahhoz, hogy megtalálja a gondos felhasználó IP címét, nézze meg aERDDAP™ bigParentDirectory[szerkesztés] /logs/log.txt fájl ( bigParentDirectory[szerkesztés] meg van határozvasetup.xml) látni, hogy ez a helyzet, és megtalálni a felhasználó IP-címét. Az IP-címet minden kérésre felsoroljuk a "{{{{##123;#" és az időszakoktól elválasztott 4 szám, például 123.45.67.8 . Az „ERROR” keresése segít olyan problémákat találni, mint az érvénytelen kérések.
- Az utolsó számot egy IP-címben is helyettesítheti\(például 202.109.200.\) egy sor IP cím blokkolására, 0-255.
- Az utolsó 2 számot is felcserélheti egy IP-címben\...\ (Például 121.204.\...\) az IP címek szélesebb körének blokkolására, 0-255.0-255.
- Például,
<requestBlacklist>98.76.54.321, 202.109.200.\\*, 121.204.\\*.\\*</requestBlacklist>
- Nem kell újraindítaniERDDAP™a változásokra<kérelemBlacklist>, hogy lépjen hatályba. A változásokat a következő alkalommal fogják észlelniERDDAP™ellenőrzi, hogy minden adatkészletet újra kell tölteni. Vagy felgyorsíthatja a folyamatot egy látogatássalsetDataset Flag URLminden adatkészlethez.
- AERDDAP™A napi jelentés tartalmazza a legaktívabb engedélyezett és blokkolt kérők listáját/tally-ját.
- Ha szeretné kitalálni, hogy mi a domain/intézmény kapcsolódik egy numerikus IP címhez, használhat egy ingyenes, fordított DNS webes szolgáltatást, mint például https://network-tools.com/ ...
- Lehetnek olyan idők, amikor értelme van bizonyos felhasználókat magasabb szinten blokkolni, például rosszindulatú felhasználókat. Például blokkolhatja a hozzáférést mindenhez a szerverén, nem csakERDDAP... Linuxon egy ilyen módszert kell használniiptables... Például hozzáadhat egy olyan szabályt, amely megakadályozza mindazt, ami 198.51.100.0-ból érkezik a parancshoz. I INPUT – 198.51.100.0 J DROP
<lassúDownTroubleMillis & gt;
- [[szerkesztés]] ** <LassúDownTroubleMillis> ** ] (#slowdowntroublemillis) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlamely tartalmaz egy integrált, amely meghatározza a milliszekundumok számát (default=1000) szünet, amikor válaszolni minden meghibásodott kérésre, pl. ismeretlen adatkészlet, kérjen túl nagy, felhasználó a feketelistán. E. pl.
<slowDownTroubleMillis>2000</slowDownTroubleMillis>
Ha egy forgatókönyv azonnal kérést tesz egy másik után, akkor gyorsan lehet, hogy egy rossz kérést egy másik után. Ezzel a beállítással lelassíthatja a hiányos forgatókönyvet, ígyERDDAP™nem árasztott rossz kérésekkel. Ha egy ember rossz kérést tesz, nem is veszik észre ezt a késést. Ajánlások:
- Ha a baj a szolgáltatás elosztott tagadása (DDOS) 100+ támadó támadása, állítsa be ezt kisebb számba (100?) ... A túl sokáig lelassítva túl sok aktív szálhoz vezet.
- Ha a baj 1-10 forrásból származik, állítsa be ezt 1000 ms-re (az alapértelmezett) , de nagyobb szám (Mint 10000) ésszerű is. Ez lelassítja őket, így kevesebb hálózati erőforrást pazarolnak. Továbbá 1000 ms vagy így nem bosszantja az embereket, akik rossz kérést tesznek.
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
<előfizetésEmailBlacklist & gt;
- [[szerkesztés]] ** <előfizetés EmailBlacklist> ** ] (#subscriptionemailblacklist) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlamely az e-mail címek egy párosított listáját tartalmazza, amelyeket azonnal feketelistáznakelőfizetési rendszerPéldául
<subscriptionEmailBlacklist>bob@badguy.com, john@badguy.com</subscriptionEmailBlacklist>
Ez egy esetérzékeny rendszer. Ha egy e-mail cím hozzáadódik ehhez a listához, ha az e-mail cím előfizetésekkel rendelkezik, az előfizetéseket törölni fogják. Ha a listán szereplő e-mail cím megpróbál előfizetni, a kérelmet elutasítják. A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
Standard szöveg
-
Standard szöveg - Számos OPTIONAL címke létezik (a legtöbbet ritkán használják) belül<erddapDatasets> tagdatasets.xmlolyan szöveg meghatározása, amely különböző helyeken jelenik megERDDAP... Ha meg akarja változtatni az alapértelmezett szöveget, másolja a meglévő értéket ugyanazon név címkéjéből Tomcat /webapps/erddap/WEB-INF/classes/gov/noa/pfel/erddap/util.messages.xml adatasets.xmlEzután módosítsa a tartalmat. Az előnye annak, hogy ezek bennük vannakdatasets.xmlaz, hogy bármikor meghatározhatja az új értékeket, még akkor is, haERDDAP™fut. Ezeknek a címkéknek az értékeinek bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló... A címke nevek leírják a célt, de lásd az alapértelmezett tartalmat az üzenetekben.xml mélyebb megértéshez.
-
<szabványos licenc>
-
<standardContact>
-
<szabványDataLicenses>
-
<szabványDisclaimerOfEndorsement>
-
<szabványDisclaimerOfExternalLinks>
-
<szabványGeneralDisclaimer>
-
<szabvány PrivacyPolicy
-
<Kezdőlap >HeadHtml5
-
<Az indulóBodyHtml5> egy jó címke, amely megváltoztatja annak érdekében, hogy testreszabja minden weboldal tetején lévő megjelenésétERDDAP... Figyelemre méltó, hogy ezt könnyen hozzáadhat egy ideiglenes üzenetet aERDDAP™weboldal (pl.: "Keresse ki az új JPL MUR SST v4.1 adatkészletet..." vagy "EzERDDAP™offline lesz 2019-05-08T17:00:00 PDT 2019-05-08T20:00 PDT.) ... Egy furcsa, hogy ezt a címkét helyezzük bedatasets.xmlha újraindításERDDAPAz első kérésERDDAP™visszatér az alapértelmezett induláshoz BodyHtml5 HTML, de minden későbbi kérés a kezdőBodyHtml5 HTML-t használjadatasets.xml...
-
<AShortDescription Html> egy jó címke, hogy megváltoztassa, hogy testreszabja a leírást aERDDAP... Vegye figyelembe, hogy könnyen megváltoztathatja ezt, hogy ideiglenes üzenetet adjon a honlapon (pl.: „EzERDDAP™offline lesz 2019-05-08T17:00:00 PDT 2019-05-08T20:00 PDT.) ...
-
<endBodyHtml5>
-
KorábbanERDDAP™v2.00, ezeket a setup.xml-ben határozták meg, amely még mindig megengedett, de elriasztott.
<szokatlan Activity & gt;
- [[szerkesztés]] ** <szokatlanActivity> ** ] (# szokatlantivitás) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmla LoadDatasets két futamideje közötti maximális kérelmek meghatározása, amelyeket normálisnak tartanak (default=10000) ... Ha ezt a számot túllépik, egy e-mailt küldünk e-mailbeEverythingTo (a setup.xml-ben megadott) ... E. pl.
<unusualActivity>10000</unusualActivity>
A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló... KorábbanERDDAP™v2.00, ezt a setup.xml-ben határozták meg, amely még megengedett, de elriasztott.
<frissítésMaxEvents & gt;
- [[szerkesztés]] ** <frissítésMaxEvents> ** ] (#updatemaxevents) egy ritkán használt OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlmeghatározni a fájlváltozási események maximális számát (default=10) Ezt a [[szerkesztés]]]<frissítésEveryNMillis> (#updateeverynmillis) a rendszer, mielőtt az adatkészlet újratöltésére váltana. Például,
<updateMaxEvents>10</updateMaxEvents>
A frissítésEveryNMillis rendszer célja, hogy futtassa nagyon gyorsan, mielőtt a felhasználó kérésére feldolgozott. Ha sok fájlváltozási esemény van, akkor valószínűleg nem tud gyorsan futni, így ehelyett kéri az adatkészlet újratöltését. Ha a teERDDAP™olyan adatkészletekkel foglalkozik, amelyeket naprakészen kell tartani, még akkor is, ha nagyszámú adatfájl változásai vannak, ezt nagyobb számba állíthatja. (100?) ...
<felhasználó és gt;
- [[szerkesztés]] ** <felhasználó> ** ] (#user) egy OPTIONAL tag egy<erddapDatasets> tagdatasets.xmlamely azonosítja a felhasználó felhasználó nevét, jelszó (ha hitelesítés=custom) és szerepek (Comma-választott lista) ... A felhasználónév és a jelszó használata kissé a [[szerkesztés]] értékén alapul.<hitelesítés>] (/docs/server-admin/additional-information#authentication) a teERDDAP"s setup.xml fájl.
- Ez része ennekERDDAPAbiztonsági rendszerbizonyos adatkészletekhez való hozzáférés korlátozása bizonyos felhasználók számára.
- Készítsen külön<felhasználói> címke minden felhasználó számára. Opcionálisan, ha hitelesítés=oauth2, létrehozhat két<felhasználó> tagok minden felhasználó számára: egy, amikor a felhasználó bejelentkezik A Google, ha a felhasználó bejelentkezik az Orcid segítségével, valószínűleg ugyanazokkal a szerepekkel.
- Ha nincs<felhasználói> címke az ügyfél számára, s / ő csak képes lesz hozzáférni a nyilvános adatkészletekhez, azaz olyan adatkészletekhez, amelyek nem rendelkeznek [a]<hozzáférhetőTo> (#Ccessibleto) Tag.
- felhasználónév Az autentication=custom esetében a felhasználónév általában levelek, számjegyek, alpontok és időszakok kombinációja. Authentication=email esetében a felhasználónév a felhasználó e-mail címe. Lehet, hogy bármilyen e-mail cím. Authentication=google esetében a felhasználónév a felhasználó teljes Google e-mail címe. Ez magában foglalja a Google által irányított számlákat, mint például@noaa.govfiókok. A hitelesítés=orcid, a felhasználónév a felhasználó Orcid számlaszáma (dashokkal) ... Authentication=oauth2 esetében a felhasználónév a felhasználó teljes Google e-mail címe vagy a felhasználó Orcid fiókszáma (dashokkal) ...
- jelszó
Az autentication=email, google, orcid vagy oauth2 esetében ne adja meg a jelszó tulajdonságát.
Authentication=custom esetében meg kell határoznia a jelszó tulajdonságát minden felhasználó számára.
- Azok a jelszavak, amelyekbe a felhasználók belépnek, érzékenyek, és 8 vagy több karakterrel kell rendelkezniük, így nehezebb repedni. Manapság még 8 karaktert is lehet repedni gyorsan és olcsón brutális erő segítségével a számítógépek klasztere AWS.ERDDAP™csak akkor érvényesíti a 8 karakteres minimumot, ha a felhasználó megpróbál bejelentkezni (nem akkor, ha<felhasználói> címke feldolgozásra kerül, mert ez a kód csak a jelszó hash emésztését látja, nem a plaintext jelszó).
- setup.xml's<jelszóEncoding> meghatározza, hogy a jelszavakat hogyan tárolják<felhasználó> címkék adatasets.xml... A biztonság növelése érdekében a lehetőségek a következők:
- MD5 (Ne használja ezt!) - a jelszó tulajdonsága, meghatározza az MD5 hash emésztését a felhasználó jelszavát.
- UEPMD5 (Ne használja ezt!) - a jelszó tulajdonsága, meghatározza az MD5 hash emésztését felhasználónév :ERDDAP: jelszó ... A felhasználónév és a "ERDDAP"Szokták használniSó a hash értékét, ami nehezebb dekódolni.
- SHA256 (nem ajánlott) - a jelszó tulajdonsága, meghatározza az SHA-256 hash emésztését a felhasználó jelszavát.
- UEPSHA256 (alapértelmezett, ajánlott jelszóEncoding. De sokkal jobb: használja a google, orchidea, vagy az oauth2 hitelesítési lehetőségeket.) - a jelszó tulajdonsága, megadja az SHA-256 hash emésztését felhasználónév :ERDDAP: jelszó ... A felhasználónév és a "ERDDAP"A hash értékének sóhajtására használják, így nehezebb dekódolni.
- Windows, akkor generál MD5 jelszó emésztési értékek letöltésével egy MD5 program (mint példáulMD5) és használat (például) : md5 -djsmith:ERDDAP: tényleges jelszó
- A Linux / Unix, akkor generál MD5 emésztési értékek segítségével a beépített md5sum program (például) : dalszöveg: Echo -n "Jsmith:ERDDAP: tényleges jelszó "..."|md5sum
- A tárolt plaintext jelszavak érzékenyek. Az MD5 és az UEPMD5 jelszavak tárolt formái nem érzékenyek.
- Például (UEPMD5 használata) , ha felhasználóneme="jsmith" és jelszó="myPassword",<felhasználó> címke:
<user username="jsmith"
password="57AB7ACCEB545E0BEB46C4C75CEC3C30"
roles="JASmith, JASmithGroup" />
ahol a tárolt jelszót generálták md5 -djsmith:ERDDAP:myPassword
- A szerepek egy képregény-választott lista azon szerepekről, amelyekre a felhasználó engedélyezett. Minden<adatkészlet> lehet egy [<hozzáférhetőTo> (#Ccessibleto) címke, amely felsorolja azokat a szerepeket, amelyek lehetővé teszik az adatkészlethez való hozzáférést. Egy adott felhasználó és egy adott adatkészlet esetében, ha a felhasználói szerepek listájának egyik szerepe megfelel az adatkészlet listájának egyik szerepének.<hozzáférhetőTo> szerepek, akkor a felhasználó engedélyezett, hogy hozzáférjen az adatkészlet.
Minden felhasználó, aki bejelentkezik, automatikusan megkapja a szerepet\[bárkit megadva Inkább\]- akár van egy<felhasználói> címke számukradatasets.xmlvagy sem. Tehát, ha egy adott adatkészlet
<accessibleTo>\\[anyoneLoggedIn\\]</accessibleTo>
akkor minden olyan felhasználó, aki be van jelentkezve, engedélyezve lesz az adatkészlethez való hozzáférést, még akkor is, ha nincs<felhasználói> címke számukradatasets.xml...
- A tag értékének bármilyen változása a következő alkalommal lép életbeERDDAP™olvasódatasets.xml, beleértve az adatkészletre adott válaszban iszászló...
<útRegex & gt;
- [[szerkesztés]] ** <ugyeRegex> ** ] (#pathregex) Adja meg a rendszeres kifejezést, amely korlátozza az utat (Melyik közvetítők) az adatkészletbe kerül. Az alapértelmezettség .\*, amely megfelel az összes útnak. Ez egy ritkán használt, ritkán szükséges, OPTIONAL címkeEDDGridFromFiles adatkészletek, EDDTableFromFiles adatkészletek, és néhány más adatkészlettípus. Azonban, amikor szüksége van rá, tényleg szüksége van rá.
Ahhoz, hogy ez a munka, akkor igazán jó a rendszeres kifejezéseket. Lásd eztregex dokumentációésregex bemutató... Különösen tudnia kell a rögzítő csoportokról (valami a parenthesesben) és a "vagy" szimbólum "|"..." Együtt, ezek lehetővé teszik, hogy megadja számos lehetőséget, például, (opció1|opció2|opció3) ... Szintén minden lehetőség nem lehet semmi, pl. (|opció2|opció3) ... Azt is tudnia kell, hogy a rögzítő csoportok fészkezhetnek, azaz a rögzítő csoport bármely lehetősége tartalmazhat egy másik rögzítő csoportot, például. (|opció2 (|opció2 b)|opció2c) |opció3) amely azt mondja, hogy az opció2 követhető semmi, vagy opció2b, vagy opció2c. Az útRegexes számára minden opció egy mappa neve lesz, amelyet egy /, pl. bar/ követ.
Az ösvény trükkös részeRegex: AmikorERDDAP™ismétlődően leereszkedik a könyvtár fájáról, az ösvényRegexnek el kell fogadnia az összes olyan utat, amellyel az adatokkal találkozik a könyvtárak felé. A Regex fészkelő rögzítő csoportjai jó módja ennek kezelésére.
Példa: Tegyük fel, hogy a következő könyvtári struktúrával rendelkezünk:
/foo/bar/D0001/a/\\*.nc
/foo/bar/D0001/b/\\*.nc
/foo/bar/D0002/a/\\*.nc
/foo/bar/D0002/b/\\*.nc
...
/foo/bar/E0001/a/\\*.nc
...
és a megadott fájlDirectory /foo/bar/, és csak akarjuk.ncfájlok a D-ben\[0-9\]{4}/a/ aláírók.
A megoldás az, hogy beállítsuk az utatRegex to /foo / bar / (|D\[0-9\]{4}/ (|a/) )
Ez azt mondja:
Az útnak a /foo/bar/
Ezt követheti semmi vagy D\[0-9\]{4}/
Ezt követheti semmi vagy a/
Igen, az útRegex hihetetlenül nehéz megfogalmazni. Ha elakad, kérjen számítógépes programozót (a legszorosabb dolog a való világban, hogy egy varázsló kiabálási ösztönzés?) vagy küldjön e-mailt Chrisnek. John at noaa.gov.
<adatkészlet és gt;
- [[szerkesztés]] ** <adatkészlet> ** ] (#dataset) az OPTIONAL (de mindig használt) egy<erddapDatasets> tagdatasets.xml(ha az összes információt tartalmazza<adatkészlet> és</dataset>) teljesen leírja az egyik adatkészletet. Például,
<dataset type="EDDGridFromDap" datasetID="erdPHssta8day" active="true"> ... </dataset>
Legfeljebb számos adatcímke van az Ön számáradatasets.xmlfájl. Három tulajdonság MAY jelenik meg egy<Dataset> címke:
- típusa=" egy típus "..." a REQUIRED tulajdonsága egy<Dataset> címkedatasets.xmlamely azonosítja az adatkészlet típusát (például, hogy ez egyEDDGrid/ gridded vagy EDDTable/tabular adatkészlet) és az adatok forrása (például egy adatbázis, fájl vagy egy távoliOPeNDAPszerver) ... Lásd: Adatkészlet típusok listája ...
adatkészlet Id
- datasetIDÓ ADatasetID "..." a REQUIRED tulajdonsága egy<adatkészlet> címke, amely rövid (általában)<15 karakter), egyedi, azonosító név egy adatkészlet.
- AdatasetIDS MUST legyen egy levél (A-Z, a-z) A-Z, a-z, 0-9 és \_ (de a legjobb, ha<32 karakter teljes).
- Adatbázis Az azonosítók érzékenyek, de nem hoznak létre kettőtdatasetIDs ez csak a felső/alacsonyabb levelekben különbözik. Ez problémákat okoz a Windows számítógépeken (Ön és / vagy egy felhasználó számítógépe) ...
- Legjobb gyakorlatok: Javasoljuk, hogy használjaTűz Esetleg...
- Legjobb gyakorlatok: Javasoljuk, hogy az első rész legyen a forrás intézmény neve akronymája vagy rövidítése, és a második rész az adatkészlet neve akronymája vagy rövidítése legyen. Ha lehetséges, létrehozunk egy nevet, amely tükrözi a forrás neve az adatkészlet. Például használtukdatasetID="erdPHssta8day” egy adatkészletreNOAA NMFS SWFSCKörnyezetkutatási osztály (ERD) amelyet a forrás a műholdas/PH/ssta/8 nap.
- Ha módosítja az adatkészlet nevét, a régi adatkészlet (a régi névvel) még mindig élni fogERDDAP... Ez egy "orfán" adatkészlet, mert a specifikáció bennedatasets.xmlmost eltűnt. Ezzel kell foglalkozni:
- MertERDDAP™V2.19 és később nem kell semmit tennie.ERDDAP™automatikusan eltávolítja ezeket az árva adatkészleteket.
- MertERDDAP™v2.18 és korábban, meg kell tennie valamit, hogy távolítsa el az árva adatkészletek: Készítsen aktív="hamis" adatkészletet, például
<dataset type="EDDTableFromNcFiles" datasetID="*theOldName*" active="false" />
A következő nagy terhelés után Adatkészletek, Ezt a címkét eltávolíthatja a régi adatkészlet után, inaktív.
aktív
- aktív =" boolean "..." OPTIONAL attribútum egy<Dataset> címkedatasets.xmlamely azt jelzi, hogy egy adatkészlet aktív (jogosult a használatraERDDAP) vagy sem.
- Valid értékek igazak (az alapértelmezett) és hamis.
- Mivel az alapértelmezett igaz, nem kell használni ezt a tulajdonságot, amíg ideiglenesen vagy tartósan eltávolítani ezt az adatkészletet.ERDDAP...
- Ha csak eltávolít egy aktív="true" adatkészletetdatasets.xmlAz adatkészlet továbbra is aktív leszERDDAP™De soha nem lesz frissítve. Az ilyen adatkészlet "orfán" lesz, és a státuszban ilyennek fogják felsorolni. html weboldal közvetlenül az olyan adatkészletek listája alatt, amelyek nem töltöttek be.
- Ha aktív="hamis"-t állít be,ERDDAP™a következő alkalommal deaktiválja az adatkészletet, amikor megpróbálja frissíteni az adatkészletet. Ha ezt megteszed,ERDDAP™nem dob ki semmilyen információt, amelyet tárolhatott az adatkészletről, és biztosan nem tesz semmit a tényleges adatokhoz.
- Az adatkészlet eltávolítása érdekébenERDDAP™lásdErő adatkészlet eltávolítása...
** Számos címke jelenhet meg a között<adatkészlet> és</dataset> címkék. **
Van néhány variáció, amelyben a címkék megengedett, hogy milyen típusú adatkészletek. Lásd a dokumentációt egy adottadatkészlet típusarészletekért.
<hozzáférhető To>
- [[szerkesztés]] ** <hozzáférhető To> ** ] (#Ccessibleto) egy OPTIONAL tag egy<adatkészlet> címke, amely meghatározza a comma-elválasztott listátszerepekamely lehetővé teszi ezen adatkészlethez való hozzáférést. Például,
<accessibleTo>RASmith, NEJones</accessibleTo>
- Ez része ennekERDDAPAbiztonsági rendszerbizonyos adatkészletekhez való hozzáférés korlátozása bizonyos felhasználók számára.
- Ha ez a címke nem jelenik meg, minden felhasználó (még akkor is, ha nem jelentkeztek be) hozzáférni fog ehhez az adatkészlethez.
- Ha ez a címke jelen van, ez az adatkészlet csak látható és hozzáférhető a bejelentett felhasználók számára, akiknek az egyik meghatározott szerepe van. Ez az adatkészlet nem lesz látható azok számára, akik nem jelentkeznek be.
- Minden felhasználó, aki bejelentkezik, automatikusan megkapja a szerepet\[bárkit megadva Inkább\]- akár van egy<felhasználói> címke számukradatasets.xmlvagy sem. Tehát, ha egy adott adatkészlet
<accessibleTo>\\[anyoneLoggedIn\\]</accessibleTo>
akkor minden olyan felhasználó, aki be van jelentkezve, engedélyezve lesz az adatkészlethez való hozzáférést, még akkor is, ha nincs<felhasználói> címke számukradatasets.xml...
<graphsAccessibleTo>
- [[szerkesztés]] ** <graphsAccessibleTo> ** ] (#grafsaccessibleto) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlamely meghatározza, hogy az adatkészlet grafikája és metaadata elérhető-e a nyilvánosság számára. Ez lehetőséget kínál arra, hogy részben felülírja az adatkészletet [<hozzáférhetőTo> (#Ccessibleto) beállítás. Az engedélyezett értékek:
- autó - Ez az érték (vagy hiánya egy<graphsAccessibleTo> címke az adatkészlethez) hozzáférést biztosít a grafikonokhoz és a metaadatokhoz az adatkészletből, az adatkészlet<hozzáférhetőTo> beállítás. Tehát ha az adatkészlet privát, a grafikonja és a metaadata privát lesz. És ha az adatkészlet nyilvános, a grafikonja és a metaadata nyilvános lesz.
- nyilvános - Ez a beállítás lehetővé teszi az adatkészlet grafikonját és metaadatát bárki számára, még azok is, akik nem jelentkeznek be, még akkor is, ha az adatkészlet egyébként privát, mert van egy<hozzáférhetőTo> címke.
<hozzáférhető ViaFiles & Gt;
- [[szerkesztés]] ** <hozzáférhetőViaFiles> ** ] (#Ccessibleviafiles) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlMertEDDGridAggregateExistingDimenzió,EDDGridMásolás,EDDGridFromEDDTable,EDDGridFromErdap,EDDGridFromEtopo,EDDGridFájlok (beleértve az összes alosztályt) ,EDDGridSideBySide,EDDTableCopy EDDTableFromErddap,EDDTableFromEDDGridésEDDTableFromFiles (beleértve az összes alosztályt) adatkészletek. Valódi vagy hamis értéke lehet. Például,
<accessibleViaFiles>true</accessibleViaFiles>
Ha az érték igaz,ERDDAP™így a felhasználók böngészhetnek és letölthetik az adatkészlet forrásadatfájljaitERDDAPA"files"rendszerrendszer... Lásd:"files"rendszerdokumentációTovábbi információkért.
Az alapértelmezett érték<hozzáférhetőViaFiles> A<DefaultAccessibleViaFiles> bennesetup.xml... A hamis alapértelmezett értéke van, de azt javasoljuk, hogy adja hozzá ezt a címkét a setup.xml-hez az igaz értékkel.
Ajánlás - Javasoljuk, hogy az összes releváns adatkészlet elérhető legyen a fájlrendszeren keresztül a fájlok beállításával<defaultAccessibleViaFiles> az igazi beállítás.xml, mert van egy csoport felhasználó, akinek ez a preferált módja az adatok megszerzésének. Egyéb okok között,"files"rendszer megkönnyíti a felhasználók számára, hogy lássák, mely fájlok állnak rendelkezésre, és amikor utoljára megváltoztak, így megkönnyíti a felhasználó számára a teljes adatkészlet saját másolatának fenntartását. Ha általában nem akarja, hogy az adatkészletek hozzáférhetők legyenek a fájlrendszeren keresztül, állítsa be<defaultAccessibleViaFiles> hamisítványhoz. Mindkét esetben csak használja<hozzáférhetőViaFiles> azon kevés adatkészlet esetében, amelyek kivételt képeznek az általános politikának, amelyet<DefaultAccessibleViaFiles> (Például, ha az adatkészlet használata.ncml mlfájlok, amelyek nem igazán hasznosak a felhasználók számára) ...
<hozzáférhető ViaWMSGt;
- [[szerkesztés]] ** <hozzáférhető ViaWMS> > > > ** ] (#Ccessibleviawms) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlmindenkinekEDDGridalosztályok. Lehet értéke az igazi (az alapértelmezett) vagy hamis. Például,
<accessibleViaWMS>true</accessibleViaWMS>
Ha az érték hamis,ERDDAPAWMSa szerver nem lesz elérhető ezen adatkészlet számára. Ezt általában olyan adatkészletek esetében használják, amelyeknek több mint 180 értéke van (amely technikailag érvénytelenWMSSzolgáltatások) és amelyre az adatkészlet változatát is kínálja, a hosszúsági értékekkel teljes egészében a -180-180-as tartományban.EDDGridLonPM180... Ha az érték igaz,ERDDAP™megpróbálja a rendelkezésre álló adatkészletet elérhetővé tenniERDDAPAWMSszerver. De ha az adatkészlet teljesen alkalmasWMS (pl. nincs hosszúsági vagy magassági adatok) Ezután az adatkészlet nem lesz elérhetőERDDAPAWMSszerver, függetlenül a beállítástól.
<Hozzáadás Variables Hol>
- [[szerkesztés]]<addVariablesWhere> (#addvariables hova) egy OPTIONAL címke belül<adatkészlet> címke az összes EDDTable adatkészlethez.
Bármely EDDTable adatkészlet iránti kérelmek tartalmazhatnak &add Variables Hol ("..." tulajdonság név "" tulajdonság Érték "...") Amit mondERDDAP™az összes változó hozzáadása az adatkészletben, ahol attributeName=attributeValue a kért változók listájára. Például, ha egy felhasználó hozzáadja &add Variables Hol ("..."ioos\_category"Wind") egy lekérdezésre,ERDDAPhozzáadja az összes változót az adatkészletben, amely rendelkezikioos\_category= A kért változók listájának tulajdonítva (Például WindSpeed, WindDirection, WindGustSpeed) ... tulajdonság név és tulajdonság Érték esetérzékenyek.
Inkábbdatasets.xml, ha az adatkészlet része.xml egy adatkészlethez
<addVariablesWhere>*attributeNamesCSV*<addVariablesWhere>
például,
<addVariablesWhere>ioos\\_category,units<addVariablesWhere>
Az adathozzáférési forma (.html weboldal) az adatkészlet tartalmaz egy widgetet (minden attriteName a comma-választott listában) a változók listája alatt, amelyek lehetővé teszik a felhasználók számára, hogy meghatározzák a tulajdonságértéket. Ha a felhasználó egy vagy több attribútum-nevet kiválaszt, hozzáadódik a kérelemhez &add Variables Hol ("..." tulajdonság név "" tulajdonság Érték "...") ... Így ez a címkedatasets.xmllehetővé teszi, hogy megjelölje azokat a tulajdonságneveket, amelyek megjelennek az Adathozzáférési Formán, és megkönnyítik a felhasználók számára, hogy hozzáadják &addVariables Ahol a kérésre működik. A attributeNamesCSV A lista esetérzékeny.
<altitudeMetersPerSourceUnit & gt;
- [[szerkesztés]] ** <AltitudeMetersPerSourceUnit> ** ] (#altitudemeterspersourceunit) egy OPTIONAL címke belül<adatkészlet> címke az adatkészletekben. xxml az EDDTableF-hezSOSadatkészletek (Csak!) ez olyan számot határoz meg, amelyet a forrás magassága vagy mélységértékei megsokszoroznak, hogy magassági értékekké alakítsák őket (méter tengerszint felett) ... Például,
<altitudeMetersPerSourceUnit>-1</altitudeMetersPerSourceUnit>
Ez a címke MUST akkor használható, ha az adatkészlet vertikális tengelyértékei nem méterek, pozitív=up. Ellenkező esetben a TIONÁLIS, mivel az alapértelmezett érték 1. Például,
- Ha a forrás már mérhető a tengerszint felett, használja az 1-et (vagy nem használja ezt a címkét, mivel az 1 az alapértelmezett érték) ...
- Ha a forrást tengerszint alatt mérik, használjon -1-et.
<altitudeMetersPerSourceUnit>-1</altitudeMetersPerSourceUnit>
- Ha a forrást a tengerszint feletti km-ben mérik, használjon 0,001-et.
<defaultDataQuery & gt;
- [[szerkesztés]] ** <DefaultDataQuery> ** ] (#defaultdataquery) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlEz azt mondjaERDDAP™a megadott lekérdezés használata (az URL része a „?” után?) ha a .html fájl típus (Az adathozzáférési forma) kérésre nincs lekérdezés.
- Valószínűleg ritkán kell használni ezt.
- XML-kódra van szüksége (nem százalékkód) az alapértelmezett kérdések, mivel egy XML dokumentumban vannak. Például, és & ,<lesz<, > válik ésgt;
- Kérjük, ellenőrizze a munkáját. Könnyű hibát követni, és nem kapja meg azt, amit akar.ERDDAP™megpróbálja megtisztítani a hibáit - de ne támaszkodjon rá, mivel\*hogyan\*Megtisztítva változhat.
- A hálózati adatkészletek esetében ennek egy közös használata egy másik alapértelmezett mélység vagy magassági dimenzió érték meghatározása. (például,\[0 0\]helyette\[utolsó\]) ... Mindenesetre mindig fel kell sorolnia az összes változót, mindig ugyanazt a dimenzió értéket használja minden változó számára, és szinte mindig használjon.\[0 0\],\[utolsó\]vagy\[0: utolsó\]a dimenzió értékeiért. Például:
<defaultDataQuery>u\\[last\\]\\[0\\]\\[0:last\\]\\[0:last\\],v\\[last\\]\\[0\\]\\[0:last\\]\\[0:last\\]</defaultDataQuery>
- Merttabledapadatkészletek, ha nem határoz meg korlátozást, a kérelem visszaadja az egész adatkészletet, amely gyakorlatilag nagy lehet, az adatkészlettől függően. Ha nem akarsz semmilyen korlátozást meghatározni, nem pedig üres<DefaultDataQuery> (ami ugyanaz, mint az alapértelmezés megjelölése Adatkérés) , meg kell kifejezetten felsorolni az összes változót, amit szeretne tartalmazni az alapértelmezettDataQuery.
- Merttabledapadatkészletek, ennek leggyakoribb használata, hogy meghatározza a különböző alapértelmezett időtartományt (viszonylag max (Idő) Például, &time>=max (Idő) -1day, vagy viszonylag most, például, &time>=now-1 nap) ... Ne feledje, hogy az adatok változóinak kérése ugyanaz, mint az összes adatváltozat meghatározása, így általában csak meghatározhatja az új időkorlátot. Például:
<defaultDataQuery>&time>=max(time)-1day</defaultDataQuery>
vagy
<defaultDataQuery>&time>=now-1day</defaultDataQuery>
<defaultGraphQuery>
- [[szerkesztés]] ** <DefaultGraphQuery> ** ] (#defaultgraphquery[szerkesztés]) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlEz azt mondjaERDDAP™a megadott lekérdezés használata (az URL része a „?” után?) ha a .graph fájl típus (A Make A Graph Form) kérésre nincs lekérdezés.
- Valószínűleg ritkán kell használni ezt.
- XML-kódra van szüksége (nem százalékkód) az alapértelmezett kérdések, mivel egy XML dokumentumban vannak. Például, és & ,<lesz<, > válik ésgt;
- Kérjük, ellenőrizze a munkáját. Könnyű hibát követni, és nem kapja meg azt, amit akar.ERDDAP™megpróbálja megtisztítani a hibáit - de ne támaszkodjon rá, mivel\*hogyan\*Megtisztítva változhat.
- A hálózati adatkészletek esetében ennek a leggyakoribb használata egy másik alapértelmezett mélység vagy magassági dimenzió érték meghatározása. (például,\[0 0\]helyette\[utolsó\]) és/vagy meg kell határozni, hogy egy adott változót grafikonozzák. Mindenesetre szinte mindig használni fog\[0 0\],\[utolsó\]vagy\[0: utolsó\]a dimenzió értékeiért. Például:
(de tedd az egészet egy sorra)<defaultGraphQuery>temp\\[last\\]\\[0\\]\\[0:last\\]\\[0:last\\]&.draw=surface&.vars=longitude|latitude|temp</defaultGraphQuery>
- Merttabledapadatkészletek, ha nem határoz meg semmilyen korlátozást, a kérelem az egész adatkészletet grafikálja, amely hosszú időt vehet igénybe az adatkészlettől függően.
- Merttabledapadatkészletek, ennek leggyakoribb használata, hogy meghatározza a különböző alapértelmezett időtartományt (viszonylag max (Idő) Például, &time>=max (Idő) -1day, vagy viszonylag most, például, &time>=now-1 nap) ... Ne feledje, hogy az adatok változóinak kérése ugyanaz, mint az összes adatváltozat meghatározása, így általában csak meghatározhatja az új időkorlátot. Például:
<defaultGraphQuery>&time>=max(time)-1day</defaultGraphQuery>
vagy
<defaultGraphQuery>&time>=now-1day</defaultGraphQuery>
<dimenzióValuesInMemory & Gt;
-
[[szerkesztés]] ** <dimenzió ÉrtékekInMemory> ** ] (#dimenziós érzelmek) (Igaz (az alapértelmezett) vagy hamis) egy OPTIONAL és ritkán használt címke belül<adatkészlet> címke bármelyikEDDGridadatkészlet, amelyERDDAP™hol tartsuk fenn a dimenziók forrásértékeit (néven is ismertaxisVariables) :
- igaz = a memóriában (ami gyorsabb, de több memóriát használ)
- hamis = a lemezen (ami lassabb, de nem használ memóriát)
Például,
<dimensionValuesInMemory>false</dimensionValuesInMemory>
Ezt csak a hamis nem-default értékkel kell használnia, ha aERDDAP™sok adatkészlettel rendelkezik nagyon nagy méretekkel (pl. értékek milliói, pl.EDDGridFromAudioFiles adatkészletek) ésERDDAPA használatban lévő memóriahasználat mindig túl magas. Lásd a memória: jelenleg használja a sort\[YourDomain\]/erddap/status.htmlmonitorERDDAP™memóriahasználat.
<fájlTableInMemory & Gt;
-
[[szerkesztés]] ** <fájlTableInMemory ** ] (#filetableinmemory) (igaz vagy hamis (az alapértelmezett) ) egy OPTIONAL címke belül<adatkészlet> címke bármelyikEDDGridFromFiles és EDDTable FromFiles adatkészlet, amely elmondjaERDDAP™hol tartsa a fájlTable (amely információkat tartalmaz minden forrásadat fájlról) :
- igaz = a memóriában (ami gyorsabb, de több memóriát használ)
- hamis = a lemezen (ami lassabb, de nem használ memóriát)
Például,
<fileTableInMemory>true</fileTableInMemory>
Ha ezt minden adatkészlethez igazítod, tartsd szemmel a Memory-t: jelenleg vonalat használsz\[YourDomain\]/erddap/status.htmlannak biztosítása, hogyERDDAP™Még mindig rengeteg szabad memóriával rendelkezik.
<fgdcFile & gt;
- [[szerkesztés]] ** <fgdcFile> ** ] (#fgdcfile) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlEz azt mondjaERDDAP™Előkészített FGDC fájl használata helyettERDDAP™Próbálja létrehozni a fájlt. Használat:
<fgdcFile>*fullFileName*</fgdcFile>
teljes FileName hivatkozhat egy helyi fájlra (valahol a szerver fájlrendszerén) vagy egy távoli fájl URL-je. Ha teljes FileName \="" vagy a fájl nem található, az adatkészletnek nem lesz FGDC metaadata. Tehát ez akkor is hasznos, ha el akarja nyomni az FGDC metaadatát egy adott adatkészlethez. Vagy, lehet tenni<fgdcActive> hamis</fgdcActive> a setup.xml-ben, hogy elmondjaERDDAP™nem kínál FGDC metaadatot minden adatkészlethez.
<Iso19115 File>
- [[szerkesztés]] ** <Iso19115Fil> ** ] (#iso19115file) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlEz azt mondjaERDDAP™Használjon előre elkészített ISO 19115 fájlt ahelyett, hogyERDDAP™Próbálja létrehozni a fájlt. Használat:
teljes FileName hivatkozhat egy helyi fájlra (valahol a szerver fájlrendszerén) vagy egy távoli fájl URL-je. Ha teljes FileName \="" vagy a fájl nem található, az adatkészlet nem lesz ISO 19115 metaadata. Tehát ez akkor is hasznos, ha el akarja nyomni az ISO 19115 metaadatot egy adott adatkészlethez. Vagy, lehet tenni<Io19115Active> hamisítás</iso19115Active> a setup.xml-ben, hogy elmondjaERDDAP™nem kínál ISO 19115 metaadatot minden adatkészlethez.
<iso19115File>*fullFileName*</iso19115File>
<MeccsAxi NDigits & Gt;
- [[szerkesztés]] ** <AxisNDigits> ** ] (#matchaxisndigits) egy OPTIONAL tag egyEDDGrid <adatkészlet> címkeEDDGridadatkészletek, amelyek aggregációk, pl. fájlok összessége. Minden alkalommal, amikor az adatkészletet újratöltik,ERDDAP™ellenőrzi, hogy az aggregáció egyes összetevőinek tengelyértékei ugyanazok. A vizsgálat pontosságát a vizsgálat határozza megAxisNDigits, amely meghatározza a számjegyek teljes számát, amelyeknek meg kell felelniük a kettős pontossági tengelyértékek tesztelésekor, 0 - 18 (az alapértelmezett) ... A float tengelyértékek tesztelésekor a teszt a matchAxisNDigits/2 számjegyekkel történik. A 18 vagy annál magasabb értéke azt mondjaEDDGridpontos tesztet végezni. A 0 értéke mondjaEDDGridne végezzen tesztelést, amelyet nem ajánlott, kivéve az alábbiakban leírtak szerint.
BárEDDGridlehetővé teszi a gyülekezet komponenseinek, hogy kissé eltérő tengelyértékekkel rendelkezzenek, csak egy tengelyértéket mutatnak a felhasználónak. A készlet ugyanaz a komponens, amely biztosítja az adatkészlet metaadatát. Például, példáulEDDGridFromFiles adatkészletek, amelyeket a<metadataFrom> beállítás (Default=last) ...
A meccsAxisNDigits\=0 használata erősen elriasztott a legtöbb esetben, mert lekapcsol minden ellenőrzést. Még a minimális ellenőrzés is hasznos, mert biztosítja, hogy az alkatrészek alkalmasak az összesítésre. Mindannyian feltételezzük, hogy minden komponens alkalmas, de ez nem mindig így van. Ez tehát egy fontos szanitásteszt. Még a matchAxisNDigits1, 2, 3 vagy 4 értéke is elriasztódik, mert a különböző tengelyértékek gyakran jelzik, hogy az összetevőket létrehozták (Megkötött?) más módon, és így nem alkalmasak az aggregációra.
Van egy eset, ahol a meccsAxisNDigits\=0 használata hasznos és ajánlott: távoli fájlok összessége, például az S3 buckets adataival. Ebben az esetben, ha az adatkészlet használja a cacheFromUrl, cacheSizeGB, matchAxisNDigits\=0, és aEDDGridFromFiles rendszerAggregáció keresztül File nevekAztánEDDGridnem kell elolvasnia az összes távoli fájlt, hogy megtegye az aggregációt. Ez lehetővé teszi az S3 buckets adataiból származó adatkészletek gyors betöltését (abszurd módon, haEDDGridletölteni és olvasni az összes fájlt) ...
<nThreads & gt;
- KezdőlapERDDAP™2.00 verzió, ha az EDDTableFromFiles vagyEDDGrida forrásból származó adatokat olvassa el, egy darab adatot elolvashat (pl. egy forrásfájl) egy időben (egy szál) (Ez az alapértelmezés) vagy több, mint egy darab adat (pl.: 2+ forrásfájlok) egy időben (2 vagy több szálban) Minden kérelem feldolgozása közben.
-
Thumb szabály: A legtöbb adatkészlet a legtöbb rendszeren, használja az nThreads=1-et, az alapértelmezettséget. Ha van egy erős számítógép (Rengeteg CPU hullám, sok memória) Ezután fontolja meg az nThreads 2, 3, 4 vagy magasabb beállítását (de soha többet, mint a CPU fűrészek száma a számítógépen) olyan adatkészletek esetében, amelyek előnyösek lehetnek:
- A legtöbb EDDTableFromFiles adatkészlet előnyös lesz.
- Adatkészletek, ahol valami okozza a lemaradást, mielőtt egy darab adat ténylegesen feldolgozható, előnyös, például:
- Adatkészletekkülsőleg elnyomott (pl.:.gz) bináris (pl.:.nc) fájlok, mertERDDAP™elnyomja az egész fájlt, mielőtt elkezdi olvasni a fájlt.
- Adatkészletek, amelyekcacheSizeGBmertERDDAP™Gyakran le kell töltenie a fájlt, mielőtt elolvashatja.
- Adatkészletek a magas sávú párhuzamos fájlrendszeren tárolt adatfájlokkal, mert több adatot, gyorsabban, ha kérik. A párhuzamos fájlrendszerek példái közé tartoznakJBOD,pNFS,GlusterFSAmazon S3 és a Google Cloud Storage.
-
Figyelmeztetés: Az nThreads>1 használatakor tarts szemmelERDDAPmemóriahasználat, szálhasználat és általános felelősség (lásd:ERDDAPstatus oldal) ... Lásd észrevételeit ezekről a kérdésekről az alábbiakban.
-
Egy adott adatkészlet esetében ez az nThreads beállítás különböző helyekről származhat:
- Hadatasets.xmlcunk for a dataset egy<nThreads> címke (belül<adatkészlet> címke, nem mint globális tulajdonság) értékkel>= 1, az nThreads értékét használják. Tehát más számot adhat az egyes adatkészletekhez.
- Egyébként, hadatasets.xmlVan egy<nTableThreads> címke (EDDTable FromFiles adatkészletek) vagy egy<nGridThreads> címke (MertEDDGridadatkészletek) értékkel>= 1, kívül egy<adatkészlet> címke, az nThreads értékét használják.
- Ellenkező esetben 1 szálat használnak, ami biztonságos választás, mivel a legkisebb memóriát használja.
MerteredetiERDDAP™telepítéshasználjuk <nTableThreads> 6 6 6</nTableThreads> (Ez egy erős szerver.) A nehéz kérések most az előző idő 30%-át teszik ki.
Monitor erőforrás felhasználása
Amikor különböző nThreads beállításokkal kísérletez (és talán nehezebb mintakéréseket tesz az Ön számáraERDDAP) , figyelemmel kísérheti a számítógép erőforrás-felhasználását:
- Macskákon használja a Finder: Applications: Utilities: Activity Monitor
- Linuxon használja a felső
- Windows 10, használat Ctrl + Shift + Esc Nyissa meg a Task Managert
Figyelmeztetés: Meghatározott felelősség
Elszigeteltségben,ERDDAP™egy magasabb nThreads-szal rendelkező adatkészlet iránti kérelem teljesítése gyorsabban, mint ha az nThreads=1. De bár ezt a kérést feldolgozzák, más felhasználók más kérései kissé zsúfoltak, és lassabb választ kapnak. Is, amikorERDDAP™válaszol egy adott kérésre, más számítási forrásokra (pl. lemezmeghajtási hozzáférés, hálózati sávszélesség) korlátozható, különösen a magasabb nThreads beállításokkal. Így a magasabb nThreads beállításokkal, az általános rendszerfelelősség rosszabb lesz, ha többszörös kérelmet dolgoznak fel - ez nagyon bosszantó lehet a felhasználók számára! Emiatt: soha ne állítsa be az nThreads-t, mint a számítógép CPU fűrészeinek száma. nThreads=1 a legtisztább beállítás minden kérés óta (több egyidejű kérés között) egyenlő részesedést kap a számítási erőforrásoknak. De minél erősebb a számítógép, annál kevésbé lesz probléma.
Figyelmeztetés: Higher Memory HasználjonEDDGridAdatkészletek
A memóriahasználat, míg a feldolgozási kérelmek közvetlenül arányosak az nThreads beállítással. Egy ésszerűen biztonságos szabály a hüvelykujjj: meg kell határozniERDDAPmemória beállításoklegalább 2GB + (2GB \* nThreads) ... Néhány adatkészlet iránti kérelemnek több memóriára lesz szüksége. Például az nThreads=3 beállítása bármelyikhezEDDGridAz adatkészlet azt jelenti, hogy a -Xmx beállításnak legalább -Xmx8000M-nek kell lennie. Ha ez a memória beállítása nagyobb, mint 3/4 a számítógép fizikai emléke, csökkenti az nThreads beállítását, hogy csökkentse a memória beállítását.
Az EDDTable adatkészletekre vonatkozó szálak feldolgozási kérelmek memóriahasználata szinte mindig alacsonyabb, mert a fájlok általában sokkal kisebbek. Ha azonban egy adott EDDTable adatkészlet hatalmas (pl.:>=1 GB) adatfájlok, majd a fenti megjegyzések is vonatkoznak ezekre az adatkészletekre.
Bármi legyen is az nThreads beállítása, tartsa szem előtt a memóriahasználati statisztikákat az ÖnénERDDAPstatus oldal... Soha nem kell közelednie ahhoz, hogy a memóriafelhasználást maximalizáljaERDDAPegyébként súlyos hibák és kudarcok lesznek.
Ideiglenes beállítás 1
Ha a jelenlegi memóriahasználat még kissé magas,ERDDAP™beállítja az nThreads-t erre a kérésre. Így,ERDDAP™megőrzi az emlékezetet, amikor a memória szűkös.
A visszatérés csökkentése
Vannak csökkenő visszatérés, hogy növelje az nThreads beállítás: 2 szál lesz jobb, mint 1 (ha figyelmen kívül hagyjuk a dinamikus túlórát) ... De a 3 csak egy darab jobb lesz, mint 2. A 4 csak marginálisan jobb lesz, mint 3.
Egy teszt egy nehéz lekérdezés egy nagy EDDTable adatkészlet, a válaszidő használata 1, 2, 3, 4, 5, 6 szál volt 38, 36, 20, 18, 13, 11 másodperc. (Most használjuk az nTableThreads=6-ot ezen a szerveren.)
nThreads=2: Bár gyakran jelentős előnye van az nThreads=2 meghatározásának az nThreads=1 helyett, gyakran nem tesz sok különbséget az adott felhasználó kérésére adott órában. Ennek oka: az nThreads=1, a legtöbb modern CPU gyakrandinamikus túlórázás (Turbo Boost) a CPU órás sebességének ideiglenes növelése. Így az nThreads=1-el, az egyik mag gyakran magasabb órás sebességgel dolgozik, mint a két sáv, ha nThreads=2-et használta. Függetlenül attól, hogy még mindig úgy gondoljuk, hogy jobb, ha az nThreads=2-t használjuk, nem pedig az nThreads=1-et, mivel ez a beállítás jobb eredményeket eredményez a helyzetek szélesebb körében. És persze, ha a számítógép rendelkezik elegendő CPU kukoricával, egy még magasabb nThreads beállításnak jobb eredményeket kell hoznia.
Mint fentebb említettük, nagyon magas nThreads beállítások vezethet gyorsabb válaszokat néhány kérésre, de a kockázat az általános csökkentettERDDAP™felelősség és magas memóriahasználat (a fentebb megjegyzett) míg ezeket a kérelmeket feldolgozzák, azt jelenti, hogy általában nem jó ötlet.
CPU Súgó
Nem szabad soha beállítani az nThreads-t egy szám nagyobbra, mint a CPU fűrészek száma a számítógép CPU-jában. Lényegében minden modern CPU-nak több sarka van (pl.: 2, 4 vagy 8) ... Néhány számítógép még több CPU-val is rendelkezik (pl. 2 CPUs \* 4 cores/CPU = 8 CPU cores) ... Hogy megtudja, hány CPU és fűző egy számítógép:
- Macskákon használja Opció kulcs Apple Menu: Rendszerinformáció
- Linuxon használjon macskát / proc / cpuinfo
- Windows 10, használat Ctrl + Shift + Esc Nyitott Feladatkezelő: Performance (A logikai processzorok megmutatják a CPU hullák teljes számát)
Igen, a legtöbb processzorok ezekben a napokban azt mondják, hogy támogatják a 2 szálat főként (keresztülhiperszálas) , de a 2 szál megosztja a számítási forrásokat, így nem fogja kétszer látni a CPU-n keresztüli teljesítményt nehéz terhelés alatt. Például egy CPU-val rendelkező számítógép 4 fűvel azt állíthatja, hogy legfeljebb 8 szálat támogat, de soha nem haladhatja meg az nThreads=4-et abban az esetben.ERDDAP... Ne feledje:
- Az nThreads beállításaERDDAP™kérésre.ERDDAP™gyakran egyszerre több kérést kezel.
- ERDDAP™más dolgokat tesz, mint a folyamatkérések, például az adatkészletek újratöltése.
- MikorERDDAP™válaszol egy adott kérésre, más számítási forrásokra (pl. lemezmeghajtási hozzáférés, hálózati sávszélesség) korlátozás lehet. A magasabb, amit nThreads-t hoztál létre, annál valószínűbb, hogy ezek a többi erőforrások le lesznek foglalva, és lelassulnakERDDAPÁltalános felelősség.
- Az operációs rendszer más dolgokat csinál, mint futniERDDAP...
Tehát a legjobb, ha nem állítja be az nThreads-t, amely több, mint a számítógép CPU-jában található fűrészek számát tartalmazza.
Lehet, hogy a mérföld Vary (YMMV)
A különböző nThreads beállítások eredményei nagyban különböznek a különböző adatkészletek különböző kéréseitől a különböző rendszereken. Ha igazán szeretné megismerni a különböző nThreads beállítások hatását, reális teszteket futtat.
Miért nHárom kérésre?
Hallhatom, hogy néhányan közületek azt gondolják, hogy „Miért nThreads per kérésre? Ha ezt kódolnám, használnék egy állandó munkásszálas medencét és egy üzenetküldő sort a jobb teljesítmény érdekében.” A probléma egy munkavállalói szálmedencével és egy üzenetküldő kérdéssel az, hogy egy nehéz kérés számos lassú feladattal elárasztja a sort. Ez hatékonyan blokkolnáERDDAP™a más kérelmekkel kapcsolatos feladatok megkezdésétől az eredeti kérelemig (lényegében) befejeződött. Így még az egyszerű későbbi kérések is lassan reagálnak.ERDDAPAz nThreads kérésre történő felhasználása a számítási források sokkal tisztább felhasználásához vezet.
nThreads vs. Több munkavállalói számítógépek
Sajnos,ERDDAP"Az nThreads rendszer soha nem lesz olyan hatékony, mint az igazi párhuzamosan több munkavállalói számítógépen keresztül, és minden egyes munka egy darab adaton dolgozik, úgy, ahogyan a Hadoop vagy az Apache Sparkot általában használják. Amikor a feladat valóban párhuzamos/elosztott több számítógéphez, minden számítógép felhasználhatja az összes erőforrását a feladat részéről. EzzelERDDAPnThreads rendszer, minden szál versenyez ugyanazon számítógép sávszélessége, lemezmeghajtók, memória stb. Sajnos a legtöbbünknek nincs forrása vagy pénzeszköze, hogy felállítson vagy akár béreljen (Az Amazon Web Services (AWS) Google Cloud platform (GCP) ) masszív hálózatok számítógépek. Ellentétben egy kapcsolati adatbázissal, amely lehetővé teszi az eredmény sorok visszaküldését bármilyen sorrendben,ERDDAP™ígéretet tesz arra, hogy az eredmény sorokat következetes sorrendben adja vissza. Ez a korlátozás tesziERDDAPAz nThreads kevésbé hatékony. DeERDDAPAz nThreads sok esetben hasznos.
Azonban vannak módjai annak, hogyERDDAP™skála, hogy kezelje a hatalmas számú kérés gyorsan létrehozásával egyháló/klaszter/szövetségERDDAPs...
<paletták és gt;
- KezdőlapERDDAP™verzió 2.12,datasets.xmltartalmazhat<paletta> címke (innen<erddapDatasets>), amely felülírja<paletták> címkeérték az üzenetekből.xml (vagy visszaállítja az üzeneteket.xml értéket, ha a címkedatasets.xmlüres) ... Ez lehetővé teszi a rendelkezésre álló paletták listáját, miközbenERDDAP™fut. Azt is lehetővé teszi, hogy változzon, és maradjon, ha telepít egy új verziótERDDAP... WARNING: A paletták szerepelnekdatasets.xmlszuperállománynak kell lennie az üzenetekben felsorolt palettáknak; különbenERDDAP™kivételt fog dobni, és abbahagyja a feldolgozástdatasets.xml... Ez biztosítja, hogy mindenERDDAP™a létesítmények legalább ugyanazokat a magpalettákat támogatják. WARNING:ERDDAP™ellenőrzi, hogy a palettafájlok az üzenetekben találhatók.xml valójában léteznek, de nem ellenőrzi a palettafájlokat.datasets.xml... Az Ön felelőssége, hogy a fájlok jelen legyenek.
Szintén kezdveERDDAP™2.12-es verzió, ha cptfilokat állít be a közvetettbeERDDAP™tartalomkezelő,ERDDAP™lemásolja az összes \*.cpt fájlt az adott könyvtárban\[Tomcat\]/webapps/erddap/WEB-INF/cptfiles könyvtár minden alkalommalERDDAP™kezdődik. Így, ha egyedi cpt fájlokat helyez be az adott könyvtárba, ezeket a fájlokat fogják használniERDDAP™Nincs több erőfeszítés a részéről, még akkor is, ha új verziót telepíteszERDDAP...
FIGYELMEZTETÉS: Ha egyedi palettákat ad hozzáERDDAP™és vanEDDGridFromErddap és/vagy EDDTableFromErdap adatkészletek az Ön adataibanERDDAP™Ezután a felhasználók meglátják a szokásos paletta opciókatERDDAP™Készítsen egy grafikus weboldalt, de ha a felhasználó megpróbálja használni őket, akkor grafikont kap az alapértelmezettel (rendszerint Rainbow) paletta. Ez azért van, mert a képet távolról alkotjákERDDAP™amely nem rendelkezik a szokásos palettával. Az egyetlen megoldás most a távoli e-mailERDDAP™adminisztrátor, hogy hozzáadja a szokásos palettáit az ő / őERDDAPvagy e-mail Chris. John at noaa.gov megkérdezi, hogy a palettákat hozzá kell adni a szabványhozERDDAP™elosztás.
<onChange & Gt;
- [[szerkesztés]] ** <OnChange> ** ] (#onchange) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlez meghatározza a cselekvést, amely akkor történik, ha ez az adatkészlet létrejön (mikorERDDAP™újraindítás) és amikor ez az adatkészlet bármilyen módon változik.
- Jelenleg,EDDGridalosztályok, bármilyen változás a metaadata vagy a tengely változó (például a közeli valós idejű adatok új időpontja) változásnak tekinthető, de az adatkészlet újratöltése nem tekinthető változásnak (önmagára) ...
- Jelenleg az EDDTable alosztály esetében az adatkészlet bármilyen újratöltése változásnak tekinthető.
- Jelenleg csak kétféle intézkedés engedélyezett:
- "..." http://" vagy " https://" - Ha a cselekvés " http://" vagy " https://" ,ERDDAP™küldjönHTTP GETkérelem a megadott URL-hez. A válasz figyelmen kívül hagyásra kerül. Például az URL elmondhat egy másik webes szolgáltatást, hogy tegyen valamit.
- Ha az URL-nek van egy lekérdező része (utána a "?") MIÉRT márszázalék kódolva... Különleges karaktereket kell kódolni a korlátozásokban (a kezdeti „és” és a fő'='korlátok) a %H formában, ahol a HH a karakter két számjegyű hexadecimális értéke. Általában csak néhány punctuációs karaktert kell átalakítania: %-25, és %26, "- %22,<%3C, = %3D, > %3E, + %2B,|%7C,\[%5B,\]%5D, tér %20, és átalakítani minden karakter felett #127 a saját UTF-8 formában, majd százaléka kódolja minden byte az UTF-8 formában a %HH formátum (kérjen programozót segítségért) ... Például, &stationID>="41004" Beszéd ésstationID%3E=%2241004%22 A százalékos kódolás általában akkor szükséges, ha hozzáférERDDAPszoftveren keresztül, mint egy böngésző. A böngészők általában kezelik a százalékos kódolást az Ön számára. Bizonyos helyzetekben százalékban kell kódolni az A-Za-z0-9\_-től eltérő összes karaktert! "..." () \*, de még mindig nem kódolja az eredeti '&' vagy a fő'='korlátokban. A programozási nyelveknek van eszközük erre (például lásdJavaAjava.net.URLEncoderésJavaOlvasson bele a(z)encodeURIComponent()] ( https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/encodeURIComponent ) ) és vannak olyan webhelyek, amelyek százalékos kódot / dekódot mutatnak Önnek...
- ótadatasets.xmlXML fájl, akkor is &-encode ALL ' &',<"és ">" az URL-ben, mint '&',<és a „>” százalékos kódolás után.
- Példa: Egy olyan URL-hez, amelyet egy böngészőbe lehet beírni:
https://www.company.com/webService?department=R%26D¶m2=value2
Meg kell határoznia egy<OnChange> címke keresztül (Egy vonalon)
<onChange>https://www.company.com/webService?department=R%26D&param2=value2</onChange>
- mailto: - Ha a cselekvés a „mailto:” címmel kezdődik,ERDDAP™e-mailt küld a későbbi e-mail címre, jelezve, hogy az adatkészletet frissítették/változtatták. Például:<dalszöveg: JOhn.smith@company.com</onChange> Ha jó oka van annak, hogyERDDAP™támogasson más típusú akciót, küldjön nekünk egy e-mailt, amely leírja, mit akar.
- "..." http://" vagy " https://" - Ha a cselekvés " http://" vagy " https://" ,ERDDAP™küldjönHTTP GETkérelem a megadott URL-hez. A válasz figyelmen kívül hagyásra kerül. Például az URL elmondhat egy másik webes szolgáltatást, hogy tegyen valamit.
- Ez a címke OPTIONAL. Ezek közül a címkék közül annyi lehet, amennyit csak akar. Használja az egyik ilyen címkét minden egyes cselekvésre.
- Ez analóg aERDDAPe-mail/URL előfizetési rendszer, de ezek a tevékenységek nem tárolják tartósan (azaz csak egy EDD objektumban tárolják) ...
- Az előfizetés eltávolítása, csak távolítsa el a<OnChange> címke. A változást a következő alkalommal fogják megjegyezni, amikor az adatkészletet újratöltik.
<ReloadEveryNMinutes & Gt;
- [[szerkesztés]] ** <újratöltés MindenNMinutes> ** ] (#reloadeveryn percek) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlszinte minden adatkészlettípusról, amely meghatározza, hogy milyen gyakran kell újratölteni az adatkészletet. Például,
<reloadEveryNMinutes>60</reloadEveryNMinutes>
-
Általában olyan adatkészletek, amelyek gyakran változnak (például kapjon új adatfájlokat) Gyakran újra kell tölteni, például 60 percenként.
-
Azok az adatkészletek, amelyek gyakran változnak, ritkán kell újratölteni, például 1440 percenként (naponta) 10080 perc (heti) ...
-
Ez a címke TIONAL, de ajánlott. Az alapértelmezett 10080.
-
Egy példa:<ReloadEveryNMinutes>1440</reload MindenNMinutes>
-
Amikor egy adatkészletet újratöltik, minden fájlt bigParentDirectory[szerkesztés] /cache/ datasetID A könyvtárat törölik.
-
Függetlenül attól, hogy mi ez be van állítva, az adatkészletet nem fogják gyakrabban betölteni, mint<loadDatasetsMinMinutes> (default = 15) , amint meghatározottsetup.xml... Tehát, ha azt szeretné, hogy az adatkészleteket nagyon gyakran újratöltsék, be kell állítani mind a reloadEveryNMinutes, mind a loadDatasets MinMinutes a kis értékekhez.
-
Ne állítsa vissza a ReloadEveryNMinutes-t ugyanazzal az értékkel, mint a loadDatasets MinMinutes, mert az eltelt idő valószínűleg (például) 14:58 vagy 15:02, így az adatkészletet csak a nagy terhelések mintegy felében töltik be. Ehelyett használjon kisebb (például 10) vagy nagyobb (Például 20) újratöltés MindenNMinutes érték.
-
Függetlenül a reloadEveryNMinutestől, manuálisan elmondhatjaERDDAP™egy adott adatkészlet visszatöltése a lehető leghamarabb egyFlag fájl...
-
Curious Programmers - InERDDAP™Az összes adatkészlet újratöltését két célszál kezeli. Az egyik szál egy kisebb rettegést kezdeményez, ha egy zászlófájlt vagy egy nagyobb rettegést talál (amely ellenőrzi az összes adatkészletet, hogy megnézze, újra kell-e tölteni) ... A másik szál egyszerre teszi az adatkészletek tényleges újratöltését. Ezek a szálak a háttérben működnek, biztosítva, hogy minden adatkészlet naprakész legyen. A szál, amely ténylegesen teszi a reloads készít egy új verziót egy adatkészlet, majd bekapcsolja a helyére (lényegében helyettesíti a régi verzió atomi) ... Tehát nagyon lehetséges, hogy az események következő sorozata bekövetkezik (ez egy jó dolog) :
- ERDDAP™kezdi újratölteni egy adatkészletet (új verzió készítése) a háttérben.
- A felhasználó „A” kérést tesz az adatkészlethez.ERDDAP™az adatkészlet jelenlegi verzióját használja a válasz létrehozásához. (Ez jó. A felhasználó számára nem volt késés, és az adatkészlet jelenlegi verziója soha nem lehet nagyon ellopni.)
- ERDDAP™befejezi az adatkészlet új újratöltött verziójának létrehozását, és lenyeli azt az új verziót a gyártásba. Az összes későbbi új kérést az adatkészlet új verziója kezeli. A következetességhez a felhasználó A kérése még mindig tele van az eredeti verzióval.
- A „B” felhasználó kéri az adatkészletet ésERDDAP™az adatkészlet új verzióját használja a válasz létrehozásához.
- Végül az A felhasználó és a B felhasználó kérése befejeződött (talán talán talán talán talán Először befejeződik, talán B befejezi az elsőt) ...
-
Hallhatok valakit, aki azt mondja: „Csak két szál! Ha! Ez a lame! Meg kell határoznia, hogy az adatkészletek újratöltése annyi szálat használ, amennyire szükség van, így minden gyorsabban és kissé vagy nem laggal történik.” Igen és nem. A probléma az, hogy egynél több adatkészlet betöltése egy időben több nehéz új problémát okoz. Mindegyiket meg kell oldani vagy kezelni. A jelenlegi rendszer jól működik, és kezelhető problémákkal rendelkezik (Például a zászló előtti potenciál észlelhető) ... (Ha segítségre van szüksége, hogy kezelje őket, lásd a mirész további támogatás megszerzéséről...) A kapcsolódófrissítés MindenNMillis. rendszer a válaszfalakon belül működik, így több adatállományhoz vezethet és frissíthető (nem a teljes reload) egyszerre.
Proaktív vs. Reactive
ERDDAPA reload rendszer proaktív - az adatkészleteket hamarosan újratöltik A EveryNMinutes idő felemelkedik (i.e., ők "találkozóvá" válnak, de soha nem lopnak) - függetlenül attól, hogy az adatkészlet a felhasználóktól érkezik-e vagy sem. SzóvalERDDAP™Az adatkészletek mindig naprakészek és készen állnak a használatra. Ez ellentétben áll a THREDDS reaktív megközelítésével: a felhasználó kérése az, ami megmondja a THREDDS-nek, hogy ellenőrizze, van-e adatkészlet (Lehet, hogy nagyon ellopott) ... Ha ellopják, a THREDDS várja a felhasználót (gyakran néhány percig) míg az adatkészlet újratöltésre kerül.
<frissítés AllNMillis & Gt;
- [[szerkesztés]] ** <frissítésEveryNMillis> ** ] (#updateeverynmillis) egy OPTIONAL tag egy<Dataset> címkedatasets.xmlnéhány adatkészlettípus, amely segítERDDAP™olyan adatkészletekkel dolgozunk, amelyek nagyon gyakran változnak (olyan gyakran, mint minden második) ... EllentétbenERDDAPRendszeres, proaktív,<újratöltés MindenNMinutes>] (#reloadeveryn percek) rendszer az egyes adatkészletek teljes újratöltéséhez, ez az OPTIONAL kiegészítő rendszer reaktív (egy felhasználói kérelem által kiváltott) és gyorsabb, mert növekményes (frissíteni kell az információkat, amelyeket frissíteni kell) ... Például, ha egy kérés egyEDDGridFromDap adatkészlet több, mint a megadott számú milliszekundum az utolsó frissítés óta,ERDDAP™látni fogja, hogy vannak-e új értékek a baloldal számára (először, általában"time") dimenzió és ha igen, csak töltse le ezeket az új értékeket a felhasználó kérésének kezelése előtt. Ez a rendszer nagyon jó, ha egy gyorsan változó adatállományt naprakészen tartunk, minimális igényekkel az adatforráson, de egy kissé lassítja néhány felhasználói kérelmek feldolgozását.
- Használja ezt a rendszert, add hozzá (például) :
<updateEveryNMillis>1000</updateEveryNMillis>
- Használja ezt a rendszert, add hozzá (például) :
közvetlenül utána<ReloadEveryNMinutes > az adatkészlet címe indatasets.xml... A megadott milliszekunddok száma olyan kicsi lehet, mint 1 (annak biztosítása érdekében, hogy az adatkészlet mindig naprakész legyen) ... 0 érték (az alapértelmezett) vagy negatív szám kapcsolja ki a rendszert.
- Növekvő jellegük miatt a frissítéseknek nagyon gyorsan kell befejeződniük, így a felhasználóknak soha nem kell sokáig várniuk.
- Ha egy második adatkérés érkezik az előző frissítés befejezése előtt, a második kérés nem indít újabb frissítést.
- A dokumentáció során megpróbáljuk használni a "reload" szót a rendszeres, teljes adatkészlet-visszatöltéshez, és "frissítés" ezeknek az új inkrementális, részleges frissítéseknek.
- Tesztelési célokra néh ány diagnosztikai nyomtatott log.txt ha [<logLevel>] (#loglevel) bennedatasets.xml"mindennek".
- Ha fokozott frissítéseket használ, és különösen, ha a baloldal (először) Például az idő, a tengely nagy, lehet, hogy be akarja állítani<ReloadEveryNMinutes> egy nagyobb számba (1440?) , hogy a frissítések a legtöbb munkát, hogy tartsa az adatkészlet naprakész, és a teljes reloads gyakran.
- Megjegyzés: ez az új frissítési rendszer frissíti a metaadatot (például az időactual\_rangeidő\_coverage\_end, ...) de nem indítja el az onChange-t (e-mail vagy érintés URL) vagy változtassa megRSStakarmány (Talán...) ...
- Minden olyan adatkészlet esetében, amely alosztályokat használEDDGridFájlokésEDDTableFromFiles:
- WARNING: ha új adatfájlot ad hozzá egy adatkészlethez azáltal, hogy a könyvtárba másolja, hogyERDDAP™Nézd meg, van egy veszély, hogyERDDAP™észreveszi a részben írott fájlt; próbálja meg elolvasni, de nem sikerül, mert a fájl hiányos; kijelenti, hogy a fájl "rossz" fájl lesz, és távolítsa el (átmenetileg) az adatkészletből. Hogy elkerüljük ezt, mi STRONGLY RECOMMEND új fájlt másol a könyvtárba egy ideiglenes névvel (Például, 20150226.ncTmp) Ez nem egyezik az adatkészletek fájljával NameRegex (\* `.nc) Ezután nevezze át a fájlt a helyes névre (Például, 20150226.nc) ... Ha ezt a megközelítést használja,ERDDAP™figyelmen kívül hagyja az ideiglenes fájlt, és csak a helyesen megnevezett fájlt veszi észre, amikor teljes és készen áll a használatra.
- Ha módosítja a meglévő adatokat a helyén (például új adatpont hozzáadása) ,<frissítésEveryNMillis> jól működik, ha a változások atom módon jelennek meg (Egy pillanatban) és a fájl mindig érvényes fájl. Például a netcdf-java könyvtár lehetővé teszi a "klasszikus" korlátlan dimenziójának kiegészítését.ncv3 fájlt atomikusan kell elkészíteni. <frissítésEveryNMillis> rosszul fog működni, ha a fájl érvénytelen, míg a változások készülnek.
- <A frissítésEveryNMillis> jól működik az adatkészleteknél, ahol egy vagy néhány fájl rövid idő alatt megváltozik.
- <frissítésEveryNMillis> rosszul fog működni az adatkészleteknél, ahol rövid idő alatt sok fájl változik (ha a változások atomi módon jelennek meg) ... Ezeknek az adatkészleteknek jobb, ha nem használjuk<frissítésEveryNMillis> és beállítászászlóMondd elERDDAP™az adatkészlet újratöltéséhez.
- <frissítésEveryNMillis> nem frissíti a [[szerkesztés]]] információt<subsetVariables>>>>>> (#subsetvariables) ... Általában ez nem probléma, mert asubsetVariablesolyan dolgokról van információ, amelyek gyakran nem változnak (például az állomás nevek, magasságok és hosszúságok listája) ... HasubsetVariablesadatok módosítása (Például, ha egy új állomás hozzáadódik az adatkészlethez) Ezután lépjen kapcsolatba azászló URLaz adatkészlet számára, hogy elmondjaERDDAP™az adatkészlet újratöltéséhez. Egyébként,ERDDAP™Nem fogja észrevenni az új alkatrészt A következő alkalommal, amikor az adatkészletet újratöltik (<ReloadEveryNMinutes>).
- Generikus ajánlásunk:
<reloadEveryNMinutes>1440</reloadEveryNMinutes>
<updateEveryNMillis>10000</updateEveryNMillis>- TUDATOK? Linux számítógépeken, ha használja<frissítésEveryNMillis> veleEDDGridFromFiles vagy EDDTableFromFiles osztályok, láthat egy problémát, ahol egy adatkészlet nem terheli (alkalmanként vagy következetesen) hibaüzenet: "IOException: Az elért vagy túl sok nyílt fájl értesítésének felhasználói korlátozása." Az ok lehet egy hibaJavaami inotifikálja az eseteket, hogy ne gyűjtsenek szemetet. Ezt a problémát elkerülikERDDAP™v1.66 és magasabb. Tehát a legjobb megoldás az, hogy váltsa át a legújabb verziótERDDAP...
Ha ez nem oldja meg a problémát (azaz, ha van egy nagyon sok adatkészlet használata<frissítésEveryNMillis>, ezt a problémát a hívással tudja megoldani:
sudo sysctl fs.inotify.max\\_user\\_watches=65536
sudo sysctl fs.inotify.max\\_user\\_instances=1024
sudo sysctl -p
Vagy használjon magasabb számokat, ha a probléma továbbra is fennáll. Az órák alapértelmezettje 8192. Az esetek alapértelmezettje 128.
- Megteheted<frissítésMaxEvents>10</updateMaxEvents> bennedatasets.xml (a többi beállítás a felső közelében) a fájlok maximális számának megváltoztatása (default=10) Ezt feldolgozza a frissítésEveryNMillis rendszer. Egy nagyobb szám hasznos lehet az adatállomány számára, ahol nagyon fontos, hogy mindig naprakészek legyenek. Lásd:frissítésMaxEvents dokumentáció...
- Curious Programmers - ezek a növekvő frissítések, ellentétben aERDDAPTeljesReloadEveryNMinutesrendszer, a felhasználói kérés szálakon belül fordul elő. Tehát minden adatkészlet egyszerre frissíthető. van kód (és egy zár) annak biztosítása érdekében, hogy egyetlen szál minden adott pillanatban frissítse az adott adatkészletet. Több egyidejű frissítés engedélyezése könnyű volt; lehetővé téve, hogy több egyidejű teljes reload nehezebb lenne.
<forrásCanConstrainStringEQNE & gt;
- [[szerkesztés]] ** <forrásCanConstrainStringEQNE> ** ] (#sourcecanconstrainstringeqne) egy OPTIONAL tag egy EDDTable-en belül<Dataset> címkedatasets.xmlez meghatározza, hogy a forrás képes-e korlátozni a String változókat a = és a !=operátorokkal.
- Az EDDTableFromDapSequence esetében ez csak a külső sorozatokra vonatkozik. Feltételezzük, hogy a forrás nem tudja kezelni a belső sorozat változói korlátozásokat.
- Ez a címke OPTIONAL. Az értékek igazak (az alapértelmezett) és hamis.
- Az EDDTableFromDapSequenceOPeNDAPDRDS szervereket kell beállítani, hogy igaz (az alapértelmezett) ...
- Az EDDTableFromDapSequence Dapper szervereket, ezt hamisnak kell beállítani.
- Egy példa:
<sourceCanConstrainStringEQNE>true</sourceCanConstrainStringEQNE>
<forrásCanConstrainStringGTLT & gt;
- [[szerkesztés]] ** <forrásCanConstrainStringGTLT ** ] (#sourcecanconstrainstringgtlt) egy OPTIONAL tag egy EDDTable-en belül<adatkészlet> címke, amely meghatározza, hogy a forrás képes-e korlátozni a String változókat a<,<=, > és >= üzemeltetők.
- Az EDDTableFromDapSequence esetében ez csak a külső sorozatokra vonatkozik. Feltételezzük, hogy a forrás nem tudja kezelni a belső sorozat változói korlátozásokat.
- Valid értékek igazak (az alapértelmezett) és hamis.
- Ez a címke OPTIONAL. Az alapértelmezettség igaz.
- Az EDDTableFromDapSequenceOPeNDAPDRDS szervereket kell beállítani, hogy igaz (az alapértelmezett) ...
- Az EDDTableFromDapSequence Dapper szervereket, ezt hamisnak kell beállítani.
- Egy példa:
<sourceCanConstrainStringGTLT>true</sourceCanConstrainStringGTLT>
<forrásCanConstrainStringRegex & gt;
- [[szerkesztés]] ** <forrásCanConstrainStringRegex> ** ] (#sourcecanconstrainstringregex) egy OPTIONAL tag egy EDDTable-en belül<adatkészlet> címke, amely meghatározza, hogy a forrás a String változókat rendszeres kifejezésekkel korlátozhatja, és ha igen, mi az üzemeltető.
- Az értékek "=" (aDAPszabvány) ,, ,,, ,,, (tévesen támogatott sokDAPszerverek) vagy "" (jelzi, hogy a forrás nem támogatja a rendszeres kifejezéseket) ...
- Ez a címke OPTIONAL. Az alapértelmezett „”.
- Az EDDTableFromDapSequenceOPeNDAPDRDS-kiszolgálókat kell beállítani, hogy "" (az alapértelmezett) ...
- Az EDDTableFromDapSequence Dapper kiszolgálók, ezt ""-re kell beállítani (az alapértelmezett) ...
- Egy példa:
<sourceCanConstrainStringRegex>=~</sourceCanConstrainStringRegex>
<forrásCanDoDistinct & gt;
- [[szerkesztés]] ** <forrásCanDoDistinct> ** ] (#sourcecandodistinct) egy OPTIONAL tag egy EDDTableFromDatabase<adatkészlet> címke, amely meghatározza, hogy a forrás adatbázisnak kezelnie kell &distinct () korlátozza a felhasználói kérdéseket.
- Ez a címke OPTIONAL. Az értékek nem (ERDDAP™egyedi; az alapértelmezett) , részleges (a forrás kezeli a különbséget ésERDDAP™újra kezeli) és igen (a forrás kezeli a különbséget) ...
- Ha nem használ, ésERDDAP™a memóriából fut, amikor külön kezeljük, használjuk igen.
- Ha igent használ, és a forrás adatbázis túl lassan kezeli a különbséget, ne használjon.
- részleges mindkettő közül a legrosszabbat adja: lassú, mert a különböző adatbázis-kezelés lassú, és memóriából futhatERDDAP...
- Az adatbázisok a DISTINCT-t úgy értelmezik, mint csupán egyedi eredmények sorát, mígERDDAP™értelmezi azt, mint egy sor egyedi eredmények listáját. Ha ezt részlegesnek vagy igennek állítod,ERDDAP™automatikusan elmondja az adatbázisnak, hogy rendezze az eredményeket.
- Egy kis különbség az eredményekben: Nem|részleges,ERDDAP™rendezni "" az eredmények elején (előtt nem "" húrok) ... Igen, az adatbázis lehet (A posztgrák) rendezett "" az eredmények végén (után non-" húrok) ... Azt hiszem, ez hatással lesz a rövid szavak fajta versus hosszabb szavakra, amelyek a rövid szóval kezdődnek. Például,ERDDAP™"Simon" fog rendezni a "Simons" előtt.
- Egy példa:
<sourceCanDoDistinct>yes</sourceCanDoDistinct>
<forrásCanOrderBy & Gt;
- [[szerkesztés]] ** <forrás CanOrderBy> ** ] (#sourcecanorderby) egy OPTIONAL tag egy EDDTableFromDatabase<adatkészlet> címke, amely meghatározza, hogy a forrás adatbázisnak kezelnie kell &orderBy (...) korlátozza a felhasználói kérdéseket.
- Ez a címke OPTIONAL. Az értékek nem (ERDDAP™kézzelfoghatóorderBy (...) ; az alapértelem) , részleges (a forrás kezeliorderByésERDDAP™újra kezeli) és igen (a forrás kezeliorderBy (...) ) ...
- Ha nem használ, ésERDDAP™a memóriából fut, amikor kezelésorderBy (...) Használja igen.
- Ha igent használ, és a forrás adatbázis kezeliorderBy (...) túl lassan, ne használjon.
- A részleges mindkettő közül a legrosszabb: lassú, mert az adatbázis kezeléseorderBy (...) lassú, és memóriából futhatERDDAP...
- Egy kis különbség az eredményekben: Nem|részleges,ERDDAP™rendezni "" az eredmények elején (előtt nem "" húrok) ... Igen, az adatbázis lehet (A posztgrák) rendezett "" az eredmények végén (után non-" húrok) ... Ez befolyásolhatja a rövid szavak fajta versus hosszabb szavakat, amelyek a rövid szóval kezdődnek. Például,ERDDAP™rendezni fogja a "Simon"-t a "Simons" előtt, de nem vagyok biztos abban, hogy egy adatbázis hogyan rendezi őket.
- Egy példa:
<sourceCanOrderBy>yes</sourceCanOrderBy>
<forrásNeedsExpandedFP\_EQ>
- [[szerkesztés]] ** <forrásNeedsExpandedFP\_EQ> ** ] (#sourceneedsexpandedfp_eq) egy OPTIONAL tag egy EDDTable-en belül<adatkészlet> címke, amely meghatározza (Igaz (az alapértelmezett) vagy hamis) ha a forrásnak segítségre van szüksége a kérdésekkel<numerikus Variable>=<FloatingPointValue> (és !=, >=,<=). Például,
<sourceNeedsExpandedFP\\_EQ>false</sourceNeedsExpandedFP\\_EQ>
- Bizonyos adatforrások esetében numerikus lekérdezések bevonásával =, !=,<=, vagy>= nem működhet úgy, ahogyan az úszópontszámokkal kívánatos. Például a hosszúság keresése = 220.2 kudarcot vallhat, ha az érték 220.20000000001-ként kerül tárolásra.
- Ez a probléma merül fel, mert az úszópontszámoknem képviselték pontosan a számítógépeken belül...
- Ha a forrásNeedsExpandedFP\_EQ Az igaz (az alapértelmezett) ,ERDDAP™módosítja az adatforráshoz küldött kérdéseket, hogy elkerülje ezt a problémát. Mindig biztonságos és jó, ha ezt a készletet igazra hagyjuk.
<sourceUrlGt;
- [[szerkesztés]] ** <sourceUrl> > > > ** ] (#sourceurl) egy közös címke egy adatkészlet globális<addAttributes> címke, amely meghatározza az URL-t, amely az adatok forrása.
- Egy példa:
(de tedd az egészet egy sorra)<sourceUrl>https://oceanwatch.pfeg.noaa.gov/thredds/dodsC/satellite/VH/chla/1day</sourceUrl>
- InkábbERDDAP™Minden adatkészletnek van egy "sourceUrl„A kombinált globális tulajdonságokban, melyeket a felhasználóknak mutatnak.
- A legtöbb adatkészlettípus esetében ez a címke REQUIRED. Lásd az adatkészlet típus leírását, hogy megtudja, hogy ez REQUIRED vagy sem.
- Néhány adatkészlet esetében a különálló<sourceUrl> címke nem engedélyezett. Ehelyett meg kell adnia egy "sourceUrl"..."globális tulajdonságáltalában a globális \>addAttributes<... Ha nincs tényleges forrás URL (például, ha az adatokat helyi fájlokban tárolják) , ez a tulajdonság gyakran csak egy helytulajdonos értéke, például,<att name="name"> (helyi fájlok) </att>
- A legtöbb adatkészlet esetében ez az URL alapja, amelyet az adatok kérésére használnak. Például, példáulDAPszerverek, ez az URL, amelyhez .dods, .das, .dds vagy .html hozzáadható.
- ótadatasets.xmlXML fájl, akkor MUST is kódolja '&',<"és ">" az URL-ben, mint '&',<és „és gt;”.
- A legtöbb adatkészlettípus esetében,ERDDAP™hozzáadja az eredetitsourceUrl (a "localSourceUrl" a forráskódban) aglobális tulajdonságok (ahol a "publicSourceUrl" a forráskódban) ... Amikor az adatforrás helyi fájlok,ERDDAP™HozzáadássourceUrlÓ (helyi fájlok) „A globális attribútumok mint biztonsági óvintézkedés. Amikor az adatforrás adatbázis,ERDDAP™HozzáadássourceUrlÓ (forrás adatbázis) „A globális attribútumok mint biztonsági óvintézkedés. Ha néhány adatkészlet nem nyilvánossourceUrlA (általában azért, mert a számítógép a DMZ vagy egy helyi LAN) Használhatja [<átalakításToPublicSourceUrl> (#konverttopublicsourceurl) címkék, hogy meghatározzák, hogyan kell átalakítani a helyisourceUrlnyilvánossourceUrlS.
- AsourceUrlKezdődhethttp://,https://Ftp: és talán más előtagok.httpskapcsolatok olvassa el és ellenőrizze a forrás digitális tanúsítványát annak biztosítása érdekében, hogy a forrás az, akiről azt mondják, hogy azok. Ritka esetekben ez az ellenőrzés kudarcot vallhat a "javax.net.ssl.SSLProtocolException: kézfogás figyelmeztetés: ismeretlen\_name". Ez valószínűleg annak köszönhető, hogy a domain név a tanúsítványon nem egyezik a domain névvel, amelyet használ. Elolvashatja és el kell olvasnia a részleteketsourceUrl"a tanúsítvány a webböngészőben, nevezetesen a "DNS neve" listája a "Subject Alternative Name" részben.
Bizonyos esetekben,sourceUrlÖn használhatja a domain nevet a tanúsítványon. Például, https://podaac-opendap.jpl.nasa.gov/opendap/allData/ccmp/L3.5a/monthly/flk/ dobja ezt a hibát, de https://opendap.jpl.nasa.gov/opendap/allData/ccmp/L3.5a/monthly/flk/ , amely a domain nevet használja a tanúsítványon, nem. A megoldás ezekben az esetekben tehát megtalálja és használja a domain nevet a tanúsítványon. Ha nem találja meg a tanúsítványt, lépjen kapcsolatba az adatszolgáltatóval.
Más esetekben a tanúsítvány domain neve lehet a nevek csoportja. Ha ez megtörténik, vagy a probléma másként megoldhatatlan, kérlek e-mailt Chris. John at noaa.gov, hogy jelentse a problémát.
<addAttributes>
- [[szerkesztés]] ** <addAttributes> > > > ** ] (#addattributes) OPTIONAL címke minden adatkészlet és minden változó, amely lehetővé tesziERDDAPAz adminisztrátorok ellenőrzik az adathalmazhoz és annak változóihoz kapcsolódó metaadat tulajdonságokat.
- ERDDAP™egyesíti az adatkészlet forrásából származó tulajdonságokat ("sourceAttributes") és a "addAttributesAmit ti definiáltokdatasets.xml (amelyek prioritást élveznek) hogy a "kombinedAttributes", amelyek azok, amelyekERDDAP™A felhasználók látják. Így használhatóaddAttributesa forrásAttributes értékeinek újraértékelése, új tulajdonságok hozzáadása vagy a tulajdonságok eltávolítása.
- A<addAttributes> címke 0 vagy több ** <att> ** altagok, amelyeket az egyes tulajdonságok meghatározására használnak.
- Minden tulajdonság egy névből és értékből áll (amely konkrét adattípussal rendelkezik, például kettős) ...
- Csak egy tulajdonság lehet egy adott névvel. Ha több van, az utolsónak van prioritása.
- Az érték lehet egységes érték vagy egy űrválasztott értékek listája.
- Syntax
- A rendje<att> altagok belüladdAttributesnem fontos.
- A<att> subtag formátum
<att name="*name*" \\[type="*type*"\\] >*value*</att>
- A rendeltetési neve minden tulajdonság MUST kezdődik egy levelet (A-Z, a-z) A MUST csak az A-Z, a-z, 0-9 vagy \_ karaktereket tartalmazza.
- Ha egy<att> az altagnak nincs értéke vagy a null értéke, ezt a tulajdonságot eltávolítják a kombinált tulajdonságokból. Például,<att name="rows" /> eltávolítja a sorokat a kombinált tulajdonságokból. Például,<att name="koordináták"</att> eltávolítja a koordinátákat a kombinált tulajdonságokból.
tulajdonság típus
- [Az OPTIONAL típusú érték<att> altagok] (#attributetype) jelzi az értékek adattípusát. Az alapértelmezett típus String. Egy sztring tulajdonság példája:
<att name="creator\\_name">NASA/GSFC OBPG</att>
- Az egységes értékek érvényes típusai byte (8 bites integráló) rövid (16 bites aláírt integrál) , Int (32 bites aláírt integrál) Hosszú (64 bites aláírt integrál) Float (32 bites úszópont) dupla (64 bites úszópont) , char és String. Például,
<att name="scale\\_factor" type="float">0.1</att>
- Az egységes értékek érvényes típusai byte (8 bites integráló) rövid (16 bites aláírt integrál) , Int (32 bites aláírt integrál) Hosszú (64 bites aláírt integrál) Float (32 bites úszópont) dupla (64 bites úszópont) , char és String. Például,
Lásd ezeket a jegyzeteket achar adattípus... Lásd ezeket a jegyzeteket ahosszú adattípus...
- Érvényes típusok az űrválasztott értékek listáihoz (vagy egyedi értékek) byteList, shortList, unsignedShortList, charList, intList, longList, floatList, dupla List. Például,
<att name="actual\\_range" type="doubleList">10.34 23.91</att>
Egy unsignedShortList lehetővé teszi, hogy megjelölje a le nem írt rövidek listáját, de a megfelelő Unicode karakterek listájába kerülnek (pl.: 65 67 69") átalakul az "A C E"-be. Ha megadja a charList, kódolja a speciális karakterek (pl., tér, kettős idézetek, backslash,<#32, vagy>#127), ahogy az NCCSV fájl adatszekciójában kódolná őket (pl. ", ", """ vagy """", "", "", ",", "\n", "\u20ac") ... Nincs stringList. Tárolja a String értékeket, mint egy multi-line String. Például,
<att name="history">2011-08-05T08:55:02Z ATAM - made CF-1.6 compliant.
2012-04-08T08:34:58Z ATAM - Changed 'height' from double to float.</att>
Globális tulajdonságok
-
[[szerkesztés]] ** Globális tulajdonságok / Globális<addAttributes> > > > ** ] (#globális tulajdonságok) - <addAttributes> egy OPTIONAL címke belül<adatkészlet> címke, amelyet a teljes adatkészletre alkalmazandó tulajdonságok megváltoztatására használnak.
- ** Használja a globális<addAttributes> az adatkészlet globális tulajdonságainak megváltoztatása. ** ERDDAP™egyesíti az adatkészlet forrásából származó globális tulajdonságokat (** Forrás: Forrás ) és a globális addAttributes amit ti definiáltokdatasets.xml (amelyek prioritást élveznek) hogy a globális kombinált tulajdonságok ** , amelyek azok, amikERDDAP™A felhasználók látják. Így használhatóaddAttributesa forrásAttributes értékeinek újraértékelése, új tulajdonságok hozzáadása vagy a tulajdonságok eltávolítása.
- Lásd: ** <addAttributes> > > > információ] (#addattributes) amely a globális és változóra vonatkozik <addAttributes> > > > ** ...
- FGDCésISO 19115-2/19139Metadata - Általában,ERDDAP™automatikusan létrehozza az ISO 19115-2/19139 és az FGDC (FGDC-STD-001-1998) XML metaadat fájlok minden adatkészlethez az adatkészlet metaadatából származó információk felhasználásával. Szóval, a jó adatkészlet metaadata jóhoz vezetERDDAP- generált ISO 19115 és FGDC metaadata. Kérjük, vegye fontolóra, hogy sok időt és erőfeszítést tegyen az adatkészletek metaadatának javítására (ami egy jó dolog, amit egyébként csinálni kell) ... Az ISO 19115 és az FGDC metadata generálásához használt adatkészletek többsége azACDD metaadat standardalább megjegyezve.
- Számos globális tulajdonság különleges ebbenERDDAP™keresi őket, és különböző módon használja őket. Például egy link ainfoUrla weboldalakon szerepel az adatkészletek listáival és más helyekkel, hogy a felhasználók többet tudhassanak meg az adatkészletről.
- Amikor egy felhasználó kiválaszt egy adathalmazt, a változó hosszúságával, szélességgel, magassággal kapcsolatos GlobalAttributes (vagy mélység) , és az időtartományok (például Southernmost\_Northing, Northernmost\_Northing, time\_coverage\_start, idő\_coverage\_end) automatikusan generált vagy frissített.
- Egy egyszerű minta globális<addAttributes> az:
<addAttributes>
<att name="Conventions">COARDS, CF-1.6, ACDD-1.3</att>
<att name="infoUrl">https://coastwatch.pfeg.noaa.gov/infog/PH\\_ssta\\_las.html</att>
<att name="institution">NOAA CoastWatch, West Coast Node</att>
<att name="title">SST, Pathfinder Ver 5.0, Day and Night, Global</att>
<att name="cwhdf\\_version" />
</addAttributes>
Az üres cwhdf\_version tulajdonsága okozza a forrás cwhdf\_version tulajdonságát (ha valaki) eltávolítani a végső, kombinált tulajdonságok listájáról.
- Ezen információk ellátása segítERDDAP™jobb munkát végezzen, és segít a felhasználóknak megérteni az adatkészleteket. A jó metaadata felhasználható adatkészletet készít. Az elégtelen metaadata haszontalanná teszi az adatkészletet. Kérjük, vegye be az időt, hogy jó munkát végezzen a metaadat tulajdonságokkal.
Különleges globális tulajdonságok aERDDAP™
elismerés
- elismerés és elismerés (aACDDmetadata szabvány) a támogatott csoport vagy csoportok elismerésének módja (nevezetesen pénzügyi) a projekt, amely létrehozta ezt az adatokat. Például,
<att name="acknowledgment">AVISO</att>
Vegye figyelembe, hogy az ACDD 1.0 és 1.1 használta a "ismerés" varázslatát (amely a szokásos varázslat az Egyesült Államokban) , de az ACDD 1.3 megváltoztatta ezt a "felhasználást" (ami a szokásos varázslat az Egyesült Királyságban.) ... A megértésem az, hogy a változás lényegében baleset volt, és minden bizonnyal nem ismerték fel a változás ramifikációit. Micsoda rendetlenség! Most már több millió adatfájl van szerte a világon, amelyek "ismétlődéssel" rendelkeznek és milliók, amelyek "felhasználással" rendelkeznek. Ez kiemeli a szabványos "egyszerű" változásokat, és hangsúlyozza a stabilitás szükségességét. Mert az ACDD 1.3 (amely az ACDD verziója,ERDDAP™támogatás) azt mondja: "ismeret", ez az, amiERDDAP™ (nevezetesen GenerateDatasets Xml) bátorítás.
cdm\_altitude\_proxy
- cdm\_altitude\_proxy csak az EDDTable adatkészletek esetében, amelyeknek nincs magassága vagy mélysége változó, de van egy változó, amely a magasság vagy a mélység proxyja. (Például a nyomás, a sigma, a palackNumber) Használhatja ezt a tulajdonságot, hogy azonosítsa ezt a változót. Például,
<att name="cdm\\_altitude\\_proxy">pressure</att>
Hacdm\_data\_typeProfil vagy TrajectoryProfil, és nincs magasság vagy mélység változó, cdm\_altitude\_proxy MUST definiálva. Ha a cdm\_altitude\_proxy-t meghatározzák,ERDDAP™hozzáadja a következő metaadatot a változóhoz: \_koordináta AxisType=Height and axis=Z.
cdm\_data\_type
- cdm\_data\_type (aACDDmetadata szabvány) egy globális tulajdonság, amely jelziUnidata Közös adatmodelladattípus az adatkészlethez. Például,
<att name="cdm\\_data\\_type">Point</att>
A CDM még mindig fejlődik, és ismét megváltozhat.ERDDAP™megfelel a kapcsolódó és részletesebbDiscrete Sampling Geometries (DSG) fejezeteCF 1.6metadatai egyezmények (korábban CF Point megfigyelési egyezményeknek nevezték) ...
- Vagy az adatkészlet globálisForrás: Forrásvagy globális<addAttributes> > > > A MUST tartalmazza a cdm\_data\_type tulajdonságát. Néhány adatkészlettípus (mint az EDDTable FromObis) ezt automatikusan beállítja.
- MertEDDGridadatkészletek, a cdm\_data\_type opciók Grid (az alapértelmezett és messze a leggyakoribb típusEDDGridadatkészletek) MovingGrid, Egyéb, Pont, Profil, RadialSweep, TimeSeries, TimeSeriesProfile, Swath, Trajectory és TrajectoryProfile. Jelenleg,EDDGridnem követeli meg, hogy minden kapcsolódó metaadatot meg kell határozni, és nem ellenőrzi, hogy az adatok megfelelnek a cdm\_data\_type-nek. Ez valószínűleg megváltozik a közeljövőben.
- Az EDDTable a cdm\_data\_type-t szigorúan használja, a CF DSG specifikációját követően, nem pedig a CDM-nél, ami valamilyen oknál fogva nem frissítették a DSG-vel való következetességet. Ha egy adatkészlet metaadata nem felel megERDDAPcdm\_data\_type követelményei (lásd alább) Az adatkészlet nem fog betölteni, és generálni foghibaüzenet... (Ez egy jó dolog, abban az értelemben, hogy a hibaüzenet megmondja, mi rossz, hogy meg tudja oldani.) És ha az adatkészlet adatai nem felelnek meg az adatkészlet metaadatkészletének (pl. ha egy adott állomás több mint egy szélességi értéke van egy időmérő adatkészletben) Az adatok egyes kérései helytelen adatokat fognak visszaküldeni a válaszban. Tehát győződjön meg róla, hogy megkapja ezt a jogot.
Mindezen adatkészletek esetében az Egyezményekben ésMetadata\_Conventionsglobális tulajdonságok, kérjük, utaljon a CF-1.6-ra (nem CF-1.0, 1.1, 1.2, 1.3, 1.4 vagy 1.5) Mivel a CF-1.6 az első verzió, amely tartalmazza a Discrete Sampling Geometryhez kapcsolódó változásokat (DSG) egyezmények.
- ERDDAP™egy nem egyszerű kapcsolat a CF DSG
- ERDDAP™érvényes DSG adatkészletet készíthet egy olyan forrásadatból, amely már érvényes DSG fájl (s) vagy egy olyan forrásadatból, amelyet nem hoznak létre a DSG-hez, de a metaadata változásain keresztül megtehető (amelyek közül néhányERDDAP-specifikus annak érdekében, hogy általánosabb megközelítést biztosítson a DSG beállításának meghatározása érdekében) ...
- ERDDAP™sok érvényességi tesztet végez, amikor adatkészletet tölt be. Ha a cdm\_data\_type adatkészlet (vagyfeatureType) a sikeresen betöltött terhek tulajdonításáraERDDAP™AztánERDDAP™azt mondja, hogy az adatkészlet megfelel a DSG követelményeinek (egyébként,ERDDAP™kivételt fog dobni, amely elmagyarázza az első problémát, amit talált) ... WARNING: A sikeresen betöltött adatkészlet úgy tűnik, hogy megfelel a DSG követelményeinek (a tulajdonságok megfelelő kombinációjával rendelkezik) De még mindig helytelenül felállítható, ami helytelen eredményeket eredményez.ncCF és.ncCFMA válaszfájlok. (A szoftver bizonyos módon okos és kényelmetlen másokban.)
- Ha megnézzük az adatkészlet metaadatátERDDAP™A DSG adatkészlete úgy tűnik, hogyERDDAPBelső formátum (hatalmas, adatbázisszerű asztal) ... Ez nem az egyik DSG formátumban van (pl. a dimenziók és a metaadatok nem helyesek) , de az adatkészlet DSG adatkészletként történő kezeléséhez szükséges információ a metadatában van (például cdm\_data\_type=TimeSeries és cdm\_timeseries\_variables= aCsvListOfStationRelatedVarables a globális metaadat és cf\_role=timeseries\_id néhány változó) ...
- Ha egy felhasználó kéri az adatkészlet egy részét egy.ncCF (egy.ncfájl a DSG Contiguous Ragged Array fájlformátumában) vagy.ncCFMA fájl (egy.ncfájl DSG Multidimenzionális Array fájl formátumban) Ez a fájl érvényes CF DSG fájl lesz. FIGYELEM: Ha azonban az adatkészlet helytelenül alakult ki (hogy a metadata által tett ígéretek nem igazak) Ezután a válaszfájl technikailag érvényes lesz, de valamilyen módon helytelen lesz.
EDDTable cdm_data_types
- Az EDDTable adatkészletek esetében a cdm\_data\_type opciók (kapcsolódó követelményekERDDAP) vannak
Pont
- Pont- egy sor mérés nem kapcsolódó időpontokban és helyeken.
- Mint minden más cdm\_data\_types más, mint más, a Point adatkészletek MUST-nak hosszúsága, szélessége és az idő változói vannak.
Profil
-
Profil- egy sor mérés, amelyet egy időben, egy magasságú hosszúságú helyen végeznek, de több mint egy mélységben (vagy magasság) ... Az adatkészlet lehet ilyen profilok gyűjteménye, például 7 profil különböző helyekről. Ez a cdm\_data\_type nem jelent semmilyen logikai kapcsolatot a profilok között.
-
Az egyik változó (például profil\_number) MUST van a változó tulajdonsága cf\_role=profil\_id azonosítani a változó, amely egyedülállóan azonosítja a profilokat.
<att name="cf\\_role">profile\\_id</att>
Ha nincs más változó, fontolja meg az idő változó használatát.
cdm\_profil\_variables
- Az adatkészlet MUST tartalmazza a GlobalAttributecdm\_profil\_variables, ahol az érték egy képregény-elválasztott lista a változókról, amelyek az egyes profilokra vonatkozó információkat tartalmazzák. Egy adott profil esetében ezeknek a változóknak az értéke állandó. Például,
<att name="cdm\\_profile\\_variables">profile\\_number,time,latitude,longitude</att>
Az MUST lista tartalmazza a cf\_role=profil\_id változót és az összes többi változót a profilról, az időről, a szélességről és a hosszúságról. A lista soha nem tartalmaz magasságot, mélységet vagy bármilyen megfigyelési változót.
\[Vélemény: cdm\_data\_type=Profilt ritkán kell használni. A gyakorlatban egy adott adatkészlet általában vagy a TimeSeriesProfile (profilok egy fix pozícióban) vagy TrajectoryProfil (profilok egy trajectory mentén) és így kell megfelelően azonosítani, mint ilyen.\]
Idősorozat
- Idősorozat- a mérések sorozata (pl. tengervíz hőmérséklet) egy, rögzített, magasság, hosszúság, mélység (vagy magasság) hely. (Gondolj úgy, mint "állomás".) Az adatkészlet ezeknek a TimeSeriesnek a gyűjteménye lehet, például három különböző helyszínből származó sorozat.
- Az egyik változó (például állomás\_id) MUST van a változó tulajdonsága cf\_role=timeseries\_id azonosítani a változó, amely egyedülállóan azonosítja az állomásokat.
<att name="cf\\_role">timeseries\\_id</att>
- Az egyik változó (például állomás\_id) MUST van a változó tulajdonsága cf\_role=timeseries\_id azonosítani a változó, amely egyedülállóan azonosítja az állomásokat.
cdm\timeseries\ változók
- Az adatkészlet MUST tartalmazza a GlobalAttributecdm\timeseries\ változók, ahol az érték egy képregény-elválasztott lista a változókról, amelyek minden állomásról információt kapnak. Egy adott állomás esetében ezeknek a változóknak az értéke állandó. Például,
<att name="cdm\\_timeseries\\_variables">station\\_id,station\\_type,latitude,longitude</att>
A lista MUST tartalmazza a cf\_role=timeseries\_id változó és az összes többi változó információt az állomásról, amely szinte mindig tartalmazza a magasság és a hosszúság (magasság vagy mélység, ha jelen van) ... A lista soha nem tartalmaz időt vagy bármilyen megfigyelési változót.
- Egyes moored buoys esetében egy adatkészlet két szélességi és hosszúsági változóval rendelkezik:
- Egy pár magassági és hosszúsági értékek, amelyek állandóak (azaz a moorálás fix helye) ... InkábbERDDAP™Adja meg ezeket a változókatdestinationNames a szélesség és a hosszúság, és tartalmazza ezeket a változókat a lista cdm\_timeseries\_variables.
- Az egyes megfigyelésekhez kapcsolódó pontos magassági és hosszúsági értékek. InkábbERDDAP™Adja meg ezeket a változókat különböződestinationNames (pl. precíz és precíz Lon) és ne tartalmazza ezeket a változókat a cdm\_timeseries\_variables listáján. Ennek oka: elméleti szempontból egy DSG TimeSeries adatkészlet, a magasság és a hosszúság (magasság vagy m élység, ha jelen van) az MUST állomás helye állandó.
TimeSeriesProfil
- TimeSeriesProfil- az egyik, rögzített, magasságbeli elhelyezkedésű profilok sorozata. Minden profil egy sor mérést több magasságban vagy mélységben. Az adatkészlet lehet ilyen TimeSeriesProfiles gyűjteménye, például a 12 különböző helyszínen vett profilok sorozata.
- Az egyik változó (például állomás\_id) MUST van a változó tulajdonsága cf\_role=timeseries\_id azonosítani a változó, amely egyedülállóan azonosítja az állomásokat.
<att name="cf\\_role">timeseries\\_id</att>
- Az egyik változó (például profil\_number) MUST van a változó tulajdonsága cf\_role=profil\_id azonosítani a változó, amely egyedülállóan azonosítja a profilokat.
(Egy adott profil\_id csak egyedinek kell lennie egy adott időzített\_id számára.) Ha nincs más változó, fontolja meg az idő változó használatát.
<att name="cf\\_role">profile\\_id</att>
- Az adatkészlet MUST magában foglalja a GlobalAttribute cdm\_timeseries\_variables, ahol az érték egy koma-választott lista a változók, amelyek az egyes állomások. Egy adott állomás esetében ezeknek a változóknak az értéke állandó. Például,
<att name="cdm\\_timeseries\\_variables">station\\_id,station\\_type,latitude,longitude</att>
A lista MUST tartalmazza a cf\_role=timeseries\_id változó és az összes többi változó információval az állomásról, amely szinte mindig tartalmazza a magasság és a hosszúság. A lista soha nem tartalmazza az időt, a magasságot, a mélységet vagy bármilyen megfigyelési változót.
- Az adatkészlet MUST magában foglalja a GlobalAttribute cdm\_profile\_variables, ahol az érték egy koma-választott lista a változók, amelyek az egyes profilok. Egy adott profil esetében ezeknek a változóknak az értéke állandó. Például,
<att name="cdm\\_profile\\_variables">profile\\_number,time</att>
A lista MUST tartalmazza a cf\_role=profil\_id változó és az összes többi változó információval a profil, amely szinte mindig tartalmazza az időt. A lista soha nem tartalmaz szélességet, hosszúságot, magasságot, mélységet vagy bármilyen megfigyelési változót.
Trajektor
- Trajektor- az áruló mentén mérések sorozata (egy út a téren és az időn keresztül) (pl. a tenger\_water\_temperature által szállított hajó, mivel a vízen keresztül mozog) ... Az adatkészlet ezeknek a trajektoroknak a gyűjteménye lehet, például 4 különböző hajóból származó sorozat.
- Az egyik változó (például a hajó \_id) A MUST rendelkezik a Cf\_role=trajectory\_id tulajdonságával, hogy azonosítsa a változót, amely egyedülállóan azonosítja a traktorokat.
<att name="cf\\_role">trajectory\\_id</att>
- Az egyik változó (például a hajó \_id) A MUST rendelkezik a Cf\_role=trajectory\_id tulajdonságával, hogy azonosítsa a változót, amely egyedülállóan azonosítja a traktorokat.
cdm\_trajectory\_variables
- Az adatkészlet MUST tartalmazza a GlobalAttributecdm\_trajectory\_variables, ahol az érték egy képregény-elválasztott lista a változókról, amelyek mindegyik pályáról információt kapnak. Egy adott pályára ezeknek a változóknak az értékei állandóak lehetnek. Például,
<att name="cdm\\_trajectory\\_variables">ship\\_id,ship\\_type,ship\\_owner</att>
Az MUST lista tartalmazza a cf\_role=trajectory\_id változót és az összes többi változót az árucikkekről. A lista soha nem tartalmazza az időt, a szélességet, a hosszúságot vagy bármilyen megfigyelési változót.
TrajectoryProfil
- TrajectoryProfil- a pályán vett profilok sorozata. Az adatkészlet ezeknek a TrajectoryProfiloknak a gyűjteménye lehet, például 14 különböző hajó által készített profilsorozat.
- Az egyik változó (például a hajó \_id) MUST van a változó tulajdonsága cf\_role=trajectory\_id azonosítani a változó, amely egyedülállóan azonosítja a traktorok.
<att name="cf\\_role">trajectory\\_id</att>
- Az egyik változó (például profil\_number) MUST van a változó tulajdonsága cf\_role=profil\_id azonosítani a változó, amely egyedülállóan azonosítja a profilokat.
(Egy adott profil\_idnek csak egy adott pályára kell egyedinek lennie.) Ha nincs más változó, fontolja meg az idő változó használatát.
<att name="cf\\_role">profile\\_id</att>
- Az adatkészlet MUST magában foglalja a GlobalAttribute cdm\_trajectory\_variables, ahol az érték egy koma-választott lista a változók, amelyek az információt az egyes áruk. Egy adott pályára ezeknek a változóknak az értékei állandóak lehetnek. Például,
<att name="cdm\\_trajectory\\_variables">ship\\_id,ship\\_type,ship\\_owner</att>
- Az egyik változó (például a hajó \_id) MUST van a változó tulajdonsága cf\_role=trajectory\_id azonosítani a változó, amely egyedülállóan azonosítja a traktorok.
Az MUST lista tartalmazza a cf\_role=trajectory\_id változót és az összes többi változót az árucikkekről. A lista soha nem tartalmaz profilhoz kapcsolódó változókat, időt, magasságot, hosszúságot vagy bármilyen megfigyelési változót.
- Az adatkészlet MUST magában foglalja a GlobalAttribute cdm\_profile\_variables, ahol az érték egy koma-választott lista a változók, amelyek az egyes profilok. Egy adott profil esetében ezeknek a változóknak az értéke állandó. Például,
<att name="cdm\\_profile\\_variables">profile\\_number,time,latitude,longitude</att>
A lista MUST tartalmazza a cf\_role=profil\_id változó és az összes többi változó információval a profil, amely szinte mindig tartalmazza az idő, a szélesség és a hosszúság. A lista soha nem tartalmaz magasságot, mélységet vagy bármilyen megfigyelési változót.
Egyéb
- Egyéb- nincs követelménye. Használja, ha az adatkészlet nem illeszkedik az egyik másik lehetőséghez, nevezetesen, ha az adatkészlet nem tartalmazza a szélességet, a hosszúságot és az idő változókat.
Kapcsolódó megjegyzések
- Minden EDDTable adatkészlet egy cdm\_data\_type más, mint "Egy másik" MUST van hosszúság, szélesség és az idő változók.
- Az MUST profilokkal rendelkező adatkészletek magasságbeli változó, mélységváltozékony vagycdm\_altitude\_proxyváltozó.
- Ha nem tudja, hogy egy adatkészlet megfeleljen az összes követelmény az ideális cdm\_data\_type, használja a "Point" (amelyeknek kevés követelménye van) Vagy "másik" (amelyeknek nincs követelménye) Ehelyett.
- Ezt az információt használjákERDDAP™különböző módon, például, de többnyire a készítéshez.ncCF fájlok (.ncolyan fájlok, amelyek megfelelnek az adatkészlet cdm\_data\_type-jéhez kapcsolódó kontigurált Array reprezentációknak) és.ncCFMA fájlok (.ncolyan fájlok, amelyek megfelelnek az adatkészlet cdm\_data\_type társult többdimenziós Array képviselőinek) mint ahogyan azt meghatároztákDiscrete Sampling Geometries (DSG) fejezeteCFmetadatai egyezmények, amelyeket korábban „CF Point Megfigyelési Egyezményeknek” neveztek.
- Hint: Ezeknek az adatoknak a megfelelő beállításasubsetVariablesáltalában a cdm\_...\_variables tulajdonságaiban felsorolt összes változó kombinációja. Például a TimeSeriesProfile, használja a cdm\_timeseries\_variables plusz a cdm\_profil\_variables.
contributor\_name
- contributor\_name (aACDDmetadata szabvány) a TÁMOGATÓ módja annak, hogy azonosítsunk egy olyan személyt, szervezetet vagy projektet, amely hozzájárult az adatkészlethez (például az adatok eredeti alkotója, mielőtt az adatkészlet létrehozója újra feldolgozta volna.) ... Például,
<att name="contributor\\_name">NOAA OceanWatch - Central Pacific</att>
Ha a "közreműködő" nem igazán vonatkozik egy adatkészletre, hagyja ki ezt a tulajdonságot. Összehasonlításcreator\_nameEz néha inkább a finanszírozási forrásra összpontosít.
contributor\_role
- contributor\_role (aACDDmetadata szabvány) AZ ELŐTTT módja annak, hogy azonosítsa a szerepétcontributor\_name... Például,
<att name="contributor\\_role">Source of Level 2b data</att>
Ha a "közreműködő" nem igazán vonatkozik egy adatkészletre, hagyja ki ezt a tulajdonságot.
Egyezmények
- Egyezmények (aCFmetadata szabvány) STRONGLY RECOMMENDED. (KÉRDÉS lehet a jövőben.) Az érték a metaadat-szabványok kombinációválasztott listája, amelyet ez az adatkészlet követ. Például:
<att name="Conventions">COARDS, CF-1.6, ACDD-1.3</att>
A közös metaadat-konvenciók, amelyeket aERDDAP™a következők:
- COARDSEgyezményeka CF prekurzora.
- Éghajlat és előrejelzés (CF) Egyezményekaz ajánlott és megkövetelt tulajdonságok sok forrásaERDDAP... A CF jelenlegi verzióját "CF-1.6"-nak nevezik.
- ANetCDFAttribute Convention for Dataset Discovery (ACDD) az ajánlott és megkövetelt tulajdonságok sok forrásaERDDAP... Az ACDD eredeti 1.0 verziója (ragyogó munka Ethan Davis) , azonosították, mintUnidataDataset Discovery v1.0A jelenlegi (Kezdés 2015-ben) Az ACDD 1.3 verzióját azonosítjákACDD-1.3... Ha az adatkészleteit használtákUnidataDataset Discovery v1.0, bátorítjuk Önt, hogykapcsolja ki az adatkészleteket az ACDD-1.3 használatára...
Ha az adatkészlete további metaadat-szabványt követ, kérjük, adja hozzá a CSV listáját az Egyezményekben.
coverage\_content\_type
- coverage\_content\_type (aISO 19115metadata szabvány) a RECOMMENDED mód a rácsos adatok típusának azonosítására (benneEDDGridadatkészletek) ... Például,
<att name="coverage\\_content\\_type">modelResult</att>
Az egyetlen megengedett értékek segéd információ, kép, modellResult, fizikai Mérés (az alapértelmezett, amikor az ISO 19115 metaadatot generálják) minőséginformáció, referenciainformáció és tematikus osztályozás. (Ne használja ezt a címkét az EDDTable adatkészletekhez.)
creator\_name
- creator\_name (aACDDmetadata szabvány) az ELŐTTT mód a személy azonosítására, szervezetre vagy projektre (ha nem egy adott személy vagy szervezet) A legtöbb felelős a teremtésért (vagy legutóbbi újrafeldolgozás) ezen adatokból. Például,
<att name="creator\\_name">NOAA NMFS SWFSC ERD</att>
Ha az adatok széles körben újrafeldolgozásra kerültek (például a 2. szinttől a 3. vagy 4. szintig terjedő műholdas adatok) , akkor általában a reprocesszor szerepel, mint a Teremtő, és az eredeti alkotó szerepelcontributor\_name... ÖsszehasonlításprojektEz rugalmasabb, mivel azonosíthat egy személyt, egy szervezetet vagy egy projektet.
creator\_email
- creator\_email (aACDDmetadata szabvány) az E-mail cím azonosításának módja (helyesen formázott) ez egy módja annak, hogy kapcsolatba lépjen a Teremtővel. Például,
<att name="creator\\_email">erd.data@noaa.gov</att>
creator\_url
- creator\_url (aACDDmetadata szabvány) a RECOMMENDED módja annak, hogy azonosítsa az URL-t olyan szervezet számára, amely létrehozta az adatkészletet, vagy egy URL-t az alkotó információjával az adatkészletről (de ez inkább a célinfoUrl) ... Például,
<att name="creator\\_url">https://www.pfeg.noaa.gov</att>
date\_created
- date\_created (aACDDmetadata szabvány) a TÁMOGATÓ módja annak, hogy azonosítsa azt a dátumot, amikor az adatokat először hozták létre (például feldolgozva ebbe a formába) ISO 8601 formátumban. Például,
<att name="date\\_created">2010-01-30</att>
Ha az adatok rendszeresen hozzáadódik az adatkészlethez, ez az első dátum, amelyet az eredeti adatok elérhetők.
date\_modified
- date\_modified (aACDDmetadata szabvány) a TISZTETT módja annak, hogy azonosítsa azt a dátumot, amelyen az adatok legutóbbi módosításra kerültek (például, amikor hiba történt, vagy amikor a legfrissebb adatokat hozzáadták) ISO 8601 formátumban. Például,
<att name="date\\_modified">2012-03-15</att>
date\_issued
- date\_issued (aACDDmetadata szabvány) a RECOMMENDED módja annak, hogy azonosítsuk azt a dátumot, amelyen az adatokat először elérhetővé tették mások számára, például 2012-03-15 formátumban. Például,
<att name="date\\_issued">2010-07-30</att>
Például az adatkészletnek lehet egydate\_created2010-01-30, de csak nyilvánosan elérhető 2010-07-30.date\_issuedkevésbé használják, mintdate\_createdésdate\_modified... Hadate\_issuedkihagyott, azt feltételezik, hogy ugyanaz, mint adate\_created...
globálisdrawLandMask
- drawLandMask - Ez egy OPTIONAL globális tulajdonság, amelyet aERDDAP™ (és nem metadata szabványok) amely meghatározza a "Draw Land Mask" alapértelmezett értéket az adatkészlet Make A Graph formanyomtatványán ( datasetID .gráf) és a &.land paraméter egy URL-ben, amely az adatok térképét kéri. Például,
<att name="drawLandMask">over</att>
Lásd:drawLandMaskÁttekintés...
featureType
- featureType (aCFmetadata szabvány) IGNORED és/vagy REPLACED. Ha az adatkészletcdm\_data\_typemegfelelő,ERDDAP™automatikusan használja, hogy létrehozzon egyfeatureTypetulajdonság. Tehát nincs szükség arra, hogy hozzáadd.
Ha azonban használjaEDDTableFromNcCFFilesegy adatkészlet létrehozása olyan fájlokból, amelyek követik aCF Discrete Sampling Geometries (DSG) szabványA fájloknak maguknak kell lenniefeatureTypehelyesen meghatározott, hogyERDDAP™helyesen olvashatja a fájlokat. Ez része az ilyen típusú fájl CF DSG követelményeinek.
történelem
- történelem (aCFésACDDmetadata szabványok) egy RECOMMENDED multi-line String globális tulajdonsága minden feldolgozási lépésnek, amelyet az adatok áthaladtak. Például,
<att name="history">2011-08-05T08:55:02Z CMOR: Rewrote data to comply with CF standards.
2012-04-08T08:34:58Z CMOR: Converted 'height' type from 'd' to 'f'.</att>- Ideális esetben minden sornak van ISO 8601:2004 (EZ) formázott dátum +timeZ (Például 2011-08-05T08:55:02Z) a feldolgozási lépés leírása követte.
- ERDDAP™létrehozza ezt, ha már nem létezik.
- Ha már létezik,ERDDAP™új információkat küld a meglévő információkhoz.
- A történelem azért fontos, mert lehetővé teszi az ügyfelek számára, hogy visszalépjenek az adatok eredeti forrásához.
infoUrl
- infoUrl REQUIRED globális tulajdonsága egy weboldal URL-jének, amely több információval rendelkezik az adatkészletről (általában a forrás intézmény honlapján) ... Például,
<att name="infoUrl">http://www.globec.org/</att>
- Vagy az adatkészlet globálisForrás: Forrásvagy globális<addAttributes> > > > A MUST ezt a tulajdonságot tartalmazza.
- infoUrlFontos, mert lehetővé teszi az ügyfelek számára, hogy többet megtudjanak az eredeti forrásból származó adatokról.
- ERDDAP™linket jelenít meg ainfoUrlaz adatkészlet adathozzáférési formája ( datasetID .html) Make A Graph weboldal ( datasetID .gráf) és más weboldalak.
- Ha az URL-nek van egy lekérdező része (utána a "?") MIÉRT márszázalék kódolva... Különleges karaktereket kell kódolni a korlátozásokban (a kezdeti „és” és a fő'='ha van) a %H formában, ahol a HH a karakter két számjegyű hexadecimális értéke. Általában csak néhány punctuációs karaktert kell átalakítania: %-25, és %26, "- %22,<%3C, = %3D, > %3E, + %2B,|%7C,\[%5B,\]%5D, tér %20, és átalakítani minden karakter felett #127 a saját UTF-8 formában, majd százaléka kódolja minden byte az UTF-8 formában a %HH formátum (kérjen programozót segítségért) ...
Például, &stationID>="41004"
Beszéd ésstationID%3E=%2241004%22
A százalékos kódolás általában akkor szükséges, ha hozzáférERDDAPszoftveren keresztül, mint egy böngésző. A böngészők általában kezelik a százalékos kódolást az Ön számára.
Bizonyos helyzetekben százalékban kell kódolni az A-Za-z0-9\_-től eltérő összes karaktert! "..." () \*, de még mindig nem kódolja az eredeti '&' vagy a fő'='...
A programozási nyelveknek van eszközük erre (például lásdJavaAjava.net.URLEncoder
ésJavaOlvasson bele a(z)encodeURIComponent()] ( https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/encodeURIComponent ) ) és vannak olyan webhelyek, amelyek százalékos kódot / dekódot mutatnak Önnek... - ótadatasets.xmlXML fájl, akkor is &-encode ALL ' &',<"és ">" az URL-ben, mint '&',<és a „>” százalékos kódolás után.
- infoUrlegyediERDDAP... Ez nem bármilyen metaadat szabványból származik.
intézmény
- intézmény (aCFésACDDmetadata szabványok) REQUIRED globális tulajdonság az intézmény neve rövid változatával, amely az adatok forrása (általában akronym, általában<20 karakter). Például,
<att name="institution">NASA GSFC</att>
- Vagy az adatkészlet globálisForrás: Forrásvagy globális<addAttributes> > > > A MUST ezt a tulajdonságot tartalmazza.
- ERDDAP™megjeleníti az intézményt, amikor az adatkészletek listáját jeleníti meg. Ha itt egy intézmény neve hosszabb, mint 20 karakter, csak az első 20 karakter látható lesz az adatkészletek listáján (De az egész intézmény látható az egérkurzor elhelyezésével a szomszédos "?" ikononon) ...
- Ha intézményt ad hozzá a listához<categoryAttributes> > > > benneERDDAPAsetup.xmlfájl, a felhasználók könnyen megtalálhatják az azonos intézményből származó adatkészleteketERDDAP"Search for Datasets by Kategória" a honlapon.
kulcsszavak
- kulcsszavak (aACDDmetadata szabvány) egy RECOMMENDED Comma-elválasztott lista a szavakról és rövid kifejezésekről (például,GCMD Tudományos kulcsszavak) általánosan leírja az adatkészletet, és nem feltételezi az adatkészlet egyéb ismereteit (például az óceáni adatokra, beleértve az óceánt) ... Például,
<att name="keywords">ano, circulation, coastwatch, currents, derived, Earth Science > Oceans > Ocean Circulation > Ocean Currents, eastward, eastward\\_sea\\_water\\_velocity, experimental, hf radio, meridional, noaa, northward, northward\\_sea\\_water\\_velocity, nuevo, ocean, oceans, radio, radio-derived, scan, sea, seawater, velocity, water, zonal</att>
ótadatasets.xmlegy XML dokumentum, a karakterek és<és > egy olyan tulajdonságban, mint a kulcsszavak (pl. a GCMD tudományos kulcsszavak > karakterei) alá: beadás éve (évszám)<, és gt; tiszteletben. Amikor egy adatkészletet töltenek beERDDAP,
- "Föld tudomány >" hozzáadódik minden GCMD kulcsszó kezdetéhez, amely hiányzik.
- A GCMD kulcsszavak megtérülnek a címsorba (az első betűket kapitalizálják) ...
- A kulcsszavak rendezett rendbe kerülnek, és minden újvonal karaktert eltávolítanak.
keywords\_vocabulary
- keywords\_vocabulary (aACDDmetadata szabvány) egy ELŐTTT TANÁCSADÓ tulajdonság: ha egy iránymutatást követ a kulcsszavakban szereplő szavak / kifejezések tekintetében (Például a GCMD Science Keywords) , tedd ide az iránymutatás nevét. Például,
<att name="keywords\\_vocabulary">GCMD Science Keywords</att>
licenc
- licenc (aACDDmetadata szabvány) a STRONGLY RECOMMENDED globális tulajdonsága a licenc és/vagy használati korlátozásoknak. Például,
<att name="license">\\[standard\\]</att>
- Ha "\[szabvány\]" a tulajdonképpeni értékben fordul elő, a szabvány helyettesítiERDDAP™licenc a<StandardLicense> címkeERDDAPA \[Tomcat\]/webapps/erddap/WEB-INF/classes/gov/noa/pfel/erddap/util/messages.xml fájl.
Metadata\_Conventions
- Metadata\_Conventions az elavultACDD 1.0 (amelyet azonosítottakMetadata\_Conventionsmint "UnidataDataset Discovery v1.0") metadata szabvány. A tulajdonság érték az adatkészlet által használt metaadat-konvenciók egy különálló listája volt.
Ha egy adatkészlet ACDD 1.0-t használ, ez a tulajdonság például szigorúan elismert.
<att name="Metadata\\_Conventions">COARDS, CF-1.6, Unidata Dataset Discovery v1.0</att>
DeERDDAP™most javasolja az ACDD-1.3-at. Ha vankapcsolta be az adatkészleteit az ACDD-1.3 használatáraHasználataMetadata\_ConventionsSTRONGLY DISCOURAGED: Csak használja [<Egyezmények>] (#konvenciók) Ehelyett.
processing\_level
- processing\_level (aACDDmetadata szabvány) a feldolgozás szöveges leírása (például,NASA műholdas adatfeldolgozási szintPéldául a 3. szint) vagy minőségellenőrzési szint (Például a Science Quality) az adatok. Például,
<att name="processing\\_level">3</att>
projekt
- projekt (aACDDmetadata szabvány) OPTIONAL tulajdonsága annak a projektnek a azonosítása, amely része az adatkészletnek. Például,
<att name="project">GTSPP</att>
Ha az adatkészlet nem része egy projektnek, ne használja ezt a tulajdonságot. Összehasonlításcreator\_nameEz a projektre összpontosít (nem személy vagy szervezet, amely több projektben részt vehet) ...
publisher\_name
- publisher\_name (aACDDmetadata szabvány) a TÁMOGATÓ módja annak, hogy azonosítsa a személyt, szervezetet vagy projektet, amely közzéteszi ezt az adatkészletet. Például,
<att name="publisher\\_name">JPL</att>
Például Ön a kiadó, ha egy másik személy vagy csoportteremtésaz adatkészlet, és csak újra kiszolgáljaERDDAP... Ha a "publisher" nem igazán vonatkozik egy adatkészletre, hagyja ki ezt a tulajdonságot. Összehasonlításcreator\_nameA kiadó valószínűleg nem módosította vagy újra feldolgozta az adatokat; a kiadó csak az új helyszínen elérhetővé teszi az adatokat.
publisher\_email
- publisher\_email (aACDDmetadata szabvány) az E-mail cím azonosításának módja (helyesen formázva, például john\_smith@great.org) ez egy módja annak, hogy kapcsolatba lépjen a kiadóval. Például,
<att name="publisher\\_email">john\\_smith@great.org</att>
Ha a "publisher" nem igazán vonatkozik egy adatkészletre, hagyja ki ezt a tulajdonságot.
publisher\_url
- publisher\_url (aACDDmetadata szabvány) a RECOMMENDED módja annak, hogy azonosítsa az URL-t a szervezet számára, amely közzéteszi az adatkészletet, vagy egy URL-t a kiadó információjával az adatkészletről (de ez inkább a célinfoUrl) ... Például,
<att name="publisher\\_url">https://podaac.jpl.nasa.gov</att>
Ha a "publisher" nem igazán vonatkozik egy adatkészletre, hagyja ki ezt a tulajdonságot.
real\_time
- real\_time egy globális sztring tulajdonság (nem bármilyen szabványból) jelzi, hogy ez egy valós idejű adatkészlet. Például,
<att name="real\\_time">true</att>
Ha ez hamis (az alapértelmezett) ,ERDDAP™a fájltípusok iránti kérelmekre adott válaszokat, ahol az egész fájlt előbb kell létrehozniERDDAP™elkezdheti küldeni a választ a felhasználóra, és akár 15 percig újra felhasználhatja őket (pl.:.nc, .png) ... Ha ez igaz,ERDDAP™Soha nem fogja összezúzni a válaszfájlokat, és mindig újonnan létrehozott fájlokat fog visszaküldeni.
sourceUrltulajdonság
- sourceUrl globális tulajdonság az adatok forrásának URL-jével. Például,
(de tedd az egészet egy sorra)
<att name="sourceUrl">https://opendap.co-ops.nos.noaa.gov/ioos-dif-sos/SOS</att>
- ERDDAP™általában automatikusan létrehozza ezt a globális tulajdonságot. Két kivétel EDDTableFromHyraxFiles és EDDTableFromThreddsFiles.
- Ha a forrás helyi fájlok, és a fájlokat a szervezet hozta létre, használja
<att name="sourceUrl">(local files)</att>
- Ha a forrás helyi adatbázis, és az adatokat a szervezet hozta létre, használja
<att name="sourceUrl">(local database)</att>
- sourceUrlFontos, mert lehetővé teszi az ügyfelek számára, hogy visszalépjenek az adatok eredeti forrásához.
- sourceUrlegyediERDDAP... Ez nem bármilyen metaadat szabványból származik.
standard\_name\_vocabulary
- standard\_name\_vocabulary (aACDDmetadata szabvány) egy ELŐTTT tulajdonság, hogy azonosítsa az ellenőrzött szókincs nevét, amelyből a változóstandard\_nameszednek. Például,
<att name="standard\\_name\\_vocabulary">CF Standard Name Table v77</att>
a 77-es verzióhozCF standard névtáblázat...
subsetVariables
- subsetVariables (Az EDDTable adatkészletekhez csak) egy RECOMMENDED globális tulajdonság, amely lehetővé teszi, hogy megjelölje a Comma-elválasztott listát<dataVariable>>>>>> (#datavariable) destinationNamea változók azonosítása, amelyek korlátozott számú értékkel rendelkeznek (másképp fogalmazva: a változók, amelyekre minden értéknek sok duplikációja van) ... Például,
<att name="subsetVariables">station\\_id, longitude, latitude</att>
Ha ez a tulajdonság jelen van, az adatkészletnek van egy datasetID .subset weboldal (és link hozzá minden adatkészlet listán) amely lehetővé teszi a felhasználók számára, hogy gyorsan és könnyen kiválaszthassák az adatok különböző alkészleteit.
- Minden alkalommal, amikor egy adatkészletet töltenek be,ERDDAPrakományok és áruházak a lemezen egy asztalt az összes különböző () az alapkészlet kombinációi Variable változó értékei.ERDDAP™olvassa el, hogysubsetVariablesasztal és feldolgozza nagyon gyorsan (különösen a sok adatfájl olvasásához vagy az adatbázisból vagy más külső szolgáltatásból származó adatokhoz képest) ...
- Ez lehetővé tesziERDDAP™3 dolgot csinálni:
- Ez lehetővé tesziERDDAP™egy listát a lehetséges értékekről az Adathozzáférési Formáról, Készítsen egy Graph weboldalt, és .subset weboldalakat.
- Ez lehetővé tesziERDDAP™.subset weboldalt kínálni az adatkészlethez. Ez az oldal érdekes, mert könnyű megtalálni a változók értékeinek érvényes kombinációját, amely néhány adatkészlet és néhány változó nagyon, nagyon nehéz (szinte lehetetlen) ... Ezután minden felhasználói kérelmet külön () aljzat A változó adatok nagyon gyorsak lesznek.
- Ha van egy felhasználói kérés, amely csak az említett változók aljzatára vonatkozik,ERDDAP™gyorsan elolvashatjasubsetVariablestáblázat, és válaszoljon a kérésre. Ez megmenthet egy tonna időt és erőfeszítéstERDDAP...
- A rendjedestinationNames Ön határozza meg a rendezési rendet datasetID .subset weboldal, így általában megadja a legfontosabb változókat először, majd a legkevésbé fontos. Például az idősoros adatokkal rendelkező adatkészletek több állomás számára használhatók, például,
<att name="subsetVariables">station\\_id, longitude, latitude</att>
hogy az értékeket az állomás \_id rendezi.
- Nyilvánvaló, hogy az Ön választása, amely változókat tartalmazhat asubsetVariableslista, de a javasolt használat:
Általában tartalmaznak olyan változókat, amelyekre szeretnéERDDAP™az adatkészlet adathozzáférési formanyomtatványának csökkentési listájának megjelenítése (.html) Make-A-Graph (.gráf) weboldalak.
Általában tartalmazzák a változókat az adatkészlet jellemzőiről (az állomások, profilok és/vagy trajektorok, különösencdm\timeseries\ változók,cdm\_profil\_variables,cdm\_trajectory\_variables) ... Ezeknek a változóknak csak néhány különböző értéke van, így jól működnek a ledobott listákkal.
Soha ne tartalmazzon semmilyen adatváltozatot az egyéni megfigyelésekhez kapcsolódóan (pl. idő, hőmérséklet, szalinitás, jelenlegi sebesség) asubsetVariableslista. Túl sok különböző értékek ezeknek a változóknak, így a ledobás lista lassú lenne, és nehéz lenne dolgozni (vagy nem működik) ...
- Ha ezeknek a változóknak a különböző kombinációinak száma meghaladja a 10 000 000-et, akkor fontolja meg a korlátozástsubsetVariableshogy meghatározza a különböző kombinációk számának csökkentését 1 000 000 alá; különben, datasetID A weblapokat lassan lehet generálni. szélsőséges esetekben az adatkészlet nem tölthet beERDDAP™mivel a különböző kombinációk listájának létrehozása túl sok memóriát használ. Ha igen, akkor el kell távolítani néhány változót asubsetVariableslista.
- Ha az egyik aljzat változójának különböző értékei több mint 20 000, akkor fontolóra kell vennie, hogy nem tartalmazza ezt a változót a listánsubsetVariablesegyébként hosszú időbe telik, hogy továbbítsák a datasetID .subset, datasetID .graph, és datasetID .html weboldalak. Szintén egy Mac-en nagyon nehéz kiválasztani a kiválasztást egy ledobott listáról, több mint 500 tétellel, mivel a görgetős bár hiánya. A kompromisszum: távolítsa el a változókat a listából, amikor a felhasználók valószínűleg nem választják ki az értékeket egy leesés listából.
- Minden adatkészletet tesztelnie kell, hogy lássa, van-esubsetVariablesA beállítás rendben van. Ha a forrásadatkiszolgáló lassú, és túl sokáig tart (vagy kudarcot vall) letölteni az adatokat, vagy csökkenteni a megadott változók számát, vagy eltávolítanisubsetVariablesglobális tulajdonság.
- Beállítás A változók nagyon hasznosak. Tehát, ha az adatkészlet megfelelő, kérjük, hozzon létre egysubsetVariablestulajdonság.
- EDDTableFromSOSautomatikusan hozzáadódik
<att name="subsetVariables">station\\_id, longitude, latitude</att>
amikor az adatkészlet jön létre.
- Lehetséges figyelmeztetés: ha egy felhasználó használja datasetID .subset weboldal kiválaszt egy olyan értéket, amely egy fuvarozóReturn vagy újline karakterrel rendelkezik, datasetID .subset kudarcot vall.ERDDAP™nem tud működni a probléma miatt néhány HTML részletek. Mindenesetre szinte mindig jó ötlet, hogy távolítsa el a fuvarozásReturn és az újline karakterek az adatok. Hogy segítsen megoldani a problémát, ha az EDDTable.subsetVariablesAdatTable módszer aERDDAPolyan adatértékeket észlel, amelyek bajt okoznak, figyelmeztetést küld az e-mail megsértő értékeinek listájával Minden Az e-mail címek megadott setup.xml. Így tudod, mit kell rögzíteni.
- Elő generált subset táblák. Normális esetben, amikorERDDAP™betölti az adatkészletet, kéri a különálló () az adatforrásból származó változó adattáblát, csak normál adatkéréssel. Bizonyos esetekben ez az adatok nem állnak rendelkezésre az adatforrásból, vagy az adatforrásból való visszakeresés nehéz lehet az adatforrás kiszolgálóján. Ha igen, akkor egy táblázatot tudsz nyújtani az információval egy.jsonvagy .csv fájl a névvel Tomcat /content/erddap/subset/ datasetID .json (vagy .csv) ... Ha jelen van,ERDDAP™egyszer elolvassa, amikor az adatkészletet betöltik, és az aljzatadatok forrásaként használja.
- Ha van hiba, amikor elolvassa, az adatkészlet nem fog betölteni.
- Pontosan ugyanaz az oszlop neve (például ugyanaz az eset) mint<subsetVariables> de az oszlopok minden rendben vannak.
- Több oszlop van (eltávolításra kerülnek, és az újonnan redundáns sorokat eltávolítják) ...
- A hiányzó értékeknek hiányozniuk kell az értékeket (nem hamis számok, mint -99) ...
- .jsonfájlok lehet egy kicsit nehezebb létrehozni, de foglalkozik az Unicode karakterek jól..jsonA fájlok könnyen létrehozhatók, ha létrehozod őketERDDAP...
- A .csv fájlok könnyen működnek, de csak az ISO 8859-1 karakterek számára alkalmasak. .csv fájlok MUST van oszlop nevek az első sorban és adatok a későbbi sorok.
- Hatalmas adatkészletek vagy ha<subsetVariables> félreértve, az értékek kombinációinak táblázata elég nagy lehet ahhoz, hogy túl sok adatot vagy OutOfMemory hibákat okozzon. A megoldás az, hogy eltávolítsuk a változókat a listáról<subsetVariables> amelyekre nagyszámú érték van, vagy szükség szerint eltávolítják a változókat, amíg az asztal mérete ésszerű. Függetlenül attól, hogy a hiba, az alkatrészekERDDAP™használjasubsetVariablesrendszer nem működik jól (pl. a weboldalak nagyon lassan töltenek be) ha túl sok sor van (pl. több mint egymillió) ebben az asztalban.
- subsetVariablessemmi köze annak megállapításához, hogy mely változó felhasználók használhatják a korlátozásokat, azaz a felhasználók hogyan kérhetik az adatkészlet alkészleteit.ERDDAP™mindig lehetővé teszi a korlátozásokat, hogy hivatkozzanak bármelyik változóra.
Időegységek
Idő és időmérőAz oszlopoknak ISO 8601:2004 (EZ) formázott dátum + idő Z strings (Például, 1985-01-31T15:31:00Z) ...
összefoglaló
- összefoglaló (aCFésACDDmetadata szabványok) REQUIRED globális tulajdonság az adatkészlet hosszú leírásával (általában)<500 karakter). Például,
<att name="summary">VIIRSN Level-3 Standard Mapped Image, Global, 4km, Chlorophyll a, Daily. The Visible and Infrared Imager/Radiometer Suite (VIIRS) is a multi-disciplinary instrument that flies on the National Polar-orbiting Operational Environmental Satellite System (NPOESS) series of spacecraft, including the NPOESS Preparatory Project (NPP).</att>
- Vagy az adatkészlet globálisForrás: Forrásvagy globális<addAttributes> > > > A MUST ezt a tulajdonságot tartalmazza.
- összefoglaló nagyon fontos, mert lehetővé teszi az ügyfelek számára, hogy olvassa el az adatkészlet leírását, amely több információval rendelkezik, mint a cím, és így gyorsan megérti, mi az adatkészlet.
- Tanácsadás: kérlek írja le az összefoglalót, hogy dolgozzon, hogy leírja az adatkészletet néhány véletlenszerű embernek, akivel találkozik az utcán vagy egy kollégának. Ne feledje, hogy tartalmazzaÖt W és egy HKi hozta létre az adatkészletet? Milyen információkat gyűjtöttek? Mikor gyűjtötték be az adatokat? Hol gyűjtötték? Miért gyűjtötték össze? Hogyan gyűjtötték össze?
- ERDDAP™megjeleníti az adatkészlet adathozzáférési formájának összefoglalását ( datasetID .html) Make A Graph weboldal ( datasetID .gráf) és más weboldalak.ERDDAP™használja az összefoglalót az FGDC és az ISO 19115 dokumentumok létrehozásakor.
testOutOfDate
- testOutOfDate (opcionálisERDDAP-specifikus globális metaadat tulajdonság, nem bármilyen szabványból) egyszerűsítve, ha a közeli valós idejű adatkészlet adatait naprakésnek tekintik,now- nUnits Például,now-2 nap olyan adatok esetében, amelyek általában 24-48 órát jelentenek az időérték után. Előrejelzési adatok, használat most + nUnits Például most + 6 nap előrejelzési adatok, amelyek a jövőben 8 nap. (Lásd:now- nUnits Szintax leírás...) Ha az adatkészlet maximális időértéke közelmúltban van, mint a megadott idő, az adatkészlet naprakésznek tekinthető. Ha a maximális időérték idősebb, mint a megadott idő, az adatkészletet naprakésznek tekintik. A naprakész adatkészletek esetében valószínűleg probléma merül fel az adatforrással, ígyERDDAP™képtelen a közelmúltbeli időpontokból származó adatokhoz jutni.
AtestOutOfDateaz érték oszlopként jelenik megallDatasetsadatkészleta teERDDAP... Azt is használják, hogy kiszámítsa az OutOfDate index, amely egy másik oszlop aallDatasetsadatkészlet. Ha az index<1, az adatkészlet naprakésznek tekinthető. Ha az index<=1, az adatkészletet naprakésznek tekintik. Ha az index<=2, az adatkészlet nagyon naprakésznek tekinthető.
AtestOutOfDateértéket is használnakERDDAP™létrehozni https://yourDomain/erddap/outOfDateDatasets.html Weboldal (példa) amely megmutatja az adatkészleteket, amelyek<testOutOfDate> címkék, az adatkészletek rangsorolva, hogy milyen out-of-date ők. Ha módosítja a fájltípust (.html és .csv,.jsonlCSV,.nc,.tsv...) Ezeket az információkat különböző fájlformátumokban kaphatja meg.
Ha lehetséges,GenerateDatasetsXmlhozzáad egytestOutOfDatea globálisaddAttributesadatkészlet. Ez az érték egy javaslat, amely a GenerateDatasetsXml rendelkezésére álló információkon alapul. Ha az érték nem megfelelő, változtassa meg.
"Out-of-date" itt nagyon különbözik a<újratöltés MindenNMinutes>] (#reloadeveryn percek) , amely foglalkozik azzal, hogy naprakészERDDAPAz adatkészlet ismerete. A<testOutOfDateA rendszer feltételezi, hogyERDDAPAz adatkészlet ismerete naprakész. A kérdés<testOutOfDate> az ügyletek: úgy tűnik, hogy valami baj van az adatok forrásával, ami újabb adatokat okoz, amelyeket nem lehet hozzáférhetővé tenniERDDAP?
cím
- cím (aCFésACDDmetadata szabványok) REQUIRED globális tulajdonság az adatkészlet rövid leírásával (általában)<= 95 karakter). Például,
<att name="title">VIIRSN Level-3 Mapped, Global, 4km, Chlorophyll a, Daily</att>
- Vagy az adatkészlet globálisForrás: Forrásvagy globális<addAttributes> > > > A MUST ezt a tulajdonságot tartalmazza.
- a cím azért fontos, mert az adatkészletek minden listája bemutatottERDDAP (más, mint a keresési eredmények) felsorolja az adatkészleteket az alfabetikus sorrendben, cím szerint. Tehát, ha meg szeretné határozni az adatkészletek megrendelését, vagy egyes adatkészletek csoportosulnak, akkor címeket kell létrehoznia ezzel szem előtt tartva. Számos adatkészlet listája (például egy kategóriás keresésre válaszul) Mutassa meg a teljes lista aljzatát és egy másik sorrendben. Tehát az egyes adatkészletek címe önmagában kell állnia.
- Ha a cím tartalmazza a "DEPRECATED" szót (minden tőkebetű) Ezután az adatkészlet alacsonyabb rangsorolást kap a keresésekben.
<axisVariableGt;
- [[szerkesztés]] ** <axisVariable> > > > ** ] (#axisvariable) egy dimenzió leírására használják (úgynevezett "axis") ...
MertEDDGridadatkészletek, egy vagy többaxisVariableA címkék REQUIRED, és mindendataVariablesmindig ossza meg/használja az összes tengelyváltozatot. (Miért? Mi van, ha nem?)
Ott lehet egy tengely változó minden dimenzióban az adatok változók. Axis változók MUST van meghatározva annak érdekében, hogy az adatok változók használja őket. (EDDTable adatkészletek nem használhatók<axisVariable> címkék.) Egy testesített példa:
<axisVariable>
<sourceName\>MT</sourceName>
<destinationName\>time</destinationName>
<addAttributes>
<att name="units">days since 1902-01-01T12:00:00Z</att>
</addAttributes>
</axisVariable>
<axisVariable> támogatja a következő altagokat:
<sourceName\>
- [[szerkesztés]]<sourceName\>] (#sourcename) - az adatforrás neve változó. Ez az a neve, hogyERDDAP™az adatforrásból származó adatok kérésekor fog használni. Ez az a neve, hogyERDDAP™megkeresi, hogy az adatok visszatérnek az adatforrásból. Ez érzékeny. Ez REQUIRED.
<destinationName\>
- [[szerkesztés]]<destinationName\>] (#destinationname) az a neve annak a változónak, amelyet bemutatunk és használunkERDDAP™felhasználók.
- Ez a TIONAL. Ha hiányzik,sourceNamehasználják.
- Ez azért hasznos, mert lehetővé teszi, hogy megváltoztassa a kriptográfiai vagy furcsasourceName...
- destinationNameérzékeny.
- destinationNameS MUST kezd egy levelet (A-Z, a-z) és követni kell 0 vagy több karaktert (A-Z, a-z, 0-9 és \_) ... ("-" megengedték korábbanERDDAP™1.10 verzió.) Ez a korlátozás lehetővé teszi, hogy a tengely változó nevek azonosak legyenekERDDAP™, a válaszfájlokban és az összes olyan szoftverben, ahol ezeket a fájlokat fogják használni, beleértve a programozási nyelveket is (mintPython,MatlabésJavaSzövegek) ahol hasonló korlátozások vannak a változó nevekre.
- InkábbEDDGridadatkészletek,hosszúság, magasság, magasság, mélység és időA tengely változók különlegesek.
axisVariable <addAttributes>
- [[szerkesztés]]<addAttributes>>>>>> (# változó-addattributes) meghatározza az OPTIONAL tulajdonságok ( név = érték ) amely hozzáadódik a forrás tulajdonságaihoz egy változó, hogy a kombinált tulajdonságok változó. Ha a változóForrás: Forrásvagy<addAttributes> beleértvescale\_factorvagyadd\_offsetattribútumok, értékeiket fogják használni, hogy kicsomagolja az adatokat a forrásból, mielőtt az ügyfél elosztása (eredmény Érték = forrás Érték \*scale\_factor+add\_offset) ... A nem csomagolt változó ugyanazon adattípus lesz (Például, float) mintscale\_factorésadd\_offsetértékek.
<dataVariableGt;
- [[szerkesztés]] ** <dataVariable> > > > ** ] (#datavariable) egy REQUIRED (szinte minden adatkészlet) címke belül<adatkészlet> címke, amelyet az adatok változó leírására használnak. Ott lehet 1 vagy több példa erre a címkére. Egy testesített példa:
<dataVariable>
<sourceName\>waterTemperature</sourceName>
<destinationName\>sea\_water\_temperature</destinationName>
<dataType>float</dataType>
<addAttributes>
<att name="ioos\_category">Temperature</att>
<att name="long\_name">Sea Water Temperature</att>
<att name="standard\_name">sea\_water\_temperature</att>
<att name="units">degree\_C</att>
</addAttributes>
</dataVariable>
<dataVariable> támogatja a következő altagokat:
<sourceNameGt;
- [[szerkesztés]]<sourceName>>>>>> (#sourcename) - az adatforrás neve változó. Ez az a neve, hogyERDDAP™az adatforrásból származó adatok kérésekor fog használni. Ez az a neve, hogyERDDAP™megkeresi, hogy az adatok visszatérnek az adatforrásból. Ez érzékeny. Ez REQUIRED.
Csoportok
CF hozzáadott támogatást csoportok CF v1.8. Kezdve ~2020-ban,NetCDFolyan eszközök, amelyek a változókat csoportokba helyezik egy.ncfájl. A gyakorlatban ez csak azt jelenti, hogy a változóknak hosszú neve van, amely azonosítja a csoportot (s) és a változó név, például a csoport1a/group2c/varName).ERDDAP™támogatja a csoportokat azáltal, hogy átalakítja a "/" változóban<sourceName> "\_" a változóban<destinationName> például csoport1a\_group2c\_varName. (Ha ezt látod, akkor rá kell jönnöd, hogy a csoportok nem sokkal többek, mint egy szintaxi egyezmény.) Amikor a változók szerepelnekERDDAP™A csoport összes változója együtt fog megjelenni, az alapul szolgáló csoportot.\[HaERDDAP™, nevezetesen GenerateDatasets Xml, nem teljesít, valamint olyan forrásfájlokkal, amelyek csoportokkal rendelkeznek, kérjük, küldjön egy mintafájlt Chrisnek. John at noaa.gov.\]
EDDTableFromFiles adatkészletek használhat néhány speciálisan kódolt, pseudosourceNameaz új adatok változóinak meghatározása, például, hogy elősegítse a globális tulajdonságot, hogy az adat változó legyen. Lásdez a dokumentáció...
HDFStruktúrák
KezdőlapERDDAP™v2.12,EDDGridFromNcFiles ésEDDGridFromNcFiles A nem csomagolt adatok a "struktúrákból" olvashatók.nc4 és.hdf4 fájl. A változó azonosítása, amely egy szerkezetből származik,<sourceName> > > > használja a formátumot: fullstructureName | tagName Például a csoport1/myStruct|myMember.
Fix érték ForrásNames
Egy EDDTable adatkészletben, ha változót szeretne létrehozni (egyetlen, rögzített értékkel) ez nem a forrásadatlapban, használat:
<sourceName>=*fixedValue*</sourceName>
A kezdeti egyenlő jelmondásERDDAP™egy rögzített Az érték követni fog.
- A numerikus változók esetében a rögzített értéknek egyetlen véges értéknek vagy NaN-nek kell lennie (esetérzékeny, pl.: \=NaN) ...
- A változók megerősítéséhez a rögzített értéknek egyedülállónak kell lennie,JSON stílusú sztring (speciális karakterekkel elmenekült \ karakterekkel) , pl. \="My "Különleges " String"
- Egyszerre változó, meghatározza a rögzített érték, mint szám a"seconds since 1970-01-01T00:00:00Z"Használat egység = másodpercek 1970-01-01T00:00Z óta.
A többi címke a<dataVariable> úgy működik, mintha ez rendszeres változó lenne. Például, hogy hozzon létre egy változó úgynevezett magasság egy fix érték 0,0 (Float) Használat:
<sourceName>=0</sourceName>
<destinationName\>altitude</destinationName>
<dataType>float</dataType>
Szokatlan helyzetek esetén még egyet is meghatározhatactual\_rangeaddAttribute, amely felülírja a célértékeketMin és a rendeltetésiMax (amely egyébként egyenlő lenne a rögzített Érték) ...
Script SourceNames / Adott változók
KezdőlapERDDAP™v2.10, egyEDDTableFromFiles,EDDTableFromDatabasevagyEDDTableFromFileNamesadatkészlet,<sourceName> lehet kifejezés (egy egyenlet, amely egy értékre értékeli) , a formátum használatával
<sourceName>=*expression*</sourceName>
vagy script (olyan nyilatkozatok sorozata, amelyek egyetlen értéket hoznak vissza) , a formátum használatával
<sourceName>=*script*</sourceName>
ERDDAP™támaszkodik aApache projektje JavaKifejezési nyelv (JEXL) (licenc:Apache) a kifejezések értékelése és a szövegek futtatása. Az adott új változó számítása az eredmények egy sorában történik, ismételten minden sorban. A kifejezések és írások egyJavaésJavaScript-szerű szintax, és bármelyiket használhat üzemeltetők és módszerek, amelyeket a JEXL-be építettek... A forgatókönyvek is használhatnak módszereket (funkciók) ezekből az osztályokból:
- Naptár2, amely egy roncs néhány statisztikai, idő- és naptári-hoz kapcsolódó módszerek com.cohort.util.Calendar2 (licenc) ... Például, Calendar2.parseToEpochSeconds ( forrásTime, dátum TimeFormat ) elválasztja a forrást Idő sztring a dátumTimeFormat sztring és visszatér"seconds since 1970-01-01T00:00:00Z" (EpochSeconds) kettős érték.
- Math, ami egy roncs szinte az összes statikus, matematikai módszerekjava.lang. Math... Például Math.atan2 ( y, x ) tőkés koordinátákban vesz részt (y, x) és visszatér a poláris koordináták (egy sor dupla kettős\[R, Theta\]) ...
- Math2, amely egy roncs szinte az összes statikus, matematikai-hoz kapcsolódó módszerek com.cohort.util. Math2 (licenc) ... Például, Math2.roundTo ( d, nPlaces ) d-t fog kerekíteni a meghatározott számjegyek számához a döntő ponthoz.
- String, amely hozzáférést biztosít az összes statikus, String-related módszerhezjava.lang. Hírek... String tárgyak aERDDAP™kifejezések és forgatókönyvek bármelyik társultJavaa java.langban leírt módszerek. Húr dokumentáció. Például String.valueOf (d)) átalakítja a kettős érték d egy String (bár használhatja a "+d"-t is) ...
- String2, amely a legtöbb statikus, String- és tömörítő módszert a com.cohort.util.String2-ben (licenc) ... Például String2.zeroPad ( szám, nDigits ) 0-ot hozzáad a String szám baljára, hogy a számjegyek teljes száma nDigits (pl.: String2.zeroPad ("6", 2) visszatér a "06") ...
- sor, amely nem statikus módszerekkel rendelkezik az adatokhoz való hozzáféréshez a forrásadattáblá jelenlegi sorában lévő különböző oszlopokból. Például row.columnString ("év") olvassa el az értéket az "év" oszlopból, mint egy String, míg row.column Int ("év") elolvassa az értéket az "év" oszlopból, mint egy integrál.
Biztonsági okokból a kifejezések és írások nem használhatnak más osztályokat, mint a 6.ERDDAP™e korlátozás végrehajtása az alapértelmezett feketelist létrehozásával (melyik feketelisták minden osztályt) Ezután egy fehérlistát (amely kifejezetten lehetővé teszi a fent leírt 6 osztályt) ... Ha más módszerekre és / vagy más osztályokra van szüksége a munkádhoz, kérjük, küldje el a Chris iránti kérelmet. John at noaa.gov.
Hatékonyság
Az EDDTableFromFiles adatkészletek esetében csak nagyon-nagyon minimális (valószínűleg nem észrevehető) lassulás az ezekből a változókból származó adatok kérésére. Az EDDTableFromDatabase esetében hatalmas sebesség büntetés van azoknak a kéréseknek, amelyek magukban foglalják ezeket a változókat (pl.: &longitude0360>30 &longitude0360<40) mivel a korlátozásokat nem lehet átadni az adatbázisba, így az adatbázisnak sokkal több adatot kell visszaadniaERDDAP™ (ami nagyon időigényes) hogyERDDAP™létrehozhatja az új változót, és alkalmazhatja a korlátozást. A legrosszabb eset elkerülése (ahol nincsenek korlátozások az adatbázisba kerülnek) ,ERDDAP™hibaüzenetet dob, hogy az adatbázisnak nem kell visszaadnia az asztal teljes tartalmát. (Ha ezt el akarod kerülni, add hozzá a korlátot egy nem-script oszlophoz, amely mindig igaz, pl.<3000-01-01.) Emiatt az EDDTableFromDatabase-val valószínűleg mindig jobb létrehozni egy bevezetett oszlopot az adatbázisban, nem pedig használni.sourceName= forgatókönyvERDDAP...
Áttekintés Hogyan Egy Kifejezés (Vagy Script) Használt:
Válaszul a felhasználó tambuláris adatok kérésére,ERDDAP™adatokat kap egy sor forrásfájlból. Minden forrásfájl létrehoz egy nyers táblát (Egyenesen a forrásból) adatok.ERDDAP™Ezután menjen át a nyers adatok tábláján, sorban sorban, és értékelje a kifejezést vagy a forgatókönyvet minden sorban, hogy létrehozzon egy új oszlopot, amely rendelkezik ezzel a kifejezéssel vagy forgatókönyvvel, mint egysourceName...
GenerateDatasetsXml
Megjegyzés: GenerateDatasets Az Xml teljesen tisztában van azzal, hogy szükség van egy változó létrehozására<sourceName>= kifejezés </sourceName>. Meg kell hozni a változótdatasets.xmlkézzel.
Kifejezési példa:
Íme néhány teljes példa az adatok változóira, amelyek kifejezést használnak az új adatoszlop létrehozásához. Arra számítunk, hogy ezek a példák (változataik) lefedi az összes kifejezés használatának 95%-átsourceNameS.
A különálló „dátum” és"time"oszlopok egy egységes időoszlopba:
<dataVariable>
<sourceName>=Calendar2.parseToEpochSeconds(row.columnString("date") + "T" +
row.columnString("time") + "Z", "yyyy-MM-dd'T'HH:mm:ss'Z'")</sourceName>
<destinationName>time</destinationName>
<dataType>double</dataType>
<addAttributes>
<att name="units">seconds since 1970-01-01</att>
</addAttributes>
</dataVariable>
AzsourceNameA kifejezés új"time"oszlop azáltal, hogy a String értékeket a "dátum" (yyyy-MM-dd) és"time" (HH:mm:ss) oszlopok a forrásfájl minden során, és azáltal, hogy átalakítja ezt a sztringet"seconds since 1970-01-01" (EpochSeconds) kettős érték.
Vagy természetesen meg kell testreszabni az idő formátumot, hogy kezelje a konkrét formátumot minden adatkészlet forrás dátuma és idő oszlopok, lásd idő egység dokumentáció...
Technikailag nem kell használni Calendar2.parseToEpochSeconds () átalakítani a kombinált dátum + idő epochSeconds. Csak átadhatja a dátumot+time StringERDDAP™és adja meg a formátumot (pl. yyyy-MM-dd"T'H:mm:ss'Z") az egységeken keresztül. De jelentős előnyökkel jár az epochSeconds-ra való áttérés - nevezetesen az EDDTableFromFiles könnyedén nyomon követheti az időértékek számát minden fájlban, és olyan gyorsan eldöntheti, hogy egy adott fájlban keres-e, amikor válaszol egy kérésre, amely időkorlátokkal rendelkezik.
A kapcsolódó probléma az, hogy egységes dátum + idő oszlopot kell létrehozni egy külön év, hónap, dátum, óra, perc, második forrásból. A megoldás nagyon hasonló, de gyakran kell nulla-pad sok mező, így például hónap (1 - 12) dátum (1 - 31) Mindig van 2 számjegy. Íme egy példa az évre, hónapra, dátumra:
<sourceName>=Calendar2.parseToEpochSeconds(row.columnString("year") +
String2.zeroPad(row.columnString("month"), 2) +
String2.zeroPad(row.columnString("date"), 2), "yyyyMMdd")</sourceName>
A kapcsolódó probléma az, hogy létre kell hozni egy egységes magassági vagy hosszúsági oszlopot azáltal, hogy kombinálja az adatokat a forrástáblázat külön fokozataiban, perceiben és másodpercek oszlopaiban, mindegyik integrálként tárolva. Például,
<sourceName>=row.columnInt("deg") + row.columnInt("min")/60.0 +
row.columnInt("sec")/3660.0</sourceName>
Konvertáljon egy "lon" nevű oszlopot, amelynek hosszúsági értékei 0 - 360° -ról egy "hosszúság" nevű oszlopra, -180 - 180° értékkel
<dataVariable>
<sourceName>=Math2.anglePM180(row.columnDouble("lon"))</sourceName>
<destinationName>longitude</destinationName>
<dataType>double</dataType>
<addAttributes>
<att name="units">degrees\\_east</att>
</addAttributes>
</dataVariable>
AzsourceNameA kifejezés egy új "hosszúság" oszlopot hoz létre, amely a "lon" oszlop kettős értéket alakítja át a forrásfájl minden során (feltehetően 0 - 360 értékkel) , és átalakítva ezt egy 180-180 kettős értékre.
Ha inkább a források hosszúsági értékeit szeretné átalakítani -180 - 180° 0 - 360°, használja
<sourceName>=Math2.angle0360(row.columnDouble("lon"))</sourceName>
A két hosszúsági változó megnevezése: Ha az adatkészlet 2 hosszúsági változóval rendelkezik, javasoljuk, hogy használjadestinationName= hossza a -180 - 180° változó ésdestinationName=hosszúság0360 (Hosszúság (cm) 360°) 0 - 360° változó. Ez azért fontos, mert a felhasználók néha Advanced Search-ot használnak az adatok kereséséhez egy adott hosszúsági tartományon belül. Ez a keresés jobb lesz, ha a hosszúság konzisztensen -180 - 180° értékű minden adatkészlet számára. Továbbá az adatkészlet geospatial\_lon\_min, geospatial\_lon\_max, Westernmost\_Easting és Easternmost\_Eastings globális tulajdonságai következetes módon lesznek meghatározva (hosszúsági értékek -180-180°) ;
A "tempF" nevű oszlop átalakítása a hőmérsékleti értékekkel a \_ F egy "tempC" nevű oszlopba, a hőmérsékletekkel fokozatosan\_ C:
<dataVariable>
<sourceName>=(row.columnFloat("tempF")-32)\\*5/9</sourceName>
<destinationName>tempC</destinationName>
<dataType>float</dataType>
<addAttributes>
<att name="units">degrees\\_C</att>
</addAttributes>
</dataVariable>
AzsourceNamea kifejezés új "tempC" oszlopot hoz létre a float fokozat átalakításával F érték a "tempF" oszlopból a forrásfájl minden során egy float fokozatba C érték.
Vegye figyelembe, hogy az adatkészlet mind az eredeti tempóval rendelkezhet F változó és az új tempó C változó, ha egy másik változó
<sourceName>tempF</sourceName>
A szél "sebességű" és "irányítás" átalakítása két oszlopba kerül az u,v komponensekkel
- Használjon változót, használjon
<sourceName>=row.columnFloat("speed") \\* Math.cos(row.columnFloat("direction"))</sourceName>
- Változékony, használható
<sourceName>=row.columnFloat("speed") \\* Math.sin(row.columnFloat("direction"))</sourceName>
Vagy adott u,v:
- A sebesség változó, használat
<sourceName>=Math.atan2(row.columnDouble("v"), row.columnDouble("u"))\\[0\\]</sourceName>
- Ahhoz, hogy egy irány változó, használja
<sourceName>=Math.toDegrees(Math.atan2(row.columnDouble("v"), row.columnDouble("u"))\\[1\\])</sourceName>
Script Példa:
Íme egy példa egy forgatókönyv használatára, nem csak egy kifejezésre, mint egysourceName... Azt várjuk, hogy a szkriptek, szemben a kifejezésekkel, nem lesz szükség gyakran. Ebben az esetben a cél az, hogy visszatérjen egy non-NaN hiányzó érték (-99) a hőmérsékleti értékek egy adott tartományon kívül. Ne feledje, hogy a forgatókönyv a "=" utáni rész.
<dataVariable>
<sourceName>=var tc=row.columnFloat("tempC"); return tc>35 || tc<-5? -99.0f : tc\\*9/5+32;</sourceName>
<destinationName>tempF</destinationName>
<dataType>float</dataType>
<addAttributes>
<att name="units">degrees\\_F</att>
</addAttributes>
</dataVariable>
Hard Flag
Ha megváltoztatja a kifejezést vagy a forgatókönyvet, amelyet egysourceNameBe kell állítanod egykemény zászlóaz adatkészlethez, ígyERDDAP™törli az összes csípett információt az adatkészlethez, és újraolvas minden adatfájlot (az új kifejezés vagy szöveg használata) a következő alkalommal tölti be az adatkészletet. Alternatívaként használhatjaDasDdsamely egyenértékű egy kemény zászló beállításával.
százalékkód
Ez csak ritkán releváns: Mert a kifejezések és a forgatókönyvek be vannak írvadatasets.xml, ami egy XML-dokumentum, akkor százalékos kódolás minden<, \> és karakterek a kifejezésekben és szövegekben, mint<, és gt; és &
Gyakori problémák
A közös probléma az, hogy változót hoz létresourceName= kifejezés De az elért adatok oszlopa csak hiányzó értékekkel rendelkezik. Alternatívaként az új oszlop néhány sorának hiányzó értékei vannak, és úgy gondolja, hogy nem szabad. A mögöttes probléma az, hogy valami rossz a kifejezéssel ésERDDAPEz a hiba egy hiányzó értékbe konvertálódik. A probléma megoldásához,
- Nézd meg a kifejezést, hogy lásd, mi lehet a probléma.
- NézzetekLog.txt, amely megmutatja az első hibaüzenetet, amely az egyes új oszlopok létrehozása során keletkezett.
A közös okok:
- A rossz esetet használta. A kifejezések és a szkriptek érzékenyek.
- Elhagyta az osztály nevét. Például a Math.abs-t kell használnia () Nem csak abs () ...
- Nem csináltatok típuskonverziókat. Például, ha egy paraméter érték adattípusa String, és kettős értéke van, meg kell alakítani egy kettőt egy String-on keresztül "+d.
- A kifejezés oszlop neve nem pontosan illeszkedik az oszlop neve a fájlban (vagy a név más lehet egyes fájlokban) ...
- Van egy szintax hiba a kifejezésben (pl. hiányzó vagy extra ") ").
Ha elakad, vagy segítségre van szüksége, Kérjük a részleteket, és lásd a mirész további támogatás megszerzéséről...
<destinationNameGt;
- [[szerkesztés]]<destinationName>>>>>> (#destinationname) - a változó neve, amelyet bemutatnak és használnakERDDAP™felhasználók.
- Ez a TIONAL. Ha hiányzik,sourceNamehasználják.
- Ez azért hasznos, mert lehetővé teszi, hogy megváltoztassa a kriptográfiai vagy furcsasourceName...
- destinationNameérzékeny.
- destinationNameS MUST kezd egy levelet (A-Z, a-z) és követni kell 0 vagy több karaktert (A-Z, a-z, 0-9 és \_) ... ("-" megengedték korábbanERDDAP™1.10 verzió.) Ez a korlátozás lehetővé teszi, hogy az adatok változó nevei azonosak legyenekERDDAP™, a válaszfájlokban és az összes olyan szoftverben, ahol ezeket a fájlokat fogják használni, beleértve a programozási nyelveket is (mintPython,MatlabésJavaSzövegek) ahol hasonló korlátozások vannak a változó nevekre.
- EDDTable adatkészletekben,Hosszúság, magasság, magasság (vagy mélység) és időAz adatok változói különlegesek.
<adatok Type & gt;
- [[szerkesztés]]<adatType>] (#datatype) - meghatározza a forrásból származó adattípust. (Bizonyos esetekben például az ASCII fájlokból származó adatok olvasásakor meghatározza, hogy a forrásból származó adatokat hogyan kell tárolni.)
- Ezt néhány adathalmaz típusa és mások által támasztott. Adattípusok, amelyek ezt megkövetelik a sajátjuk számáradataVariableS:EDDGridFromXxxFiles, EDDTableFromXxFiles, EDDTableFromMWFSEDDTableFromNOS, EDDTableFromSOS... Más adatkészlettípusok figyelmen kívül hagyják ezt a címkét, mert megkapják az információkat a forrásból.
- Az értékek bármelyike a szabványnakERDDAP™adattípusokplusz boolean (lásd alább) ... Az adattípus nevek esetérzékenyek.
boolean adatok
- "boolean"különleges eset.
- Internally,ERDDAP™nem támogatja a boolean típust, mert a booleanok nem tárolhatják a hiányzó értékeket, és a legtöbb fájltípus nem támogatja a booleanokat. SzinténDAPnem támogatja a booleanokat, így nem lenne szabványos módja a boolean változók lekérdezésének.
- "boolean" specifikálása az adatokhoz típusdatasets.xmlboolean értékeket kell tárolni és képviselni, mint bytes: 0=hamis, 1=igaz, 127=missing\_value...
- A felhasználók korlátozódhatnak a számértékek használatával (Például: "isAlive=1") ...
- ERDDAP™Az adminisztrátoroknak néha használniuk kell a "boolean" adatokat típusdatasets.xmlMondd elERDDAP™hogyan kell kölcsönhatásba lépni az adatforrással (pl. a boolean értékek elolvasása a kapcsolati adatbázisból, és 0, 1 vagy 127-re átalakítja őket) ...
- Ha szeretné megváltoztatni az adat változót az adattípustól a forrásfájlokban (például rövid) más adatokba Típus az adatkészletben (például int) Ne használj<adatType> megadni, amit akar. (Néhány adatkészlet esetében működik, de nem mások.) Ehelyett:
- Használat<adatType> megadni, mi van a fájlokban (például rövid) ...
- A<addAttributes> a változó, add hozzá egyscale\_factoraz új adatok tulajdonításához típus (például int) és az 1 érték, például
<att name="scale\\_factor" type="int">1</att>
dataVariable <addAttributes>
- [[szerkesztés]]<addAttributes>>>>>> (# változó-addattributes) - meghatározza egy sor tulajdonságot ( név = érték ) amely hozzáadódik a forrás tulajdonságaihoz egy változó, hogy a kombinált tulajdonságok változó. Ez a TIONAL. Ha a változóForrás: Forrásvagy<addAttributes> beleértvescale\_factorvagyadd\_offsetattribútumok, értékeiket fogják használni, hogy kicsomagolja az adatokat a forrásból, mielőtt elosztják az ügyfélt. A nem csomagolt változó ugyanazon adattípus lesz (Például, float) mintscale\_factorésadd\_offsetértékek.
Variable<addAttributes>
-
[[szerkesztés]] ** Változatos tulajdonságok / változó<addAttributes> > > > ** ] (# változó-addattributes) -<addAttributes> egy OPTIONAL tag egy<axisVariable> vagy<dataVariable> címke, amelyet a változó tulajdonságainak megváltoztatására használnak.
-
** Használjon egy változót<addAttributes> megváltoztatni a változó tulajdonságait. ** ERDDAP™egyesíti a változó tulajdonságait az adatkészlet forrásából (** Forrás: Forrás ) és a változó addAttributes amit ti definiáltokdatasets.xml (amelyek prioritást élveznek) a változó " kombinált tulajdonságok ** „Az, amik azok,ERDDAP™A felhasználók látják. Így használhatóaddAttributesa forrásAttributes értékeinek újraértékelése, új tulajdonságok hozzáadása vagy a tulajdonságok eltávolítása.
-
Lásd: ** <addAttributes> > > > információ] (#addattributes) amely a globális és változóra vonatkozik <addAttributes> > > > ** ...
-
ERDDAP™keresi és használja ezeket a tulajdonságokat különböző módon. Például a színBar értékek szükségesek ahhoz, hogy a változó elérhetővé váljanakWMS, hogy a térképek következetes színBars.
-
A hosszúság, a magasság, a magasság (vagy mélység) és az idő változóksok megfelelő metaadat automatikusan (például,egység) ...
-
Egy minta<addAttributes> az adatok változója:
<addAttributes>
<att name="actual\_range" type="doubleList">10.34 23.91</att>
<att name="colorBarMinimum" type="double">0</att>
<att name="colorBarMaximum" type="double">32</att>
<att name="ioos\_category">Temperature</att>
<att name="long\_name">Sea Surface Temperature</att>
<att name="numberOfObservations" />
<att name="units">degree\_C</att>
</addAttributes> -
Az üres számOfObservations tulajdonsága okozza a forrás számOfObservations tulajdonsága (ha valaki) eltávolítani a végső, kombinált tulajdonságok listájáról.
- Ezen információk ellátása segítERDDAP™jobb munkát végezzen, és segít a felhasználóknak megérteni az adatkészleteket. A jó metaadata felhasználható adatkészletet készít. Az elégtelen metaadata haszontalanná teszi az adatkészletet. Kérjük, vegye be az időt, hogy jó munkát végezzen a metaadat tulajdonságokkal.
Megjegyzések a változó tulajdonságokról, amelyek különlegesekERDDAP:
actual\_range
- actual\_range a RECOMMENDED változó tulajdonsága. Például,
<att name="actual\_range" type="floatList"\>0.17 23.58</att>
- Ez a tulajdonság aCDCCOARDSésCF 1.7+metadata szabványok.
- Ha jelen van, akkor lehet egy sor két értéke ugyanazon adattípus, mint a rendeltetési adatok típusa változó, meghatározva a tényleges (nem elméleti vagy megengedett) az ilyen változó adatok minimális és maximális értékei.
- Ha az adatok tele vannakscale\_factorvagyadd\_offset,actual\_rangekicsomagolt értékekkel kell rendelkeznie, és ugyanolyan adattípusúnak kell lennie, mint a nem csomagolt értékek.
- Néhány adatforráshoz (Például minden EDDTableFrom... Files adatkészletek) ,ERDDAP™határozza megactual\_rangeminden változó és beállítjaactual\_rangetulajdonság. Más adatforrásokkal (például kapcsolati adatbázisok, Cassandra,DAPPER,Hyrax) , lehet, hogy nehéz vagy terhelő a forrás, hogy kiszámítsa a tartomány, ígyERDDAP™nem kéri. Ebben az esetben a legjobb, ha beállíthatjaactual\_range (különösen a hosszúság, a szélesség, a magasság, a mélység és az idő változói) hozzáadásával egyactual\_rangeminden változónak tulajdonítva [<addAttributes>>>>>> (#addattributes) ez az adatkészletdatasets.xmlPéldául,
<att name="actual\_range" type="doubleList"\>-180 180</att>
- numerikusIdő és időbélyegző változókA megadott értékeknek a megfelelő forrásnak kell lenniük (nem rendeltetés) numerikus értékek. Például, ha a forrásidő értékeit "napként 1985-01-01" tárolják, akkor aactual\_rangeMeg kell határozni a "napok óta 1985-01-01". És ha azt szeretné, hogy hivatkozzon a MOST, mint a második értéke a közeli valós idejű adatok, hogy rendszeresen frissítik, akkor használja NaN . Például, hogy megadja az 1985-01-17-es adattartományt, amíg nem, használjon
<att name="actual\_range" type="doubleList"\>16 NaN</att>
- Haactual\_rangeIsmert (vagyERDDAP™kiszámítása, vagy ha hozzáadja azt keresztül<addAttributes>),ERDDAP™megjeleníti a felhasználónak az adathozzáférési formában ( datasetID .html) Készítsen egy Graph weboldalt ( datasetID .gráf) az adatkészlet és használja az FGDC és az ISO 19115 metaadatok generálásakor. Az utolsó 7 napos időactual\_rangeaz alapértelmezett idő alkészletként használják.
- Haactual\_rangeIsmert, a felhasználók használhatják ab) () és max () funkciókkérések esetén, ami gyakran nagyon hasznos.
- Minden EDDTable... adatkészletek, haactual\_rangeIsmert (vagy megadja, vagyERDDAP™kiszámítása) ,ERDDAP™képesek lesznek gyorsan elutasítani az adott tartományon kívüli adatok iránti kérelmeket. Például, ha az adatkészlet legalacsonyabb időértéke megfelel az 1985-01-17-nek, akkor az 1985-01-01-től 1985-01-16-ig terjedő összes adatkérelmet azonnal elutasítják az „A lekérdezés nem hozott megfelelő eredményeket.” Ez tesziactual\_rangeegy nagyon fontos metaadata, mivel megmenthetiERDDAP™sok erőfeszítést és sok időt takarít meg a felhasználónak. És ez kiemeli, hogy aactual\_rangeaz értékek nem szűkebbek, mint az adatok tényleges tartománya; különbenERDDAP™téves mondás "Nincs megfelelő adat", ha valójában releváns adatok vannak.
- Amikor egy felhasználó kiválaszt egy adatkészletet, és olyan fájltípust kér, amely magában foglalja a metaadatot (például,.nc) ,ERDDAP™Módosításactual\_rangea válaszfájlban, hogy tükrözze az alkészlet tartományát.
- Lásd mégdata\_minésdata\_max, amelyek alternatív módja annak, hogy meghatározza aactual\_range... Azonban ezek most eltökéltek, hogyactual\_rangea CF 1.7+.
Color Bar tulajdonságok
Számos OPTIONAL változó tulajdonság létezik, amelyek meghatározzák a javasolt alapértelmezett tulajdonságokat egy színes bár számára (az adatértékek konvertálása a színekbe a képeken) ehhez a változóhoz.
-
Ha jelen van, ezt az információt a griddap éstabledapAmikor olyan képet kér, amely színes bárot használ.
-
Például, ha a szélességi hálós adatok egy térképen lefedettségként kerülnek elhelyezésre, a színes bár meghatározza, hogy az adatértékek hogyan alakíthatók át a színekre.
-
Ezeknek az értékeknek köszönhetően lehetővé válikERDDAP™olyan képek létrehozása, amelyek konzisztens színvonalat használnak különböző kéréseken keresztül, még akkor is, ha az idő vagy más dimenzió értékek változnak.
-
Ezeket a tulajdonságneveket a használatra hozták létreERDDAP... Ezek nem egy metaadat szabványból származnak.
-
A színes bárhoz kapcsolódó tulajdonságok:
-
colorBarMinimum meghatározza a minimális értéket a színBar. Például,
<att name="colorBarMinimum" type="double"\>-5</att>
- Ha az adatok tele vannakscale\_factorvagyadd\_offsetAdja meg acolorBarMinimumnem csomagolt értékként.
- Az adatérték alacsonyabb, mintcolorBarMinimumugyanaz a szín képviseli, mintcolorBarMinimumértékek.
- A tulajdonságnak kell lennieType="double"az adatváltozat típusától függetlenül.
- Az érték általában egy szép körszám.
- Legjobb gyakorlatok: Javasoljuk, hogy az érték valamivel magasabb legyen, mint a minimális adatérték.
- Nincs alapértelmezett érték.
-
-
colorBarMaximum meghatározza a színesBar maximális értéket. Például,
<att name="colorBarMaximum" type="double"\>5</att>
- Ha az adatok tele vannakscale\_factorvagyadd\_offsetAdja meg acolorBarMinimumnem csomagolt értékként.
- Adatértékek magasabbak, mintcolorBarMaximumugyanaz a szín képviseli, mintcolorBarMaximumértékek.
- A tulajdonságnak kell lennieType="double"az adatváltozat típusától függetlenül.
- Az érték általában egy szép körszám.
- Legjobb gyakorlatok: Javasoljuk, hogy az érték valamivel alacsonyabb legyen, mint a maximális adatérték.
- Nincs alapértelmezett érték.
- szín BarPalette meghatározza a palettát a színBar számára. Például,
<att name="colorBarPalette">WhiteRedBlack</att>
- MindenERDDAP™a telepítések támogatják ezeket a szabványos palettákat: BlackBlueWhite, BlackRedWhite, BlackWhite, BlueWhiteRed, LightRainbow, Ocean, OceanDepth, Rainbow, RedWhiteBlue, ReverseRainbow, Topography, TopographyDepth\[hozzáadott v1.74\]WhiteBlack, WhiteBlueBlack és WhiteRedBlack.
- Ha telepítetttovábbi palettákÖn egyikükre hivatkozhat.
- Ha ez a tulajdonság nem jelenik meg, az alapértelmezett BlueWhiteRed, ha \-1\*colorBarMinimum=colorBarMaximumegyébként az alapértelmezés Rainbow.
- színesBarScale meghatározza a színesBar méretét. Például,
<att name="colorBarScale">Log</att>
- Az értékek a lineárisak és a Log.
- Ha az érték a Log,colorBarMinimumnagyobbnak kell lennie, mint 0.
- Ha ez a tulajdonság nem jelenik meg, az alapértelmezett a Linear.
- szín BarContinuous meghatározza, hogy a színBar folyamatos színpaletta-e, vagy hogy a színBarnak van-e néhány diszkrét színe. Például,
<att name="colorBarContinuous">false</att>
- Az értékes értékek igazak és hamisak.
- Ha ez a tulajdonság nem jelenik meg, az alapértelmezés igaz.
- színBarNSections meghatározza az alap értelmezett számát a színBar. Például,
<att name="colorBarNSections" type="int">6</att>
- Az értékek pozitív integrációk.
- Ha ez a tulajdonság nem jelenik meg, az alapértelmezett \-1, ami azt mondjaERDDAP™a színesBar tartományán alapuló szakaszok számának kiválasztása.
WMS
A változó fő követelményei, amelyek elérhetőek aERDDAPAWMSszerver:
- Az adatkészletnek kell lennieEDDGrid... adatkészlet.
- Az adatok változó MUST lehet egy rácsos változó.
- Az adatok változó MUST van hosszúságú és szélességi tengely változók. (Más tengelyváltozatok a TIONAL.)
- Van valami hosszúsági érték -180 és 180 között.
- AcolorBarMinimuméscolorBarMaximumaz MUST tulajdonságait meg kell határozni. (M ás színes bár tulajdonságok OPTIONAL.)
data\_minésdata\_max
-
data\_min és data\_max - Ezek a világ Ocean Circulation Experimentben meghatározott változó tulajdonságok (WOCE) metadata leírás. Például,
<att name="data\_min" type="float"\>0.17</att>
<att name="data\_max" type="float"\>23.58</att>- Javasoljuk, hogy használjaactual\_rangehelyettedata\_minésdata\_maxmertactual\_rangemost a CF specifikációja határozza meg.
- Ha jelen van, ugyanazon adattípusnak kell lennie, mint a változó céladattípusnak, és meghatározza a tényleges (nem elméleti vagy megengedett) az ilyen változó adatok minimális és maximális értékei.
- Ha az adatok tele vannakscale\_factorvagyadd\_offset,data\_minésdata\_maxkicsomagolt értékeknek kell lenniük a csomagolatlan adattípus használatával.
változódrawLandMask
- drawLandMask - Ez egy OPTIONAL változó tulajdonság, amelyet aERDDAP™ (és nem metadata szabványok) amely meghatározza a "Draw Land Mask" alapértelmezett értéket az adatkészlet Make A Graph formanyomtatványán ( datasetID .gráf) és a &.land paraméter egy URL-ben, amely az adatok térképét kéri. Például,
<att name="drawLandMask">under</att>
Lásd:drawLandMaskÁttekintés...
kódolás
- \_Encoding
- Ez a tulajdonság csak String változókkal használható.
- Ez a tulajdonság erősen ajánlott.
- Ez a tulajdonság aNetCDFFelhasználói útmutató (NUG) ...
- Internally belülERDDAP™, Strings egy sor 2 fehér karakter, hogy használja aUnicode UCS-2 karakterkészlet...
- Számos fájl csak 1 fehér karaktert támogat a Strings-ben, és ezért szükség van erre a tulajdonságra, hogy azonosítsa a kapcsolódó Charset (AKA kódoldal) amely meghatározza, hogyan térképezze fel a 256 lehetséges értékeket egy 256 karakterből álló karakterből és / vagy a kódolási rendszerből, példáulUTF-8 (amely 1 és 4 byte karakterenkénti) ...
- Az értékek a \_Encoding esetében érzékenyek.
- Elméletben,ERDDAP™támogathatná a \_Encoding azonosítókatIANA listaDe a gyakorlatban,ERDDAP™Jelenleg csak támogatások
- ISO-8859-1 (jegyezze meg, hogy dashes, nem alscores) , amely előnye, hogy azonos az első 256 karakter Unicode, és
- UTF-8.
- A forrásfájlok olvasásakor az alapértelmezett érték az ISO-8859-1, kivéve a netcdf-4 fájlokat, ahol az alapértelmezett UTF-8.
- Ez egy folyamatban lévő gondos probléma, mert sok forrásfájl olyan charseteket vagy kódolásokat használ, amelyek különböznek az ISO-8859-1-től, de nem azonosítják a charset-et vagy kódolást. Például számos forrásadatfájlnak van néhány metaadata másolta és pazarolta a Microsoft Word-t a Windows-on, így fancy hyphens és apostrophes a Windows-specifikus charset helyett az ASCII hyphens és az apostrophes. Ezek a karakterek aztán furcsa karakterként vagy "?"-ként jelennek megERDDAP...
AccessBaseUrl
- AccessBaseUrlfájl AccessSuffix Nagyon ritkán használják azokat a tulajdonságokat, amelyek nem bármilyen szabványból származnak. Ha egy EDDTable oszlop rendelkezik a webes hozzáférhető fájlok fájlneveivel (pl. kép, videó vagy audio fájlok) Hozzáadhat
<att name="fileAccessBaseUrl">*someBaseURL*</a>
a bázis URL megadásához (befejezés /) szükséges, hogy a fájlnév teljes URL-ek. Szokatlan esetekben, például amikor egy oszlop hivatkozik a .png fájlokra, de az értékek hiányoznak ".png", hozzáadhatja
<att name="fileAccessSuffix">*someSuffix*</a>
(például<att name="fileAccessSuffix">.png</a>) megadni egy kelléket, hogy a fájlnév teljes URL-be kerüljön. Aztán.htmlTableválaszok,ERDDAP™megjeleníti a fájlnév, mint a teljes URL-hez való kapcsolódás (az alap Url plusz a fájlnév plusz a elegendő) ...
Ha akarodERDDAP™a kapcsolódó fájlok kiszolgálása, különEDDTableFromFileNamesadatkészlet ezekhez a fájlokhoz (lehet magán adatkészlet) ...
AccessArchive Url
- AccessArchive Url egy nagyon ritkán használt tulajdonság, amely nem bármilyen szabványból származik. Ha egy EDDTable oszlop rendelkezik a webes hozzáférhető fájlok fájlneveivel (pl. kép, videó vagy audio fájlok) amely egy archívumon keresztül elérhető (pl.:.zipfájl) hozzáférhető egy URL-en keresztül, használat<att name="fileAccessArchiveUrl" URL </att> megadni az URL-t az archívumnak.
Ha akarodERDDAP™hogy szolgálja az archív fájlt, készítsen különEDDTableFromFileNamesadatkészlet ehhez a fájlhoz (lehet magán adatkészlet) ...
ioos\_category
-
ioos\_category - Ez egy REQUIRED változó tulajdonság, ha<változókMustHaveIoosCategory> igaz (az alapértelmezett) bennesetup.xmlMáskülönben ez a TIONÁLIS. Például,<att name="ioos\_categorySalinitás</att> A kategóriák aNOAAIntegrált óceán megfigyelő rendszer (IOOS) ...
- (Írni ezt) Nem vagyunk tudatában ezeknek a neveknek a formális meghatározásainak.
- A fő nevek Zdenka Willis .ppt "Integrált Ocean Observing System (IOOS) NOAA"A kezdeti működési képesség létrehozásának megközelítése" ésUS IOOS Blueprint (oldal 1-5) ...
- Valószínű, hogy a listát a jövőben felül fogják vizsgálni. Ha van kérése, kérjük, e-mailben Chris. John at noaa.gov.
- ERDDAP™támogatja a kategóriák nagyobb listáját, mint az IOOS, mert a Bob Simons további neveket adott (főként tudományos területek nevein alapul, például Biológia, Ekológia, Meteorológia, Statisztika, Taxonómia) más típusú adatok esetében.
- A jelenlegi érvényes értékekERDDAP™Bathymetria, Biológia, alsó karakter, CO2, színes feloldott szerves anyag, szennyező anyagok, áramlók, feloldott tápanyagok, szétválasztott O2, ökológia, halak bőség, halak fluxus, hidrológia, jég elosztás, lakhely, meteorológia, optikai tulajdonságok, egyéb, pathogens, Phytoplankton Species, Pressure, Productivity, Minőség, Szalinitás, Level
- Van néhány átfedés és kétértelműség különböző kifejezések között - tedd a legjobbat.
- Ha hozzáadioos\_categorya listára<categoryAttributes> > > > benneERDDAPAsetup.xmlfájl, a felhasználók könnyen megtalálhatják az adatkészleteket hasonló adatokkalERDDAP"Search for Datasets by Kategória" a honlapon. Próbálja ki használniioos\_categoryaz érdeklődés adatkészleteinek keresése.
- Ott voltegy beszélgetésrőlERDDAP™ésioos\_categoryaERDDAP™Google Group.
Lehet, hogy kísértés van beállítva<változókMustHaveIoosCategory> hamis, hogy ez a tulajdonság nem szükséges. ("Pfft! Mi ez nekem?”) Néhány ok arra, hogy elhagyja azt igaznak (az alapértelmezett) Használatioos\_categorya következők:
- Ha a setup.xml<változókMustHaveIoosCategory> igaznak van állítva,GenerateDatasetsXmlmindig létrehozza/bocsát egyetioos\_categoryminden változó tulajdonsága minden új adatkészletben. Miért ne hagyja csak be?
- ERDDAP™lehetővé teszi a felhasználók számára, hogy kategória szerint keressék az érdeklődési eszközöket.ioos\_categoryegy nagyon hasznos keresési kategória, mert az ioos\_categories (például a hőmérséklet) meglehetősen szélesek. Ez tesziioos\_categorysokkal jobb erre a célra, mint például a sokkal finomabb CFstandard\_names (amelyek nem annyira jók erre a célra, mert az összes szinonimák és enyhe variációk, például a tenger\_surface\_temperature versus tenger\_water\_temperature) ... (Használásioos\_categoryerre a célra az ellenőrzése alatt áll<categoryAttributes> a setup.xml fájlban.) Próbálja ki használniioos\_categoryaz érdeklődés adatkészleteinek keresése.
- Ezek a kategóriákNOAAIntegrált óceán megfigyelő rendszer (IOOS) ... Ezek a kategóriák alapvető fontosságúak az IOOS küldetésének leírásához. Ha benne vagyNOAAtámogatásioos\_categoryjó Egy-egyNOAAdolgod. (Nézd meg eztEgyetlenNOAAvideóés légy inspiráló!) Ha Ön más amerikai vagy nemzetközi ügynökségben vagy kormányzati ügynökségekkel dolgozik, vagy más Ocean Observing System-rel dolgozik, nem jó ötlet együttműködni az Egyesült Államok IOOS irodájával?
- Előbb vagy utóbb, lehet, hogy mást akarszERDDAP™az adatkészletekhez való kapcsolódásEDDGridFromErdapésEDDTableFromErddap... Ha a másikERDDAP™követelményekioos\_categoryAz adatkészleteknek rendelkezniük kellioos\_categoryaEDDGridFromErddap és EDDTableFromErddap dolgozni.
- Ez pszichológiailag sokkal könnyebb bevonniioos\_categoryamikor létrehozod az adatkészletet (ez csak egy másik dolog, amitERDDAP™szükséges az adatkészlet hozzáadásáhozERDDAP) , mint hozzáadni a tény után (ha úgy döntött, hogy használja a jövőben) ...
long\_name
- long\_name (COARDS,CFésACDDmetadata szabványok) a RECOMMENDED változó tulajdonságaERDDAP... Például,
<att name="long\\_name">Eastward Sea Water Velocity</att>
- ERDDAP™Használja along\_namea grafikonok címkézésére.
- Legjobb gyakorlatok: Kapitalizálja a szavakat a szavakbanlong\_namemintha ez lenne egy cím (kapitalizálja az első szót és az összes nem ritka szót) ... Ne tartalmazza az egységeket along\_name... A hosszú név nem lehet nagyon hosszú (általában)<20 karakter), de le kell írni, mintdestinationName- ami gyakran nagyon tömör.
- Ha "long\_name"Nem definiálódik a változóbanForrás: Forrásvagy<addAttributes>,ERDDAP™létrehozza azt azáltal, hogy megtisztítja astandard\_name (ha jelen van) vagydestinationName...
missing\_value
- missing\_value és \_Töltés Érték (COARDSésCF) változó tulajdonságok, amelyek leírják a számot (például -9999) amelyet a hiányzó érték képviselésére használnak. Például,
<att name="missing\_value" type="double"\>-9999</att>
For String változók, az alapértelmezett mindketten "" (Az üres sztring) ... A numerikus változók esetében mindkét alapértelmezés a NaN.
- ERDDAP™mindkettő támogatásamissing\_valueés a \_FillValue, mivel egyes adatforrások kissé eltérő jelentéseket adnak nekik.
- Ha jelen van, ugyanolyan adattípusnak kell lenniük, mint a változó.
- Ha az adatok tele vannakscale\_factorvagyadd\_offsetAmissing\_valueA \_FillValue értékeket hasonlóképpen csomagolni kell. Hasonlóképpen, egy oszlopban a String dátum / idő értékek, hogy használja a helyitime\_zoneAmissing\_valueA \_FillValue értékeknek a helyi időzónát kell használniuk.
- Ha egy változó használja ezeket a különleges értékeket, amissing\_valueés/vagy a \_FillValue tulajdonságai REQUIRED.
- MertIdő és időbélyegző változók (hogy a forrás húr vagy numerikus) ,missing\_values és \_FillValues úgy tűnik, mint "" (Az üres sztring) Amikor az idő meg van írva, mint egy String, és mint NaN, amikor az idő meg van írva, mint egy kettős. A forrásértékek amissing\_value\_FillValue nem jelenik meg a változó metaadatában.
- A változók erősítése érdekében,ERDDAP™mindig megtérítmissing\_values vagy \_FillValue adatértékek "" (Az üres sztring) ... A forrásértékek amissing\_value\_FillValue nem jelenik meg a változó metaadatában.
- numerikus változók esetében: Amissing\_value\_FillValue megjelenik a változó metaadatában. Néhány kimeneti adatformátum esetében,ERDDAP™elhagyja ezeket a különleges számokat, például látni fogja -9999. Más kimeneti adatformátumokhoz (különösen szövegszerű formátumok, mint .csv és.htmlTable) ,ERDDAP™helyettesíti ezeket a különleges számokat a NaN-vel vagy a ".
- Egyes adattípusok olyan hiányzó értékjelzőket tartalmaznak, amelyek nem kell kifejezetten azonosítani amissing\_valuevagy a \_FillValue tulajdonságai: a float és a dupla változók NaN (Nem szám) A String értékek az üres sztringet használják, és a char értékek karakterrel rendelkeznek\uffff (#65535 karakter, amely az Unicode értéke nem egy karakter számára) ... Az Integer adattípusok nem rendelkeznek belső hiányzó értékjelzőkkel.
- Ha egy integráló változónak hiányzó értéke van (Például egy üres pozíció egy .csv fájlban) ,ERDDAP™értelmezni fogja az értéket, mint a meghatározottmissing\_valuevagy \_FillValue ehhez a változóhoz. Ha senkit nem definiálnak,ERDDAP™értelmezni fogja az értéket, mint az adott adattípus alapértelmezett hiányzó értéket, amely mindig a maximális érték, amelyet az adattípus megtarthat: 127 byte variables, 32767 rövid, 2147483647 int, 92233720368547807 hosszú ideig, 255 ubyte, 65535 a ushort számára, 4294967295 az uint számára, és 18446744073709551615 az ulong számára.
ADD \_FillValue ATTRIBUTES?
- ADD \_FillValue ATTRIBUTES?
Minden alkalommalERDDAP™adatkészlet betöltése, ellenőrzi, hogy az integrált forrásadatokkal rendelkező változók meghatározottak-emissing\_valuevagy \_FillValue tulajdonság. Ha egy változó nem, akkorERDDAP™kinyomtat egy üzenetet a logfájlhoz ("Add \_FillValue Attribute?") ajánljuk, hogyERDDAP™adminisztrátor hozzáad egy \_Fill Érték tulajdonsága ennek a változónakdatasets.xml... Nagyon hasznos minden változó számára, hogy \_FillValue vagymissing\_valuemert a hiányzó értékek mindig lehetségesek, például, ha egy adott fájl egy adatkészletben nem rendelkezik eltérő,ERDDAP™képesnek kell lennie arra, hogy ezt a változót bemutassa, mivel minden hiányzó értéke van a változó számára. Ha úgy dönt, hogy a változó nem rendelkezik \_FillValue tulajdonsággal, akkor hozzáadhatja <att nevek="\_FillValue">null</att> helyett, amely elnyomja az üzenetet erredatasetID+ változó kombináció a jövőben.
Minden alkalommalERDDAP™kezdődik, összegyűjti az összes ajánlást egy üzenetbe, amelyet a logfájlhoz írnak (Kezdőlap »ADD \_FillValue ATTRIBUTES?”) e-mailbenERDDAP™adminisztrátor, és egy CSV adatfájlra írt\[bigParentDirectory[szerkesztés]\]/logs/ könyvtár. Ha szeretné, akkor használja a GenerateDatasetsXml programot (és az AddFillValueAttributes opció) az összes javaslat alkalmazása a CSV fájlban adatasets.xmlfájl. bármelyiknekdatasetID/ változó kombinációk a fájlban, ha úgy dönt, nincs szükség hozzáadni a tulajdonított, akkor megváltoztathatja a tulajdonságot, hogy<att nevek="\_FillValue">null</att> elnyomni az erre vonatkozó ajánlástdatasetID+ változó kombináció a jövőben.
Ez fontos! Ahogy Bob gyakran mondta: rossz lenne (és kínos) ha a globális felmelegedés néhány bizonyítékát az adatok azonosítatlan hiányzó értékei okozták (pl. 99 vagy 127 fokos hőmérséklet-értékek C, hogy kellett volna jelezni, mint hiányzó értékek, és így elnyomta az eszköz és/vagy medián statisztika magasabb) ...
- A \_FillValue ésmissing\_valueaz adott változó értékek különböző forrásfájlokban következeteseknek kell lenniük; különbenERDDAP™fogadja el a fájlokat egy sor értékkel, és utasítsa el az összes többi fájlt "Bad Files". A probléma megoldásához,
- Ha a fájlokat megrúgják.ncfájlokat, használhatEDDGridFromNcFilesUnpack...
- Ha a fájlok mesés adatfájlok, használhatja az EDDTableFrom... Fájlok "..."szabványosítás AmitMondd elERDDAPszabványosítani a forrásfájlokat, ahogy olvassákERDDAP...
- Keményebb problémák esetén használhatNcMLvagyNCOmegoldani a problémát.
scale\_factor
- scale\_factor (default = 1) és add\_offset (default = 0) (COARDSésCF) OPTIONAL változó tulajdonságok, amelyek leírják azokat az adatokat, amelyeket egyszerűbb adattípusban csomagolnak egy egyszerű átalakuláson keresztül.
-
Ha jelen van, az adattípusuk különbözik a forrásadat típusától, és leírja a rendeltetési értékek adattípusát. Például egy adatforrás lehetett tárolni float adatértékek egy decimális számjegy csomagolt, mint rövid ints (Int16) Használatscale\_factor= 0,1 ésadd\_offset= 0. Például,
<att name="scale\_factor" type="float"\>0.1</att>
<att name="add\_offset" type="float"\>0</att> -
Ebben a példában,ERDDAP™kicsomagolja az adatokat, és bemutatja a felhasználónak, mint a float adatértékek.
- Ha jelen van,ERDDAP™kivonja az értékeket ezekből a tulajdonságokból, távolítsa el a tulajdonságokat, és automatikusan kicsomagolja a felhasználó adatait:
célállomás Érték = forrás Érték \*scale\_factor+add\_offset
Vagy másképp fogalmazva: UnpackedValue = csomagolás Érték \*scale\_factor+add\_offset - Ascale\_factorésadd\_offsetaz adott változó értékek különböző forrásfájlokban következeteseknek kell lenniük; különbenERDDAP™fogadja el a fájlokat egy sor értékkel, és utasítsa el az összes többi fájlt "Bad Files". A probléma megoldásához,
- Ha a fájlokat megrúgják.ncfájlokat, használhatEDDGridFromNcFilesUnpack...
- Ha a fájlok mesés adatfájlok, használhatja az EDDTableFrom... Fájlok "..."szabványosítás AmitMondd elERDDAPszabványosítani a forrásfájlokat, ahogy olvassákERDDAP...
- Keményebb problémák esetén használhatNcMLvagyNCOmegoldani a problémát.
standard\_name
- standard\_name (aCFmetadata szabvány) a RECOMMENDED változó tulajdonságaERDDAP... A CF fenntartja az engedélyezett listátCF szabvány neve... Például,
<att name="standard\\_name">eastward\\_sea\\_water\\_velocity</att>
- Ha hozzáadstandard\_namea változók tulajdonságai és hozzáadásastandard\_namea listára<categoryAttributes> > > > benneERDDAPAsetup.xmlfájl, a felhasználók könnyen megtalálhatják az adatkészleteket hasonló adatokkalERDDAP"Search for Datasets by Kategória" a honlapon.
- Ha megadja a CF-tstandard\_nameVáltozékony, a változó egységeknek tulajdonítható egységeknek nem kell azonosnak lenniük a CF Standard Name táblázatban meghatározott kánonikus egységekkel, de a MUST egységeket át kell alakítani a kánonikus egységek számára. Például az összes hőmérséklethez kapcsolódó CFstandard\_name"K" (Kelvin) mint a kanonikus egységek. Tehát változó a hőmérséklethez kapcsolódóstandard\_nameMUST van egy egység K, fokozat\_C, fokozat\_F, vagy néhány UDUnits változata ezeknek a neveknek, mivel ők mind interkonvertálható.
- Legjobb gyakorlatok: A hatalom egy részeellenőrzött szókincsekcsak a listán szereplő feltételeket használja. Ezért javasoljuk, hogy ragaszkodjon az ellenőrzött szókincsben meghatározott feltételekhez, és javasoljuk, hogy tegyen fel egy kifejezést, ha nincs megfelelő a listában. Ha további feltételekre van szüksége, nézze meg, hogy a szabványok bizottsága hozzáadja-e őket az ellenőrzött szókincshez.
- standard\_nameAz értékek az egyetlen CF-értékek, amelyek érzékenyek. Ők mindig mind alsóbbrendűek. KezdőlapERDDAP™v1.82, GenerateDatasets átalakítja a felsőkategóriás betűket az alsó levélbe. És amikor egy adatkészlet be van töltveERDDAPA felsőkategóriás betűk csendben változnak az alsó betűkre.
time\_precision
- time\_precisionegy OPTIONAL tulajdonság, amelyet aERDDAP™ (és nem metadata szabványok) MertIdő és időbélyegző változók, amely megfogott adatkészletekben vagy mesés adatkészletekben lehet, ésaxisVariablevagydataVariableS. Például,
time\_precisionmeghatározza a precizitást, amelyet akkor kell használni, haERDDAP™formázza az időértékeket ebből a változóból, mint a hálóoldalak, beleértve.htmlTableválaszok. Olyan fájlformátumokban, aholERDDAP™formázási idők, mint sztringek (például .csv és.json) ,ERDDAP™csak használjatime\_precision-specifikus formátum, ha frakcionális másodperceket tartalmaz; egyébként,ERDDAP™használja az 1970-01-01T00:00 Z formátum.
<att name="time\\_precision">1970-01-01</att>
- Érvényes értékek 1970-01, 1970-01-01, 1970-01-01T00Z, 1970-01-01T00Z, 1970-01-01T00:00Z (az alapértelmezett) , 1970-01-01T00:00:00:00.0Z, 1970-01-01T00:00:00,00Z, 1970-01-01T00:00:00.000Z.\[1970 nem egy lehetőség, mert ez egy szám, ígyERDDAP™nem tudja, hogy ez egy formázott idő húr (év) vagy ha az 1970-01-01T00:00Z óta néhány másodperc.\]
- Hatime\_precisionnem meghatározott, vagy az érték nem egyezik, az alapértelmezett értéket fogják használni.
- Itt, mint más részeinERDDAP™A nem megjelenített formázott idő bármely területét feltételezik, hogy minimális értéke van. Például 1985-07, 1985-07-01, 1985-07-01T00Z, 1985-07-01T00:00Z és 1985-07-01T00:00 A Z mind egyenértékűnek tekinthető, bár a pontosság különböző szintjével. Ez megfelel aISO 8601:2004"extended"Időforma specifikáció...
- WARNING: Csak korlátozottan kell használniatime\_precisionha Minden a változó adatértékeknek csak minimális értéke van az összes rejtett mező számára.
- Például használhatsz egytime\_precision1970-01-01, ha az összes adatérték órá=0, perc=0 és második=0 (Például 2005-03-04T00:00Z és 2005-03-05T00:00Z) ...
- Például ne használjontime\_precision1970-01-01, ha nincs 0 óra, perc vagy másodperc értékek, (Például 2005-03-05T12:00Z) mert a nem default órás érték nem jelenik meg. Ellenkező esetben, ha egy felhasználó kéri az összes adatot az idő=2005-03-05, a kérés nem sikerül váratlanul.
time\_zone
- time\_zone
- time\_zoneegy OPTIONAL tulajdonság, amelyet aERDDAP™ (és nem metadata szabványok) MertIdő és időbélyegző változók, amely rácsos adatkészletekben vagy tabuláris adatkészletekben lehet.
- Az alapértelmezett "Zulu"..." (amely a GMT modern időzóna verziója) ...
- Háttérinformáció: "idős ofszets" (pl. Pacific Standard Time, -08:00, GMT-8) rögzített, specifikus, ellentmondásokZulu (GMT) ... Ezzel szemben a "időzónák" sokkal összetettebb dolgok, amelyek befolyásolj ák a Daylight Saving (pl. „US/Pacific”) , amelyeknek különböző szabályok vannak különböző helyeken különböző időpontokban. Az időzónáknak mindig vannak nevei, mivel nem lehet egy egyszerű ofset értékkel összefoglalni (lásd a "TZ adatbázis nevek" oszlopot az asztalon https://en.wikipedia.org/wiki/List\_of\_tz\_database\_time\_zones ) ...ERDDAPAtime\_zoneattribute segít kezelni a helyi időadatokat egy időzónából (1987-03-25T17:32:05 Pacific Idő) ... Ha van sztring vagy numerikus időadata egy (rögzített) idő ofszet, egyszerűen ki kell igazítania az adatokatZulu (Ez az, amiERDDAP™Akarat) egy másik alapidő meghatározása az egységekben (pl. „órákat 1970-01-01T08:00Z óta”, jegyezze meg a T08-at, hogy meghatározza az idő ofszetet) , és mindig ellenőrizze az eredményeket annak biztosítása érdekében, hogy megkapja az eredményeket akar.
- Az időbélyegző változók forrásadatokkal a Strings-tól, ez a tulajdonság lehetővé teszi, hogy meghatározza az időzónát, amely vezetERDDAP™átalakítani a helyi-time-zóna forrási időket (néhány a Standard időben, néhány a Daylight Saving Time) aZuluIdőnként (amelyek mindig a szabványos időben vannak) ... Az érvényes időzóna nevek listája valószínűleg azonos a TZ oszlop listáján https://en.wikipedia.org/wiki/List\_of\_tz\_database\_time\_zones ... A közös amerikai időzónák: US/Hawaii, US/Alaska, US/Cacific, US/Mountain, US/Arizona, US/Central, US/Kelet.
- Az időbélyegző változók számszerű forrásadatokkal, megadhatja a "time\_zonetulajdonság, de az értéknek "Zulu" vagy "UTC". Ha más időzónák támogatására van szüksége, kérjük, e-mailben Chris. John at noaa.gov.
egység
- egység (COARDS,CFésACDDmetadata szabvány) meghatározza az adatértékek egységeit. Például,
<att name="units">degree\\_C</att>
-
"egységek" a REQUIRED, mint egy forrásAttribute vagy addAttribute"time"változók, és szigorúan más változók számára, ha megfelelő (ami szinte mindig) ...
-
Általában ajánljuk, hogyUDUnits\ kompatibilis egységek, amelyeket a szükségesCOARDSésCFszabványok.
-
Egy másik közös szabványUCUM- az Egységes Mérési Szabályzat.OGColyan szolgáltatások, mint példáulSOS,WCSésWMSUCUM-re van szükség, és gyakran UCUM-ra utal, mint UOM (Measure egységei) ...
-
Javasoljuk, hogy egy egység szabványt használjon az összes adatkészlethez az ÖnbenERDDAP... Meg kell mondaniaERDDAP™melyik szabványt használod<Egységek\_standard>, a tesetup.xmlfájl.
-
Az adott változó egységeknek különböző forrásfájlokban következetesnek kell lenniük. Ha van egy adatfájl gyűjteménye, ahol a fájlok egyik aljzata különböző egységértékeket használ, mint a fájlok egy vagy több más aljzata (például, "a napok 1985-01-01" versus "napok óta 2000-01-01", "degree\_Celsius" versus "deg\_C", vagy "knots" versus "m/s", meg kell találni a módját, hogy szabványosítsa az egység értékek, különben,ERDDAP™csak betölti a fájlok egyik aljzatát. Gondolj bele: ha egy fájl WindSpeed units=knots és egy másik szélSpeed units=m/s, akkor a két fájl értékei nem tartoznak ugyanabban az aggregált adatkészletben.
- Ha a fájlokat megrúgják.ncfájlok, sok helyzetben használhatjaEDDGridFromNcFilesUnpack...
- Ha a fájlok mesés adatfájlok, sok helyzetben használhatja az EDDTableF-t... Fájlok "..."szabványosítás AmitMondd elERDDAPszabványosítani a forrásfájlokat, ahogy olvassákERDDAP...
- Keményebb problémák esetén használhatNcMLvagyNCOmegoldani a problémát.
-
A CF szabvány 8.1. szakasza szerint ha a változó adatait ascale\_factorvagyadd\_offset„A változó egységeinek a csomagolatlan adatok képviselőjének kell lenniük.”
-
Idő- és időbélyegző változók esetében,vagy a változóForrás: Forrásvagy<addAttributes> > > > (ami előbbre kerül) MUSTegységvagy
- Az idő tengely változók vagy időadatok változók numerikus adatokkal:UDUnits\-kompatibilis sztring (formátummal egység óta alapTim ) leírva, hogyan értelmezhető a forrásidő értékek (Például a másodpercek 1970-01-01T00:00Z) ...
egység lehet bármelyik:
ms, msec, msecs, millis, millisec, millisecs, millisecond, milliseconds,
s, sec, secs, second, seconds, m, min, mins, minute, minutes, h, hr, hrs, hour, hours,
d, day, days, week, weeks, mon, mons, month, months, yr, yrs, year, or years.
-
Technikailag,ERDDAP™NEM kövesseUDUNITSszabvány, ha átalakítjuk"years since"és"months since"időértékek a"seconds since"... AUDUNITSA szabvány rögzített, egységes értékként határozza meg az évet: 3.15569259747e7 másodperc. ÉsUDUNITSmeghatároz egy hónapot, mint év/12. Sajnos, a legtöbb / minden adatkészlet, amit láttunk, hogy használja"years since"vagy"months since"egyértelműen szándékozik tartani az értékeket naptári évekkel vagy naptári hónapokkal. Például 3"months since 1970-01-01"általában az 1970-04-01-et jelenti. Szóval,ERDDAP™értelmezés"years since"és"months since"naptári évek és hónapok, és nem követi szigorúanUDUNITSszabvány.
A alapTim ISO 8601:2004 kell lennie (EZ) formázott dátum idő sztring (yyyy-MM-ddT'HH:mm:ssZ, például 1970-01-01T00:00Z) vagy ennek valamilyen változata (például a végén hiányzó részekkel) ...ERDDAP™próbálkozik az ideális formátumú változatok széles skálájával, például az "1970-1 0:0:0" támogatást kap. Ha az időzóna információ hiányzik, feltételezik, hogy azZuluIdőzóna (AKA GMT) ... Még akkor is, ha egy másik idő ofszet van meghatározva,ERDDAP™Soha nem használja a Daylight Saving Time-t. Ha az alapTime más formátumot használ, akkor használnia kell<addAttributes> megadni egy új egységek sztringjét, amely az ISO 8601:2004 változatát használja (EZ) formátum (pl. változási napok 1985. január 1-től napokig 1985-01-ig.
TesztelhetERDDAP"A képesség, hogy egy adott egység óta alapTim veleERDDAPAIdő átalakító... Remélhetőleg egy számba tudsz dugni (az első érték az adatforrásból?) és egy egység sztring, kattintson a konvertre, ésERDDAP™lesz képes átalakítani az ISO 8601:2004 (EZ) formázott dátum idő húr. A konverter hibaüzenetet fog küldeni, ha az egységek sztringje nem felismerhető.
Húró időegységek
- Az idő- vagy ütemterv-adatok változóinak egységei számára a String adatokkal,meg kell határoznia egyjava.time.DateTimeFormatterminta (ami leginkább kompatibilis a java.text-szel. SimpleDateFormat) amely leírja, hogyan kell értelmezni a szigorú időket.
Az ISO 8601:2004 általánosan használt időformátumok esetében (EZ) standard formátum (például 2018-01-02T00:00Z) , megadhatja a variációk variációityyyy-MM-ddT'HH:mm:ssZ, például használatyyyy-MM-ddha a sztringidőnek csak dátuma van. bármilyen formátumban, amely a Yyy-M-vel kezdődik,ERDDAPegy speciális parsert használ, amely nagyon megbocsátja a kisebb variációkat a formátumban. A parser kezelheti az időzónákat a "Z", "UTC", "GMT", ±XX:XX, ±XXXX és ±XXX formátumban. Ha a dátumidő részeit nem határozzák meg (például percek és másodpercek) ,ERDDAP™feltételezi a legalacsonyabb értéket ezen a területen (pl. ha a másodperceket nem határozzák meg, a másodperceket=0 feltételezik) ...
Az összes többi szigorú időformátum esetében pontosan meg kell határoznia a DateTimeFormatter-kompatibilis időformátumot. Mintyyyy-MM-dd"T'H:mm:ssZ, ezek a formátumú karakterláncok olyan karakterekből épülnek, amelyek azonosítják az adott típusú információt a sztringből, például percről órára. Ha megismételi a formátum karaktert néhány alkalommal, ez tovább finomítja a jelentést, pl., m azt jelenti, hogy az értéket lehet meghatározni számos számjegy, mm azt jelenti, hogy az értéket kell meghatározni 2 számjegy. AJavaA DateTimeFormatter dokumentációja egy durva áttekintés, és nem teszi ezeket a részleteket egyértelművé. Tehát itt van egy lista a formátum karakter variációk és a jelentés belülERDDAP™ (ami néha kissé különbözik attól,JavaDateTimeFormatter) :
Karakterek | példák | A jelentés |
---|---|---|
u, y, Y | \-4712, 0, 1, 10, 100, 2018 | egy évszám, számos számjegy.ERDDAP™bánik y (Év-Era) és Y (heti alapú év, mert ez gyakran tévesen használják helyetted) mint u,csillagászati évszám... A csillagászati évek pozitív vagy negatív integrátorok, amelyek nem használják a BCE-t (BC) vagy CE (AD) korszaktervezők: 2018=2018CE, ..., 2=2CE, 1=1CE, 0=1BCE, -1=2BCE, -2=3BCE, ... |
Uuuuu, igen, Igen, | \-4712, 0000, 0001, 0010, 0100, 2018 | 4 számjegyű csillagászati évszám (figyelmen kívül hagyni minden megelőző "-") |
M | 1, 01, 12 | egy hónapos szám, számos számjegy (1=Január) |
MM | 01, 12 | 2 számjegy (nulla padded) hónapszám |
MMM | Jan, jan, JAN | 3 betű angol havi név, esetérzékeny |
MMM | Jan, jan, JAN, január, január, JANUARY | 3 betű vagy teljes angol havi név, esetérzékeny |
d) | 1, 01, 31 | napi szám, bármilyen számjegy |
dd | 01, 31 | 2 számjegy (nulla padded) nap-hónap. Az első „digit” lehet egy űr. |
D | 1, 001, 366 | nap-év, bármilyen számjegy, 001=Jan 1 |
DDD | 001, 366 | nap-év, 3 számjegy, 001=Jan 1 |
EEE | HU, THU, Thu | egy 3 betűs napi hetet, az érték figyelmen kívül hagyva, amikor a párosítás |
EEEE | HU, THU, Thu, tegnap, THURSDAY, csütörtök | egy 3 betű vagy teljes angol napi hét, eseti érzéketlen, az érték figyelmen kívül hagyása, amikor a pletykát |
Hát | 0, 00, 23 | Hónap (0-23) bármilyen számjegy |
HH | 00, 23 | HH óra-nap (00-23) 2 számjegy. Az első „digit” lehet egy űr. |
egy | AM, PM, PM | AM vagy PM, eseti érzékeny |
h | 12, 1, 01, 11 | órá-hour-of-am-pm (12, 1, 2, 11) bármilyen számjegy |
hó | 12, 01, 11 | órá-hour-of-am-pm (12, 1, 2, 11) 2 számjegy. Az első „digit” lehet egy űr. |
K. | 0, 1, 11 | óra-of-am-pm (0, 1, ...11) bármilyen számjegy |
KK | 00, 01, 11 | órá-of-am-pm, 2 számjegy |
m | 0, 00, 59 | perc órája, bármilyen számjegy |
mm | 00, 59 | perc óra, 2 számjegy |
s | 0, 00, 59 | perc, bármilyen számjegy |
SS | 00, 59 | perc, 2 számjegy |
Súgó | 0, 000, 999 | frakció-második, mintha egy meghatározott pontot követnénk, bármilyen számjegyet |
SS | 00, 99 | Több száz másodperc, 2 számjegy |
SSS | 000, 999 | ezer másodperc, 3 számjegy |
A | 0, 0000, 863999 | millisecond-of-day, bármilyen számjegy |
AAAAAA | 000 000, 863999 | napi, 8 számjegy |
N | 0,000000000000, 863999999999 | nanoszecond-of-day, bármilyen számjegy. InkábbERDDAP™Ez az nMillis-re trunkál. |
NNNNNNNNNNNNN | 000000000000, 8639999999 | nanoszecond-of-day, 14 számjegy. InkábbERDDAP™Ezt az nMillis-re trunkálják. |
n | 0,000000000, 59999999999 | nanoszekundum-második, számos számjegy. InkábbERDDAP™Ezt az nMillis-re trunkálják. |
nnnnnnnnnn | 000000000, 599999999 | nanoszekundum-második, 11 számjegy. InkábbERDDAP™Ezt az nMillis-re trunkálják. |
XXX, ZZZ | Z, -08:00, +01:00 | egy időzóna a "Z" vagy ± formátummal (2 Digitális óra offset) : (2 Digitális perc offset) ... Ez kezeli Tér mint + (Nem szabványos) ... ZZ támogató "Z" nem szabványos, de foglalkozik egy közös felhasználói hiba. |
XX, ZZ | Z -0800, +0100 | egy időzóna a "Z" vagy ± formátummal (2 Digitális óra offset) : (2 Digitális perc offset) ... Ez kezeli Tér mint + (Nem szabványos) ... A ZZ támogatja a "Z" nem szabványos, de közös felhasználói hibával foglalkozik. |
X, Z | Z, -08, +01 | egy időzóna a "Z" vagy ± formátummal (2 Digitális óra offset) : (2 Digitális perc offset) ... Ez kezeli Tér mint + (Nem szabványos) ... A „Z” támogatása nem szabványos, de közös felhasználói hibával foglalkozik. |
XXX. | \-08:00, +01:00 | időzóna a formátummal ± (2 Digitális óra offset) : (2 Digitális perc offset) ... Ez kezeli Tér mint + (Nem szabványos) ... |
xx | \-0800, +0100 | időzóna a formátummal ± (2 Digitális óra offset) (2 Digitális perc offset) ... Ez kezeli Tér mint + (Nem szabványos) ... |
x x x x | \-08, +01 | időzóna a formátummal ± (2 Digitális óra offset) ... Ez kezeli Tér mint + (Nem szabványos) ... |
"..." | "T", "Z", "GMT" | egy sor szó szerinti karakter kezdete és vége |
"..." "..." (Két egyetlen idézet) | "..." "..." | Két egyetlen idézet egy szó szerinti egyetlen idézetet |
\[\] | \[ \] | Kezdőlap ("..."\["...") és vége ("..."\]"...") opcionális rész. Ez a megjegyzés csak szó szerinti karakterek és a végén a formátum sztring. |
#, { és#125; | #, { és#125; | fenntartva a jövőbeli használatra |
G,L, Q,e,c,V,z,O,p | Ezeket a formázási karaktereket támogatjákJavaDateTimeFormatter, de jelenleg nem támogatottERDDAP... Ha támogatásra van szüksége, e-mail Chris. John at noaa.gov. |
Megjegyzések:
- Egy dátumban a punctuációval, a numerikus értékek változatos számjegyeket tartalmazhatnak (pl. az Egyesült Államokban a „1/2/1985” szilárd dátum formátumban a hónap és a dátum 1 vagy 2 számjegy lehet) így a formátumnak 1 betűs tokeneket kell használnia, pl. M/d/yyyyyy-t, amely havonta és napra számos számjegyet fogad el.
- Ha egy elem számjegye állandó, például 01/02/1985, akkor adja meg a számjegyek számát a formátumban, pl. MM/dd/yyyy 2 számjegyű hónap, 2 számjegyű dátum és 4 számjegyű év.
- Ezek a formátumok trükkösek dolgozni. Egy adott formátum működik a legtöbb, de nem minden, idő húrok egy adott változó. Mindig ellenőrizze, hogy a megadott formátum a vártnál működikERDDAPminden változó idejére.
- Ha lehetséges, a GenerateDatasetXml időformátumot javasol.
- Ha segítségre van szüksége, hogy létrehozzon egy formátumot, kérjük, e-mailben Chris. John at noaa.gov.
A fő időadatok változóak (mesés adatkészletek) és a fő idő tengely változó (a rácsos adatkészletekért) által elismertdestinationNameIdő. Egységük metaadatának UDUnits-kompatibilis egységnek kell lennie, amely a numerikus időértékekre vonatkozik, pl. „1970-01-01 napja” (tabuláris vagy rácsos adatkészletek) vagyA szigorú időkre alkalmas egységekpl.: „M/d/yyyy” (mesés adatkészletek) ...
Különböző időegységek különböző fosztva.ncFile - Ha van egy gyűjteménye rácsos.ncfájlok, ahol az idő változó, az egyik alkészlet a fájlok különböző időegységek, mint egy vagy több más alkatrészek a fájlokat, akkor használhatóEDDGridFromNcFilesUnpack... Az időértékeket átalakítja"seconds since 1970-01-01T00:00:00Z"alacsonyabb szinten, ezáltal elrejtve a különbségeket, így egy adatkészletet készíthet a heterogén fájlok gyűjteményéből.
TimeStamp változók
TimeStamp változók- Bármely más változó (axisVariablevagydataVariableEgybenEDDGridvagy EDDTable adatkészlet) lehet egy timeStamp változó. A Timestamp változók olyan változók, amelyek idővel kapcsolatos egységekkel és időadatokkal rendelkeznek, de van egy<destinationName> más, mint idő. A TimeStamp változók úgy viselkednek, mint a fő idő változók abban, hogy átalakítják a forrás idő formátumát"seconds since 1970-01-01T00:00:00Z"és/vagy ISO 8601:2004 (EZ) formátum).ERDDAP™felismeri az időt Stamp változók az idővel kapcsolatos "egység"Metadata, amelynek meg kell felelnie ennek a rendszeres kifejezésnek"\[a-zA-Z\]++since +\[0-9\].+" (numerikus dátum Idők, például"seconds since 1970-01-01T00:00:00Z") vagy legyen dátum Time formátum string tartalmaz "uuuu", "yyyy" vagy "YYYY" (Például: "yyyy-MM-dd"T'HH:mm:ssZ") ... De kérlek még mindig használd adestinationName "time"a fő dátumhoz Idő változó.
Mindig ellenőrizze a munkáját, hogy megbizonyosodjon arról, hogy az időadatok, amelyek jelennek megERDDAP™a megfelelő időadatok. Az időadatokkal való munka mindig trükkös és hibás hajlam.
Lásdtöbb információ az idő változóiról... ERDDAP™haszonnal rendelkezikKonvertáljon Numeric Idő / sztring idő... LásdHogyanERDDAP™Üzletek az idővel...
valid\_range
-
valid\_range vagy valid\_min és valid\_max - Ezek az OPTIONAL változó tulajdonságok, amelyeket aCFmetadatai egyezmények. Például,
<att name="valid\_range" type="floatList"\>0.0 40.0</att>
vagy
<att name="valid\_min" type="float"\>0.0</att>
<att name="valid\_max" type="float"\>40.0</att>
- Ha jelen van, ugyanazon adattípusnak kell lennie, mint a változónak, és meg kell határoznia az adott változó adatok érvényes minimális és maximális értékeit. A felhasználóknak az ezen tartományon kívüli értékeket érvénytelennek kell tekinteniük.
- ERDDAP™nem alkalmazzákvalid\_range... Mondj egy másik módot:ERDDAP™nem konvertálja az adatértékeket kívülvalid\_rangea \_Fill Érték vagymissing\_value...ERDDAP™csak továbbhalad ezen a metaadatán, és elhagyja az alkalmazást az Ön számára. Miért? Ezért van ez a metaadata. Ha az adatszolgáltató akart volna, az adatszolgáltató az adatértékeket az adatokon kívül is át tudta alakítanivalid\_range\_FillValues.ERDDAP™nem a második találgatja az adatszolgáltatót. Ez a megközelítés biztonságosabb: ha később kiderül, hogy avalid\_rangetúl szűk vagy egyébként helytelen volt,ERDDAP™nem akadályozta meg az adatokat.
- Ha az adatok tele vannakscale\_factorvagyadd\_offset,valid\_range,valid\_minésvalid\_maxlegyen a csomagolt adattípus és érték. ótaERDDAP™alkalmazandóscale\_factorésadd\_offsetha betölti az adatkészletet,ERDDAP™kicsomagolja avalid\_range,valid\_minésvalid\_maxértékek, hogy a célállomás metaadata (a felhasználók számára) jelzi a csomagolatlan adattípust és tartományt. Vagy, ha nem csomagolt\_valid\_rangeattribútum jelen van, átnevezikvalid\_rangemikorERDDAP™betölti az adatkészletet.
<eltávolításaMVRows & gt;
- [[szerkesztés]] ** <eltávolításaMVRows> ** ] (#removemvrows) egy OPTIONAL tag egy címkén belüldatasets.xmlEDDTableFromFiles (beleértve az összes alosztályt) adatkészletek, bár csak az EDDTableFromMultidimNcFiles számára használják. Valódi vagy hamis értéke lehet. Például igaz Ez eltávolítja a sorok blokkját egy csoport végén, ahol az összes értékmissing\_value, \_FillValue, vagy a CoHort...Array natív hiányzó érték (dalszöveg: CharArrays) ... Ez a CF DSG Multidimenzionális Array fájltípus és hasonló fájlok. Ha igaz, ez a megfelelő teszt, és így mindig betölti az összes max dim változó, így lehet, hogy extra időt. Az alapértelmezett érték hamis. Ajánlás - Ha lehetséges az adatkészlet, javasoljuk, hogy állítsa be a eltávolításMVRows hamis. A eltávolítás MVRows igazba történő beállítása jelentősen lelassíthatja a kérelmeket, bár egyes adatkészletekhez lehet szükség.