Den EDDTableFraEML og EDDTableFraEMLBatch Valgmuligheder i GenererDatasets Xml
\[Denne webside vil kun være af interesse forERDDAP™Administratorer, der arbejder med EML-filer. Dette dokument blev oprindeligt oprettet i 2016. Det blev senest redigeret den 30. april 2020.\]
ERDDAP™ er en dataserver, der giver brugerne en enkel, konsekvent måde at downloade subsets af gitterded og faneformede videnskabelige datasæt i almindelige filformater og lave grafer og kort.ERDDAP™arbejder med en given datasæt som enten en gruppe multidimensionelle gitterded variabler (f.eks. satellit- eller modeldata) eller som en databaselignende tabel (med en kolonne for hver type oplysninger og en række for hver observation) .ERDDAP™er gratis og Open Source Software, så alle kandownload og installationERDDAP™at tjene deres data.
Sådan tilføjer du et datasæt til etERDDAP™installation, installationERDDAP™Administrator skal tilføje en smule XML, der beskriver datasættet til en fil kaldetdatasets.xml. (Der er dergrundig dokumentation fordatasets.xml.) Selvom det er muligt at generere klumpen af XML fordatasets.xmlhelt ved hånden,ERDDAP™leveres med et værktøj kaldet GenererDatasetsXml som kan generere det grove udkast til omfanget af XML nødvendig for en given datasæt baseret på nogle oplysninger om datasættet.
Den første ting GenererDatasets Xml spørger, hvilken type datasæt du ønsker at oprette. GenererDatasets Xml har en særlig mulighed, EDDTableFraEML , som bruger oplysningerne i enEcological Metadata Sprog (EML) XML-fil til at generere klumpen af XML fordatasets.xmlat oprette enEDDTableFraAsciiFilesdatasæt fra hver datatabel i en EML-fil. Dette fungerer meget godt for de fleste EML-filer, for det meste fordi EML-filer gør et fremragende job for at gemme alle de nødvendige metadata til et datasæt i et let-til-arbejde-med format. De oplysninger, der GenererDatasetsXml skal oprette datasæt, er i EML-filen, herunder URL for datafilen, som GenererDatasetsXml downloads, parses og sammenligner til beskrivelsen i EML-filen. (Mange grupper vil gøre godt for at skifte til EML, som er et godt system til at dokumentere eventuelle tabulære videnskabelige datasæt, ikke kun økologiske data. Og mange grupper, der skaber XML schemas ville gøre godt at bruge EML som en case undersøgelse for XML schema, der er klar, til det punkt, ikke overdrevent dyb (dvs. for mange niveauer) , og let for mennesker og computere at arbejde med.)
Spørgsmål og svar
Her er alle spørgsmål GenererDatasets Xml vil spørge, med kommentarer om, hvordan du skal svare, hvis du ønsker at behandle kun en EML-fil eller en batch af EML-filer:
-
Hvilken EDDType? Hvis du ønsker at behandle en fil, skal du svare: EDDTableFraEML Hvis du vil behandle en gruppe filer, skal du svare: EDDTableFraEMLBatch
-
Directory til at gemme filer? Indtast navnet på den mappe, der vil blive brugt til at gemme downloadede EML og/eller datafiler. Hvis mappen ikke findes, oprettes den.
-
(Til EDDTableFraEML kun) EML URL eller lokal filnavn? Indtast URL-adressen eller det lokale filnavn på en EML-fil.
-
(Til EDDTableFraEMLBatch kun) EML dir (URL eller lokal) ? Indtast navnet på mappen med EML-filer (en URL eller en lokal dir) . For eksempel: http://sbc.lternet.edu/data/eml/files/
-
(Til EDDTableFraEMLBatch kun) Omdøbt regex? Indtast det regulære udtryk, der vil blive brugt til at identificere de ønskede EML-filer i EML-mappen. For eksempel: knb-lter-sbc«.
-
Brug lokale filer, hvis de er til stede (sande sande sande sande|falsk) ? Indtast sande for at bruge de eksisterende lokale EML-filer og datafiler, hvis de findes. Indtast falsk for altid at downloade EML-filer og / eller datafiler.
-
tilgængelig Vil du? Hvis du vil have de nye datasæt til at være private datasæt iERDDAP, angive navnet på gruppen (s s s) det vil være tilladt adgang. Anbefalet til LTER grupper: kombinere "lter" plus gruppen, f.eks. lter Sbc . Hvis du indtaster "null", vil der ikke være nogen<tilgængelig Til> tag i output. Se endnutilgængelig Sådan skal du til.
-
lokal lokal lokal lokal lokal lokal lokale TimeZone (f.eks. US/Pacific) ? Hvis en tidsvariabel angiver, at det har lokale tidsværdier, vil denne tidszone blive tildelt. Dette skal være en værdi fraTZ kolonne liste over tidszonenavne. Bemærk alle de brugervenlige "US/..." navne i slutningen af listen. Hvis du senere finder det, der skal være forkert, kan du ændre ændringen.time\_zonei bunden afdatasets.xml.
EML plusERDDAP™er en stor kombination, daERDDAP™kan give brugerne mere direkte adgang til rigdom afVidensnet for Biocomplexity (KNB) og og ogLangtids Økologisk forskning (LTER) data og hjælpe dem med at møde den amerikanske regeringsOffentlig adgang til forskningsresultater (PARR) kravved at gøre de tilgængelige data via en webtjeneste. Også, EML plusERDDAP™synes som en stor bro mellem forskere i det akademiske / NSF-funderede rige og forskere i det føderale agentur (NOAA, NASA, USGS) rige.
Se vores udvalgsektion om at få ekstra støtte.
Designdetaljer
Her er designdetaljerne for EDDTableFraEML mulighed i GenererDatasetsXml. Nogle er relateret til forskelle i, hvordan EML ogERDDAP™gøre ting og hvordan GenererDatasets Xml behandler disse problemer.
En dataTable Bliver enERDDAP™Datasæt
En EML fil kan have flere<Datadata Tabel>s.ERDDAP™gør énERDDAP™Datasæt pr EML dataTable. The The The The The The ThedatasetIDfor datasættet er EMLName \_t tabelnummer (når EMLname er tekst) eller eller eller System\_EMLName \_t tabelnummer (når EMLname er et nummer) . For eksempel, tabel #1 i filen knb-lter-sbc.28, bliverERDDAP™ datasetID=knb\_lter\_sbc\_28\_t1,
EML mod CF+ACDD
Næsten alle metadata i EML-filer bliver iERDDAP, men i et andet format.ERDDAP™Brug af cookiesCFog og ogACDDmetadatastandarder. De er komplementære metadatasystemer, der bruger nøgle=værdipar til globale metadata og for hver variabels metadata. Ja, EML-præsentationen af metadata er pænere end CF+ACDD-præsentationen. Jeg foreslår ikke at bruge CF+ACDD-præsentationen som erstatning for EML. Tænk på CF+ACDD som en del af broen fra EML verden til EML verdenOPeNDAP/CF/ACDD verden.
Små ændringer
ERDDAP™gør en masse små ændringer. For eksempel,ERDDAP™Brug af EML ikke-DOIalternativ alternativ Identifier plus et dataTabelt nummer somERDDAP™ datasetID, men lidt ændringer alternativ Identifier til at gøre det et gyldigt variabelt navn på de fleste computersprog, f.eks. knb-lter-sbc.33 data Tabel #1 bliver knb\_lter\_sbc\_33\_t1.
DocBook
EML bruger DocBooks mærkningssystem til at give struktur til blokke af tekst i EML-filer. CF og ACDD kræver, at metadata er almindelig tekst. Så GenererDatasets Xml konverterer den markerede tekst til almindelig tekst, der ligner den formaterede version af teksten. Inline tags er helliget med firkantede beslag, f.eks.\[understregede\], og venstre i tekst.
Datafiler
Da EML-dataTable indeholder URL'en for den faktiske datafil, indeholder GenererDatasetsets Xml vil:
- Hent datafilen.
- Gem det i samme mappe som EML-filen.
- Læs oplysningerne.
- Sammenlign beskrivelsen af dataene i EML med de faktiske data i filen.
- Hvis GenererDatasets Xml finder forskelle, det beskæftiger sig med dem, eller spørger operatøren, om forskellene er okay, eller returnerer en fejlmeddelelse. Detaljerne er i forskellige emner nedenfor.
.zip'd Datafiler
Hvis den registrerede datafil er en.zipfil, det skal indeholde kun én fil. Denne fil vil blive brugt tilERDDAP™Datasæt. Hvis der er mere end 1 fil.ERDDAP™vil afvise, at datasæt. Hvis det er nødvendigt, kan dette ændres. (I praksis har alle SBC LTER zip-filer kun en datafil.)