Der EDDTableFromEML und EDDTableFromEMLBatch Optionen in GenerateDatasets Xml
\[Diese Webseite wird nur von Interesse seinERDDAP™Administratoren, die mit EML-Dateien arbeiten. Dieses Dokument wurde ursprünglich im Jahr 2016 erstellt. Es wurde zuletzt am 2020-11-30 bearbeitet.\]
ERDDAP™ ist ein Datenserver, der den Benutzern eine einfache, konsistente Möglichkeit gibt, Teilmengen von gegitterten und tabellarischen wissenschaftlichen Datensätzen in gemeinsamen Dateiformaten herunterzuladen und Grafiken und Karten zu erstellen.ERDDAP™arbeitet mit einem bestimmten Datensatz als entweder eine Gruppe von multidimensionalen gitterförmigen Variablen (z.B. Satelliten- oder Modelldaten) oder als datenbankähnliche Tabelle (mit einer Spalte für jede Art von Informationen und einer Zeile für jede Beobachtung) .ERDDAP™ist Freie und Open Source Software, so dass jeder kannherunterladen und installierenERDDAP™um ihre Daten zu bedienen.
Einen Datensatz zu einem hinzufügenERDDAP™Installation, dieERDDAP™Administrator muss einen chunk von XML hinzufügen, der den Datensatz in eine Datei namensdatasets.xml. (Es gibtgründliche Dokumentationdatasets.xml.) Obwohl es möglich ist, den chunk von XML fürdatasets.xmlvollständig von Hand,ERDDAP™kommt mit einem Werkzeug namens GenerateDatasetsXml die den groben Entwurf des für einen gegebenen Datensatz benötigten XML-Chunks basierend auf einer Informationsquelle über den Datensatz erzeugen kann.
Das erste, was GenerateDatasets Xml fragt, welche Art von Datensatz Sie erstellen möchten. Datensätze generieren Xml hat eine spezielle Option, EDDTableFromEML , die die Informationen in einemÖkologische Metadatensprache (EML) XML-Datei, um den chunk von XML fürdatasets.xmlum einEDDTableFromAsciiFilesDatensatz aus jeder Datentabelle in einer EML-Datei. Dies funktioniert sehr gut für die meisten EML-Dateien, vor allem weil EML-Dateien eine hervorragende Aufgabe der Speicherung aller benötigten Metadaten für einen Datensatz in einem einfach zu handhabenden Format. Die Informationen, die GenerateDatasetsXml die Datensätze erstellen muss, sind in der EML-Datei, einschließlich der URL für die Datendatei, die GenerateDatasetsXml Downloads, Parses und vergleicht mit der Beschreibung in der EML-Datei. (Viele Gruppen würden gut tun, um auf EML umzuschalten, was ein großartiges System zur Dokumentation eines tabellarischen wissenschaftlichen Datensatzes ist, nicht nur ökologische Daten. Und viele Gruppen, die XML-Schema erstellen, würden gut tun, um EML als Fallstudie für XML-Schema zu verwenden, die klar sind, zum Punkt, nicht zu tief (d.h. zu viele Ebenen) , und einfach für Menschen und Computer mit zu arbeiten.)
Fragen
Hier sind alle Fragen GenerateDatasets Xml wird fragen, mit Kommentaren, wie Sie antworten sollten, wenn Sie nur eine EML-Datei oder eine Charge von EML-Dateien verarbeiten möchten:
-
Welcher EDDType? Wenn Sie nur eine Datei bearbeiten möchten, antworten Sie: EDDTableFromEML Wenn Sie eine Gruppe von Dateien bearbeiten möchten, antworten Sie: EDDTableFromEMLBatch
-
Verzeichnis, um Dateien zu speichern? Geben Sie den Namen des Verzeichnisses ein, mit dem heruntergeladene EML- und/oder Datendateien gespeichert werden. Wenn das Verzeichnis nicht existiert, wird es erstellt.
-
(Für EDDTableFromEML nur) EML URL oder lokale DateiName? Geben Sie die URL oder den lokalen Dateinamen einer EML-Datei ein.
-
(Nur für EDDTableFromEMLBatch) EML dir (URL oder lokal) ? Geben Sie den Namen des Verzeichnisses mit den EML-Dateien ein (eine URL oder einen lokalen Schmutz) . Zum Beispiel: http://sbc.lternet.edu/data/eml/files/
-
(Nur für EDDTableFromEMLBatch) Dateiname regex? Geben Sie den regulären Ausdruck ein, mit dem die gewünschten EML-Dateien im EML-Verzeichnis identifiziert werden. Zum Beispiel: knb-lter-sbc\\\d+
-
Lokale Dateien verwenden, wenn vorhanden (wahr|falsch) ? Geben Sie true ein, um die vorhandenen lokalen EML-Dateien und Dateien zu verwenden, wenn sie vorhanden sind. Geben Sie falsch ein, um die EML-Dateien und/oder Datendateien immer wieder herunterzuladen.
-
zugänglich Zu? Wenn Sie wollen, dass die neuen Datensätze private Datensätze inERDDAP, den Namen der Gruppe angeben (S) der Zugang erlaubt ist. Empfohlen für LTER-Gruppen: kombinieren "lter" plus die Gruppe, z.B. Lter Sbc. Wenn Sie "null" eingeben, gibt es keine<zugänglich Zu > Tag in der Ausgabe. Vgl.zugänglich Zu.
-
Ort ZeitZone (z.B., US/Pacific) ? Wenn eine Zeitvariable angibt, dass sie lokale Zeitwerte hat, wird diese Zeitzone zugewiesen. Dies muss ein Wert vonTZ Spaltenliste der Zeitzonennamen. Beachten Sie alle einfach zu bedienenden "US/..." Namen am Ende der Liste. Wenn Sie später feststellen, dass, um falsch zu sein, können Sie dietime\_zonein der Schlampedatasets.xml.
EML plusERDDAP™ist eine tolle Kombination, daERDDAP™kann den Benutzern einen direkten Zugang zum Reichtum gebenWissensnetzwerk für Biokomplexität (KN-Code) undLangfristige ökologische Forschung (LTER) Daten und Hilfe für diese Projekte, die die US-Regierung treffenÖffentlicher Zugang zu Forschungsergebnissen (PARR) Anforderungendurch Bereitstellung der Daten über einen Webservice. Auch, EML plusERDDAP™scheint wie eine große Brücke zwischen Wissenschaftlern im akademischen / NSF-finanzierten Reich und Wissenschaftlern in der Bundesagentur (NOAA, NASA, USGS) Reich.
Sehen Sie unsAbschnitt zum Erhalt zusätzlicher Unterstützung.
Design Details
Hier sind die Designdetails der EDDTableFromEML Option in GenerateDatasetsXml. Einige beziehen sich auf Unterschiede, wie EML undERDDAP™Dinge tun und wie GenerateDatasets Xml behandelt diese Probleme.
One dataTable Becomes OneERDDAP™Datensatz
Eine EML-Datei kann mehrere<Daten Tabelle >s.ERDDAP™macht einenERDDAP™dataset per EML dataTable. DiedatasetIDfür den Datensatz EMLName ) TabelleAnzahl (wenn EMLname Text ist) oder System\_EMLName ) TabelleAnzahl (wenn EMLname eine Nummer ist) . Beispielsweise wird Tabelle #1 in der Datei knb-lter-sbc.28,ERDDAP™ datasetID= kb\_lter\_sbc\_28\_t1,
EML gegen CF+ACDD
Fast alle Metadaten in den EML-Dateien werden inERDDAP, aber in einem anderen Format.ERDDAP™Verwendung vonCFundANLAGEMetadatenstandards. Sie sind komplementäre Metadatensysteme, die für globale Metadaten und für die Metadaten jeder Variablen Schlüssel=Wertpaare verwenden. Ja, die EML Darstellung der Metadaten ist schöner als die CF+ACDD Darstellung. Ich schlage nicht vor, die CF+ACDD-Darstellung als Ersatz für die EML zu verwenden. Bitte denken Sie an CF+ACDD als Teil der Brücke von der EML-Welt zurOPeNDAP/CF/ACDD Welt.
Kleine Veränderungen
ERDDAP™macht viele kleine Veränderungen. Zum BeispielERDDAP™verwendet das EML-Nicht-DOIStellvertreter Identifier plus eine DatenTabellennummer alsERDDAP™ datasetID, aber leicht Änderungen wechseln Identifier, um es zu einem gültigen Variablennamen in den meisten Computersprachen zu machen, z.B. knb-lter-sbc.33 Daten Tabelle #1 wird knb\_lter\_sbc\_33\_t1.
Wie geht's?
EML verwendet DocBooks Markup-System, um Struktur zu Blöcken von Text in EML-Dateien bereitzustellen. CF und ACDD erfordern, dass Metadaten ein einfacher Text sein. So GenerateDatasets Xml wandelt den markierten Text in Klartext um, der wie die formatierte Version des Textes aussieht. Die Inline-Tags werden mit quadratischen Klammern, z.B.\[betont\], und links im Klartext.
Datendateien
Da die EML-DatenTabelle die URL der eigentlichen Datendatei umfasst, GenerateDatasets Xml wird:
- Laden Sie die Datendatei.
- Speichern Sie es im gleichen Verzeichnis wie die EML-Datei.
- Lesen Sie die Daten.
- Vergleichen Sie die Beschreibung der Daten im EML mit den tatsächlichen Daten in der Datei.
- Wenn Sie Datasets generieren Xml findet Unterschiede, behandelt sie mit ihnen oder fragt den Bediener, ob die Unterschiede in Ordnung sind, oder gibt eine Fehlermeldung zurück. Die Details sind in verschiedenen Artikeln unten.