Ο πίνακας EDDFromEML και ο πίνακας EDDFromEMLBatch Επιλογές δημιουργίας συνόλων δεδομένων Xml
\[Αυτή η ιστοσελίδα θα ενδιαφέρει μόνοERDDAP™διαχειριστές που εργάζονται με αρχεία EML. Το έγγραφο αυτό δημιουργήθηκε αρχικά το 2016. Τελευταία επιμέλεια έγινε στις 2020-11-30.\]
ERDDAP™ είναι ένας διακομιστής δεδομένων που δίνει στους χρήστες έναν απλό, συνεπή τρόπο για να κατεβάσετε υποσύνολα των gridded και πίνακα επιστημονικών δεδομένων σε κοινές μορφές αρχείων και να κάνει γραφήματα και χάρτες.ERDDAP™λειτουργεί με δεδομένο σύνολο δεδομένων είτε ως ομάδα πολυδιάστατων καννάβδινων μεταβλητών (π.χ. δεδομένα δορυφορικών ή μοντέλων) ή ως πίνακας βάσης δεδομένων (με στήλη για κάθε τύπο πληροφοριών και σειρά για κάθε παρατήρηση) .ERDDAP™είναι Ελεύθερο και Open Source Software, έτσι ώστε ο καθένας μπορείλήψη και εγκατάστασηERDDAP™για να εξυπηρετήσουν τα δεδομένα τους.
Για να προσθέσετε ένα σύνολο δεδομένων σε έναERDDAP™εγκατάσταση, ηERDDAP™Ο διαχειριστής πρέπει να προσθέσει ένα κομμάτι XML που περιγράφει το σύνολο δεδομένων σε ένα αρχείο που ονομάζεταιdatasets.xml. (Υπάρχει.ενδελεχή τεκμηρίωσηdatasets.xml.) Αν και είναι δυνατόν να δημιουργήσετε το κομμάτι του XML γιαdatasets.xmlεξ ολοκλήρου με το χέρι,ERDDAP™έρχεται με ένα εργαλείο που ονομάζεται Δημιουργία συνόλων δεδομένωνXml που μπορεί να δημιουργήσει το πρόχειρο σχέδιο του κομματιού XML που απαιτείται για ένα δεδομένο σύνολο δεδομένων με βάση κάποια πηγή πληροφοριών σχετικά με το σύνολο δεδομένων.
Το πρώτο πράγμα GenerateDatasets Το Xml ρωτάει τι είδους σύνολο δεδομένων θέλετε να δημιουργήσετε. Δημιουργία συνόλων δεδομένων Xml έχει μια ειδική επιλογή, Πίνακας EDDFromEML , η οποία χρησιμοποιεί τις πληροφορίες σεΟικολογικά μεταδεδομένα Γλώσσα (EML) Αρχείο XML για τη δημιουργία του κομματιού XML γιαdatasets.xmlγια τη δημιουργία ενόςΠίνακας EDD από αρχεία Asciiσύνολο δεδομένων από κάθε πίνακα δεδομένων σε ένα αρχείο EML. Αυτό λειτουργεί πολύ καλά για τα περισσότερα αρχεία EML, κυρίως επειδή τα αρχεία EML κάνουν μια εξαιρετική δουλειά της αποθήκευσης όλων των απαραίτητων μεταδεδομένων για ένα σύνολο δεδομένων σε μια εύκολη στην εργασία-με τη μορφή. Οι πληροφορίες που GenerateDatasetsXml πρέπει να δημιουργήσουν τα σύνολα δεδομένων είναι στο αρχείο EML, συμπεριλαμβανομένου του URL για το αρχείο δεδομένων, το οποίο GenerateDatasetsXml κατεβάζει, αναλύει, και συγκρίνει με την περιγραφή στο αρχείο EML. (Πολλές ομάδες θα έκαναν καλά να στραφούν σε EML, το οποίο είναι ένα μεγάλο σύστημα για την τεκμηρίωση κάθε πίνακα επιστημονικών δεδομένων, όχι μόνο οικολογικά δεδομένα. Και πολλές ομάδες που δημιουργούν σχήματα XML θα κάνει καλά να χρησιμοποιήσει EML ως μελέτη περίπτωση για XML σχήμα που είναι σαφές, ως το σημείο, όχι υπερβολικά βαθιά (Δηλαδή, πάρα πολλά επίπεδα) , και εύκολο για τους ανθρώπους και τους υπολογιστές να εργαστούν με.)
Ερωτήσεις
Εδώ είναι όλες οι ερωτήσεις GenerateDatasets Xml θα ρωτήσει, με σχόλια σχετικά με το πώς θα πρέπει να απαντήσετε αν θέλετε να επεξεργαστείτε μόνο ένα αρχείο EML ή μια παρτίδα αρχείων EML:
-
Ποιο είδος EDD; Αν θέλετε να επεξεργαστείτε μόνο ένα αρχείο, απαντήστε: EDDTableFromEML Αν θέλετε να επεξεργαστείτε μια ομάδα αρχείων, απαντήστε: EDDTableFromEMLBatch
-
Κατάλογος αποθήκευσης αρχείων; Εισάγετε το όνομα του καταλόγου που θα χρησιμοποιηθεί για την αποθήκευση κατεβασμένων αρχείων EML ή/και δεδομένων. Αν ο κατάλογος δεν υπάρχει, θα δημιουργηθεί.
-
(Για τον πίνακα EDDFromEML μόνο) URL EML ή τοπικό αρχείοName? Εισάγετε το URL ή το τοπικό όνομα αρχείου ενός αρχείου EML.
-
(Μόνο για τον πίνακα EDDFromEMLBatch) EML dir (URL ή τοπικό) ♪ ♪ Εισάγετε το όνομα του καταλόγου με τα αρχεία EML (ένα URL ή ένα τοπικό dir) . Για παράδειγμα: http://sbc.lternet.edu/data/eml/files/
-
(Μόνο για τον πίνακα EDDFromEMLBatch) Όνομα αρχείου regex; Εισάγετε την κανονική έκφραση που θα χρησιμοποιηθεί γι α τον προσδιορισμό των επιθυμητών αρχείων EML στον κατάλογο EML. Για παράδειγμα: Mamba, Σχέση/dating
-
Χρήση τοπικών αρχείων αν υπάρχουν (αλήθεια|ψευδές) ♪ ♪ Εισάγετε αλήθεια για να χρησιμοποιήσετε τα υπάρχοντα τοπικά αρχεία EML και αρχεία δεδομένων, αν υπάρχουν. Εισάγετε ψευδή για να επανακατεβάσετε πάντα τα αρχεία EML ή/και τα αρχεία δεδομένων.
-
προσβάσιμη Για να; Αν θέλετε τα νέα σύνολα δεδομένων να είναι ιδιωτικά σύνολα δεδομένων σεERDDAP, να προσδιορίσει το όνομα της ομάδας (α) θα επιτρέπεται η πρόσβαση. Συνιστάται για ομάδες LTER: συνδυάζουν "lter" συν την ομάδα, π.χ., lter ΣΒΚ . Εάν μπείτε "null", δεν θα υπάρξει<προσβάσιμη To> ετικέτα στην έξοδο. Βλέπεις;προσβάσιμη Στο.
-
τοπικό ΧρόνοςZone (π.χ., ΗΠΑ/Ειρηνικού) ♪ ♪ Εάν μια χρονική μεταβλητή δείχνει ότι έχει τοπικές τιμές ώρας, αυτή η ζώνη ώρας θα οριστεί. Αυτό πρέπει να είναι μια τιμή από τοΚατάλογος των ονομάτων ζώνης ώρας στη στήλη TZ. Σημειώστε όλα τα εύκολα στη χρήση "ΗΠΑ/..." ονόματα στο τέλος της λίστας. Εάν αργότερα διαπιστώσετε ότι είναι λάθο ς, μπορείτε να αλλάξετε τοtime\_zoneστο κομμάτι τουdatasets.xml.
EML συνERDDAP™είναι ένας μεγάλος συνδυασμός, δεδομένου ότιERDDAP™μπορεί να δώσει στους χρήστες πιο άμεση πρόσβαση στον πλούτοΔίκτυο Γνώσης για Βιοπλοκή (ΚΝΒ) καιΜακροπρόθεσμη Οικολογική Έρευνα (ΛΕΚΤΡΟΝ) δεδομένα και να βοηθήσει αυτά τα έργα πληρούν την κυβέρνηση των ΗΠΑΠρόσβαση του κοινού στα Ερευνητικά Αποτελέσματα (ΠΑΡR) Απαιτήσειςκαθιστώντας τα δεδομένα διαθέσιμα μέσω υπηρεσίας ιστού. Επίσης, EML συνERDDAP™Φαίνεται σαν μια μεγάλη γέφυρα μεταξύ των επιστημόνων στο ακαδημαϊκό / NSF-χρηματοδοτούμενο βασίλειο και επιστήμονες στην ομοσπονδιακή υπηρεσία (NOAA, NASA, USGS) Βασίλειο.
Δείτε μαςτμήμα για τη λήψη πρόσθετης υποστήριξης.
Λεπτομέρειες σχεδιασμού
Εδώ είναι οι λεπτομέρειες σχεδιασμού της επιλογής EDDTableFromEML στο GenerateDatasetsXml. Ορισμένες σχετίζονται με διαφορές στον τρόπο με τον οποίο EML καιERDDAP™κάνει πράγματα και πώς GenerateDatasets Xml ασχολείται με αυτά τα προβλήματα.
Ένας πίνακας δεδομένων γίνεται έναςERDDAP™Σύνολο δεδομένων
Ένα αρχείο EML μπορεί να έχει πολλαπλές<δεδομένα Πίνακας>s.ERDDAP™κάνει έναERDDAP™dataset ανά EML dataTable. ΗdatasetIDγια το σύνολο δεδομένων EMLName \Τ Αριθμός πίνακα (όταν το όνομα EML είναι κείμενο) ή *σύστημα\ EMLName* \_Τ Αριθμός πίνακα (όταν το όνομα EML είναι αριθμός) . Για παράδειγμα, ο πίνακας # 1 στο αρχείο knb-lter-sbc.28, γίνεταιERDDAP™ datasetID=knb\_lter\_sbc\_28\_t1,
EML έναντι CF+ACDD
Σχεδόν όλα τα μεταδεδομένα στα αρχεία EML μπαίνουν σεERDDAP, αλλά σε διαφορετική μορφή.ERDDAP™χρησιμοποιεί τοΚΦκαιACDDπρότυπα μεταδεδομένων. Πρόκειται για συμπληρωματικά συστήματα μεταδεδομένων που χρησιμοποιούν ζεύγη key=τιμών για τα παγκόσμια μεταδεδομένα και για τα μεταδεδομένα κάθε μεταβλητής. Ναι, η αναπαράσταση EML των μεταδεδομένων είναι καλύτερη από την αναπαράσταση CF+ACDDD. Δεν προτείνω τη χρήση της αναπαράστασης CF+ACDD ως αντικατάστασης του EML. Παρακαλώ σκεφτείτε CF+ACDD ως μέρος της γέφυρας από τον κόσμο EML στοOPeNDAP/CF/ACDD κόσμο.
Μικρές αλλαγές
ERDDAP™Κάνει πολλές μικρές αλλαγές. Για παράδειγμα,ERDDAP™χρησιμοποιεί το EML μη-DOIαναπληρωματικό Αναγνωριστικό συν έναν αριθμό πίνακα δεδομένων ωςERDDAP™ datasetID, αλλά ελαφρώς αλλάζει εναλλάξ Αναγνωριστικό για να γίνει έγκυρο μεταβλητό όνομα στις περισσότερες γλώσσες υπολογιστών, π.χ., δεδομένα knb-lter-sbc.33 Ο πίνακας # 1 γίνεται knb\_lter\_sbc\_33\1.