EDDTableFromEML और EDDTableFromEMLBatch में विकल्प GenerateDatasets एक्सएमएल
\[यह वेब पेज केवल ब्याज का ही होगाERDDAP™व्यवस्थापक जो EML फ़ाइलों के साथ काम करते हैं। यह दस्तावेज़ मूल रूप से 2016 में बनाया गया था। यह पिछले 2020-11-30 पर संपादित किया गया था।\]
ERDDAP™ एक डेटा सर्वर है जो उपयोगकर्ताओं को सामान्य फ़ाइल प्रारूपों में ग्रिडड और सारणीबद्ध वैज्ञानिक डेटासेट के सबसेट डाउनलोड करने और ग्राफ और मैप बनाने का एक सरल, सुसंगत तरीका देता है।ERDDAP™किसी दिए गए डेटासेट के साथ या तो बहुआयामी ग्रिड चर के एक समूह के रूप में काम करता है (उदाहरण के लिए, उपग्रह या मॉडल डेटा) या डेटाबेस जैसी तालिका के रूप में (प्रत्येक प्रकार की जानकारी के लिए एक कॉलम और प्रत्येक अवलोकन के लिए एक पंक्ति क े साथ) ।ERDDAP™मुफ्त और ओपन सोर्स सॉफ्टवेयर है, इसलिए कोई भी कर सकता हैडाउनलोड करेंERDDAP™अपने डेटा की सेवा करने के लिए।
एक डेटासेट को जोड़ने के लिएERDDAP™स्थापना, स्थापनाERDDAP™व्यवस्थापक को XML का एक हिस्सा जोड़ना होगा जिसे डेटासेट को एक फ़ाइल में वर्णित करना चाहिए जिसे बुलाया जाता हैdatasets.xml। (वहाँ हैप्रलेखनdatasets.xml।) हालांकि, XML का हिस्सा बनाना संभव हैdatasets.xmlपूरी तरह से हाथ सेERDDAP™कहा जाता है एक उपकरण के साथ आता है जनरेट DatasetXml जो डेटासेट के बारे में जानकारी के कुछ स्रोत के आधार पर किसी दिए गए डेटासेट के लिए XML के हिस्से के मोटे ड्राफ्ट को तैयार कर सकता है।
पहली चीज GenDatasets Xml पूछता है कि आप किस प्रकार का डेटासेट बनाना चाहते हैं। जनगणना XML एक विशेष विकल्प है, EDDTableFromEML , जो जानकारी का उपयोग करता हैपा रिस्थितिक मेटाडाटा भाषा (EML) XML फ़ाइल के लिए XML का हिस्सा उत्पन्न करने के लिएdatasets.xmlबनानाEDDTableFromAsciiFilesप्रत्येक डेटा तालिका से एक EML फ़ाइल में डेटासेट। यह अधिकांश EML फ़ाइलों के लिए बहुत अच्छी तरह से काम करता है, क्योंकि ज्यादातर EML फाइलें एक आसान काम करने वाले प्रारूप में डेटासेट के लिए आवश्यक मेटाडाटा के सभी भंडारण का उत्कृष्ट काम करती हैं। उस जानकारी को उत्पन्न करने वालेDatasetsXml को डेटासेट बनाने की आवश्यकता होती है, जिसमें डेटा फ़ाइल के लिए यूआरएल शामिल है, जो उत्पन्न करता हैDatasetsXml डाउनलोड, parses, और EML फ़ाइल में विवरण की तुलना करता है। (कई समूह EML पर स्विच करने के लिए अच्छी तरह से करेंगे, जो किसी भी सारणीबद्ध वैज्ञानिक डेटासेट को दस्तावेज करने के लिए एक महान प्रणाली है, न केवल पारिस्थितिक डेटा। और XML स्कीमा बनाने वाले कई समूह EML का उपयोग XML स्कीमा के लिए एक केस स्टडी के रूप में करने के लिए अच्छी तरह से करेंगे, जो स्पष्ट हैं, बिंदु पर, अत्यधिक गहरी नहीं (यानी, बहुत सारे स्तर) मानव और कंप्यूटर के साथ काम करने के लिए आसान है।)
प्रश्न
यहाँ सभी प्रश्न हैं GenerateDatasets Xml पूछेंगे, इस बारे में टिप्पणियां के साथ कि आपको कैसे जवाब देना चाहिए यदि आप सिर्फ एक EML फ़ाइल या EML फ़ाइलों का बैच संसाधित करना चाहते हैं:
-
कौन सा EDDtype? यदि आप केवल एक फ़ाइल संसाधित करना चाहते हैं, तो उत्तर दें: EDDTableFromEML यदि आप फ़ाइलों के एक समूह को संसाधित करना चाहते हैं, तो उत्तर दें: EDDTableFromEMLBatch
-
फ़ाइलों को स्टोर करने के लिए निर्देशिका? उस निर्देशिका का नाम दर्ज करें जिसका उपयोग डाउनलोड EML और/या डेटा फ़ाइलों को स्टोर करने के लिए किया जाएगा। यदि निर्देशिका मौजूद नहीं है, तो इसे बनाया जाएगा।
-
(EDDTableFromEML के लिए केवल) EML यूआरएल या स्थानीय fileName? एक EML फ़ाइल का URL या स्थानीय फ़ाइल नाम दर्ज करें।
-
(केवल EDDTableFromEMLBatch के लिए) EML dir (यूआरएल या स्थानीय) ? EML फ़ाइलों के साथ निर्देशिका का नाम दर्ज करें (यूआरएल या एक स्थानीय dir) । उदाहरण के लिए: http://sbc.lternet.edu/data/eml/files/
-
(केवल EDDTableFromEMLBatch के लिए) फ़ाइल नाम regex? नियमित अभिव्यक्ति दर्ज करें जिसका उपयोग EML डायरेक्टरी में वांछित EML फ़ाइलों की पहचान करने के लिए किया जाएगा। उदाहरण के लिए: knb-lter-sbc \\d+
-
यदि मौजूद हो तो स्थानीय फ़ाइलों का उपयोग करें (सच|झूठ) ? यदि वे मौजूद हैं तो मौजूदा स्थानीय EML फ़ाइलों और डेटा फ़ाइलों का उपयोग करने के लिए सही दर्ज करें। हमेशा EML फ़ाइलों और/या डेटा फ़ाइलों को फिर से डाउनलोड करने के लिए झूठी प्रवेश करें।
-
सुलभ क्या? यदि आप चाहते हैं कि नए डेटासेट निजी डेटासेट होंERDDAP, समूह का नाम निर्दिष्ट करें (s) इसे अनुमति दी जाएगी। LTER समूहों के लिए सिफारिश की: गठबंधन "lter" प्लस समूह, उदाहरण के लिए, lटर एसबीसी यदि आप "null" में प्रवेश करते हैं, तो कोई नहीं होगा<सुलभ To> उत्पादन में टैग. देखेंसुलभ करने के लिए।
-
स्थानीय टाइमजोन (उदाहरण के लिए, US/Pacific) ? यदि एक समय परिवर्तनीय इंगित करता है कि इसमें स्थानीय समय मान हैं, तो इस समय क्षेत्र को सौंपा जाएगा। इससे मूल्य होना चाहिएटाइम जोन नामों की TZ कॉलम सूची। सूची के अंत में सभी आसान उपयोग "यूएस / ..." नामों को नोट करें। यदि आपको बाद में पता चल जाता है कि गलत है, तो आप बदल सकते हैंtime\_zoneके हिस्से मेंdatasets.xml।
EML प्लसERDDAP™एक महान संयोजन है, क्योंकिERDDAP™उपयोगकर्ताओं को धन के लिए अधिक प्रत्यक्ष पहुंच प्रदान कर सकते हैंBiocomplexity के लिए ज्ञान नेटवर्क (KNB) औरदीर्घकालिक पारिस्थितिक अनुसंधान (LTER) उन परियोजनाओं को अमेरिकी सरकार से मिलने में मदद करता हैअनु संधान परिणाम (PARR) आवश्यकताएंवेब सेवा के माध्यम से उपलब्ध डेटा बनाकर। इसके अलावा, EML प्लसERDDAP™संघीय एजेंसी में अकादमिक / एनएसएफ-फंडेड रियल्म और वैज्ञानिकों के बीच एक महान पुल की तरह लगता है (NOAAनासा, USGS) Realm.
देखेंअतिरिक्त समर्थन प्राप्त करने पर अनुभाग।
डिजाइन विवरण
यहां GENERDatasetsXml में EDDTableFromEML विकल्प का डिजाइन विवरण दिया गया है। कैसे EML में अंतर से संबंधित हैं औरERDDAP™What is a word or how जेनरेटडेटासेट Xml इन समस्याओं से संबंधित है।
एक डाटाटेबल बन जाता है एकERDDAP™डेटासेट
एक EML फ़ाइल एकाधिक हो सकता ह ै<डेटा तालिका>s.ERDDAP™बनानाERDDAP™प्रति EML dataTable dataset। The The most of thedatasetIDडेटासेट के लिए है EMLName \_t तालिका (जब EMLname पाठ है) या प्रणाली \_EMLName \_t तालिका (जब EMLname एक नंबर है) । उदाहरण के लिए, फ़ाइल knb-lter-sbc.28 में टेबल #1, बन जाता हैERDDAP™ datasetID= knb \_lter \_sbc \_28 \_t1,
EML बनाम CF+ACDD
लगभग सभी मेटाडाटा में EML फ़ाइलें हो जाता हैERDDAPलेकिन एक अलग प्रारूप में।ERDDAP™उपयोगCFऔरएसीडीमेटाडाटा मानकों। वे पूरक मेटाडाटा सिस्टम हैं जो वैश्विक मेटाडाटा के लिए और प्रत्येक परिवर्तनीय मेटाडाटा के लिए key=value जोड़े का उपयोग करते हैं। हां, मेटाडाटा का EML प्रतिनिधित्व CF + ACDD प्रतिनिधित्व की तुलना में अच्छा है। मैं EML के प्रतिस्थापन के रूप में CF+ACDD प्रतिनिधित्व का उपयोग करने का सुझाव नहीं दे रहा हूं। कृपया EML दुनिया से EML दुनिया के पुल के हिस्से के रूप में CF+ACDD के बारे में सोचेंOPeNDAP/CF / ACDD दुनिया।
छोटे बदलाव
ERDDAP™कई छोटे बदलाव करता है। उदाहरण के लिए,ERDDAP™EML का उपयोग करनाDOIवैकल्पिक पहचानकर्ता प्लस डेटाTable संख्या के रूप मेंERDDAP™ datasetIDलेकिन थोड़ा बदलाव वैकल्पिक पहचानकर्ता इसे अधिकांश कंप्यूटर भाषाओं में एक वैध परिवर्तनीय नाम बनाने के लिए, उदाहरण के लिए, knb-lter-sbc.33 डेटा तालिका #1 \_lter \_sbc \_33 \_t1 हो जाता है।
DocBook
EML EML फ़ाइलों में पाठ के ब्लॉक के लिए संरचना प्रदान करने के लिए डॉकबुक की मार्कअप प्रणाली का उपयोग करता है। CF और ACDD की आवश्यकता है कि मेटाडाटा सादे पाठ है। So GenerateDataset Xml पाठ को सादे पाठ में परिवर्तित करता है जो पाठ के स्वरूपित संस्करण की तरह दिखता है। इनलाइन टैग को वर्ग कोष्ठक के साथ पवित्र किया जाता है, उदाहरण के लिए,\[जोर देना\], और सादे पाठ में छोड़ दिया।
डेटा फ़ाइल
चूंकि EML डेटाTable में वास्तविक डेटा फ़ाइल का URL, जेनरेटडाटासेट शामिल है Xml होगा:
- डेटा फ़ाइल डाउनलोड करें।
- इसे EML फाइल के समान डायरेक्टरी में स्टोर करें।
- डेटा पढ़ें।
- फ़ाइल में वास्तविक डेटा के साथ EML में डेटा के विवरण की तुलना करें।
- अगर GenerateDatasets Xml मतभेदों को ढूंढता है, यह उनके साथ सौदा करता है, या ऑपरेटर से पूछता है यदि अंतर ठीक है, या त्रुटि संदेश लौटाता है। विवरण नीचे विभिन्न वस्तुओं में हैं।