EDTable fromEML และ EDTable fromEMLBatch ตัวเลือกต่าง ๆ ในการสร้าง Datatas Xml
\[หน้าเว็บนี้จะสนใจเฉพาะหน้าเว็บERDDAP™ผู้ดูแลระบบที่ทํางานกับแฟ้ม EML เดิมมีการสร้างเอกสารนี้ในปี 2016 มันถูกแก้ไขครั้งสุดท้ายเมื่อ 2020-11-30\]
ERDDAP™ เป็นเซิร์ฟเวอร์ข้อมูลที่ทําให้ผู้ใช้สามารถดาวน์โหลด สับเซตของข้อมูลวิทยาศาสตร์ที่ฝังอยู่ และแท็บลาร์ในรูปแบบแฟ้มทั่วไป และทํากราฟและแผนที่ได้ERDDAP™ทํางานกั บชุดข้อมูลที่เป็นกลุ่มของตัวแปรหลายมิติ (เช่น ดาวเทียมหรือข้อมูลต้นแบบ) หรือเป็นตารางแบบฐานข้อมูล (มีคอลัมน์สําหรับข้อมูลแต่ละประเภท และแถวสําหรับแต่ละข้อสังเกต) .ERDDAP™เป็นซอฟต์แวร์เสรีและโอเพนซอร์ส ดังนั้นทุกคนสามารถดาวน์โหลดและติดตั้งERDDAP™เพื่อให้บริการข้อมูลของพวกเขา
เพื่อเพิ่มข้อมูลไปยังERDDAP™การติดตั้ง,ERDDAP™ผู้ดูแลระบบต้องเพิ่มส่วนย่อยของ XML เพื่ออธิบายข้อมูลเป็นแฟ้มที่ชื่อdatasets.xml. (มีเอกสารที่สมบูรณ์สําหรับdatasets.xml.) แม้ว่ามันเป็นไปได้ที่จะสร้างส่วนย่อยของ XML สําหรับdatasets.xmlด้วยมือทั้งหมดERDDAP™มาพร้อมเครื่องมือที่เรียกว่า สร้าง DatatasXml ซึ่งสามารถสร้างการ ร่างแบบหยาบๆ ของส่วนย่อยของ XML ที่จําเป็นต้องใช้สําหรับชุดข้อมูลที่ให้ โดยอิงจากแหล่งข้อมูลบางอย่างเกี่ยวกับช ุดข้อมูล
สิ่งแรกที่สร้าง Datatatets Xml ถามคือว่า คุณสร้างชุดข้อมูลแบบไหน ตั้งค่าชุดภาพไอคอนสื่ออารมณ์ XMI มีตัวเลือกพิเศษ EDTable fromEML ซึ่งใช้ข้อมูลในภาษา ข้อมูลกํากับภาพ ทาง นิเวศ วิทยา (EML) แฟ้ม XML เพื่อสร้างส่วนย่อยของ XML สําหรับdatasets.xmlเพื่อสร้างแฟ้ม DDTA จาก Asciiชุดข้อมูลจากแต่ละตารางข้อมูลในแฟ้ม EML มันใช้ได้อย่างดีกับแฟ้ม EML ส่วนใหญ่เพราะไฟล์ EML ทําหน้าที่อย่างดีเยี่ยมในการเก็บข้อมูลกํากับภาพที่จําเป็นทั้งหมด ข้อมูลที่สร้าง DatatatasXml จําเป็นต้องสร้างชุดข้อมูลอยู่ในแฟ้ม EML รวมถึงที่อยู่ URL ของแฟ้มข้อมูล ซึ่งสร้างการดาวน์โหลด DatatatasXml, profiles และเปรียบเทียบกับรายละเอียดในแฟ้ม EML (หลายกลุ่มน่าจะเปลี่ยนเป็น EML ซึ่งเป็นระบบที่ดีในการบันทึกข้อมูลทางวิทยาศาสตร์ และหลายๆกลุ่มที่สร้าง XML Schemas ควรจะใช้ EML เป็นกรณีศึกษาสําหรับ XML Chema ที่ชัดเจน (มีหลายระดับ) และง่ายสําหรับมนุษย์และคอมพิวเตอร์ที่จะทํางานกับ)
คํา ถาม
นี่คือคําถามทั้งหมดที่สร้าง Datatets Xml จะถามด้วยหมายเหตุเกี่ยวกับวิธีการตอบคําถาม หากคุณต้องการประมวลผลเพียงแฟ้ม EML ครั้งเดียว หรือชุดของแฟ้ม EML:
-
ED ประเภทไหน? หากคุณต้องการประมวลผลเพียงแฟ้มเดียว คําตอบ: EDTable fromEML หากคุณต้องการประมวลผลกลุ่มของแฟ้ม ให้คําตอบ: EDTable fromEMLBatch
-
ไดเร็กทอรีที่จะจัดเก็บแฟ้มหรือไม่? ป้อนชื่อไดเรกทอรีที่จะใช้เก็บค่า EML และ/หรือแฟ้มข้อมูล ถ้าไดเรกทอรีไม่มีอยู่ ก็จะถูกสร้างขึ้น
-
(สําหรับ EDTable fromEML เท่านั้น) ที่อยู่ URL EML หรือแฟ้มภายในระบบName ป้อนที่อยู่ URL หรือชื่อแฟ้มภายในระบบของ EML
-
(สําหรับ EDTable fromEMLBatch เท่านั้น) ไดเร็คทอรี EML (ที่อยู่ URL หรือภายใน) ? ป้อนชื่อไดเรกทอรีที่มีแฟ้ม EML (ที่อยู่ URL หรือไดเรกทอรีภายในระบบ) . ตัว อย่าง เช่น: http://sbc.lternet.edu/data/eml/files/
-
(สําหรับ EDTable fromEMLBatch เท่านั้น) Regex ชื่อแฟ้ม? ป้อนเงื่อนไขการค้นหาที่จะใช้ระบุแฟ้ม EML ที่ต้องการในไดเร็กทอรี EML ตัวอย่างเช่น: nnb-lter-sbc\\d+
-
ใช้แฟ้มภายในระบบหากมีอยู่ (จริง|เท็จ) ? ป้อนจริงที่จะใช้แฟ้ม EML ภายในระบบที่มีอยู่ และแฟ้มข้อมูล หากมันมีอยู่จริง เติมเท็จเพื่อทําการโหลดแฟ้ม EML และ/หรือแฟ้มข้อมูลใหม่อีกครั้งเสมอ
-
เข้าใช้ได้ เพื่อ? หากคุณต้องการชุดข้อมูลใหม่ ให้เป็นชุดข้อมูลส่วนตัวERDDAPชื่อกลุ่ม (วินาที) นั่นอนุญาตให้เข้าถึงได้ แนะนําสําหรับกลุ่ม LTER: ผสม "lter" บวกกลุ่ม, e.g., Iter เอสบีซี ถ้าคุณป้อน "null" จะไม่มี<เข้าใช้ได้ ถึง httpgt; แท็ก ในการแสดงผล ดูเข้าใช้ได้ ถึง.
-
ภายใน เวลาzone (เช่น US/Pacific) ? หากตัวแปรเวลาแสดงว่า มีค่าของเวลาท้องถิ่น พื้นที่เวลานี้จะถูกกําหนดให้ใช้ นี่ต้องเป็นค่าจากรายชื่อคอลัมน์ของเขตเวลา TZ. หมายเหตุทั้งหมดของชื่อ "US/..." ที่อยู่ท้ายรายการที่ง่ายต่อการใช้ ถ้าคุณพบว่ามันไม่ถูกต้อง คุณสามารถเปลี่ยนtime\_zoneในก้อนของdatasets.xml.
EML บวกERDDAP™เป็นส่วนผสมที่ดีตั้งแต่ERDDAP™สามารถให้ผู้ใช้เข้าถึงความอุดมสมบูรณ์ของความ รู้ ใน เครือ ข่าย ชีวภาพ (KNB) ถึงการ วิจัย ทาง นิเวศ วิทยา ระยะ ยาว (LTER) ข้อมูลและช่วยเหลือโครงการเหล่านั้น ตรงกับรัฐบาลสหรัฐการ เข้า ถึง แหล่ง วิจัย ทั่ว ไป (ผิดพลาด) ต้องการโดยทําให้ข ้อมูลใช้ได้ผ่านทางบริการเว็บ นอกจากนี้ EML บวกERDDAP™ดูเหมือนเป็นสะพานที่ดี ระหว่างนักวิทยาศาสตร์ในราชอาณาจักรของ NSF และนักวิทยาศาสตร์ในหน่วยงานกลาง (NOAAนาซ่า USGS) แดน
ดูของเราส่วนของการได้รับการสนับสนุนเพิ่มเติม.
รายละเอียดการออกแบบ
นี่เป็นรายละเอียดของการออกแบบ ตัวเลือก EDTable fromEML ในการสร้าง DatatasXml บางคนเกี่ยวข้องกับความแตกต่างของ EML และERDDAP™ทําสิ่งต่างๆ และวิธีสร้าง Datatets XmI จัดการกับปัญหาเหล่านี้
หนึ่งข้อมูลกลายเป็นหนึ่งERDDAP™ชุดข้อมูล
แฟ้ม EML หนึ่งแฟ้มอาจมีหลายแฟ้ม<ข้อมูล Table>s.ERDDAP™ทําให้หนึ่งERDDAP™ชุดข้อมูลต่อข้อมูล EML เดอะdatasetIDสําหรับชุดข้อมูล อีเอ็มแอลName _สี ตัวเลขตาราง (เมื่อชื่อ EML เป็นข้อความ) หรือ ระบบ\ _อีเอ็มแอลName _สี ตัวเลขตาราง (เมื่อชื่อ EML เป็นหมายเลข) . ตัวอย่างเช่น ตาราง #1 ในแฟ้ม mineb-lter-sbc.28 กลายเป็นERDDAP™ datasetID= knb\_lter_sbc\_28_t1
EML เทียบกับ CF+ACDD
ข้อมูลกํากับภาพเกือบทั้งหมดในแฟ้ม EMLERDDAPแต่ในรูปแบบอื่นERDDAP™ใช้CFถึงหมายเลข ACDมาตรฐานข้อมูล มันเป็นระบบข้อมูลกํากับที่เสริมสร้าง ซึ่งใช้คีย์ = คู่ค่าของข้อมูลกํากั บภาพระดับโลก และต่อข้อมูลกํากับภาพของตัวแปรแต่ละตัวแปร ใช่ รูป EML ของข้อมูลกํากับ ดีกว่ารูป CF+ACD ผมไม่ได้แนะนําให้ใช้รูป CF+ACDD แทน EML กรุณาคิดว่า CF+ACAD เป็นส่วนหนึ่งของสะพาน จากโลก EMLOPeNDAPโลกของ CF/ACDD
การเปลี่ยนแปลงขนาดเล็ก
ERDDAP™ทําการเปลี่ยนแปลงเล็กๆ มากมาย ยกตัวอย่างเช่นERDDAP™ใช้ EML ที่ไม่ -DOIเปลี่ยน ตัวระบุบวกข้อมูลERDDAP™ datasetIDแต่การเปลี่ยนแปลงเล็กน้อย ตัวระบุเพื่อทําให้เป็นชื่อตัวแปรที่ถูกต้องในภาษาคอมพิวเตอร์ส่วนใหญ่ เช่น, knb-lter-sbc.33 ข้อมูล ตาราง #1 กลายเป็น knb\_lter///sbc\_33/_t1
ด็อกบุ๊ค
EML ใช้ระบบทําเครื่ องหมายของ DocBook เพื่อให้โครงสร้างสําหรับบล็อกข้อความในแฟ้ม EML CF และ ACDD ต้องการข้อมูลกํากับเป็นข้อความธรรมดา ดังนั้นการสร้าง Datatatets Xml แปลงข้อความที่ถูกขีดไว้เป็นข้อความธรรมดาที่ดูคล้ายกับฉบับที่มีหน่วยเป็นระบบ ป้ายอินไลน์ถูกเคลือบด้วยวงเล็บสี่เหลี่ยม, e.g.\[เน้น\]และทิ้งไว้ในข้อความธรรมดา
แฟ้มข้อมูล
เนื่องจากข้อมูลของ EML มีตําแหน่ง URL ของแฟ้มข้อมูลจริงอยู่ ให้สร้าง Datatas XMI จะ:
- ดาวน์โหลดแฟ้มข้อมูล
- เก็บในไดเรกทอรีเดียวกันกับแฟ้ม EML
- อ่านข้อมูล
- เปรียบเทียบรายละเอียดของ EML กับข้อมูลจริงในแฟ้ม
- หากสร้าง Datatas XMI หาความแตกต่าง, มันเกี่ยวข้องกับพวกมัน, หรือถามผู้ดําเนินการว่าผลต่างโอเคหรือไม่, หรือตอบกลับข้อคว ามผิดพลาด ราย ละเอียด เหล่า นี้ มี หลาย อย่าง ข้าง ล่าง นี้.
.zipแฟ้มข้อมูล 'd'
ถ้าแฟ้มอ้างอิงคือ.zipแฟ้ม, มันต้องมีเพียงแฟ้มเดียว แฟ้มนั้นจะถูกใช้สําหรับERDDAP™ชุดข้อมูล ถ้ามีมากกว่าหนึ่งแฟ้มERDDAP™จะปฏิเสธข้อมูลชุดนั้น ถ้า จําเป็น อาจ มี การ แก้ไข เรื่อง นี้. (ในการฝึก แฟ้มข้อมูล SBC ทั้งหมด มีไฟล์ข้อมูลเพียงแฟ้มเดียว)
สื่อเก็บข้อมูล
ถ้าคลังของคอลัมน์ ไม่ได้ระบุประเภทERDDAP™ใช้การเดาที่ดีที่สุด จากข้อมูลในแฟ้มข้อมูล อันนี้ใช้ได้ทีเดียว
หน่วย
ERDDAP™ใช้UDUNITSฟอร์แมตสําหรับหน่วย. ตั้งค่าชุดภาพไอคอนสื่ออารมณ์ Xml สามารถแปลงหน่วย EML เป็นUDUNITSอย่างชัดเจนประมาณ 95% ของเวลา 5% ส่วนที่เหลือให้ผลในคําอธิบายการอ่านของหน่วย เช่น "biomasDensity Unit Perabundance University" ใน EML กลายเป็น "หน่วยความหนาแน่นไบมาสต่อหน่วยมวล" ในERDDAP. ในทางเทคนิคแล้วมันไม่ได้รับอนุญาต ฉันไม่คิดว่ามันแย่นัก ภายใต้สถานการณ์แบบนี้\[ถ้าจําเป็น หน่วยที่ไม่สามารถทําUDUNITSการเข้ากันได้สามารถถูกย้ายไปยังคุณลักษณะหมายเหตุของตัวแปร\]
EML รุ่น 2.1.
การรองรับ EML v2.1 นี้ ถูกเพิ่มเข้ากับแฟ้มถูกสร้าง Datatets XMI ในปี ค.ศ. 2020 นั่นยังไม่เกิดขึ้น เดอะERDDAP™ผู้พัฒนาคงจะยินดีที่จะเพิ่มการสนับสนุน EML รุ่นล่าสุดมากขึ้น แต่เฉพาะเมื่อคุณสมบัติใหม่นี้ถูกนําไปใช้จริงเท่านั้น กรุณาส่งเมลerd.data at noaa.govถ้าคุณต้องการการสนับสนุน EML รุ่นล่าสุด และจะใช้คุณสมบัตินี้จริงๆ
ปัญหาเกี่ยวกับแฟ้ม EML
มีบางปัญหา/ ปัญหาเกี่ยวกับแฟ้ม EML ที่ก่อให้เกิดปัญหาเมื่อโปรแกรมลูกข่าย (เช่น ตัวเลือก EDTable fromEML ในการสร้าง DatatetesXML) พยายามแปล/ โพรเซสของแฟ้ม EML
- แม้ ว่า มี หลาย ประเด็น ที่ กล่าว มา นี้ แต่ ส่วน ใหญ่ แล้ว ปัญหา เหล่า นี้ เป็น ปัญหา เล็ก ๆ และ แก้ ได้. โดยทั่วไป EML เป็นระบบที่ยอดเยี่ยม และได้รับความสุขของฉันที่จะทํางานกับมัน
- มี การ คัด แยก อย่าง คร่าว ๆ จาก สิ่ ง ที่ เลว ร้าย ที่ สุด หรือ ส่วน ใหญ่ แล้ว ไม่ ดี หรือ น้อย ที่ สุด.
- ส่วนใหญ่เกี่ยวข้องกับปัญหาเล็ก ๆ ในแฟ้ม EML เฉพาะ (ซึ่งมันไม่ใช่ความผิดของ EML) .
- ส่วนมากสามารถแก้ไขได้โดยการเปลี่ยนรูปแบบแฟ้ม EML หรือแฟ้มข้อมูล
- จากที่คน LTER สร้างเครื่องตรวจ EML เพื่อทดสอบความถูกต้องของไฟล์ EML ผมเพิ่มคําแนะนําบางอย่างด้านล่างนี้ เกี่ยวกับคุณสมบัติที่อาจถูกเพิ่มเข้าไป
ต่อ ไป นี้ เป็น ประเด็น:
แบ่งวันที่และเวลาเป็นคอลัมน์
แฟ้มข้อมูลบางแฟ้มแยกคอลัมน์สําหรับวันที่และเวลาด้วย แต่ไม่มีคอลัมน์วันรวม+เวลา ปัจจุบัน XmI สร้างชุดข้อมูลที่มีคอลัมน์แยกเหล่านี้ แต่มันไม่ได้อุดมคต ิเพราะ:
- มันจะดีที่สุดถ้าชุดข้อมูลในERDDAP™มีคอลัมน์วันที่รวม"time".
- บ่อยครั้งที่ชุดข้อมูลจะไม่โหลดERDDAP™เพราะว่า"time"คอลัมน์ไม่มีข้อมูลวันที่ + เวลา
มีวิธีแก้ที่เป็นไปได้อยู่สองทาง
- แก้ไขแฟ้มข้อมูลต้นฉบับเพื่อเพิ่มคอลัมน์ใหม่ในแฟ้มข้อมูล (และอธิบายมันใน EML) โดยวันที่และเวลา จะรวมกันเป็นหนึ่งคอลัมน์ การสร้าง Datata ใหม่อีกครั้ง XMI เพื่อให้มันหาคอลัมน์ใหม่
- ใช้ตัวแปรการไล่ระดับสีแสดงในERDDAP™เพื่อกําหนดตัวแปรใหม่ในdatasets.xmlผู้ทรงกําหนดวันและเวลา ตัว อย่าง หนึ่ง เกี่ยว ข้อง กับ สถานการณ์ นี้ โดย เฉพาะ.