EML 的 EDD 表和EMLBatch 的 EDD表 產生達泰斯的選項 Xml 命令
\[此網頁將只引起興趣ERDDAP™工作於 EML 文件的管理員 。 此文件最初建立于2016年. 最近一次改編于2020-11-30.\]
ERDDAP™ 是一個數據伺服器, 讓使用者可以簡單、一致的方式以共同的檔案格式下載網格化和表格化的科學數據集, 並製作圖和地圖。ERDDAP™以給定的數據集做為多维網格變數群組 (例如,卫星或模型数据) 或作為類似資料庫的表格 (每類資訊的列和每項觀察的列) .ERDDAP™是自由開源碼軟件,所以任何人都可以下載及安裝ERDDAP™提供他們的數據
將數據集加入到ERDDAP™安裝, 即ERDDAP™管理員必須將描述數據集的 XML 區塊加入到稱為檔案中datasets.xml. (有完整文件datasets.xml.) 雖然可以產生 XML 的區塊datasets.xml完全靠手ERDDAP™帶來一個叫做「 工具」 的工具 產生 DatasetsXml 它可以產生一個給定的資料集需要的 XML 區塊的粗略草稿, 其基於數據集的某些資訊來源 。
第一件事 產生達塔塞斯 Xml 問您要建立什麼樣的數據集 。 產生達塔斯 Xml有特殊的選擇 EML 的 EDD 表格 ,在其中使用信息生态元数据語言 (EML) 產生 XML 區塊的 XML 檔案datasets.xml要建立Ascii 檔案中的 EDD 表格EML 檔案中每個資料表中的數據集。 這對大多數 EML 檔案非常有效, 大多是因為 EML 檔案非常出色地將所有需要的中繼資料儲存在容易操作的格式中 。 GenerateDatasetsXml 要建立數據集需要的資訊在 EML 檔案中, 包括資料檔的URL, 它會產生 DatasetsXml 下載, 剖析, 並比對 EML 檔案中的描述 。 (許多團體會善於轉換到EML, 建立 XML chemas 的許多群組會用 EML 做為 XML chema 的案例研究, (也就是,太多的關卡) 也容易讓人類和電腦合作)
疑問
這是所有問題 產生達塔斯 Xml 會問, 若您要處理一個 EML 檔案或數批 EML 檔案, 該如何回答 :
-
哪個EDDTYPE? 如果您要處理一個檔案, 請回答: EDD Table FromEML 如果您要處理一组檔案, 請回答: EDD Table FromEMLBatch
-
要儲存檔案的目錄 ? 輸入要儲存已下載的EML 和/或資料檔的目錄名稱 。 如果目錄不存在, 會被建立 。
-
(EML 中的 EDD 表格 只有) EML 網址或本地檔案Name 輸入 EML 文件的 URL 或本地文件名 。
-
(只對EMLBatch的 EDD 表格) EML 迪爾 (網址或本地端) ? 用 EML 檔案輸入目錄名稱 (URL 或本地目录) . 例如: http://sbc.lternet.edu/data/eml/files/
-
(只對EMLBatch的 EDD 表格) 文件名 regex ? 輸入正規表示式, 用于在 EML 目錄中辨識想要的 EML 檔案 。 例如: knb- lter- sbc\.\ d+
-
如果存在, 使用本地文件 (真|假) ? 如果已存在, 輸入以使用本地 EML 檔案與資料檔 。 輸入假以總是重新下載 EML 檔案和/或資料檔 。
-
可存取 要? 如果您想讓新數據集成為私人數據集ERDDAP,指定群組名稱 (s) 這將被允許存取。 建議使用 LTER 群組: 將「 lter」 加上群組, 例如 liter 斯比克 如果你輸入「 null 」 , 就沒有<可存取 輸出中的 togt; 標籤 。 看可存取 至.
-
本地 時區 (例如,美国/太平洋) ? 如果時間變數表示它有本地時間值, 此時區將被指定 。 這一定是從TZ 時區名稱列列表. 注意所有容易使用的名字。 如果你後來發現這不正確,你可以改變time\_zone區塊datasets.xml.
EML 附加ERDDAP™是個很棒的搭檔,因為ERDDAP™可以讓使用者更直接地取得生物复合性知识网络 (KNB) 和长期生态研究 (升) 幫助這些計畫與美國政府相遇,公众获取研究成果 (批次) 所需经费以網路服務提供數據。 另外,EML+ERDDAP™似乎在學術界/NSF資助的科學家 和聯邦機構的科學家之間 (NOAANASA,USGS) 域。
看我們的部分.
設計細節
以下是生成 DatasetsXml 中的 EDDTable FromEML 選項的設計細節 。 部分原因与EML和ERDDAP™做事和如何產生達塔塞斯 Xml處理這些問題。
一個資料表變成一個ERDDAP™數據集
一個EML 檔案可能有多重<資料 表格( G) 。ERDDAP™做一個ERDDAP™eML 資料表。 其datasetID數據集 EML Name \_t 表格 (當 EML 名稱是文字時) 或 系統QQEMLName \_t 表格 (當 EML 名稱是數字時) . 例如, 檔案 knb- lter- sbc.28 中的表 1 變成ERDDAP™ datasetID=knb\_lter\_sbc\_28\_t1,
EML 對 CF+ACDD
EML 檔案中几乎所有的中繼資料都進入ERDDAP,但格式不同。ERDDAP™使用CF和ACDD元数据標準 。 它們是互补的元数据系統, 對, 中繼資料的 EML 代表比 CF+ ACDD 代表更好 。 我不是說用CF+ACDD代表來取代EML 請將 CF+ACDD 視為從EML世界到OPeNDAP/CF/ACDD世界.
小變更
ERDDAP™做了很多小改變。 例如,ERDDAP™使用 EML 非 -DOI替代 辨識器加數據表數字為ERDDAP™ datasetID稍有變更 以 Knb- lter- sbc.33 資料等語言將它變成有效的變數名稱 表1成了knb\_lter\_sbc\_33\_t1.
DocBook 文稿
EML 使用 DocBook 的標記系統來為 EML 檔案中的文字區塊提供結構 。 CF 和 ACDD 要求中繼資料是純文字 。 所以產生達塔斯 Xml 將標記的文字轉換成純文本, 看起來像是格式化的文字版本 。 內含的標籤用方括号进行消毒,例如,\[強調\],然后放在正文中。
資料檔案
由于 EML 資料表包含實際資料檔的網址, GenerateDatasets Xml 會:
- 下載資料檔 。
- 儲存在與 EML 檔案相同的目錄中 。
- 讀一下資料
- 將 EML 中的資料描述與檔案中的实际資料比較 。
- 如果產生達塔斯 Xml 找到不同, 它會處理它們, 或是問操作員是否正確, 或是傳回錯誤訊息 。 以下各目各目。
.zip資料檔
如果引用的資料檔是.zip檔案, 它必須包含一個檔案 。 此檔案將用於ERDDAP™數據集。 如果有不止一個檔案 。ERDDAP™會拒絕數據集 如果需要,可以修改。 (實際上, 所有 SBC LTER zip 檔案只有一個資料檔 。)
儲存模式
如果列的儲存 型態沒有指定,ERDDAP™使用基于資料檔中資料的最佳猜測 。 效果很好
單位
ERDDAP™使用UDUNITS單位格式化. 產生達塔斯 Xml 能將 EML 單位轉換為UDUNITS95%的時間是清潔的 其余的5%可以讀取單位的描 述,例如,EML中的"生質單位感應單位"(BiomasDensity UnitPerAbendance Unit)成為"生質單位密度單位每丰度單位"(Biomas centrality unit each fund).ERDDAP. 從技術上說,這是不允许的。 我不認為在這種情況下會很糟\[必要的話,不能制造的單位UDUNITS兼容可移至變數的註解屬性 。\]
EML 版本 2.1.1
EML v2.1.1 檔案的此支援已新增到 GenerateDatasets 2016年, 截至2020年,这种情况尚未发生。 其ERDDAP™開發者很樂意加入對 EML 更近代版本的支援, 但前提是新功能會被實際使用 。 請發郵件erd.data at noaa.gov如果您想要支援 EML 的最近版本, 並會使用此功能 。
EML 文件的問題
EML 檔案中有些問題或問題讓軟體客戶端產生問題 (例如生成 DatasetsXML 中的 EDDTable FromEML 選項) 試著解析/處理 EML 檔案 。
- 雖然這裡有幾個問題, 總而言之 EML是個很棒的系統 我很高興能與它合作
- 由最差的/ 最普遍到最差的/ 不太常见。
- 大多與特定 EML 檔案中的小問題有關 (不是EML的錯) .
- 大多數可以由 EML 檔案或資料檔的簡單變更來固定 。
- 因為LTER人們正在建立EML檢查器以測試EML檔案的有效性,
以下是: