与datasets.xml文件
\[此網頁將只引起興趣ERDDAP™管理者\]
你跟著我ERDDAP™ 安裝指令您必須編輯datasets.xml文件在 湯姆卡 /content/erddap/ 描述您的數據集ERDDAP™安裝會用上
你可以看到一個例子datasets.xml在 GitHub 上.
-
- –
引言
需要一些大會
在ERDDAP™不只是指向數據集的目錄或網址。 您必須寫入一塊 XML 。datasets.xml描述數據集。
- 用于网格化的數據集,以使數據集符合ERDDAP網格化數據的數據結構, 您必須找出數據集的一個子集, 這些子集的變數具有相同的維度 。 (為什麼? 怎么做?)
- 資料集目前的元数据自動匯入 。 但如果您要修改中繼資料或加入其他中繼資料, 您必須在datasets.xml. 而且ERDDAP™需要其他元数据,包括全局屬性 (例如infoUrl机构,sourceUrl摘要和标题) 和變數屬性 (例如long\_name單位) . 正如目前數據集中的中繼資料增加了描述性資訊,ERDDAP™新增資料集的描述性資訊 。 新增的中繼資料是您數據集的一個很好的新增, 并且有幫助ERDDAP ™向不熟悉的使用者展示你的資料。
- ERDDAP™需要你做一些特殊的事情經度、纬度、高度 (深度) 時間變數.
如果你買入這些想法 并花錢建立 XMLdatasets.xml你得到所有的優點ERDDAP™,包括:
- 資料集的全文搜索
- 按類別搜尋數據集
- 資料存取表 ( datasetID .html) 以便您可以要求數個不同檔案格式的數據子集
- 要求圖示和地圖的表單 ( datasetID 圖片)
- 網頁映射服務 (WMS) 格子化的數據集
- RESTful存取您的資料
制作datasets.xml第一批數據集需要大量努力,但 越來越容易 . 在第一個數據集之後, 您常常可以重新使用很多工作來做下一個數據集 。 很幸運ERDDAP™帶兩個來工具以幫助您建立 XML 每套資料datasets.xml. 如果你卡住了,看我們的部分.
資料提供者 表單
當數據提供者來到您想要將一些數據加入您的ERDDAP,收集所有的中繼資料可能很困難和耗時 (數據集的資訊) 需要將數據集加入ERDDAP. 很多資料來源 (例如,.csv文件, Excel 文件, 資料庫) 沒有內部中繼資料 所以ERDDAP™有一個資料提供方表格,它收集資料提供者的中繼資料,并給資料提供者一些其他的指導,包括廣泛的指導數據庫中的資料. 提交的資訊已轉換成datasets.xml格式,然后發到ERDDAP™管理者 (你) 已寫入 (附 件) 至 大家长會 /logs/data 提供form.log. 因此,窗体半自動將數據集的進化 过程ERDDAP但是ERDDAP™管理員仍然需要完成datasets.xml區塊與處理取得資料檔 (s) 從提供者或連接數據庫。
外部來源提交實際資料檔案是巨大的安全風險,所以ERDDAP™不處理。 您必須想出一個對您和數據提供者有效的解決方案, 例如電子郵件 (小檔案) ,拉出云 (例如, DropBox 或 Google 驱动器) , sftp 網站 (有密碼) 或运动鞋 净额 (USB 拇指硬碟或外部硬碟) . 你可能只應該接受你認識的人的檔案 您需要掃瞄病毒的檔案並采取其他安全防范措施 。
沒有任何連結ERDDAP™到資料提供者表格 (例如,ERDDAP™主頁) . 相反,當有人告訴你,他們想得到他們的數據 由你的ERDDAP你可以發個電子郵件給他們說: 是的,我們可以把你的數據輸入ERDDAP. 要開始,請填表到 https://yourUrl/erddap/dataProviderForm.html (或http://如果https://沒有開啟) . 你做完後,我會聯繫你 找出最後的細節 如果你想看看表格 (不填) 你可以看到表格上ERD是ERDDAP:引言,第一部分,第二部分,第三部分和第四部分. 這些連結在ERD ERDDAP™傳送資訊給我,不是你,所以不要跟他們提交資訊 除非你真的想把數據加入到ERD ERDDAP.
如果您要移除資料提供者表格ERDDAP™放 置
<dataProviderFormActive>false</dataProviderFormActive>
在您的設定值. xml 檔案中 。
原因就是NOAA2014年公众获取研究成果 (批次) 指令,要求所有NOAA透過數據服務, (不只是檔案) 在建立12個月內 因此,使用ERDDAP™以讓數據集通過服務 ASAP 提供 。 我們需要更有效的方法 處理大量數據提供商
反馈/建议? 此表格是新格式, 請用電子郵件erd dot data at noaa dot gov若您有任何回應或建議,
工具
ERDDAP™包含兩個指令行程式, 它們是幫助您為您想要的每個數據集建立 XML 的工具ERDDAP™服侍。 一旦你建立ERDDAP™运行它 (至少一次) 您可以在 湯姆卡 /webapps/erddap/WEB-INF目錄. 有 Linux/ Unix shell 文稿 (与延伸.sh) 和 Windows 文稿 (與延伸.bat) 。\[在 Linux 上, 以相同的使用者來執行這些工具 (湯姆卡特?) 那會是湯姆卡特的運作\]當你執行每個項目,它會問你問題。 每一個問題, 輸入回覆, 然后按 Enter 。 或者按 ^C 以退出程式 。
程序不跑?
- 如果您得到未知的程序 (或类似) 錯誤訊息, 問題可能是操作系統找不到Java. 你需要知道在哪里Java在您的電腦上, 然后編輯您要使用的 . bat 或 .sh 檔案中的 java 參考 。
- 如果您得到一個沒有找到的罐子檔案或類別找不到錯誤訊息, 那么Java找不到您要使用的 . bat 或 .sh 檔案中列出的課程 。 解決辦法是找出 . jar 檔案的位置,
- 如果你正在使用版本Java對程式來說太老了,程式不會執行,你會看到一個錯誤訊息
線中的例外 java. lang。 未支援的 ClassVersion Error :
部分/ 类/ 名稱 : 不支援的主要. minor 版本 數字
解決辦法是更新最新版本Java確保程式的 .sh 或 .bat 檔案正在使用它 。
這些工具會印出各种診斷訊息:
- 使用「 錯誤」 一词, 雖然犯錯很煩人,
- 但程序得以完成。 這些很稀有
- 其他的只是信息 您可以加入 &- 動詞到產生 DatasetsXml或達斯Dds命令行以取得其他信息訊息, 這有時有助于解決問題 。
這兩件工具很有幫助 但你還是得小心翼翼地讀讀這些指示 自己做出重要的決定
產生 DatasetsXml
- 產生 DatasetsXml 是一個命令行程式, 它可以為幾乎任何類型的數據集產生一個簡略的數據集 XML 草稿 。
我們強烈建議你用"造物主" Xml 而不是建立區塊datasets.xml因:
- 產生達塔斯 Xml工作在秒。 即使你知道自己在做什麼 手工做這至少是一個小時的工作
- 產生達塔斯 Xml做得更好 手動操作需要大量了解ERDDAP™工作。 你不可能用手做更好的工作 (鮑勃·西蒙斯總是使用產生代碼 他寫了ERDDAP.)
- 產生達塔斯 Xml 總是產生有效的區塊datasets.xml. 任何區塊datasets.xml您寫作的錯誤可能至少會有幾項防止ERDDAP™從載入數據集。 人們常常需要數小時才能判斷這些問題。 別浪費時間 讓產生 數據集 努力工作 如果你愿意,你可以手工提炼.xml。
當您使用產生代碼時 Xml 程式 :
- 在 Windows 上, 當您第一次執行 GenerateDatasetsXml 時, 您需要用文字編輯器編輯 GenerateDatasetsXml. bat 檔案, 以改變 java 的路徑 。 exe 檔案以便 Windows 找到Java.
- 產生達塔斯 Xml 先要求您指定 EDDType (Erd Dap 資料集 類型) 中。 看數據集類型列表 (此文件) 以找出适合您正在研究的數據集的類型 。 除了普通的EDDTYPS外,特殊/ Pseudo 資料集類型 (例如,爬行THREDDS目錄以產生大量datasets.xml用于目錄中的每個數據集) .
- 產生達塔斯 Xml 然后問你一系列與EDDType相關的問題 收集 所需信息ERDDAP™以存取数据集的來源。 要明白什么ERDDAP™的 EDDType 檔案。數據集類型列表.
如果您需要輸入有特殊字元的字串 (例如,初端或末端的空白字符,非 ASCII 字符) 插入JSON 樣式字串 (用\ 字符逃出的特殊字符) . 例如,只輸入一個分頁字元, 請輸入「\ t 」 (與周圍的雙引號一起), 它會顯示ERDDAP™這是JSON式的弦
- 通常,你的答案之一 不會是Generate DatasetsXml需要的。 你可以再試一次, 重新回答問題, 直到生成達塔塞斯 Xml 可以成功找到和理解源資料 。
- 如果你回答正确 (或完全正确) 生成達塔斯 Xml 將會連接至數據集的來源並收集基本資訊 (例如,變數名稱和中繼資料) . 用于本地端的數據集NetCDF .nc和相關檔案, 產生 Datasets Xml 會在檔案第一次讀取後, 列印檔案的類似 ncdump 的結構 。 這可能會提供資訊, 讓您在之後的回路中更好的回答問題。 GenerateDatasetsXml 。
- 產生達塔斯 Xml 將會產生該数据集的資料集 XML 的粗略草稿 。
- 診斷資訊和數據集 XML 的粗略草稿將寫入 大家长會 /logs/GenerateDatasetsXml.log.
- 數據集 XML 的粗略草稿將寫入 大家长會 / logs/ Generate DatasetsXml.
"0文件" 錯誤訊息
如果你執行產生達泰斯 Xml 或達斯Dds或者如果你試著加載EDDGrid來自... 檔案資料集ERDDAP™,您會收到"0檔案"的錯誤訊息,表示ERDDAP™在目錄中找到 0 匹配的檔案 (當你認為目錄中有匹配的檔案 時) :
-
請檢查您是否指定了目錄的全名 。 如果您指定了樣本檔名, 請確定您指定了檔案的全名, 包括完整目錄名稱 。
-
請檢查檔案是否真的在目錄中 。
-
請檢查目錄名稱的拼寫 。
-
檢查檔案Name Regex 。 真的,真的很容易犯錯 為了試驗目的, 試試所有檔案的 regex 。 (看這個regex 文件和regex 教程.)
-
檢查執行程式的使用者 (例如,使用者=Tomcat (?) 托姆卡特/ERDDAP) 已讀取檔案的權限 。
-
在一些操作系統中 (例如, SELinux) 依據系統設定, 執行此程式的使用者必須有「 讀取」 的權限, 才能將目錄連結到有檔案的目錄 。
-
如果你有你無法解決的問題要求支援有尽可能多的信息。 類似地,如果它似乎適當的 EDDType 對給定的數據集不起作用, 或者沒有適當的 EDDType, 請檔案 。在 GitHub 上發表內容 (和樣本檔( 如果相關)) .
您需要編輯 GenerateDatasets 的輸出 使它更好。
-
女士: 琴datasets.xml產生代碼 Xml不完美。 在公開使用前,你必須讀和剪除XMLERDDAP. 產生達塔斯 Xml Relis on a lot -OF -THUMB的很多規定, 總是不正確的。 你對确保你所愛的XML 的不公有責任ERDDAP'Sdatasets.xml法利。
(趣事:我不是大喊大叫. 因為歷史上的法律原因 免责書必須寫在所有的封面上)
GenerateDatasetsXml 的輸出是粗略的草稿 。 您幾乎總是需要編輯它 。 我們已經做了,而且繼續做了巨大的努力 盡可能使輸出做好了準備 但有限度的 通常,根本找不到來源中繼資料。
一個根本的問題是 我們在要求電腦程序 (產生 DatasetsXml) 如果你把同樣的任務給了100人 你會得到100個不同的結果 沒有一個"正确"的答案 顯然,這個程序最接近于讀 Bob的心思 (不是你的) 但即使如此,這也不是一個全體理解的AI程序, 只是一堆heuristics拼凑在一起來完成一個AI類似的工作. (一個全體理解的AI程式的那一天可能會到來,但還沒有. 如果有的話 我們人類可能有更大的問題 當心你的願望)
-
以資訊為目的, 輸出顯示全局源屬性與變數源屬性為註解 。ERDDAP™合并來源屬性與addAttributes (优先) 混合 顯示給使用者的屬性 。 (其他屬性自動加入經度、經度、高度、深度和時間變數ERDDAP™實際上使數據集) .
-
如果您不喜歡來源屬性, 請加入一個同名的附加屬性來覆寫它 。 (或者沒有值, 如果您要移除它) .
-
全部addAttributes是電腦產生的建議 。 編輯他們! 如果你不喜歡增加屬性 就改一下
-
如果你想加入其它addAttributes加入
-
如果你想改變destinationName改一下 但不要改變sourceNames.
-
你可以改變秩序dataVariables或移除其中任何一個。
- 你可以使用達斯Dds (见下文) 以重試 XML 的數據集, 以确保產生的數據集以您想要的顯示方式出現ERDDAP.
- 可以做小的改變datasets.xml例如,生成的區塊提供更好的infoUrl或标题。
不添加標準名稱
如果您在執行產生時將 \- doNoteAddStandard Names 作为命令行參數 數據集 Xml, 產生 數據集 Xml 不會新增standard\_name至addAttributes除已命名為經度、高度、深度或時間的變數外, (明顯的standard\_names) . 如果您使用產生的輸出, 這可能有用 數據集 直接在 Xml 中ERDDAP™不編輯輸出, 因為產生 數據集 Xml 常猜standard\_name不對 (注意,我們總是建議您先編輯輸出後再用到ERDDAP.) 使用此參數會有其他次要的相關效果, 因為猜測standard\_name通常用于其他目的,例如:long\_name,並建立色彩列設定值。
文稿
可以提供命令行參數, 回答所有問題以產生一個數據集。 產生達塔斯 Xml 會處理這些參數, 將輸出寫入輸出檔, 並退出程式 。
要設定此項目, 請先以互動模式使用程式並寫入您的答案 。 以下是部分例子: 不如你來執行劇本吧... 然後輸入: EDD Table From AsiiFiles 的 EDD Table 檔案 然后輸入 : /u00/ data/ 加入: 然後輸入:/u00/data/sampleFile.asc 然后輸入: ISO- 8859-1
要以非交互方式執行, 請使用此命令行 : . / Generate DatasetsXml.sh 由 Ascii Files /u00/data/. \*\.asc /u00/data/sampleFile.asc ISO-8859-1 所以基本上 你只要列出命令線上的所有答案 這對經常變更的數據集有用, 需要重新執行 GenerateDatasets Xml 命令 (显著EDDGrid從 ThreddsCatalog 中) .
細節 :