与datasets.xml文件
\[此網頁將只引起興趣ERDDAP™管理者\]
你跟著我ERDDAP™ 安裝指令您必須編輯datasets.xml文件在 湯姆卡 /content/erddap/ 描述您的數據集ERDDAP™安裝會用上
你可以看到一個例子datasets.xml在 GitHub 上.
-
- –
引言
需要一些大會
在ERDDAP™不只是指向數據集的目錄或網址。 您必須寫入一塊 XML 。datasets.xml描述數據集。
- 用于网格化的數據集,以使數據集符合ERDDAP網格化數據的數據結構, 您必須找出數據集的一個子集, 這些子集的變數具有相同的維度 。 (為什麼? 怎么做?)
- 資料集目前的元数据自動匯入 。 但如果您要修改中繼資料或加入其他中繼資料, 您必須在datasets.xml. 而且ERDDAP™需要其他元数据,包括全局屬性 (例如infoUrl机构,sourceUrl摘要和标题) 和變數屬性 (例如long\_name單位) . 正如目前數據集中的中繼資料增加了描述性資訊,ERDDAP™新增資料集的描述性資訊 。 新增的中繼資料是您數據集的一個很好的新增, 并且有幫助ERDDAP™向不熟悉的使用者展示你的資料。
- ERDDAP™需要你做一些特殊的事情經度、纬度、高度 (深度) 時間變數.
如果你 買入這些想法 并花錢建立 XMLdatasets.xml你得到所有的優點ERDDAP™,包括:
- 資料集的全文搜索
- 按類別搜尋數據集
- 資料存取表 ( datasetID .html) 以便您可以要求數個不同檔案格式的數據子集
- 要求圖示和地圖的表單 ( datasetID 圖片)
- 網頁映射服務 (WMS) 格子化的數據集
- RESTful存取您的資料
制作datasets.xml第一批數據集需要大量努力,但 越來越容易 . 在第一個數據集之後, 您常常可以重新使用很多工作來做下一個數據集 。 很幸運ERDDAP™帶兩個來工具以幫助您建立 XML 每套資料datasets.xml. 如果你卡住了,看我們的部分.
資料提供者 表單
當數據提供者來到您想要將一些數據加入您的ERDDAP,收集所有的中繼資料可能很困難和耗時 (數據集的資訊) 需要將數據集加入ERDDAP. 很多資料來源 (例如,.csv文件, Excel 文件, 資料庫) 沒有內部中繼資料 所以ERDDAP™有一個資料提供方表格,它收集資料提供者的中繼資料,并給資料提供者一些其他的指導,包括廣泛的指導數據庫中的資料. 提交的資訊已轉換成datasets.xml格式,然后發到ERDDAP™管理者 (你) 已寫入 (附 件) 至 大家长會 /logs/data 提供form.log. 因此,窗体半自動將數據集的進化过程ERDDAP但是ERDDAP™管理員仍然需要完成datasets.xml區塊與處理取得資料檔 (s) 從提供者或連接數據庫。
外部來源提交實際資料檔案是巨大的安全風險,所以ERDDAP™不處理。 您必須想出一個對您和數據提供者有效的解決方案, 例如電子郵件 (小檔案) ,拉出云 (例如, DropBox 或 Google 驱动器) , sftp 網站 (有密碼) 或运动鞋 净额 (USB 拇指硬碟或外部硬碟) . 你可能只應該接受你認識的人的檔案 您需要掃瞄病毒的檔案並采取其他安全防范措施 。
沒有任何連結ERDDAP™到資料提供者表格 (例如,ERDDAP™主頁) . 相反,當有人告訴你,他們想得到他們的數據 由你的ERDDAP你可以發個電子郵件給他們說: 是的,我們可以把你的數據輸入ERDDAP. 要開始,請填表到 https://yourUrl/erddap/dataProviderForm.html (或http://如果https://沒有開啟) . 你做完後,我會聯繫你 找出最後的細節 如果你想看看表格 (不填) 你可以看到表格上ERD是ERDDAP:引言,第一部分,第二部分,第三部分和第四部分. 這些連結在ERD ERDDAP™傳送資訊給我,不是你,所以不要跟他們提交資訊 除非你真的想把數據加入到ERD ERDDAP.
如果您要移除資料提供者表格ERDDAP™放置
<dataProviderFormActive>false</dataProviderFormActive>
在您的設定值. xml 檔案中 。
原因就是NOAA2014年公众获取研究成果 (批次) 指令,要求所有NOAA透過數據服務, (不只是檔案) 在建立12個月內 因此,使用ERDDAP™以讓數據集通過服務 ASAP 提供 。 我們需要更有效的方法 處理大量數據提供商
反馈/建议? 此表格是新格式, 請用電子郵件erd dot data at noaa dot gov若您有任何回應或建議,
工具
ERDDAP™包含兩個指令行程式, 它們是幫助您為您想要的每個數據集建立 XML 的工具ERDDAP™服侍。 一旦你建立ERDDAP™运行它 (至少一次) 您可以在 湯姆卡 /webapps/erddap/WEB-INF目錄. 有 Linux/ Unix shell 文稿 (与延伸.sh) 和 Windows 文稿 (與延伸.bat) 。\[在 Linux 上, 以相同的使用者來執行這些工具 (湯姆卡特?) 那會是湯姆卡 特的運作\]當你執行每個項目,它會問你問題。 每一個問題, 輸入回覆, 然后按 Enter 。 或者按 ^C 以退出程式 。
程序不跑?
- 如果您得到未知的程序 (或类似) 錯誤訊息, 問題可能是操作系統找不到Java. 你需要知道在哪里Java在您的電腦上, 然后編輯您要使用的 . bat 或 .sh 檔案中的 java 參考 。
- 如果您得到一個沒有找到的罐子檔案或類別找不到錯誤訊息, 那么Java找不到您要使用的 . bat 或 .sh 檔案中列出的課程 。 解決辦法是找出 . jar 檔案的位置,
- 如果你正在使用版本Java對程式來說太老了,程式不會執行,你會看到一個錯誤訊息
線中的例外 java. lang。 未支援的 ClassVersion Error :
部分/ 类/ 名稱 : 不支援的主要. minor 版本 數字
解決辦法是更新最新版本Java確保程式的 .sh 或 .bat 檔案正在使用它 。
這些工具會印出各种診斷訊息:
- 使用「 錯誤」 一词, 雖然犯錯很煩人,
- 但程序得以完成。 這些很稀有
- 其他的只是信息 您可以加入 &- 動詞到產生 DatasetsXml或達斯Dds命令行以取得其他信息訊息, 這有時有助于解決問題 。
這兩件工具很有幫助 但你還是得小心翼翼地讀讀這些指示 自己做出重要的決定
產生 DatasetsXml
- 產生 DatasetsXml 是一個命令行程式, 它可以為幾乎任何類型的數據集產生一個簡略的數據集 XML 草稿 。
我們強烈建議你用"造物主" Xml 而不是建立區塊datasets.xml因:
- 產生達塔斯 Xml工作在秒。 即使你知道自己在做什麼 手工做這至少是一個小時的工作
- 產生達塔斯 Xml做得更好 手動操作需要大量了解ERDDAP™工作。 你不可能用手做更好的工作 (鮑勃·西蒙斯總是使用產生代碼 他寫了ERDDAP.)
- 產生達塔斯 Xml 總是產生有效的區塊datasets.xml. 任何區塊datasets.xml您寫作的錯誤可能至少會有幾項防止ERDDAP™從載入數據集。 人們常常需要數小時才能判斷這些問題。 別浪費時間 讓產生 數據集 努力工作 如果你愿意,你可以手工提炼.xml。
當您使用產生代碼時 Xml 程式 :
- 在 Windows 上, 當您第一次執行 GenerateDatasetsXml 時, 您需要用文字編輯器編輯 GenerateDatasetsXml. bat 檔案, 以改變 java 的路徑 。 exe 檔案以便 Windows 找到Java.
- 產生達塔斯 Xml 先要求您指定 EDDType (Erd Dap 資料集 類型) 中。 看數據集類型列表 (此文件) 以找出适合您正在研究的數據集的類型 。 除了普通的EDDTYPS外,特殊/ Pseudo 資料集類型 (例如,爬行THREDDS目錄以產生大量datasets.xml用于目錄中的每個數據集) .
- 產生達塔斯 Xml 然后問你一系列與EDDType相關的問題 收集所需信息ERDDAP™以存取数据集的來源。 要明白什么ERDDAP™的 EDDType 檔案。數據集類型列表.
如果您需要輸入有特殊 字元的字串 (例如,初端或末端的空白字符,非 ASCII 字符) 插入JSON 樣式字串 (用\ 字符逃出的特殊字符) . 例如,只輸入一個分頁字元, 請輸入「\ t 」 (與周圍的雙引號一起), 它會顯示ERDDAP™這是JSON式的弦
- 通常,你的答案之一 不會是Generate DatasetsXml需要的。 你可以再試一次, 重新回答問題, 直到生成達塔塞斯 Xml 可以成功找到和理解源資料 。
- 如果你回答正确 (或完全正确) 生成達塔斯 Xml 將會連接至數據集的來源並收集基本資訊 (例如,變數名稱和中繼資料) . 用于本地端的數據集NetCDF .nc和相關檔案, 產生 Datasets Xml 會在檔案第一次讀取後, 列印檔案的類似 ncdump 的結構 。 這可能會提供資訊, 讓您在之後的回路中更好的回答問題。 GenerateDatasetsXml 。
- 產生達塔斯 Xml 將會產生該数据集的資料集 XML 的粗略草稿 。
- 診斷資訊和數據集 XML 的粗略草稿將寫入 大家长會 /logs/GenerateDatasetsXml.log.
- 數據集 XML 的粗略草稿將寫入 大家长會 / logs/ Generate DatasetsXml.
"0文件" 錯誤訊息
如果你執行產生達泰斯 Xml 或達斯Dds或者如果你試著加載EDDGrid來自... 檔案資料集ERDDAP™,您會收到"0檔案"的錯誤訊息,表示ERDDAP™在目錄中找到 0 匹配的檔案 (當你認為目錄中有匹配的檔案時) :
-
請檢查您是否指定了目錄的全名 。 如果您指定了樣本檔名, 請確定您指定了檔案的全名, 包括完整目錄名稱 。
-
請檢查檔案是否真的在目錄中 。
-
請檢查目錄名稱的拼寫 。
-
檢查檔案Name Regex 。 真的,真的很容易犯錯 為了試驗目的, 試試所有檔案的 regex 。 (看這個regex 文件和regex 教程.)
-
檢查執行程式的使用者 (例如,使用者=Tomcat (?) 托姆卡特/ERDDAP) 已讀取檔案的權限 。
-
在一些操作系統中 (例如, SELinux) 依據系統設定, 執行此程式的使用者必須有「 讀取」 的權限, 才能將目錄連結到有檔案的目錄 。
-
如果你有你無法解決的問題要求支援有尽可能多的信息。 類似地,如果它似乎適當的 EDDType 對給定的數據集不起作用, 或者沒有適當的 EDDType, 請檔案 。在 GitHub 上發表內容 (和樣本檔( 如果相關)) .
您需要編輯 GenerateDatasets 的輸出 使它更好。
-
女士: 琴datasets.xml產生代碼 Xml不完美。 在公開使用前,你必須讀和剪除XMLERDDAP. 產生達塔斯 Xml Relis on a lot -OF -THUMB的很多規定, 總是不正確的。 你對确保你所愛的XML 的不公有責任ERDDAP'Sdatasets.xml法利。
(趣事:我不是大喊大叫. 因為歷史上的法律原因 免责書必須寫在所有的封面上)
GenerateDatasetsXml 的輸出是粗略的草稿 。 您幾乎總是需要編輯它 。 我們已經做了,而且繼續做了巨大的努力 盡可能使輸出做好了準備 但有限度的 通常,根本找不到來源中繼資料。
一個根本的問題是 我們在要求電腦程序 (產生 DatasetsXml) 如果你把同樣的任務給了100人 你會得到100個不同的結果 沒有一個"正确"的答案 顯然,這個程序最接近于讀 Bob的心思 (不是你的) 但即使如此,這也不是一個全體理解的AI程序, 只是一堆heuristics拼凑在一起來完成一個AI類似的工作. (一個全體理解的AI程式的那一天可能會到來,但還沒有. 如果有的話 我們人類可能有更大的問題 當心你的願望)
-
以資訊為目的, 輸出顯示全局源屬性與變數源屬性為註解 。ERDDAP™合并來源屬性與addAttributes (优先) 混合 顯示給使用者的屬性 。 (其他屬性自動加入經度、經度、高度、深度和時間變數ERDDAP™實際上使數據集) .
-
如果您不喜歡來源屬性, 請加入一個同名的附加屬性來覆寫它 。 (或者沒有值, 如果您要移除它) .
-
全部addAttributes是電腦產生的建議 。 編輯他們! 如果你不喜歡增加屬性 就改一下
-
如果你想加入其它addAttributes加入
-
如果你想改變destinationName改一下 但不要改變sourceNames.
-
你可以改變秩序dataVariables或移除其中任何一個。
- 你可以使用達斯Dds (见下文) 以重試 XML 的數據集, 以确保產生的數據集以您想要的顯示方式出現ERDDAP.
- 可以做小的改變datasets.xml例如,生成的區塊提供更好的infoUrl或标题。
不添加標準名稱
如果您在執行產生時將 \- doNoteAddStandard Names 作为命令行參數 數據集 Xml, 產生 數據集 Xml 不會新增standard\_name至addAttributes除已命名為經度、高度、深度或時間的變數外, (明顯的standard\_names) . 如果您使用產生的輸出, 這可能有用 數據集 直接在 Xml 中ERDDAP™不編輯輸出, 因為產生 數據集 Xml 常猜standard\_name不對 (注意,我們總是建議您先編輯輸出後再用到ERDDAP.) 使用此參數會有其他次要的相關效果, 因為猜測standard\_name通常用于其他目的,例如:long\_name,並建立色彩列設定值。
文稿
可以提供命令行參數, 回答所有問題以產生一個數據集。 產生達塔斯 Xml 會處理這些參數, 將輸出寫入輸出檔, 並退出程式 。
要設定此項目, 請先以互動模式使用程式並寫入您的答案 。 以下是部分例子: 不如你來執行劇本吧... 然後輸入: EDD Table From AsiiFiles 的 EDD Table 檔案 然后輸入 : /u00/ data/ 加入: 然後輸入:/u00/data/sampleFile.asc 然后輸入: ISO- 8859-1
要以非交互方式執行, 請使用此命令行 : . / Generate DatasetsXml.sh 由 Ascii Files /u00/data/. \*\.asc /u00/data/sampleFile.asc ISO-8859-1 所以基本上 你只要列出命令線上的所有答案 這對經常變更的數據集有用, 需要重新執行 GenerateDatasets Xml 命令 (显著EDDGrid從 ThreddsCatalog 中) .
細節 :
- 如果參數包含空間或某些特殊字元,則將參數編碼為JSON 樣式字串,例如,“我的參數有空 格和兩個\n行。
- 如果您要指定一個空字串為參數, 請使用: nothing
- 如果您要指定參數的預設值, 請使用: 預設值
- 產生達塔斯 Xml 支持 a -i 数据集 Xml Name # 標籤Name 將輸出插入到指定的命令行參數datasets.xml文件 (預設值是 湯姆卡 /内容/erddap/datasets.xml) . 產生達塔斯 Xml 在數據集中尋找兩行 Xml Name:
<!-- Begin GenerateDatasetsXml #*tagName someDatetime* -->
和
<!-- End GenerateDatasetsXml #*tagName someDatetime* -->
用新內容取代這些行之間的所有東西, 並改變一些日期。
- -i 切換只是處理 (更改datasets.xml只制作) 如果你執行產生達泰斯 Xml 有命令行參數, 指定所有問題的答案 。 (上面有"文稿") (想法是: 此參數與文稿一起使用 。 如果您以互動模式使用此程式 (在鍵盤上輸入信息) ,您很可能會產生一些不正確的 XML 區塊,然后才能產生您想要的 。)
- 如果找不到 Begin 和 End 的行, 那么這些行和新內容就在前面插入</erdapDatasets>.
- 還有... 我... (首都一) 切換以試驗目的與 -i 相同, 但會建立一個叫做檔案datasets.xml 日期 不做改變datasets.xml.
- 不要執行生成達泰斯 Xml 和 -i 一起分兩個行程 。 可能只保留一組變更 可能會有嚴重的麻煩 (例如, 檔案已損毀) .
如果你用「 Generate DatasetsXml - 動詞」 , 它會比通常的更打印批判性訊息 。
特殊/ Pseudo 資料集類型
泛泛的 EDDtype 選項 此文件描述的 EDD 型態的 Xml 匹配 (看數據集類型列表) 生成一datasets.xml從一 個特定資料來源建立一個数据集的區塊 。 有一些例外和特殊情况:
EDDGrid來自 Erddap
此 EDDType 產生所有datasets.xml需要做的區塊EDDGrid來自 Erddap所有資料集EDDGrid遠端的數據集ERDDAP. 你可以保留原版datasetIDs (可能重复一些datasetID已經在您的ERDDAP) 或生成新名稱 (但通常不是人能看懂的) .
EDD 表格來自 Erddap
此 EDDType 產生所有datasets.xml需要做的區塊EDD 表格來自 Erddap遠端 EDDTable 資料集中的數據集ERDDAP. 你可以保留原版datasetIDs (可能重复一些datasetID已經在您的ERDDAP) 或生成新名稱 (但通常不是人能看懂的) .
EDDGrid從 ThreddsCatalog 中
此 EDDType 產生所有datasets.xml全部需要的區塊EDDGrid從 Dap 中通过 THREDDS 遞迴爬行可以找到的數據集 (子) 目录. THREDDS 編目網址有很多形式。 此選項需要一個带有/ catalog/ 的 THREDDS . xml 網址, 例如 ,
https://oceanwatch.pfeg.noaa.gov/thredds/catalog/catalog.xml 或
https://oceanwatch.pfeg.noaa.gov/thredds/catalog/Satellite/aggregsatMH/chla/catalog.xml
(相關的.html目錄在
https://oceanwatch.pfeg.noaa.gov/thredds/Satellite/aggregsatMH/chla/catalog.html ,不能接受EDDGrid來自 ThreddsCatalog 。
如果你有問題EDDGrid從垃圾 星表 :
- 確保您使用的 URL 是有效的, 包括 / catalog/, 並以 / catalog. xml 結束 。
- 如果可能, 使用公共IP地址 (例如, https://oceanwatch.pfeg.noaa.gov ) 在 URL 中,不是本地的 IP 位址 (例如, https://12.34.56.78 ) . 如果 THREDDS 只能通过本地數位 IP 地址存取, 您可以使用 [<轉換到 Public SourceUrl > ] (#轉換到公用源碼器) 所以ERDDAP™使用者可以看到公共地址, 即使ERDDAP™得到本地數據位址的資料 。
- 如果你有你無法解決的問題檢查排除故障提示.
- 低等代碼現在使用UnidataNetcdf- java 編目爬行程式碼 (鞭打 目錄類別) 讓它能處理所有的 THREDDS 目錄 (可能很複雜) 多虧了Unidata密碼
EDDGrid來自 ErddapCatalog 的 LonPM180
此 EDDType 產生datasets.xml要制作EDDGrid龍PM180所有資料集EDDGrid數據集ERDDAP其經度值大于180。
- 如果可能, 使用公共IP地址 (例如, https://oceanwatch.pfeg.noaa.gov ) 在 URL 中,不是本地的 IP 位址 (例如, https://12.34.56.78 ) . 如果ERDDAP™只能透過本地數字 IP 位址存取, 您可以使用 [<轉換到 Public SourceUrl > ] (#轉換到公用源碼器) 所以ERDDAP™使用者可以看到公共地址, 即使ERDDAP™得到本地數據位址的資料 。
EDDGrid來自 ErddapCatalog 的 Lon0360
此 EDDType 產生datasets.xml要制作EDDGrid朗0360所有資料集EDDGrid數據集ERDDAP其經度值小于 0。
- 如果可能, 使用公共IP地址 (例如, https://oceanwatch.pfeg.noaa.gov ) 在 URL 中,不是本地的 IP 位址 (例如, https://12.34.56.78 ) . 如果ERDDAP™只能透過本地數字 IP 位址存取, 您可以使用 [<轉換到 Public SourceUrl > ] (#轉換到公用源碼器) 所以ERDDAP™使用者可以看到公共地址, 即使ERDDAP™得到本地數據位址的資料 。
檔案中的 EDDs
根據一個啟動目錄, 這會穿過目錄和所有子目錄, 並試著為它找到的每组資料檔案建立數據集 。
- 這假設當找到數據集時, 數據集包含所有的子目 。
- 如果找到數據集, 相似的兄弟姐妹目錄會被視為单独的數據集 ( 例如, 1990年代、 2000年代、 2010年代的目錄會產生不同的數據集) . 它們應該很容易用手結合 - 只需要改變第一數據集的<檔案 Dir > 到父目錄, 並刪除所有之後的兄弟姐妹數據集 。
- 這只會試著產生一塊datasets.xml在目錄中最常用的檔案延伸型態 (不計數 . md5, 已忽略) . 所以,給一個有十個的目錄.nc檔案與 5 .txt 檔案,將產生數據集.nc只有文件。
- 這假設一個目錄中所有與扩展名相同的檔案都屬於同一數據集 。 如果目錄有一些.nc包含 SST 資料和一些檔案.nc含有叶绿素數據的檔案,只有一個樣本.nc檔案將被讀取 (史蒂夫? 叶绿素?) 只會為此類型的檔案建立一個資料集 。 這套數據可能無法載入, 因為要將兩種檔案載入同一套數據會有複雜的問題 。
- 如果一個目錄中最常用的延伸檔數不足4個, 這會假設它們不是數據檔, 只是跳過目錄 。
- 如果目錄中有 4 個或更多檔案, 但此檔案無法成功產生 。datasets.xml檔案 (例如,不支援的檔案類型) ,會產生檔案名稱中的 EDD 表格檔案的數據集。
- 最後的診斷 寫到紀錄檔,就在之前datasets.xml區塊, 這會列印一個表格, 上面有所有子目錄的資訊摘要 。 表格會列出每個子目錄, 并指示最常用的檔案延伸檔類型、 檔案總數以及這些檔案的資料集類型 (如果有) . 如果您面對複雜而深嵌的檔案結構, 請考慮執行 GenerateDatasets 使用 EDDType=EDDsFromFiles 產生此資訊的 Xml,
- 這項選項可能無法為特定數據檔案猜測最好的 EDDType , 但是它很快速、容易, 值得一試 。 如果來源檔案適合,它效果良好,是產生此檔案的第一步。datasets.xml一個有許多子目錄的檔案系統, 每個子目錄都有不同數據集的資料檔。
EML 和 EMLBatch 的 EDD 表格
這些特殊的 EDDType 產生datasets.xml制作Ascii 檔案中的 EDD 表格a 描述的每個表格的數據集生态元数据語言XML 檔案 。 “ 批量” 變體工作於本地目錄或遠端目錄中的所有 EML 檔案 。 請看單位EML 中的 EDD Table 文件.
端口的 EDD 表格
這個特殊的 EDDType 產生datasets.xml制作Ascii 檔案中的 EDD 表格從資訊中的數據集插入- xml文件。 如果您能存取來源資料檔 (Inport-xml 檔案應該有線索找到它的位置) 您可以在ERDDAP.
以下階段概要描述如何使用 GenerateDataset 要取得工作數據集, Xml 使用 port- xml 檔案ERDDAP.
- 一旦您可以存取 import- xml 檔案 (或作為網址或本地端檔案) : 執行產生達泰斯 Xml, 指定 EDDType = EDDTable From InPort, 指定 port- xml URL 或全檔名, 指定哪個 Child=0, 指定要求的其他資訊 (如果知道) . (此刻, 您不需要有來源資料檔或指定其名稱 。) 小孩=0 的設定顯示產生達泰斯 Xml 寫入資訊 全部 主席<屬性- 資訊 ><實體 > 在 port- xml 檔案中 (如果有) . 也印出背景資訊摘要,
- 看看所有的信息 (包括生成 Datasets 的背景信息 Xml 打印) 查看下載的 URL (s) 要尋找來源資料檔 (s) . 如果你能找到它 (他們) 下載 (他們) 進入可以存取的目錄ERDDAP. (如果您找不到任何來源資料檔, 程序沒有意義 。)
- 執行產生 數據集 又是XML 如果來源資料檔案符合 lnport- xml 檔案中的一個<屬性- 資訊 ><實體>,指定哪個Child= 实体的數字 (例如,1,2,3...) .ERDDAP™將試圖將來源資料檔中的列名與實體資訊中的名字相匹配, 并迅速接受/ 拒絕/ 修正任何不符的地方 。 或者 如果進口文件沒有<屬性- 資訊 ><實體>,指定是哪一個Child=0.
- 在一塊datasets.xml由 GenerateDatasets 製作 Xml 修改 [全球<addAttributes>] (全球屬性) 需要/需要。
- 在一塊datasets.xml由 Generate DatasetsXml 制成,加入/重覆 [<dataVariable>] (可數據變化) 需要/希望描述每一變數的信息。 請確認每個變數是否正確 [<sourceName>] (# 源碼名稱) (根據來源) , [<destinationName>] (目的地名) (它比起sourceName) , [<單位 >] (單位) (特别是如果它是時間或時間戳變數單位需要指定格式的地方) 和 [<missing\_value>] (缺少值) ,
- 當你接近完成的時候, 重复使用達斯Dds工具以快速查看數據集描述是否合法, 以及數據集是否會出現在ERDDAP™如你所愿
如果使用 InPort 記錄其數據集的群組也會使用的話,那就太好了 。ERDDAP™提供实际数据:
- ERDDAP™是現在可以用到的解決方法 這樣你就能完成NOAA是公众获取研究成果 (批次) 所需经费現在,不是在某個模糊的時刻 在未來。
- ERDDAP™提供使用者的實際資料, (沒有資料的元数据有什麼用?)
- ERDDAP™支援中繼資料 (尤其是變數的單位) ,與 其它數據伺服器軟體不同。 (沒有中繼資料有什麼用?) 使用不支持中繼資料的軟體,
- ERDDAP™是自由且開源的軟體, 目前ERDDAP™已經付了錢。 支持ERDDAP™使用者是自由的。
- ERDDAP外表可以輕易地定制來反射和突出您的群組 (不是ERD或ERDDAP) .
- ERDDAP™以一致的方式存取所有數據集。
- ERDDAP™能夠從很多類型的資料檔和關係資料庫讀取資料。
- ERDDAP™可以處理大數據集,包括很多數據檔中有來源資料的數據集.
- ERDDAP™在使用者的要求下,可以將資料寫入很多類型的資料檔,包括科學資料檔類型,如NetCDF,ESRI.csv,以及ODV .txt.
- ERDDAP™根據使用者的规格,
- ERDDAP™可以處理非數據數據集, 如影像、影像或音效檔案的集合。
- ERDDAP™已安裝和使用於全世界60多家机构.
- ERDDAP™被列出為建議在NOAA在NOAA資料存取程序指令與其他軟體不同
- ERDDAP™是NMFS/NOAA因此在內部使用NMFS和NOAA應該是值得驕傲的一點NMFS和NOAA.
請給我ERDDAP™試一下 如果您需要幫助,請在ERDDAP™谷歌集團.
新增 FillVale 屬性
這個特殊的 EDDType 選項不是數據集類型 。 它可以將 QQFillValue 屬性加入到一些數據集中 。 看新增 FillVale 屬性.
尋找重复 時間
這個特殊的 EDDType 選項不是數據集類型 。 相反,它告訴生成達泰斯 要搜尋的 Xml 通訊錄.nc (相关) 要尋找和打印有重复時間值的檔案清單的檔案。 當它看到時間值時, 它會將它們從原始單位轉換成"seconds since 1970-01-01"如果不同的檔案使用不同的單位字符串。 您需要提供起始目錄 (隨後的刀片) ,檔案名稱正規表示式 (例如 . ..nc ) ,以及檔案中時間變數的名称。
弧度
這個特殊的 EDDType 選項不是數據集類型 。 相反,它告訴生成達泰斯 要打印的 Xml弧度類似印出.nc,.ncML,或.hdf文件。 實際上,它用的是 netcdf -java的NCdump 中,它比NCdump的C版本更有限。 如果您使用此選項, GenerateDatasetsXml 會要求您使用其中一個選項 : "- h" (信頭) ,"-c" (坐标 vars) "... " (預設) ,"-v var1;var2","-v var1" (0,0:10,0:20) ". 這是有用的,因為沒有了cdump 它很難知道是什麼在一個.nc,.ncML,或.hdf您要為 GenerateDataset 指定哪個 EDType 檔案 XML 。 為了.ncml 檔, 此檔案會列印 nucdump 輸出結果.nc套用到底部的 ml 文件變更.nc或.hdf文件。
達斯Dds
- 達斯Dds 是您在 XML 中建立新數據集的首次試驗後可以使用的指令行程式 。datasets.xml. 用 DasDds 可以反复測試和完善 XML 。 當您使用 DasDds 程式時 :
- 在 Windows 上, 您第一次執行 DasDds 時需要編輯 DasDds 。 使用文字編輯器的 bat 檔來改變路徑到 java 。 exe 檔案以便 Windows 找到Java.
- DasDds要你datasetID您正在工作的數據集 。
- DasDds 試著用它建立數據集datasetID.
- DasDds總是打印很多的診斷訊息. 如果您使用「 DasDds - 動詞 」 , DasDds 會比往常打印更多的診斷訊息 。
- 為安全起见, DasDds 總是刪除所有快取的數據集資訊 (文件) 用于建立數據集。 這相当于設定硬旗因此, 对于總合數據集, 您可能要暫時調整檔案NameRegex 以限制數據建構器找到的檔案數量 。
- 如果數據集無法載入 (不管原因如何) , DasDds 將會停止並顯示它找到的第一個錯誤的錯誤訊息 。
不要試著猜出問題是什麼 仔细讀取錯誤訊息 。
如果有必要, 讀取前面的診斷訊息, - 更改數據集的 XML 以試圖解決問題
讓 DasDds 重新建立數據集 。 - 如果你再三解決每個問題 你終究會解決所有的問題
而數據集會載入。
- 所有 DasDds 輸出 (诊断和成果) 寫入螢幕與 大家长會 /日志/DasDds.log.
- 如果 DasDds 能 建立數據集, DasDds 就會顯示.das (資料集屬性結構) ,.dds (數據集描述程式 结构) 和. timeGaps ( 時空) 您屏幕上的數據集的資訊, 並寫入到 大家长會 /日志/ DasDds. out.
- 通常您會想要對數據集的 XML 做一些小的變更, 以清理數據集的中繼資料, 重新執行 DasDds 。
獎金 第三方工具 :ERDDAP-林特
ERDDAP-林特是愛爾蘭海洋研究所的羅布·富勒和亞當·萊德比特的一個程序 你可以用它來改善你的中繼資料ERDDAP™數據集。ERDDAP-林特"包含一些規則和一個簡單的靜态網絡應用程式,以對付您ERDDAP™伺服器。 所有測試都在網絡瀏覽器中進行". 就像Unix/ Linux 林特工具,可以編輯已有的規則或新增規則。 看ERDDAP-林特更多信息。
此工具對您之前建立過的數據集尤其有用, 現在要更新您目前的元数据偏好 。 例如, GenerateDatasets 的早期版本 Xml 沒有用任何努力建立全球creator\_name,creator\_email,建立者型態,或creator\_url元数据。 你可以用ERDDAP-林特來辨識那些缺乏元数据屬性的數據集。
多虧了羅布和亞當 創造了這個工具 并把它提供给ERDDAP™社区。
基本结构datasets.xml文件
在 a 中需要的和可選擇的標籤datasets.xml文 件 (及其可能出現的次数) 注 實際上 你的datasets.xml會有很多<數據集> 的標籤, 只使用其他標籤<需要的話 。
<?xml version="1.0" encoding="ISO-8859-1" ?>
<erddapDatasets>
<angularDegreeUnits>...</angularDegreeUnits> <!-- 0 or 1 -->
<angularDegreeTrueUnits>...</angularDegreeTrueUnits> <!-- 0 or 1 -->
<cacheMinutes>...</cacheMinutes> <!-- 0 or 1 -->
<commonStandardNames>...</commonStandardNames> <!-- 0 or 1 -->
<convertInterpolateRequestCSVExample /> <!-- 0 or more -->
<convertInterpolateDatasetIDVariableList /> <!-- 0 or more -->
<convertToPublicSourceUrl /> <!-- 0 or more -->
<decompressedCacheMaxGB>...</decompressedCacheMaxGB> <!-- 0 or 1 -->
<decompressedCacheMaxMinutesOld>...</decompressedCacheMaxMinutesOld> <!-- 0 or 1 -->
<drawLandMask>...</drawLandMask> <!-- 0 or 1 -->
<emailDiagnosticsToErdData>...</emailDiagnosticsToErdData> <!-- 0 or 1 -->
<graphBackgroundColor>...</graphBackgroundColor> <!-- 0 or 1 -->
<ipAddressMaxRequests>...</ipAddressMaxRequests> <!-- 0 or 1 -->
<ipAddressMaxRequestsActive>...<ipAddressMaxRequestsActive> <!-- 0 or 1 -->
<ipAddressUnlimited>...<ipAddressUnlimited> <!-- 0 or 1 -->
<loadDatasetsMinMinutes>...</loadDatasetsMinMinutes> <!-- 0 or 1 -->
<loadDatasetsMaxMinutes>...</loadDatasetsMaxMinutes> <!-- 0 or 1 -->
<logLevel>...</logLevel> <!-- 0 or 1 -->
<nGridThreads>...</nGridThreads> <!-- 0 or 1 -->
<nTableThreads>...</nTableThreads> <!-- 0 or 1 -->
<palettes>...</palettes> <!-- 0 or 1 -->
<partialRequestMaxBytes>...</partialRequestMaxBytes> <!-- 0 or 1 -->
<partialRequestMaxCells>...</partialRequestMaxCells> <!-- 0 or 1 -->
<requestBlacklist>...</requestBlacklist> <!-- 0 or 1 -->
<slowDownTroubleMillis>...</slowDownTroubleMillis> <!-- 0 or 1 -->
<subscriptionEmailBlacklist>...</subscriptionEmailBlacklist> <!-- 0 or 1 -->
<unusualActivity>...</unusualActivity> <!-- 0 or 1 -->
<updateMaxEvents>...</updateMaxEvents> <!-- 0 or 1 --><standardLicense>...</standardLicense> <!-- 0 or 1 -->
<standardContact>...</standardContact> <!-- 0 or 1 -->
<standardDataLicenses>...</standardDataLicenses> <!-- 0 or 1 -->
<standardDisclaimerOfEndorsement>...</standardDisclaimerOfEndorsement> <!-- 0 or 1 -->
<standardDisclaimerOfExternalLinks>...</standardDisclaimerOfExternalLinks> <!-- 0 or 1 -->
<standardGeneralDisclaimer>...</standardGeneralDisclaimer> <!-- 0 or 1 -->
<standardPrivacyPolicy>...</standardPrivacyPolicy> <!-- 0 or 1 -->
<startHeadHtml5>...</startHeadHtml5> <!-- 0 or 1 -->
<startBodyHtml5>...</startBodyHtml5> <!-- 0 or 1 -->
<theShortDescriptionHtml>...</theShortDescriptionHtml> <!-- 0 or 1 -->
<endBodyHtml5>...</endBodyHtml5> <!-- 0 or 1 --><user username="..." password="..." roles="..." /> <!-- 0 or more -->
<dataset>...</dataset> <!-- 1 or more -->
</erddapDatasets>
但目前只建議ISO-8859-1。
包含
2.25版本中的新版本是支持 X Include 。 這需要您使用 SAX 解析器<使用 SaxPaerser > true<在您的設定中使用 SaxParser >. xml 。 這可以讓您在自己的檔案中寫入每個數據集, 然后全部包含在主檔中datasets.xml,重用數據集定義的部份,或兼用。 如果你想看看例子EDD TestiewDataset.java 電子郵件建立 X 插入重用變數定義 。
-
- –
注
与datasets.xml文件是非三角工程。 請仔細讀讀這些筆記 你先挑一個數據集類型請仔細讀一下
選擇數據集類型
大多數情况下,只有一個ERDDAP™适合指定資料來源的數據集類型。 有的 (例如,.nc文件) 有一些可能性 但通常其中之一絕對是最好的 您必須做的第一個也是最大的決定是: 將數據集視為多维陣列群組是否合适 。 (如果看到EDDGrid數據集類型) 或作為類似資料庫的資料表 (如果看到EDD Table 資料集類型) .
使用此資料
通常不需要修改資料來源 (例如, 將檔案轉換成其他檔案類型) 所以ERDDAP™可以服侍它。 假設之一:ERDDAP™表示此資料來源將被使用 。 通常這樣很好 有些例外是:
- 相關數據 庫與卡珊德拉 --ERDDAP™可以直接從相關數據庫和卡珊德拉提供資料。 但對於安全性,載入平衡性,以及性能問題,您可以選擇用相同的資料建立另一個數據庫,或者儲存資料到NetCDFv3.nc文件和有ERDDAP™提供新資料來源的資料。 看數據庫中的 EDD 表格和來自卡桑德拉的EDD表.
- 不支援資料來源...ERDDAP™可以支持大量類型的數據來源, 但世界充滿了1000's (百万?) 不同資料來源 (特别是資料檔結構) . 如果ERDDAP™不支援您的資料來源 :
- 如果資料來源是NetCDF .nc文件,你可以使用NcML修改在飛行上或使用的資料檔NCO以永久修改資料檔。
- 您可以將資料寫入資料來源類型ERDDAP™支持。NetCDF-3.nc檔案是很好的,一般的建議, 因為它們是二進制檔案ERDDAP™讀得很快 表格數據中,.nc使用CF 分解采样 (副秘书长) 相連的 ragged 數據結構, 所以可以處理ERDDAP是来自 NcCFF 的 EDD 表格). 如果它們有理有理 (每個都有數量的數據) ,ERDDAP™可以很快地從它們中提取資料。
- 您可以要求新增此資料來源的支援ERDDAP™發郵件給克里斯 約翰在Noaa.gov。
- 您可以用寫入代碼來新增對此資料來源的支持 。 看该ERDDAP™程式指南
- 速度 -ERDDAP™可以比其他資料來源更快地讀取資料。 例如,讀取NetCDFv3.nc檔案速度快, 讀取 ASCII 文件速度慢 。 如果有大 (> 1 000) 或大 (> 10,000) 來源數據檔數量 ,ERDDAP™會慢慢回應一些數據要求。 通常,這一點對人類來說并不明显。 但是,如果你覺得ERDDAP™您可以選擇將資料寫入更有效率的設定以解決問題 。 (通常:NetCDFv3.nc文件) . 表格数据,参见此建議.
提示
在 dataset. xml 中提供工作數據集描述的副本, 然后再修改, 通常更容易產生 XML 。
編碼特殊字元
自datasets.xml是 XML 檔案, 您必須編碼( E)","<",以及任何內容中的">",如"和amp;","<"和"gt;". 錯 :<標題 > 時碼( T)<(字幕) 右 :<標題 > 時間( P) :<(字幕)
XML 無法容忍語法錯誤
在您編輯 dataset.xml 檔案後, 確認結果是成型好的 XML將 XML 文字貼上 XML 檢查器xml 驗證.