Trabalhar com odatasets.xmlArquivo
\[Esta página será apenas de interesse paraERDDAP™administradores.\]
Depois de ter seguido oERDDAP™ instruções de instalação, você deve editar odatasets.xmlarquivo em Toca a brincar. /content/erddap/ para descrever os conjuntos de dados que seuERDDAP™instalação irá servir.
Você pode ver um exemplodatasets.xmlem GitHub.
-
- Não.
Introdução
Um conjunto necessário
Configurar um conjunto de dadosERDDAP™não é apenas uma questão de apontar para o diretório ou URL do conjunto de dados. Você tem que escrever um pedaço de XML paradatasets.xmlque descreve o conjunto de dados.
- Para conjuntos de dados gradeados, a fim de fazer o conjunto de dados conformeERDDAP's estrutura de dados para dados gradeados, você tem que identificar um subconjunto das variáveis do conjunto de dados que compartilham as mesmas dimensões. (Porquê? Como?)
- Os metadados atuais do conjunto de dados são importados automaticamente. Mas se você quiser modificar esses metadados ou adicionar outros metadados, você precisa especificá-lo emdatasets.xml. EERDDAP™precisa de outros metadados, incluindoatributos globais (comoinfoUrl, instituição,sourceUrl, resumo e título) eatributos variáveis (comolong\_namee unidades) . Assim como os metadados que estão atualmente no conjunto de dados adicionam informações descritivas para o conjunto de dados, os metadados solicitados porERDDAP™adiciona informações descritivas ao conjunto de dados. Os metadados adicionais são uma boa adição ao seu conjunto de dados e ajudamERDDAP™fazer um trabalho melhor de apresentar seus dados aos usuários que não estão familiarizados com isso.
- ERDDAP™precisa que você faça coisas especiais com olongitude, latitude, altitude (ou profundidade) , e variáveis de tempo.
Se você comprar essas ideias e gastar o esforço para criar o XML paradatasets.xml, você tem todas as vantagens deERDDAP™, incluindo:
- Busca de texto completo para conjuntos de dados
- Procurar conjuntos de dados por categoria
- Formulários de acesso de dados ( datasetID .html) para que você possa solicitar um subconjunto de dados em vários formatos de arquivo diferentes
- Formulários para solicitar gráficos e mapas ( datasetID .)
- Serviço de Mapa Web (WMS) para conjuntos de dados gradeados
- RESTfulacesso aos seus dados
Fazendo adatasets.xmlleva um esforço considerável para os primeiros conjuntos de dados, mas fica mais fácil . Após o primeiro conjunto de dados, você pode frequentemente reutilizar muito do seu trabalho para o próximo conjunto de dados. Felizmente,ERDDAP™vem com doisFerramentaspara ajudá-lo a criar o XML para cada conjunto de dadosdatasets.xml. Se ficares preso, vê o nossoseção sobre como obter suporte adicional.
Provedor de dados Formulário
Quando um provedor de dados vem a você esperando adicionar alguns dados ao seuERDDAP, pode ser difícil e demorado para coletar todos os metadados (informações sobre o conjunto de dados) necessário para adicionar o conjunto de dadosERDDAP. Muitas fontes de dados (por exemplo, arquivos .csv, Arquivos do Excel, bancos de dados) não tem metadados internos, entãoERDDAP™tem um formulário de provedor de dados que reúne metadados do provedor de dados e dá ao provedor de dados alguma outra orientação, incluindo ampla orientação paraDados em Bancos de Dados. As informações apresentadas são convertidas emdatasets.xmlformato e depois enviado para oERDDAP™administrador (tu) e escrito (apêndice) para Diretriz de grande porte /logs/dataProviderForm.log . Assim, o formulário semi-automatiza o processo de obtenção de um conjunto de dados emERDDAP, mas oERDDAP™administrador ainda tem que completar odatasets.xmlchunk e lidar com a obtenção do arquivo de dados (S) do provedor ou conectando ao banco de dados.
A submissão de arquivos de dados reais de fontes externas é um enorme risco de segurança, portantoERDDAP™não lida com isso. Você tem que descobrir uma solução que funciona para você e o provedor de dados, por exemplo, e-mail (para arquivos pequenos) , puxar da nuvem (por exemplo, DropBox ou Google Drive) , um site de sftp (com senhas) , ou tênis Rede (uma pen drive USB ou disco rígido externo) . Você provavelmente só deve aceitar arquivos de pessoas que você conhece. Você precisará verificar os arquivos para vírus e tomar outras precauções de segurança.
Não há ligação.ERDDAP™para o formulário de fornecedor de dados (por exemplo, noERDDAP™Página inicial) . Em vez disso, quando alguém lhe diz que eles querem ter seus dados servidos por seuERDDAP, você pode enviar-lhes um e-mail dizendo algo como: Sim, nós podemos colocar seus dados emERDDAP. Para começar, preencha o formulário no https://yourUrl/erddap/dataProviderForm.html (ouhttp://sehttps://não está habilitado) . Depois de terminares, contacto-te para resolveres os pormenores finais. Se você só quer olhar para o formulário (sem encher) , você pode ver o formulário emERD'ERDDAP:Introdução,Parte 1,Parte 2,Parte 3eParte 4. Estas ligaçõesERD ERDDAP™enviar informações para mim, não você, então não envie informações com eles a menos que você realmente queira adicionar dados aoERD ERDDAP.
Se você quiser remover o Formulário de Provedor de Dados do seuERDDAP™, posto
<dataProviderFormActive>false</dataProviderFormActive>
em seu arquivo setup.xml.
O impulso para isto foiNOAA2014Acesso público aos resultados da pesquisa (PARR) directiva, que requer tudoNOAAdados ambientais financiados através de dólares contribuintes ser disponibilizado através de um serviço de dados (não apenas arquivos) dentro de 12 meses de criação. Assim, há maior interesse em usarERDDAP™para disponibilizar conjuntos de dados através de um serviço ASAP. Precisávamos de uma forma mais eficiente de lidar com um grande número de provedores de dados.
Feedback/Sugestões? Este formulário é novo, então por favor e-mailerd dot data at noaa dot govse você tem algum feedback ou sugestões para melhorar isso.
Ferramentas
ERDDAP™vem com dois programas de linha de comando que são ferramentas para ajudá-lo a criar o XML para cada conjunto de dados que você desejaERDDAP™servir. Uma vez que você tenha configuradoERDDAP™e executar (pelo menos uma vez) , você pode encontrar e usar estes programas no Toca a brincar. /webapps/erddap/WEB-INF diretório. Existem scripts de shell Linux/Unix (com a extensão .sh) e scripts do Windows (com a extensão .bat) para cada programa.\[No Linux, execute essas ferramentas como o mesmo usuário (Tomcat?) Isso vai correr Tomcat.\]Quando você executar cada programa, ele fará perguntas. Para cada pergunta, digite uma resposta e, em seguida, pressione Enter. Ou pressione ^C para sair de um programa a qualquer momento.
O programa não funciona?
- Se você conseguir um programa desconhecido (ou similar) mensagem de erro, o problema é provavelmente que o sistema operacional não conseguiu encontrarJava. Você precisa descobrir ondeJavaestá em seu computador, em seguida, editar a referência java no arquivo .bat ou .sh que você está tentando usar.
- Se você receber um arquivo jar não encontrado ou classe não encontrada mensagem de erro, entãoJavanão encontrou uma das classes listadas no arquivo .bat ou .sh que você está tentando usar. A solução é descobrir onde está o arquivo .jar e editar a referência java para ele no arquivo .bat ou .sh.
- Se você estiver usando uma versão deJavaque é muito velho para um programa, o programa não será executado e você verá uma mensagem de erro como
Exceção na linha "principal" java.lang.UnsupportedClassVersionError:
alguns/classe/nome : Versão principal não suportada.minor um pouco de madeira
A solução é atualizar para a versão mais recente deJavae certifique-se de que o arquivo .sh ou .bat para o programa está usando-o.
As ferramentas imprimem várias mensagens diagnósticas:
- A palavra "ERROR" é usada quando algo correu tão mal que o procedimento não foi concluído. Embora seja irritante para obter um erro, o erro força você a lidar com o problema.
- A palavra "ARNING" é usada quando algo correu mal, mas o procedimento foi capaz de ser concluído. São muito raros.
- Qualquer outra coisa é apenas uma mensagem informativa. Você pode adicionar \-verbose aoGerar conjuntos de dadosXmlouDasDdslinha de comando para obter mensagens informativas adicionais, que às vezes ajuda a resolver problemas.
As duas ferramentas são uma grande ajuda, mas você ainda deve ler todas essas instruções nesta página cuidadosamente e tomar decisões importantes você mesmo.
Gerar conjuntos de dadosXml
- Gerar conjuntos de dadosXml é um programa de linha de comando que pode gerar um rascunho áspero do conjunto de dados XML para quase qualquer tipo de conjunto de dados.
Nós STRONGLY RECOMEND que você usa GenerateDatasets Xml em vez de criar pedaços dedatasets.xmlpor mão porque:
- Gerar conjuntos de dados Xml funciona em segundos. Fazer isto à mão é pelo menos uma hora de trabalho, mesmo quando você sabe o que está fazendo.
- Gerar conjuntos de dados Xml faz um trabalho melhor. Fazer isso à mão requer amplo conhecimento de comoERDDAP™funciona. É improvável que você faça um trabalho melhor à mão. (Bob Simons sempre usa GerrateDatasets Xml para o primeiro rascunho, e ele escreveuERDDAP.)
- Gerar conjuntos de dados Xml sempre gera um pedaço válido dedatasets.xml. Qualquer pedaço dedatasets.xmlque você escreve provavelmente terá pelo menos alguns erros que impedemERDDAP™de carregar o conjunto de dados. Muitas vezes leva as pessoas horas para diagnosticar esses problemas. Não percas tempo. Deixe Gerar Conjuntos de dados Xml faz o trabalho duro. Então você pode refinar o .xml à mão se quiser.
Quando você usa o GerarDatasets Programa Xml:
- No Windows, a primeira vez que você executa GenerateDatasetsXml, você precisa editar o arquivo GenerateDatasetsXml.bat com um editor de texto para mudar o caminho para o java. exe arquivo para que o Windows possa encontrarJava.
- Gerar conjuntos de dados Xml pede primeiro para especificar o EDDType (Erd Dap Dataset Tipo) do conjunto de dados. VerLista de Tipos de Conjunto de Dados (neste documento) para descobrir qual é o tipo apropriado para o conjunto de dados em que você está trabalhando. Além dos EDDTypes regulares, há também algunsTipos Especiais/Pseudo Dataset (por exemplo, um que rasteja um catálogo THREDDS para gerar um pedaço dedatasets.xmlpara cada um dos conjuntos de dados no catálogo) .
- Gerar conjuntos de dados Xml então faz uma série de perguntas específicas para esse EDDType. As perguntas reúnem as informações necessárias paraERDDAP™para acessar a fonte do conjunto de dados. Para entender o queERDDAP™está pedindo, veja a documentação para o EDDType que você especificou clicando no mesmo tipo de conjunto de dados noLista de Tipos de Conjunto de Dados.
Se você precisar inserir uma string com caracteres especiais (por exemplo, caracteres do espaço branco no início ou fim, caracteres não-ASCII) , entrar emCorda de estilo JSON (com caracteres especiais escapou com caracteres \) . Por exemplo, para inserir apenas um caractere de aba, digite "\t" (com aspas duplas circundantes, que dizemERDDAP™que esta é uma corda de estilo JSON.
- Muitas vezes, uma de suas respostas não será o que GenerateDatasetsXml precisa. Você pode tentar novamente, com respostas revisadas para as perguntas, até GerarDatasets Xml pode encontrar e entender com sucesso os dados de origem.
- Se você responder corretamente às perguntas (ou suficientemente corretamente) , Gerar conjuntos de dados Xml se conectará à fonte do conjunto de dados e recolherá informações básicas (por exemplo, nomes variáveis e metadados) . Para conjuntos de dados que são de localNetCDF .nce arquivos relacionados, GerarDatasets Xml muitas vezes imprimir a estrutura semelhante ao ncdump do arquivo depois que ele lê primeiro o arquivo. Isso pode lhe dar informações para responder às perguntas melhor em um loop subsequente através do GerrateDatasetsXml.
- Gerar conjuntos de dados Xml irá então gerar um rascunho áspero do conjunto de dados XML para esse conjunto de dados.
- InformaçÃμes diagnósticas e o rascunho áspero do conjunto de dados XML será escrito para Diretriz de grande porte /logs/GenerateDatasetsXml.log .
- O rascunho áspero do conjunto de dados XML será escrito para Diretriz de grande porte /logs/GenerateDatasetsXml.out .
"0 ficheiros" Mensagem de erro
Se você executar GerarDatasets Xml ouDasDds, ou se você tentar carregar umEDDGridDe...Files ou EDDTableDe... Dataset de arquivos emERDDAP™, e você recebe uma mensagem de erro "0 files" indicando queERDDAP™encontrado 0 arquivos correspondentes no diretório (quando você acha que existem arquivos correspondentes nesse diretório) :
-
Verifique se você especificou o nome completo do diretório. E se você especificou o nome do arquivo da amostra, certifique-se de especificar o nome completo do arquivo, incluindo o nome completo do diretório.
-
Verifique se os arquivos estão realmente nesse diretório.
-
Verifique a ortografia do nome do diretório.
-
Verifique o arquivoNameRegex. É realmente, muito fácil cometer erros com regexes. Para fins de teste, tente o regex .\* que deve corresponder a todos os nomes de arquivos. (Veja istodocumentaçãoetutorial do regex.)
-
Verifique se o usuário que está executando o programa (por exemplo, user=tomcat (?) para Tomcat /ERDDAP) tem permissão 'read' para esses arquivos.
-
Em alguns sistemas operacionais (por exemplo, SELinux) e dependendo das configurações do sistema, o usuário que executou o programa deve ter permissão de 'leitura' para toda a cadeia de diretórios que levam ao diretório que tem os arquivos.
-
Se você tem problemas que você não pode resolver,suporte de solicitaçãocom o máximo de informação possível. Da mesma forma, se parece que o EDDType apropriado para um determinado conjunto de dados não funciona com esse conjunto de dados, ou se não houver nenhum EDDType apropriado, por favor, apresente umquestão sobre GitHubcom os detalhes (e um arquivo de amostra se relevante) .