Este artigo apresenta sugestões e soluções para a curadoria de dados no Repositório Brasileiro Livre para Dados Abertos do Solo (FEBR), com destaque para a melhoria da qualidade da descrição dos métodos de análise de solo. Para isso, foi realizado levantamento do padrão de descrição de métodos analíticos em trabalhos que se basearam na [edição de 1979](http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/330592) do Manual de Métodos de Análise de Solo da Embrapa.
As aplicações espaciais de dados do solo como o MDS requerem dados geoespaciais consistentes, incluindo coordenadas geográficas e um sistema de referência de coordenadas conhecido. No entanto, quando se trata de dados legados, frequentemente encontramos esses dados geoespaciais ausentes ou incorretas. Neste artigo, nós avaliamos a qualidade dos dados geoespaciais de dados legados do solo no Brasil e avaliamos fontes de dados geoespaciais (relatórios de pesquisa, mapas, infraestruturas de dados espaciais, serviços de mapeamento na web) e conhecimento especializado como forma de corrigir tais inconsistências.
No mapeamento digital do solo, técnicas de aprendizado de máquina estão sendo usadas para inferir relações entre propriedades do solo e covariáveis. Informações derivadas desse processo são frequentemente traduzidas em conhecimento pedológico. Esse mecanismo é conhecido como descoberta de conhecimento. Neste estudo, mostramos que a descoberta de conhecimento com base nessa estratégia deve ser tratada com cautela. Métodos de aprendizagem de máquina podem encontrar padrões relevantes mesmo quando as covariáveis não têm sentido e não estão relacionadas a fatores e processos de formação do solo.
Oportunidade de bolsa de iniciação científica da Fundação Araucária com duração de dois anos (2020/2022). Atividades envolvem a curadoria de conjuntos de dados do solo e o desenvolvimento do sistema de codificação e descrição de métodos de análise física, química e morfológica do solo.
O MDS usa modelos estatísticos para quantificar a correlação entre propriedades do solo e condições ambientais para fazer predições em locais não amostrados. Seu sucesso depende, em grande medida, dos dados de amostragem do solo. É provável que uma estratégia amostral pobre ofereça um modelo pobre e grandes erros de predição, resultando em desperdício de recursos. Uma solução computacional é a otimização da configuração amostral usando a técnica do recozimento simulado.
O mapeamento digital do solo se beneficiou do rápido aumento no poder dos computadores para lidar com grandes volumes de dados de base para produzir novas informações sobre o solo. No Brasil, pesquisas de solo são realizadas desde a década de 1930. Mas a maioria dos dados coletados nos últimos 90 anos ainda está em formato de papel. Esse cenário começou a mudar em 2017, quando foi lançado o Repositório Brasileiro Livre de Dados de Solo Aberto (FEBR). Até o final de 2018, o FEBR já continha dados de cerca de 15.000 observações do solo, consolidando-se como a maior fonte de dados do solo do Brasil
O mapeamento digital do solo (MDS) ganhou popularidade nos últimos anos. O principal motivo é a facilidade e rapidez com que permite produzir informações do solo. Neste artigo nós descrevemos algumas das mais importantes novidades e alguns dos maior desafios do MDS de alta no Brasil.