esta pergunta começou como " Agrupando dados espaciais em R " e agora foi movida para a pergunta DBSCAN.
Como as respostas à primeira pergunta sugeriram, procurei informações sobre o DBSCAN e li alguns documentos sobre. Novas questões surgiram.
O DBSCAN requer alguns parâmetros, um deles é "distância". Como meus dados são tridimensionais, longitude, latitude e temperatura, qual "distância" devo usar? qual dimensão está relacionada a essa distância? Suponho que deve ser a temperatura. Como encontro essa distância mínima com R?
Outro parâmetro é o número mínimo de pontos necessários para formar um cluster. Existe algum método para encontrar esse número? Infelizmente não encontrei.
Pesquisando através do Google, não consegui encontrar um exemplo de R para usar o dbscan em um conjunto de dados semelhante ao meu. Você conhece algum site com esse tipo de exemplo? Para que eu possa ler e tentar me adaptar ao meu caso.
A última pergunta é que minha primeira tentativa de R com DBSCAN (sem uma resposta adequada às perguntas anteriores) resultou em um problema de memória. R diz que não pode alocar vetor. Começo com uma grade espaçada de 4 km com 779191 pontos que termina em aproximadamente 300000 linhas x 3 colunas (latitude, longitude e temperatura) ao remover pontos SST não válidos. Qualquer dica para resolver esse problema de memória. Depende do meu computador ou do próprio DBSCAN?
Agradecemos a paciência em ler uma mensagem longa e provavelmente chata e por sua ajuda.