Eu tenho conjuntos de dados que contêm, entre muitos recursos, coordenadas GPS (latitude e longitude). Eu gostaria de usar esses conjuntos de dados para explorar problemas como: (1) computação do ETA para conduzir entre os pontos inicial e final; e (2) estimar a quantidade de crimes para um ponto específico.
Eu gostaria de usar um modelo de regressão linear. No entanto, posso usar essas coordenadas GPS diretamente em um modelo linear?
Latitude e longitude não têm uma propriedade ordinal , como na idade de uma pessoa. Por exemplo, os dois pontos (40.805996, -96.681473) e (41.226682, -95.986587) não parecem ter nenhuma ordem significativa. São apenas pontos no espaço. Eu estava pensando em substituí-los por códigos postais categóricos dos EUA e depois fazer a codificação one-hot , mas isso resultaria em muitas variáveis.