Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

4
Como fazer a correspondência difusa de endereços postais?
Gostaria de saber como combinar endereços postais quando o formato deles for diferente ou quando um deles estiver incorreto. Até agora, encontrei soluções diferentes, mas acho que elas são bastante antigas e não muito eficientes. Tenho certeza de que existem métodos melhores; portanto, se você tiver referências para ler, tenho …




2
K-significa rápido como algoritmo para 10 ^ 10 pontos?
Eu estou olhando para fazer k-significa agrupar em um conjunto de 10 pontos dimensionais. O problema: há 10 ^ 10 pontos . Estou procurando apenas o centro e o tamanho dos maiores aglomerados (digamos 10 a 100); Não me importo com o cluster em que cada ponto termina. Usar k-means …

1
Bibliotecas de aprendizado de máquina para Ruby
Existem bibliotecas de aprendizado de máquina para Ruby que são relativamente completas (incluindo uma grande variedade de algoritmos para aprendizado supervisionado e não supervisionado), testadas com robustez e bem documentadas? Eu amo o scikit-learn do Python por sua documentação incrível, mas um cliente prefere escrever o código em Ruby, pois …


4
Quais são as implicações para o treinamento de um Tree Ensemble com conjuntos de dados altamente tendenciosos?
Eu tenho um conjunto de dados binários altamente tendencioso - tenho 1000x mais exemplos da classe negativa do que a classe positiva. Gostaria de treinar um conjunto de árvores (como árvores aleatórias extras ou uma floresta aleatória) nesses dados, mas é difícil criar conjuntos de dados de treinamento que contenham …



1
As árvores reforçadas com gradiente podem se encaixar em qualquer função?
Para redes neurais, temos o teorema da aproximação universal, que afirma que as redes neurais podem aproximar qualquer função contínua em um subconjunto compacto de .RnRnR^n Existe um resultado semelhante para árvores com gradiente? Parece razoável, pois você pode continuar adicionando mais ramos, mas não consigo encontrar nenhuma discussão formal …

1
Como adicionar recursos sem imagem a imagens laterais como entrada de CNNs
Estou treinando uma rede neural convolucional para classificar imagens em condições de neblina (3 aulas). No entanto, para cada uma das cerca de 150.000 imagens, também tenho quatro variáveis ​​meteorológicas disponíveis que podem ajudar a prever as classes das imagens. Fiquei imaginando como poderia adicionar as variáveis ​​meteorológicas (por exemplo, …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.