Perguntas com a marcação «large-data»

'Dados grandes' refere-se a situações em que o número de observações (pontos de dados) é tão grande que requer mudanças na maneira como o analista de dados pensa ou conduz a análise. (Não confunda com 'alta dimensionalidade'.)




7
Desafios da indústria versus Kaggle. A coleta de mais observações e o acesso a mais variáveis ​​são mais importantes que a modelagem extravagante?
Eu espero que o título seja auto-explicativo. No Kaggle, a maioria dos vencedores usa o empilhamento com algumas vezes centenas de modelos de base, para extrair alguns% extra de MSE, precisão ... Em geral, na sua experiência, o quão importante é a modelagem sofisticada, como empilhar versus simplesmente coletar mais …



10
O que exatamente é Big Data?
Fui perguntado em várias ocasiões a pergunta: O que é Big-Data? Tanto por estudantes quanto por meus parentes que estão começando a se interessar por estatísticas e ML. Encontrei este CV-post . E sinto que concordo com a única resposta lá. A página da Wikipedia também tem alguns comentários, mas …
44 large-data 






1
Aprendizado de streaming de última geração
Ultimamente, tenho trabalhado com grandes conjuntos de dados e encontrei muitos documentos sobre métodos de streaming. Para nomear alguns: Líder seguidor-regularizado e descida espelhada: teoremas de equivalência e regularização L1 ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Aprendizado em fluxo contínuo: SVMs de uma passagem ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) Pegasos: Primal estimado sub-GrAdient SOlver para …


3
Primeiro passo para big data (
Suponha que você esteja analisando um enorme conjunto de dados na ordem de bilhões de observações por dia, em que cada observação possui algumas milhares de variáveis ​​numéricas e categoriais esparsas e possivelmente redundantes. Digamos que exista um problema de regressão, um problema de classificação binária desequilibrada e uma tarefa …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.