Perguntas com a marcação «distributed-computing»

5
Explicando o Apache ZooKeeper
Estou tentando entender o ZooKeeper, como ele funciona e o que faz. Existe algum aplicativo comparável ao ZooKeeper? Se você souber, como descreveria o ZooKeeper a um leigo? Eu tentei o apache wiki, zookeeper sourceforge ... mas ainda não consigo me relacionar com ele. Acabei de ler http://zookeeper.sourceforge.net/index.sf.shtml , então …

13
Spark - repartição () vs coalescência ()
De acordo com o Learning Spark Lembre-se de que o reparticionamento dos dados é uma operação bastante cara. O Spark também possui uma versão otimizada do repartition()chamado coalesce()que permite evitar a movimentação de dados, mas apenas se você estiver diminuindo o número de partições RDD. Uma diferença que recebo é …



3
O que determina a compensação do consumidor Kafka?
Eu sou relativamente novo em Kafka. Eu experimentei um pouco, mas algumas coisas não estão claras para mim em relação à compensação do consumidor. Pelo que entendi até agora, quando um consumidor inicia, o deslocamento do qual ele começará a ler é determinado pela configuração auto.offset.reset(corrija-me se estiver errado). Agora …

25
Calcular a mediana de um bilhão de números
Se você possui um bilhão de números e cem computadores, qual é a melhor maneira de localizar a mediana desses números? Uma solução que tenho é: Divida o conjunto igualmente entre os computadores. Classifique-os. Encontre as medianas para cada conjunto. Classifique os conjuntos em medianas. Mesclar dois conjuntos de uma …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.