Eu processos a partir do qual eu recebo pequenas amostras (normalmente distribuída n tipicamente 10-30) que eu quero usar para estimar a variância. Mas frequentemente as amostras estão tão próximas que não podemos medir pontos individuais perto do centro.
Tenho um entendimento vago de que deveríamos ser capazes de construir um estimador eficiente usando amostras ordenadas: por exemplo, se eu souber que a amostra contém 20 pontos e que 10 estão agrupados perto do centro com muita força para serem medidos individualmente, mas tenho medições discretas de 5 em cada uma das extremidades, existe uma abordagem padrão / fórmula para estimar a variação do processo que faz uso otimizado dessas amostras?
(Observe que eu não acho que posso apenas ponderar a média central. Por exemplo, é possível que 7 amostras se agrupem firmemente, enquanto outras três são assimetricamente inclinadas para um lado, mas perto o suficiente, não podemos dizer isso sem uma amostragem única mais tediosa .)
Se a resposta for complicada, qualquer dica sobre o que eu deveria pesquisar seria apreciada. Por exemplo, isso é um problema estatístico de pedidos? É provável que exista uma resposta formulada ou este é um problema computacional?
Detalhes atualizados: O aplicativo é uma análise de alvos de tiro. Uma única amostra subjacente é o ponto de impacto ( x, y ) de um único tiro no alvo. O processo subjacente tem uma distribuição normal bivariada simétrica, mas não há correlação entre eixos, portanto, podemos tratar as amostras { x } e { y } como desenhos independentes da mesma distribuição normal. (Também podemos dizer que o processo subjacente é distribuído por Rayleigh, mas não podemos medir as variáveis de amostra de Rayleigh porque não podemos ter certeza das coordenadas do centro "verdadeiro" do processo, que para n pequeno pode ser significativamente distante do centro da amostra ( , ˉ y ).)
Recebemos um alvo e o número de tiros disparados contra ele. O problema é que, para n >> 3, armas precisas normalmente disparam em um "buraco irregular" cercado por tiros distintos. Podemos observar o x - e y -width do buraco, mas não sabemos onde o buraco os tiros não-distintas impactado.
Aqui estão alguns exemplos de destinos mais problemáticos:
(É verdade que, em um mundo ideal, alterávamos / trocávamos de alvos após cada disparo e, em seguida, agregávamos as amostras para análise. Há várias razões que geralmente são impraticáveis, embora sejam feitas sempre que possível .)
Para facilitar a solução, acredito que será mais fácil reduzi-lo a um conjunto de amostras unidimensionais do normal, com um intervalo central de largura w > d , em que d é o diâmetro do projétil, contendo amostras c < n "censuradas".