Usando decibéis nas estatísticas

11

Estou trabalhando em um projeto que envolve a leitura de etiquetas RFID e a comparação da intensidade do sinal que o leitor vê quando você altera a configuração da antena (número de antenas, posição, etc ...). Como parte do projeto, preciso comparar as configurações para ver quais são mais eficazes.

Idealmente, eu seria capaz de executar um teste t não pareado ou uma ANOVA entre duas posições de antena (ou MANOVA entre múltiplas). No entanto, como a resposta está em decibéis logarítmicos, estou me perguntando qual a melhor maneira de prosseguir com isso.

Seria melhor converter os resultados em uma escala linear e comparar com um dos métodos mencionados, ou devo usar decibéis como estão com um teste estatístico diferente para compará-los?

data-transformation linear-model descriptive-statistics

— Brian Truman
fonte

2

Tomei a liberdade de editar tags. A estatística matemática é, na prática, uma etiqueta inútil. A série logarítmica refere-se a algo bem diferente com uma resposta discreta.

— Nick Cox

1

Como você está usando testes assumindo uma distribuição gaussiana, se a distribuição das respostas for "mais gaussiana" em dB do que na escala linear (isto é, os dados originais são aproximadamente log normais), faz sentido permanecer na escala logarítmica.

— Luca Citi

@ NickCox, acho que mathematical-statisticsfunciona muito bem ao solicitar uma prova, a tag correspondente sendo sinônimo da tag anterior.

— Richard Hardy

Talvez eu devesse ter dito "uma etiqueta inútil para esse tipo de pergunta".

— Nick Cox

5

A transformação deve depender de qual escala você deseja sua inferência.

Geralmente, a variação de uma função de não é igual à função da variação de . Porque transformando com e executando inferência estatística (testes de hipóteses ou intervalos de confiança) em , depois a transformação - os resultados dessa inferência a serem aplicados a são inválidos (pois as estatísticas de teste e os ICs exigem uma estimativa da variação). $x$ $x$ $\sigma^{2}_{f(x)} \ne f(\sigma^{2}_{x})$ $x$ $f$ $f(x)$ $f^{-1}$ $x$

Basear ICs em variáveis transformadas + retrotransformação produz intervalos sem as probabilidades nominais de cobertura; portanto, a confiança retrotraduzida sobre uma estimativa baseada em não é confiança em uma estimativa baseada em . $f(x)$ $x$

Da mesma forma, inferências sobre variáveis não transformadas com base em testes de hipótese em variáveis transformadas significam que qualquer um dos itens a seguir pode ser verdadeiro, por exemplo, ao fazer inferências sobre base em alguma variável de agrupamento : $x$ $y$

$x$ difere significativamente em , mas não difere significativamente em . $y$ $f(x)$ $y$
$x$ difere significativamente entre , e difere significativamente entre . $y$ $f(x)$ $y$
$x$ não diferem significativamente entre , e não diferem significativamente entre . $y$ $f(x)$ $y$
$x$ não difere significativamente em , mas difere significativamente em . $y$ $f(x)$ $y$

Em suma, saber se difere significativamente entre os grupos de não indica se difere entre . $f(x)$ $y$ $x$ $y$

Portanto, a questão de transformar esses dBs é respondida se você se preocupa com dB ou dB exponencial.

— Alexis
fonte

14

Estritamente, precisamos ver seus dados para ter alguma chance de dar conselhos definitivos, mas é possível adivinhar.

Como você diz, os decibéis já estão em uma escala logarítmica. É provável que isso signifique, por uma variedade de razões físicas e estatísticas, que eles provavelmente se comportem bem por serem aproximadamente aditivos, homoscedásticos e distribuídos simetricamente, dependendo dos preditores. Mas você pode dar um argumento físico ou de engenharia de como a resposta deve variar conforme você altera suas variáveis de design.

Não conheço nenhum princípio ou teoria possível, o que significa que você é obrigado a exponenciá-los antes de aplicar um teste ou ANOVA. Eu esperava que isso piorasse o comportamento estatístico, não melhor. $t$

O mesmo tipo de raciocínio geralmente se aplica a outras escalas logarítmicas "pré-transformadas", como pH ou escala Richter.

PS: Não faço ideia do que são as etiquetas RFID.

— Nick Cox
fonte

4

As etiquetas RFID são etiquetas de identificação por radiofrequência ... aquelas coisas no seu passaporte, materiais de biblioteca, cartão de crédito lascado, etc. que tornam possível a identificação baseada em token sem fio.

— Alexis8 de

2

Voto negativo aparentemente aleatório lá. Não tenho muitos motivos para reclamar, pois tenho vários votos por pouco trabalho e não é uma ótima resposta. (Eu poderia ter escrito melhor, tendo em vista alguns dados.) Mas o voto negativo é inútil: sem uma razão, não há margem para mudar a mente de alguém!

— Nick Cox

3

Eu sei direito? Eu realmente gostaria que os eleitores em baixa deixassem feedback construtivo.

— Alexis8

3

Bem, a única maneira de responder definitivamente a essa pergunta é examinar alguns dados em decibéis - existe uma distribuição simples (por exemplo, distribuição gaussiana) que é um bom modelo para isso? Ou o exponencial dos dados é um candidato melhor? Meu palpite é que os dados não exponencializados são mais quase gaussianos e, portanto, para tornar mais simples as análises que se seguem, você deve usá-las, mas eu deixarei que você as julgue.

Discordo de sua análise proposta, que consiste em aplicar um teste de significância aos dados observados de diferentes experimentos (ou seja, diferentes posições da antena). Ao considerar a física disso, deve haver alguma diferença, talvez minúscula, talvez substancial. Porém, a priori, há alguma diferença; portanto, com um conjunto de dados grande o suficiente, você deve rejeitar a hipótese nula de nenhuma diferença. Assim, o efeito de um teste de significância é apenas para concluir "você possui / não possui um grande conjunto de dados". Isso não parece muito útil.

Mais útil seria quantificar a diferença entre as diferentes posições da antena e talvez também levar em conta custos e benefícios para decidir qual posição deve ser selecionada. Às vezes, diferenças quantificadas são chamadas de "análise do tamanho do efeito"; uma pesquisa na web para isso deve gerar alguns recursos. Custos e benefícios estão sob o cabeçalho da teoria da utilidade e da teoria da decisão; novamente uma pesquisa encontrará alguns recursos.

— Robert Dodier
fonte

2

A escala de decibéis (logarítmica) é útil porque a potência de um sinal geralmente pode ser descrita por uma série (variável) (ou faixa de fluidos) de multiplicações.

$\frac{1}{10}$
$\frac{1}{100}$
$\frac{1}{1000}$
etc.

P [m W] = P_{0 0} {(\frac{1}{10})}^{eu [c m]}

$P[mW] = P_0 \left( \frac{1}{10} \right)^{L[cm]}$

Isso é mais simples, se você expressar o logaritmo da potência do sinal, como uma função linear (que, se desejar, requer alguma definição sobre a escala absoluta, neste caso, 0dB se refere a 1 mW)

P [d B] = 10 (registro (P_{0 0} [m W]) - eu [c m])

$P[dB] = 10 \left(\log(P_0[mW])-L[cm]\right)$

Sempre que você tiver um processo multiplicativo como:

X \propto e^{Y}

$X \propto e^Y$

$Y$

Y \sim N (μ, σ^{2})

$Y \sim N(\mu,\sigma^2)$

$X$ $log(X)$

Espero que o seu termo de erro seja multiplicativo assim. Ou seja: a força do sinal será uma soma de muitos termos de erro distribuídos normais (por exemplo, flutuações de temperatura do amplificador, condições atmosféricas etc.) que ocorrem no expoente da expressão para a força do sinal.

y_{Eu} = e^{x_{Eu} + ϵ_{Eu}}

$y_{i} = e^{x_i+\epsilon_i}$

— Sextus Empiricus
fonte