Pode ser inútil lutar contra mudanças na linguagem. Mas
parâmetro não significa variável
Na estatística clássica, que neste caso começa precisamente com RA Fisher, que primeiro usou o termo com esse significado, um parâmetro é uma constante desconhecida a ser estimada, digamos, uma média ou correlação populacional. Em matemática, existem significados relacionados, mas não idênticos, como quando uma curva é dada parametricamente. Em muitas ciências, parâmetro é apenas outra palavra para uma medida (ela própria, um termo denso com significado matemático), propriedade ou variável, digamos comprimento ou condutividade, porosidade ou virtude, conforme o caso. Naturalmente, o comprimento ou a virtude de um indivíduo são desconhecidos antes de serem medidos. mas as pessoas de espírito estatístico podem ficar confusas com seu uso para um conjunto de tais medidas. Na linguagem comum ou vulgar, os parâmetros(quase sempre plural) geralmente significam os limites de algo, digamos, um relacionamento pessoal ou uma política política, talvez decorrente de alguma confusão original com o perímetro . Com alta probabilidade prévia, presume-se que os bayesianos falem por si mesmos em seus próprios usos (agradecimento a @conjugateprior).
inclinado não significa tendencioso
Por um século ou mais, a distorção teve um senso estatístico específico de se referir à assimetria das distribuições, avaliadas graficamente, medidas numericamente ou presumidas teoricamente como uma questão de fé ou esperança. Por muito mais tempo, ou pelo menos pode ser adivinhado, o viés significava estar errado, em média, que - desde que saibamos a verdade, significando um valor verdadeiro ou correto - pode ser quantificado como erro sistemático. Inclinado na linguagem comum tem o senso comum de ser distorcido e distorcido e, portanto, incorreto, errado e também tendencioso. Esse sentido (até onde eu notei, apenas muito recentemente) começou a voltar a discussões estatísticas, de modo que o significado original de assimetria corre o risco de ficar embaçado ou submerso.
correlação não significa concordância
A correlação atraiu vários sentidos precisos na estatística, que têm em comum a idéia de uma relação bivariada perfeita em um sentido preciso: os casos principais são a relação linear e monótona. Muitas vezes, é diluído, mesmo em discussões estatísticas, para significar quase qualquer tipo de relacionamento ou associação. O que correlação não significa, necessariamente, é concordância: assim, implica correlação de Pearson de ou , contanto que , mas a concordância requer a condição muito estrita .y=a+bx1−1b≠0y=xa=0,b=1
único não significa distinto
É bastante comum para falar sobre os valores distintos de dados como único , mas único ainda é idealmente melhor preservada no sentido de que ocorre apenas uma vez. Meu palpite é que parte da culpa deriva do utilitário Unix uniq
e de seus imitadores, que reduzem possíveis valores repetidos a um conjunto em que cada valor é realmente único. O uso, nesse palpite, confunde a entrada e a saída de um programa. (Por outro lado, se falamos de duplicatas nos dados, raramente nos restringimos a dupletos que ocorrem precisamente duas vezes. O termo replicafaria mais sentido lingüístico, mas foi antecipado para replicação deliberada de controles em experimentos; os valores de resposta resultantes geralmente não são de todo idênticos, o que é muito importante.)
amostras raramente são repetidas
Na estatística, uma amostra inclui vários valores, e a amostragem repetida é uma alta virtude teórica, mas raramente praticada, exceto por simulação, que é o nosso termo habitual para qualquer tipo de falsificação in silico . Em muitas ciências, uma amostra é um único objeto, consistindo em um pedaço, pedaço ou quantidade de água, solo, sedimento, rocha, sangue, tecido ou outras substâncias que variam de atrativas a benignas a repugnantes; longe de ser excepcional, coletar muitas amostras pode ser essencial para qualquer análise séria. Aqui, a terminologia de cada campo faz todo o sentido para o seu povo, mas às vezes é necessária tradução.
erro geralmente não significa erro; como Harold Jeffreys apontou, o sentido primário é errático, não errôneo.
No entanto, devemos ter cuidado com nossos próprios pecados ou peculiaridades de terminologia:
regressão não está indo para trás
estacionário não significa imóvel ou fixo
confiança não tem nada a ver com o estado mental ou psicológico de alguém
o significado tem apenas algumas vezes seu significado cotidiano
exato é geralmente um termo honorífico, referindo-se a uma solução ou cálculo convenientemente tratável, e não a um apropriado para o problema
distribuições inclinadas à direita para muitas parecem distorcidas à esquerda e vice-versa
o lognormal é assim chamado porque é um normal exponenciado
mas o lognormal é mais normal que o normal
o gaussiano foi descoberto por De Moivre
Poisson não descobriu o Poisson , muito menos a regressão de Poisson
o bootstrap não irá ajudá-lo com o seu calçado
o canivete não corta
curtose não é uma condição médica
parcelas de caule e folhas não se referem a plantas
uma variável fictícia é útil, não faz sentido ou é estúpida
quem na Terra (ou em qualquer outro lugar) pensa que heterocedasticidade é realmente um termo preferível à variabilidade desigual ?
O robusto agora tem pelo menos dois significados técnicos principais para grupos diferentes, nenhum dos quais inibe seu uso frequente, mesmo em discussões técnicas, para significar apenas algo como "afirmado para se comportar bem"
IV agora tem pelo menos dois significados principais para diferentes grupos
O fator agora tem pelo menos dois significados principais para diferentes grupos
normalizar e padronizar têm inúmeros significados (precisamos realmente padronizar lá)
versus descrever um gráfico significa variável vertical versus variável horizontal , a menos que signifique o oposto
e (por último, mas não menos importante, cunhar uma frase) as estatísticas têm pelo menos três significados principais.
Notas:
Apesar das aparências em contrário, acho que essa é uma pergunta boa e séria.
A moda muda. Bem no século XX, parece que muitas pessoas (sem nome, sem broca, mas Karl Pearson poderia ser mencionado) só podiam inventar termos buscando seus dicionários de grego e latim. (Seria injusto não lhe dar crédito pelo gráfico de dispersão .) Mas RA Fisher seqüestrou muitas palavras em inglês pré-existentes, incluindo variação , suficiência , eficiência e probabilidade . Mais recentemente, JW Tukey era um mestre no uso de termos caseiros, mas poucos deveriam sentir angústia que as espinhas e os maus mandamentos não entendiam .
Um comentário é baseado na lembrança de "A vida é [...] multiplicativa em vez de aditiva: a distribuição normal do log é mais normal que a normal". Anon. 1962. Regras de trabalho de Bloggins. Em Good, IJ (Ed.) O cientista especula: uma antologia de idéias parcialmente cozidas. Londres: Heinemann, 212-213 (citação na p.213).