Por exemplo, tenho dados históricos de perdas e estou calculando quantis extremos (Valor em risco ou Perda máxima provável). Os resultados obtidos são para estimar a perda ou prever? Onde alguém pode traçar a linha? Estou confuso.
Por exemplo, tenho dados históricos de perdas e estou calculando quantis extremos (Valor em risco ou Perda máxima provável). Os resultados obtidos são para estimar a perda ou prever? Onde alguém pode traçar a linha? Estou confuso.
Respostas:
"Previsão" e "estimativa" são, de fato, às vezes usadas de forma intercambiável na escrita não técnica e parecem funcionar de maneira semelhante, mas há uma nítida distinção entre elas no modelo padrão de um problema estatístico. Um estimador usa dados para adivinhar um parâmetro, enquanto um preditor usa os dados para adivinhar algum valor aleatório que não faz parte do conjunto de dados. Para aqueles que não estão familiarizados com o que "parâmetro" e "valor aleatório" significam nas estatísticas, o seguinte fornece uma explicação detalhada.
Nesse modelo padrão, supõe-se que os dados constituam uma observação (possivelmente multivariada) de uma variável aleatória X cuja distribuição é conhecida apenas por estar dentro de um conjunto definido de possíveis distribuições, os "estados da natureza". Um estimador t é um procedimento matemático que atribui a cada valor possível x alguma propriedade t ( x ) de um estado de natureza θ , como sua média μ ( θ ) . Assim, uma estimativa é um palpite sobre o verdadeiro estado da natureza. Podemos dizer quão boa é uma estimativa comparando t ( x ) para .
Um preditor diz respeito à observação independente de outra variável aleatória Z cuja distribuição está relacionada ao verdadeiro estado da natureza. Uma previsão é um palpite sobre outro valor aleatório. Podemos dizer o quão bom uma previsão especial é de apenas comparando p ( x ) com o valor realizado por Z . Esperamos que, em média, o acordo seja bom (no sentido de calcular a média de todos os resultados possíveis x e simultaneamente de todos os valores possíveis de Z ).
Os mínimos quadrados comuns fornecem o exemplo padrão. Os dados consistem em pares associando valores y i da variável dependente a valores x i da variável independente. O estado da natureza é especificado por três parâmetros α , β e σ : diz que cada y i é como um desenho independente de uma distribuição normal com média α + β x i e desvio padrão σ . α , β e são parâmetros (números) que se acredita serem fixos e invariáveis. O interesse se concentra em α (a interceptação) e β (a inclinação). Os OLS estimar, por escrito ( α , β ) , é bom no sentido de que α tende a estar perto de ct e β tende a estar perto de β ,não importa o que o verdadeiro (mas desconhecido) valores de α e β pode ser.
A previsão do OLS consiste em observar um novo valor da variável dependente associada a algum valor x da variável independente. x pode ou não estar entre os x i no conjunto de dados; isso é imaterial. Uma intuitivamente boa predição é que este novo valor é provável que seja perto de α + β x . Melhores previsões dizem quão próximo o novo valor pode estar (elas são chamadas intervalos de previsão ). Eles representam o fato de que αe β são incertas (uma vez que dependem matematicamente sobre os valores aleatórios ( y i ) ), que σ não se sabe ao certo (e, por conseguinte, tem de ser avaliado), bem como o pressuposto de que Y ( x ) tem uma distribuição normal com desvio padrão σ e média α + β x (observe a ausência de qualquer chapéu!).
Aqui, então, no exemplo do OLS, vemos claramente a distinção: uma estimativa adivinha os parâmetros (que são números fixos, mas desconhecidos), enquanto uma previsão adivinha o valor de uma quantidade aleatória. A fonte da confusão potencial é que a previsão geralmente se baseia nos parâmetros estimados e pode até ter a mesma fórmula que um estimador.
Na prática, você pode distinguir estimadores de preditores de duas maneiras:
objetivo : um estimador procura conhecer uma propriedade do verdadeiro estado da natureza, enquanto uma previsão procura adivinhar o resultado de uma variável aleatória; e
incerteza : um preditor geralmente tem uma incerteza maior que um estimador relacionado, devido à incerteza adicionada no resultado dessa variável aleatória. Preditores bem documentados e descritos, portanto, geralmente vêm com faixas de incerteza - intervalos de previsão - que são mais amplas que as faixas de incerteza dos estimadores, conhecidas como intervalos de confiança. Uma característica dos intervalos de previsão é que eles podem (hipoteticamente) encolher à medida que o conjunto de dados cresce, mas eles não encolherão para largura zero - a incerteza no resultado aleatório é "irredutível" - enquanto as larguras dos intervalos de confiança tenderão a encolher para zero, correspondendo à nossa intuição de que a precisão de uma estimativa pode se tornar arbitrariamente boa com quantidades suficientes de dados.
Ao aplicar isso para avaliar a possível perda de investimento, primeiro considere o objetivo: você deseja saber quanto pode realmente perder nesse investimento (ou nessa cesta específica de investimentos) durante um determinado período, ou está realmente adivinhando qual é o perda esperada (talvez em um grande universo de investimentos)? O primeiro é uma previsão, o segundo uma estimativa. Então considere a incerteza. Como sua resposta mudaria se você tivesse recursos quase infinitos para coletar dados e realizar análises? Se isso se tornar muito preciso, você provavelmente está estimando o retorno esperado do investimento, enquanto que, se permanecer altamente incerto sobre a resposta, estará fazendo uma previsão.
Portanto, se você ainda não sabe ao certo com qual animal está lidando, pergunte ao seu estimador / preditor: qual é a probabilidade de ser errado e por quê? Por meio dos dois critérios (1) e (2), você saberá o que possui.
A estimativa é sempre para parâmetro desconhecido, enquanto a previsão é para variável aleatória.
Não há diferença nos modelos. De fato, há uma (leve) diferença na ação realizada. Estimativa é a calibração do seu modelo probabilístico usando dados ("aprendizado" na terminologia da IA). Previsão é o "palpite" de uma observação futura. Supondo que esse "palpite" seja baseado em dados passados - esse pode ser um caso de estimativa; como a previsão da altura da próxima pessoa que você está prestes a conhecer, usando uma estimativa da altura média da população. Observe, porém, que a previsão nem sempre é uma instância de estimativa. O gênero da próxima pessoa que você está prestes a conhecer não é um parâmetro da população no sentido clássico; A previsão do sexo pode exigir alguma estimativa, mas será necessário um pouco mais ...
No caso do valor em risco, a previsão e a estimativa coincidem desde a perda prevista , é a expectativa estimada da perda.
Normalmente, "estimativa" é reservada para parâmetros e a "predição" é para valores. No entanto, algumas vezes a distinção fica embaçada, por exemplo, você pode ter visto algo como "estimar o valor amanhã" em vez de "prever o valor amanhã".
O valor em risco (VaR) é um caso interessante. O VaR não é um parâmetro, mas não dizemos "prever o VaR". Dizemos "estimar VaR". Por quê?
O motivo pelo qual o VaR não é uma quantidade aleatória SE você conhece a distribuição E precisa conhecer a distribuição para calcular o VaR. Então, se você estiver usando a abordagem paramétrica do VaR, primeiro estimar os parâmetros da distribuição e depois calcular o VaR. Se você estiver usando o VaR não paramétrico, estimará diretamente o VaR de maneira semelhante à estimativa dos parâmetros. Nesse sentido, é semelhante ao quantil.
Por outro lado, o valor da perda é um valor aleatório. Portanto, se você for solicitado a prever perdas, estaria prevendo que não estimariam. Novamente, às vezes dizemos "estimar" a perda. Então, a linha está embaçada, como escrevi anteriormente.
Acho as definições abaixo mais explicativas:
Estimativa é a aproximação calculada de um resultado. Esse resultado pode ser uma previsão, mas não necessariamente. Por exemplo, posso estimar que o número de carros na Ponte Golden Gate às 17h de ontem foi de 900, assumindo que as três faixas que iam para Marin estavam em capacidade, cada carro ocupa um espaço de 30 pés e a ponte tem 9000 pés de comprimento ( 9000/30 x 3 = 900).
Extrapolação é estimar o valor de uma variável fora de um intervalo conhecido de valores assumindo que o valor estimado segue algum padrão dos conhecidos. A forma mais simples e popular de extrapolação é estimar uma tendência linear com base nos dados conhecidos. Alternativas à extrapolação linear incluem extrapolação polinomial e cônica. Como a estimativa, a extrapolação pode ser usada para previsão, mas não se limita à previsão.
Previsão é simplesmente dizer algo sobre o futuro. As previsões geralmente são focadas nos resultados e não no caminho para esses resultados. Por exemplo, eu poderia prever que em 2050 todos os veículos serão movidos a motores elétricos sem explicar como passamos da baixa adoção em 2011 à adoção completa em 2050. Como você pode ver no exemplo anterior, as previsões não são necessariamente baseadas em dados.
Previsão é o processo de fazer uma previsão ou previsão. Os termos previsão e previsão são freqüentemente usados de forma intercambiável, mas às vezes as previsões se distinguem das previsões, pois as previsões geralmente fornecem explicações sobre os caminhos para um resultado. Por exemplo, uma previsão de adoção de veículo elétrico pode incluir o caminho para a adoção completa de veículo elétrico, seguindo um padrão de adoção em forma de S, onde poucos carros são elétricos antes de 2025, um ponto de inflexão ocorre em 2030 com adoção rápida e a maioria dos carros é elétrica após 2040
Estimativa, extrapolação, previsão e previsão não são termos mutuamente exaustivos e coletivamente exaustivos. Boas previsões de longo prazo para problemas complexos muitas vezes precisam usar técnicas diferentes da extrapolação para produzir resultados plausíveis. Previsões e previsões também podem ocorrer sem qualquer tipo de estimativa calculada.