Suponha que seja necessário prever a altura da base de nuvem, , um problema importante nos aeroportos. Várias variáveis climáticas são medidas, incluindo a temperatura superficial T s e o ponto de orvalho da superfície, T d . Aqui, T d é a temperatura à qual o ar na superfície seria saturado com vapor de água, e a diferença T s - T d , é uma medida da humidade da superfície. Agora T s , t d são geralmente correlacionada positivamente, então uma análise de componentes principais das variáveis climatéricas terá uma componente de alta variância que está altamente correlacionado com o tHTsTdTdTs- TdTs, Td , e um componente de baixa variância que é similarmente correlacionado com T s - T d . Mas H está relacionada com a humidade e, por conseguinte, para o t s - T d , isto é, a uma baixa variação em vez de um componente de elevada variação, de modo que uma estratégia que rejeita componentes de baixa variância dará previsões pobres para H .Ts+ TdTs- TdHTs- TdH
A discussão deste exemplo é necessariamente vaga por causa dos efeitos desconhecidos de quaisquer outras variáveis climáticas que também são medidas e incluídas na análise. No entanto, mostra um caso fisicamente plausível em que uma variável dependente estará relacionada a um componente de baixa variância, confirmando os três exemplos empíricos da literatura.
Além disso, o exemplo de base de nuvem foi testado em dados do aeroporto de Cardiff (País de Gales) para o período de 1966 a 1973, com uma variável climática extra, a temperatura da superfície do mar, também incluída. Os resultados foram essencialmente como previsto acima. O último componente principal era aproximadamente
, e representava apenas 0,4% da variação total. No entanto, em um principal componente de regressão era facilmente o indicador mais importante para H . [Enfase adicionada]Ts- TdH
Os três exemplos da literatura mencionados na última frase do segundo parágrafo foram os três que mencionei na minha resposta à pergunta vinculada .