A resposta curta para sua pergunta (como declarado em outro lugar) é que não existe uma definição matemática única de uma forma de U. O comentário de @whuber é a melhor definição geral que eu já vi.
Pesquiso testes de formas em U e, para a minha apresentação, tenho um slide com o título "O que um U significa para você?", O que significa que é subjetivo o que as pessoas querem dizer com o termo "U-shape". O mais importante é que, quando você usa o termo "formato de U", define exatamente o que quer dizer com isso, sem assumir que outros saberão o que você quer dizer.
Como você especificou o caso de apenas um regressor, vou me concentrar nisso. Vi as seguintes definições usadas em vários artigos:
- Uma forma de U é quadrática.
- Uma forma em U significa convexidade (para uma aplicação nesse sentido, consulte 2012, de Van Landeghem, "Um teste para a convexidade do bem-estar humano ao longo do ciclo de vida: evidência longitudinal de um painel de 20 anos").
- Uma forma de U é uma função com derivada média ponderada negativa até um ponto e derivada média ponderada positiva após esse ponto (consulte Duas linhas de Uri Simonsohn : o primeiro teste válido de relacionamentos em forma de U ).
- Uma forma de U é uma função com exatamente um ponto de viragem. Isso corresponde a uma função que é quase convexa, mas não monótona.
Uma complicação que surge é: e se o ponto de virada estiver próximo do final do intervalo da variável x? Ainda devemos considerar essa função em forma de U? Na minha opinião, essa discussão deve ser realizada quando você define o que um formato em U significa para você em sua aplicação e quando especifica sua hipótese nula.
A definição que utilizo no meu artigo, Teste não paramétrico de relacionamentos em forma de U , é a seguinte:
Deixei m(x) ser a função de regressão e deixe S(X) ser o apoio de X. Para um conjunto especificadoA0⊂S(X), estamos interessados em testar o seguinte:
H0:versusHA:∃a∈A0 st ∀x∈S(X)m′(x)(x−a)≥0∀a∈A0,∃x∈S(X) stm′(x)(x−a)<0
Por exemplo, em um aplicativo, testei a satisfação em vida em forma de U na faixa etária de 20 a 70 anos, onde o ponto de virada é entre 30 e 60 anos. Decisões arbitrárias são necessárias com essa estrutura proposta. O importante é ser aberto sobre eles e verificar a sensibilidade dos resultados às mudanças (e desafiar outras pessoas a fazer o mesmo).
Além de declarar a hipótese nula, como sempre, você deve indicar as suposições em que se baseia. Por exemplo, uma suposição comum é que a função de regressão seja em forma de U em monotonia. Veja, por exemplo, 2009 "Com ou sem U? O teste apropriado para um relacionamento em forma de U", de Lind e Mehlum, onde eles propõem uma melhoria no teste quadrático de baunilha OLS, testando se a derivada de uma forma funcional especificada é negativa em o início do intervalo e positivo no final.
Um ponto adicional a ser considerado é: você deseja um teste que rejeite a hipótese nula devido a uma pequena violação da forma de U? Se sim, considere o pacote R qmutest , que implementa testes não paramétricos com base em splines das hipóteses nulas de que a função de regressão é quase-convexa e, separadamente, é monótona. Se você não deseja um teste que inferência contra uma forma de U por causa de uma pequena violação, o teste de duas linhas de Uri pode ser melhor se você quiser testar se uma função de regressão está diminuindo e depois aumentando.
Como sua pergunta era sobre o uso do termo "forma de U" e da definição, acho relevante listar aqui alguns termos que são usados com frequência para se referir à mesma coisa que "forma de U" e "forma de U invertida" "são usados para se referir a:" em forma de vale "," em forma de vale "," em forma de colina "," unimodal "," de pico único "e" em forma de sino ". Não existe uma razão inerente para "formato em U" ser um termo melhor que os outros, mas seu uso parece ter se popularizado.
Estou trabalhando em um pacote R geral que será apenas uma interface para pacotes R específicos (como o qmutest) que testam relacionamentos em forma de U, mas eles escolhem defini-los. O objetivo será ajudar os usuários a comparar testes diferentes e pensar bem sobre a hipótese nula exata que eles querem testar e quais suposições estão preparadas para fazer.