Respostas:
Se por algum motivo você sabe a interceptação (especialmente se for zero), você pode evitar o desperdício de variância em seus dados para estimar algo que você já sabe, e ter mais confiança nos valores que você não têm de estimar.
Um exemplo um pouco simplificado é se você já sabe (pelo conhecimento do domínio) que uma variável é (em média) um múltiplo de outra e está tentando encontrar essa múltipla.
Considere o caso de uma covariável categórica de três níveis. Se alguém tiver uma interceptação, isso exigiria 2 variáveis indicadoras. Usando a codificação usual para variáveis indicadoras, o coeficiente para qualquer variável indicadora é a diferença média em comparação com o grupo de referência. Ao suprimir a interceptação, você teria 3 variáveis representando a covariável categórica, em vez de apenas 2. Um coeficiente é a estimativa média para esse grupo. Um exemplo mais concreto de onde fazer isso é na ciência política, onde se pode estudar os 50 estados dos Estados Unidos. Em vez de ter uma interceptação e 49 variáveis indicadoras para os estados, geralmente é preferível suprimir a interceptação e, em vez disso, ter 50 variáveis.
Para ilustrar o argumento de @Nick Sabbe com um exemplo específico.
Certa vez, vi um pesquisador apresentar um modelo da idade de uma árvore em função de sua largura. Pode-se supor que quando a árvore está com zero anos de idade, ela tem efetivamente uma largura de zero. Assim, uma interceptação não é necessária.