Olá, bem-vindo ao site!
O que você está dizendo é certo: a Data Science não chegou ao estágio em que possui alguns métodos padrão para isso (procedimentos padrão, não sei se poderíamos alcançar esse estágio no futuro próximo). Mas temos alguns padrões gerais como:
- Previsão: ETS, ARIMA, SARIMA etc
- Previsão: regressão linear, floresta aleatória, GLM, rede neural etc.
- Classificação: Regressão Logística, Floresta Aleatória etc
Quando você passa para o nível granular, é difícil generalizar, pois todos os problemas de negócios são diferentes e um único método não pode ser usado para resolver todos os problemas de negócios.
Portanto, para responder à próxima pergunta, como você obtém a confiança de que o resultado é bom o suficiente, presumo que você tenha ouvido falar sobre o RMSE, o MAPE e muito mais sobre previsões e matriz de confusão para problemas de classificação. Usamos essas métricas para acessar o desempenho dos modelos. Por exemplo, se você está tentando classificar se a célula especificada é célula cancerosa ou não, existem 100 registros nos quais 90 são células não-cancerígenas e 10 são células cancerígenas, seu modelo fornece Precisão de 99%, mas poderia classificar 5 de 9 literalmente 55% do total nesses cenários que você precisa olhar, não pode usar precisão, precisa usar a pontuação F1 etc. Como você estava perguntando sobre um modelo certo, todos os modelos não são úteis. É verdade que nem todos os modelos construídos vão para o nível de produção; você escolheria o melhor e o produziria. Você pode treinar novamente seu modelo (diariamente, semanalmente, Mensal, com base nos requisitos de negócios). Você chamaria de folga após a conclusão da validação? Não, eu iria ao Especialista no assunto, apresento os resultados, solicitando suas idéias; se os dois estão em linha, eu faria um teste beta em alguns dados reais e depois o produziria.
Agora, para responder à sua última pergunta, não há um padrão dizendo que isso é bom ou ruim; se funcionar para você, sua empresa, então esse é um bom modelo. Para conveniência de seus gerentes e especialistas no assunto (Dados), você precisa se aprofundar nos dados. Experimente todos os cenários diferentes e faça o maior número possível de perguntas. Tente entender os dados muito bem. Portanto, você pode responder às perguntas comerciais com respostas de suporte a dados (isso só é possível quando você está bem pior com os dados). Como eles são muito bons nos negócios, estariam fazendo perguntas em relação aos negócios, você precisa estar preparado para todos esses cenários, entendendo bem os negócios e os dados.
Finalmente, tenho um sentimento como você. Eu fiz muitas coisas, mas nada funcionou, mas você não deveria estar infeliz, pois entendeu que estas são as maneiras que o levariam a resultados sem sucesso (o melhor exemplo é Thomas Alva Edison usou 1000 metais diff antes de usar o tungstênio para fazer uma lâmpada) . Da mesma forma, todos os métodos que tentamos são etapas diferentes que você tentou obter a solução. Meu objetivo é: tentei algo diferente / novo todos os dias ou não. Parte crucial desse processo é a manutenção de documentação clara em cada etapa. O que seria útil em um futuro próximo.
Qualquer coisa em P&D nunca é um desperdício, é apenas uma outra tentativa ou experimento, portanto seu trabalho nunca é desperdiçado. Você está tentando construir uma base sólida para o futuro brilhante da sua empresa.