Estou procurando informações sobre como deve ser organizado um projeto de aprendizado de máquina do Python. Para projetos usuais do Python, existe o Cookiecutter e para o R ProjectTemplate .
Esta é a minha estrutura de pastas atual, mas estou misturando Jupyter Notebooks com o código Python real e isso não parece muito claro.
.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools
Eu trabalho na pasta scripts e atualmente adiciono todas as funções nos arquivos em my_module, mas isso leva a erros ao carregar dados (caminhos relativos / absolutos) e outros problemas.
Não consegui encontrar boas práticas adequadas ou bons exemplos sobre esse tópico, além de algumas soluções de competição kaggle e alguns Notebooks com todas as funções condensadas no início desse Notebook.