Eu tenho um conjunto de dados contendo dados sobre temperatura, precipitação e produtividade de soja de uma fazenda por 10 anos (2005 - 2014). Gostaria de prever os rendimentos para 2015 com base nesses dados.
Observe que o conjunto de dados possui valores DIARIOS para temperatura e precipitação, mas apenas 1 valor por ano para o rendimento, uma vez que a colheita da colheita ocorre no final da estação de cultivo.
Quero construir uma regressão ou outro modelo baseado em aprendizado de máquina para prever os rendimentos de 2015, com base em um modelo de regressão / algum outro derivado do estudo da relação entre rendimentos e temperatura e precipitação nos anos anteriores.
Estou familiarizado com a realização de aprendizado de máquina usando o scikit-learn. No entanto, não sei como representar esse problema. A parte complicada aqui é que a temperatura e a precipitação são diárias, mas o rendimento é de apenas 1 valor por ano.
Como abordar isso?