Contexto: SysID e controla o cara que entrou no ML.
Acho que a resposta do user110686 faz um bom trabalho ao explicar algumas diferenças. O SysID é necessariamente sobre modelos dinâmicos a partir de dados de entrada / saída, enquanto o ML cobre uma classe mais ampla de problemas. Mas a maior diferença que vejo é com (a) memória (número de parâmetros); (b) uso final do modelo "aprendido". A identificação do sistema é bastante uma abordagem de processamento de sinal, considerando representações no domínio da frequência, análise de frequência e tempo etc. Algumas pessoas da ML chamam isso de "engenharia de recursos".
(uma memoria:O SysID tornou-se proeminente muito antes da ML, quando um campo de pesquisa tomou forma. Portanto, a estatística e o processamento de sinais foram a base principal dos fundamentos teóricos, e o cálculo foi assustador. Portanto, as pessoas trabalhavam com uma classe muito simples de modelos (trade-off de polarização) com muito poucos parâmetros. Estamos falando de no máximo 30 a 40 parâmetros e principalmente modelos lineares, mesmo nos casos em que as pessoas sabem claramente que o problema não é linear. No entanto, agora a computação é muito barata, mas o SysID ainda não saiu de seu shell. As pessoas devem começar a perceber que agora temos sensores muito melhores, que podem estimar facilmente milhares de parâmetros com conjuntos de modelos muito ricos. Alguns pesquisadores tentaram usar redes neurais para o SysID, mas muitos parecem relutantes em aceitá-las como "convencionais", já que não existem muitas garantias teóricas.
(b) Uso final do modelo aprendido: Agora, isso é uma coisa que o SysID ficou muito correto, mas muitos algoritmos de ML não conseguem capturar. É importante reconhecer que, para os aplicativos de destino, você está necessariamente criando modelos que podem ser usados efetivamente para otimização online.Esses modelos serão usados para propagar quaisquer decisões de controle tomadas e, quando configuradas como um problema de controle ideal, os modelos se tornam restrições. Portanto, ao usar uma estrutura de modelo extremamente complicada, torna a otimização on-line muito mais difícil. Observe também que essas decisões online são tomadas na escala de segundos ou menos. Uma alternativa proposta é aprender diretamente a função de valor de maneira fora da política para um controle ideal. Isso é basicamente um aprendizado por reforço, e acho que há uma boa sinergia entre o SysID e o RL.