Qual é a melhor maneira de preparar interações de recursos categóricos antes de se adaptar ao scikit-learn?
Com statsmodels
eu poderia dizer convenientemente em estilo R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()
(o mesmo em Stata com regress depvar i.var1##i.var2
).
Pode sklearn.preprocessing.PolynomialFeatures
(na v0.15, atualmente dev) ser usado com variáveis categóricas?
~var1*var2
É perfeitamente bem em R para a construção da matriz de RHS)