Uma variável binária com valores 0, 1 pode (geralmente) ser dimensionada para (valor - média) / DP, que é presumivelmente o seu z-score.
A restrição mais óbvia disso é que, se você conseguir todos os zeros ou todos, ligar o SD cegamente significaria que o escore z é indeterminado. Há um caso de atribuir zero também, na medida em que value - mean é identicamente zero. Mas muitas coisas estatísticas não farão muito sentido se uma variável for realmente uma constante. De maneira mais geral, porém, se o DS for pequeno, há mais risco de que os escores sejam instáveis e / ou não sejam bem determinados.
Um problema para dar uma resposta melhor à sua pergunta é precisamente o "algoritmo de aprendizado de máquina" que você está considerando. Parece que é um algoritmo que combina dados para várias variáveis e, portanto, geralmente faz sentido fornecê-los em escalas semelhantes.
(MAIS TARDE) Como o pôster original adiciona comentários um por um, a pergunta deles está se transformando. Eu ainda considero que (valor - média) / SD faz sentido (isto é, não faz sentido) para variáveis binárias, desde que o SD seja positivo. No entanto, a regressão logística mais tarde foi nomeada como o aplicativo e, para isso, não há ganho teórico ou prático (e, de fato, alguma perda de simplicidade) em algo além de alimentar variáveis binárias como 0, 1. Seu software deve ser capaz de lidar bem com aquele; caso contrário, abandone esse software em favor de um programa que possa. Em termos da pergunta do título: can, yes; deveria, não.