Espero que esta pergunta seja a mais adequada neste site ...
Em Python, geralmente o nome da classe é definido usando a letra maiúscula como seu primeiro caractere, por exemplo
class Vehicle:
...
No entanto, no campo de aprendizado de máquina, muitas vezes os dados de treinamento e teste são definidos como X
e Y
- não x
e y
. Por exemplo, agora estou lendo este tutorial no Keras , mas ele usa as X
e Y
como suas variáveis:
from sklearn import datasets
mnist = datasets.load_digits()
X = mnist.data
Y = mnist.target
Por que estes são definidos como letras maiúsculas? Existe alguma convenção (pelo menos em Python) no campo de aprendizado de máquina de que é melhor usar a letra maiúscula para definir essas variáveis?
Ou talvez as pessoas distinguam as variáveis maiúsculas e minúsculas no aprendizado de máquina?
De fato, o mesmo tutorial posteriormente distingue essas variáveis da seguinte maneira:
from sklearn.cross_validation import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X, Y, train_size=0.7, random_state=0)