1) Sim, suas observações estão corretas.
2) O sistema global de coordenadas XYZ padrão faz sentido quando você pensa em termos de um jogo de tiro em primeira pessoa, quando olha através dos olhos de um personagem na cena com uma matriz de transformação em branco (identidade). Como quando você desenha um sistema de coordenadas em um pedaço de papel, X aponta para a direita e Y aponta para cima. De acordo com a regra da mão direita (x-> polegar, y-> dedo indicador, z-> dedo médio), Z aponta para você.
3) Não seria errado, mas seria um desvio dos padrões. Existem três problemas em que posso pensar no momento: (a) Digamos que um dia você queira usar uma biblioteca de física que use o quadro de coordenadas padrão. Se você não seguiu o padrão, agora precisa pensar na transformação que o leva do seu mundo para o mundo da física. Pode ser irritante quando você deseja corrigir um erro. (b) Quando você deseja compartilhar código com alguém ou trazer alguém para ajudar no desenvolvimento, eles precisam se acostumar com a sua convenção. (c) Ao usar modelos 3D padrão, você sempre deve ter uma transformação acima deles para impedir que olhem de lado.
Agora, para adicionar à pergunta 2, é muito útil pensar em X, Y e Z como não apenas três letras, mas também como certas, para cima e para trás. Todos os personagens da cena têm um sistema de coordenadas local anexado a eles e, em seus quadros de coordenadas locais, X está sempre certo, Y está ativo e Z está invertido. Depois de ter isso, agora você pode entender os vetores impressos ou escrever seus algoritmos de uma maneira que faça sentido. Digamos que você tenha dois caracteres A e B e queira fazer algo se um deles estiver voltado para o outro. Você pode simplesmente encontrar a localização de B no quadro de coordenadas de A (Ta ^ -1 * p_b), olhar para o vetor obtido e ver se Z (para trás) é negativo e X (à direita) e Y (para cima) são pequenos, porque esse vetor informa quanto, para trás e para a direita, B está em relação a A.