Gostaria de oferecer uma alternativa à resposta bem pensada de David Postill. Em sua resposta, ele abordou a questão dos pixels serem quadrados, exatamente como o título sugeria. No entanto, ele fez um comentário muito perspicaz em sua resposta:
Alguns argumentam que nunca são quadrados ("Um pixel é uma amostra pontual. Existe apenas em um ponto").
Essa posição pode realmente gerar uma resposta totalmente diferente. Em vez de focar no motivo de cada pixel ser um quadrado (ou não), ele pode se concentrar no motivo pelo qual tendemos a organizar essas amostragens de pontos em grades retangulares. Na verdade, nem sempre foi assim!
Para argumentar, vamos jogar de um lado para o outro entre tratar uma imagem como dados abstratos (como uma grade de pontos) e a implementação dela em hardware. Às vezes, uma visão é mais significativa que a outra.
Para começar, vamos voltar muito longe. As fotografias tradicionais de filmes não tinham "grade", o que é uma das razões pelas quais as fotos sempre pareciam tão nítidas em comparação às fotos digitais modernas. Em vez disso, tinha um "grão", que era uma distribuição aleatória de cristais no filme. Era mais ou menos uniforme, mas não era um bom arranjo retilíneo. A organização desses grãos surgiu a partir do processo de produção do filme, utilizando propriedades químicas. Como resultado, o filme realmente não tinha uma "direção". Foi apenas um 2d respingo de informação.
Avance rapidamente para a TV, especificamente os antigos CRTs de digitalização. Os CRTs precisavam de algo diferente das fotos: eles deveriam poder representar seu conteúdo como dados. Em particular, precisavam ser dados que pudessem transmitir, em analógico, através de um fio (normalmente como um conjunto de tensões que muda constantemente). A foto era 2d, mas precisávamos transformá-la em uma estrutura 1d, para que pudesse variar em uma dimensão (tempo). A solução foi dividir a imagem por linhas (não pixels!). A imagem foi codificada linha por linha. Cada linha era um fluxo analógico de dados, não uma amostragem digital, mas as linhas eram separadas uma da outra. Assim, os dados foram discretos na direção vertical, mas contínuos na direção horizontal.
As TVs precisavam renderizar esses dados usando fósforos físicos, e uma TV colorida exigia uma grade para dividi-los em pixels. Cada TV pode fazer isso de maneira diferente na direção horizontal, oferecendo mais pixels ou menos pixels, mas eles precisam ter o mesmo número de linhas. Em teoria, eles poderiam ter compensado todas as outras linhas de pixels, exatamente como você sugere. No entanto, na prática, isso não era necessário. De fato, eles foram ainda mais longe. Percebeu-se rapidamente que o olho humano lidava com o movimento de uma maneira que os deixava enviar apenas metade da imagem a cada quadro! Em um quadro, eles enviavam as linhas numeradas ímpares e, no quadro seguinte, enviavam as linhas numeradas pares e as uniam.
Desde então, digitalizar essas imagens entrelaçadas tem sido um pouco complicado. Se eu tivesse uma imagem de 480 linhas, na verdade só tenho metade dos dados em cada quadro devido ao entrelaçamento. O resultado disso é muito visível quando você tenta ver algo se mover rapidamente pela tela: cada linha é deslocada temporariamente 1 quadro do outro, criando faixas horizontais em objetos em movimento rápido. Menciono isso porque é bastante divertido: sua sugestão compensa todas as outras linhas da grade em meio pixel para a direita, enquanto o entrelaçamento muda todas as outras linhas da grade pela metade no tempo!
Francamente, é mais fácil fazer essas belas grades retangulares para as coisas. Sem nenhuma razão técnica para fazer melhor do que isso, ele ficou preso. Então chegamos à era do computador. Os computadores precisavam gerar esses sinais de vídeo, mas não tinham capacidade analógica para escrever uma linha analógica. A solução era natural, os dados foram divididos em pixels. Agora, os dados eram discretos tanto na vertical quanto na horizontal. Tudo o que restava era escolher como fazer a grade.
Fazer uma grade retangular era extremamente natural. Primeiro, todas as TVs por aí já estavam fazendo isso! Segundo, a matemática para desenhar linhas em uma grade retangular é muito mais simples do que desenhá-las em uma grade hexagonal. Você pode dizer "mas pode desenhar linhas suaves em 3 direções em uma grade hexagonal, mas apenas 2 na retangular". No entanto, as grades retangulares facilitam o desenho de linhas horizontais e verticais. As grades hexagonais só podem ser feitas para desenhar uma ou outra. Naquela época, poucas pessoas usavam formas hexagonais para qualquer um dos seus esforços não computacionais (papel retangular, portas retangulares, casas retangulares ...). A capacidade de tornar horizontal e horizontalas linhas verticais ultrapassam em muito o valor de criar imagens com cores suaves ... especialmente porque as primeiras telas eram monocromáticas e levaria muito tempo até que a suavidade das imagens tivesse um papel importante no pensamento.
A partir daí, você tem um precedente muito forte para uma grade retangular. O hardware gráfico suportava o que o software estava fazendo (grades retangulares) e o software direcionava o hardware (grades retangulares). Em teoria, algum hardware poderia ter tentado criar uma grade hexagonal, mas o software simplesmente não a recompensou, e ninguém queria pagar pelo dobro do hardware!
Este rápido nos encaminha para hoje. Ainda queremos boas linhas horizontais e verticais, mas com telas retinas de ponta, isso fica cada vez mais fácil. No entanto, os desenvolvedores ainda são treinados para pensar em termos da antiga grade retangular. Estamos vendo algumas novas APIs suportando "coordenadas lógicas" e fazendo anti-aliasing para fazer parecer que há um espaço 2D contínuo completo para brincar, em vez de uma grade de pixels 2D rígidos, mas é lento. Eventualmente, podemos ver grades hexagonais.
Na verdade, nós os vemos, mas não com telas. Na impressão, é muito comum usar uma grade hexagonal. O olho humano aceita a grade hexagonal muito mais rapidamente do que uma grade retangular. Tem a ver com a maneira como as linhas "alias" nos diferentes sistemas. As grades hexagonais também apelidam de uma maneira menos agressiva, com a qual os olhos se sentem mais confortáveis (se uma grade hexadecimal precisar subir uma linha para cima ou para baixo, eles o farão suavemente durante uma transição diagonal. As grades retangulares precisam pular, criando um descontinuidade clara)