A história destes pode esclarecer você aqui. Simplesmente falar sobre meta-idiomas, perfis, subconjuntos e instâncias é um pouco seco! Vou tentar mantê-lo curto e simples.
O SGML evoluiu do GML (Generalized Markup Language), desenvolvido por três engenheiros da IBM na década de 1960 como um meio de armazenar elaborados documentos legais, governamentais, industriais e militares. O GML foi gradualmente refinado até ser padronizado como SGML em 1986.
GML / SGML não é um idioma em si . É mais uma meta-linguagem , ou seja, uma linguagem para definir idiomas conformes ou as "regras" pelas quais a formatação de uma variedade de documentos elaborados pode ser projetada de uma maneira geralmente consistente. Cada tipo diferente de documento definiria, portanto, seu próprio conjunto de nomes de tags em conformidade com SGML, além de atributos associados, assim como qualquer identificador / espaço público formal definido, esquemas, etc. Cada formato definido como esse se tornou, portanto, uma linguagem de armazenamento de dados distinta para o documento tipo em questão. Devido à consistência entre todos os documentos em conformidade com as regras SGML, é possível escrever código para agrupar / processar dados nesses documentos e transferir dados entre documentos que compartilham um formato comum.
O SGML foi considerado excessivamente elaborado para o documento numeroso, mas de tamanho menor. Portanto, o XML foi desenvolvido entre 1996 e 2006 como um subconjunto (a palavra perfil significa efetivamente o mesmo que subconjunto) do SGML que pode lidar com documentos pequenos e grandes. Sendo um subconjunto de uma meta-linguagem, o XML é em si uma meta-linguagem, embora seja mais simples. Você poderia dizer que o XML fornece uma base para o design de formatos de documento adequados para fácil armazenamento e transferência entre sistemas em uma rede.
Após a padronização do SGML, mas antes de ser simplificado para XML, a Internet surgiu e, com ela, a necessidade de um formato de documento que permitisse fácil transferência e exibição de documentos e dados perdidos. O resultado foi a linguagem HTML, uma instância (ocasionalmente chamada de aplicativo ) de SGML com 18 tags predefinidas, fornecendo uma maneira padronizada de exibir uma variedade de tipos de dados, por exemplo, texto, imagens, áudio, etc. alguns elementos para omitir tags iniciais ou finais. Versões subseqüentes do HTML adicionaram novas tags e atributos e tornaram obsoletas algumas existentes. Até o HTML 5, eram feitas alterações no HTML para que ele permanecesse sempre uma linguagem filho do SGML.
Após a padronização do XML, surgiu uma instância chamada XHTML que combinava os nomes de tags HTML existentes com o rigor do XML no fechamento de tags, espaços de nomes, esquemas etc. O XHTML inicialmente teve a promessa de ser útil para armazenamento, transferência e exibição de dados. Parecia estar prestes a substituir o HTML como a maneira mais comum de exibir material da web - até o lançamento do HTML 5. O HTML 5 tinha alguns recursos sintáticos que foram além dos definidos no SGML, a fim de fornecer uma exibição de dados mais rica, especialmente para sites carregados de multimídia. Com o passar do tempo, foram adicionados recursos adicionais ao HTML 5, que enriqueceram ainda mais seu uso para exibição / uso de dados, a ponto de dificilmente ser substituído por novas versões XHTML, pelo menos no que diz respeito à exibição de dados em questão. Embora os padrões para HTML e XHTML sejam feitos por grupos de trabalho do W3C, A propagação real dessas linguagens "no terreno" é feita por web designers progressistas e não há mais progressiva do que aqueles que trabalham no setor de mídia (publicidade / RP / marketing): basta olhar para a criatividade dos sites das agências de publicidade em comparação com outros sites. Esse setor realmente adotou a nova linguagem HTML 5, encantada em explorar sua capacidade de SVG, áudio, vídeo eas novas APIs . Sua pronta adoção do HTML 5 levou rapidamente à sua popularidade entre os web designers em geral, um processo acelerado pela troca on-line de habilidades e truques no YouTube e em vários outros sites. Uma versão XHTML atualizada, XHTML5, surgiu, mas não é realmente um derivado XML estrito, mas uma versão do HTML5 serializada por XML. Apenas uma pequena proporção de sites parece ter alguma utilidade para isso.
Essa é a história por trás dessas linguagens de dados. Espero que ajude você a distinguir o significado e o propósito de todos eles. Filosoficamente, esta história mostra como uma ferramenta habilitadora essencial (SGML) para uma nova tecnologia (internet) pode, no novo ambiente com demandas cada vez mais variadas, superar seus limites originais e se tornar conceitualmente mais simples, aplicável mais versátil e impactante e mais poderosa.