Que linguagem de marcação é essa? (ca. 1991)


19

Estou preservando um manuscrito escrito por meu pai. Os arquivos de dados estão no disquete de 5,25 ". Eu li os arquivos com sucesso, mas nenhum de nós sabe qual é o formato da linguagem de marcação. É um usado pelos editores de livros no início dos anos 90.

Aqui estão algumas linhas de um dos arquivos.

\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\

Alguém pode identificar a linguagem de marcação que está sendo usada aqui?

Eu tenho esses arquivos originais e o livro publicado. Não seria muito difícil para mim descobrir o que os códigos significam. Mas se o formato puder ser identificado, algum tipo de tradutor automático para algo mais recente (RTF, XML etc.) poderá estar disponível.

Editar

É como um mistério a ser resolvido! Aqui está como uma tabela é iniciada:

<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>

Eu pesquisei no Google por termos como begtabe setbgut. O último apareceu um documento PDF que parece ter um "erro de digitação", mas o erro de digitação é uma setbgutmarca quase exatamente igual à dos meus arquivos.

http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (pesquise setbgut)

Parece que este trabalho de pesquisa foi apresentado usando o mesmo software. Eu o trouxe para o Acrobat e as propriedades dizem que foi gerado pelo Xyvision Parlance Publisher (XPP). Aqui está o melhor que eu encontrei sobre eles até agora: http://www.isgmlug.org/n2-1/n2-1-49.htm

Editar 2

OK, eu vejo agora. XPP é uma linguagem de marcação semelhante a SGML. De fato, a literatura de vendas XPP anuncia como é "fácil" pegar um documento SGML existente e adicionar suas tags proprietárias. Infelizmente, o XPP foi vendido para a General Dynamics há alguns anos. Traduzir o documento automaticamente para, digamos, HTML é difícil sem o DTD. No entanto, como outros já apontaram, a maioria das tags é fácil de descobrir. Alguns deles, como as referências bibliográficas e os valores após o ponto-e-vírgula, em tags como <rrh;1>e <lp;&-1q>ainda me escapam. Vou ter que comparar o arquivo com a cópia física lado a lado para decodificar tudo.


Bem, não é TeX, RTF ou SGML. Você sabe se foi escrito à mão ou gerado por um processador de texto?
Kevin Reid

1
Provavelmente escrito à mão. A marcação é muito concisa para ser gerada por computador. No entanto, pode ter sido escrito por um programa de computador que permite ao usuário um controle muito específico sobre os códigos de formatação - o que estaria a apenas um passo de ser codificado manualmente.
Barry Brown,

1
A extensão do nome do arquivo ajudaria muito.
Joel Coehoorn

uma rápida olhada exclui o XyWrite e o wordstar (usa códigos de ponto). Talvez seja perfeito?
Journeyman Geek

4
lrhe rrhestão correndo cabeças, respectivamente esquerda e direita. xlrhe xrrhsaia do modo de corrida. cncentraliza um número onde-como ctcentraliza um título. italcoloca você no modo itálico, enquanto o medcoloca de volta no modo médio. %inicia um novo parágrafo em que uma barra invertida apenas continua o parágrafo. Eu não consigo descobrir os outros, e fiz alguns termos de pesquisa, mas nenhum revela o formato ...
Tamara Wijsman

Respostas:


4

Encontrei este PDF no Xyvision Production Publisher (provavelmente o que foi usado). Observe em FinalPages que lista HTML como um formato de saída.

Se você conseguir, de alguma forma, obter uma cópia de alguma versão deste software em execução, poderá conseguir que ele cuspa algum HTML. Isso pode ou não ser mais difícil do que a engenharia reversa da marcação do documento. Há um pouco mais de informações sobre exportações de HTML na parte inferior desta página .

insira a descrição da imagem aqui


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.