Acho que estou um pouco atrasado para a festa, mas escrevi uma pequena função para realizar essa tarefa. Ele também cuida de atributos, conteúdo de texto e mesmo que vários nós com o mesmo nome de nó sejam irmãos.
Dislaimer:
Eu não sou nativo do PHP, então, por favor, aceite erros simples.
function xml2js($xmlnode) {
$root = (func_num_args() > 1 ? false : true);
$jsnode = array();
if (!$root) {
if (count($xmlnode->attributes()) > 0){
$jsnode["$"] = array();
foreach($xmlnode->attributes() as $key => $value)
$jsnode["$"][$key] = (string)$value;
}
$textcontent = trim((string)$xmlnode);
if (count($textcontent) > 0)
$jsnode["_"] = $textcontent;
foreach ($xmlnode->children() as $childxmlnode) {
$childname = $childxmlnode->getName();
if (!array_key_exists($childname, $jsnode))
$jsnode[$childname] = array();
array_push($jsnode[$childname], xml2js($childxmlnode, true));
}
return $jsnode;
} else {
$nodename = $xmlnode->getName();
$jsnode[$nodename] = array();
array_push($jsnode[$nodename], xml2js($xmlnode, true));
return json_encode($jsnode);
}
}
Exemplo de uso:
$xml = simplexml_load_file("myfile.xml");
echo xml2js($xml);
Exemplo de entrada (myfile.xml):
<family name="Johnson">
<child name="John" age="5">
<toy status="old">Trooper</toy>
<toy status="old">Ultrablock</toy>
<toy status="new">Bike</toy>
</child>
</family>
Exemplo de saída:
{"family":[{"$":{"name":"Johnson"},"child":[{"$":{"name":"John","age":"5"},"toy":[{"$":{"status":"old"},"_":"Trooper"},{"$":{"status":"old"},"_":"Ultrablock"},{"$":{"status":"new"},"_":"Bike"}]}]}]}
Bastante impresso:
{
"family" : [{
"$" : {
"name" : "Johnson"
},
"child" : [{
"$" : {
"name" : "John",
"age" : "5"
},
"toy" : [{
"$" : {
"status" : "old"
},
"_" : "Trooper"
}, {
"$" : {
"status" : "old"
},
"_" : "Ultrablock"
}, {
"$" : {
"status" : "new"
},
"_" : "Bike"
}
]
}
]
}
]
}
Peculiaridades a serem lembradas:
várias tags com o mesmo nome de tag podem ser irmãos. É provável que outras soluções descartem todos, menos o último irmão. Para evitar isso, todo nó único, mesmo que tenha apenas um filho, é uma matriz que armazena um objeto para cada instância do tagname. (Veja vários "" elementos no exemplo)
Mesmo o elemento raiz, do qual apenas um deveria existir em um documento XML válido, é armazenado como matriz com um objeto da instância, apenas para ter uma estrutura de dados consistente.
Para poder distinguir entre o conteúdo do nó XML e os atributos XML, os atributos de cada objeto são armazenados no "$" e o conteúdo no filho "_".
Editar:
esqueci de mostrar a saída para os dados de entrada de exemplo
{
"states" : [{
"state" : [{
"$" : {
"id" : "AL"
},
"name" : [{
"_" : "Alabama"
}
]
}, {
"$" : {
"id" : "AK"
},
"name" : [{
"_" : "Alaska"
}
]
}
]
}
]
}
var_dump
funciona bem.)