Me deparei com o mesmo problema e chegou à seguinte solução. Não entrei na documentação de como os arquivos PDF são construídos. Apenas comparei dois arquivos PDF vazios com tamanhos de página diferentes.
Parece que os PDFs têm todos os tipos de atributos incorporados entre "<<" e ">>". Descobri que as informações de tamanho da página estão disponíveis em texto simples e podem ser encontradas com uma simples pesquisa de expressões regulares.
Isso pode ou não ser verdade para todos os pdfs, mas funcionou em tudo o que pude encontrar de diferentes fontes.
A parte relevante pode parecer com qualquer uma dessas para uma página A4 de tamanho:
/MediaBox [0 0 595 842]
/MediaBox[0 0 595 842]
/MediaBox[ 0 0 595.32 841.92]
Significa [0 0 width height], então aqui está minha solução super manca, mas funcional, para extrair isso:
cat test.pdf | egrep -ao "/MediaBox ?\[ ?[0-9]+ [0-9]+ [0-9]+(\.[0-9]+)? [0-9]+(\.[0-9]+)?\]" | head -1
Basta alterar test.pdf para o seu arquivo.