Wilberhg's blog

Arquitetura dos Arquivos PDFs

Explicação

A estrutura geral do PDF é composta pelos seguintes componentes:

Demonstração com imagem:

Imgur

O cabeçalho contém uma linha somente que identifica a versão do PDF (Exemplo: %PDF-1.5).

O "trailer" contém ponteiros (pointers) para a tabela xref e os objetos chaves contidos no dicionário "trailer". O mesmo termina com %%EOF para identificar o final do arquivo.

A tabela xref contém um ponteiro para todos os objetos inclusos no arquivo de PDF. Isso permite identificar quantos objetos existem na tabela. Podendo localizar onde os objetos começam (o deslocamento - the offset) e o tamanho em bytes.

O corpo contém todas as informações dos objetos. (Ex.: Fonte, Imagens, Palavras, Marcações de campos, etc...)

Referências: