Arquitetura dos Arquivos PDFs
Explicação
A estrutura geral do PDF é composta pelos seguintes componentes:
- Header (Cabeçalho);
- Body (Corpo);
- Cross-Reference (xref) table (Tabela de Referência Cruzada);
- Trailer.
Demonstração com imagem:

O cabeçalho contém uma linha somente que identifica a versão do PDF (Exemplo: %PDF-1.5).
O "trailer" contém ponteiros (pointers) para a tabela xref e os objetos chaves contidos no dicionário "trailer". O mesmo termina com %%EOF para identificar o final do arquivo.
A tabela xref contém um ponteiro para todos os objetos inclusos no arquivo de PDF. Isso permite identificar quantos objetos existem na tabela. Podendo localizar onde os objetos começam (o deslocamento - the offset) e o tamanho em bytes.
O corpo contém todas as informações dos objetos. (Ex.: Fonte, Imagens, Palavras, Marcações de campos, etc...)