Wilberhg's blog

Usando Camelot no Google Colab

Contextualizando

Esse artigo tem como objetivo apresentar como usar a biblioteca Camelot para a leitura de PDFs no Google Colab.

Para isso, basta efetuar os seguintes passos:

  1. Acessar o Google Colab;
  2. Se autenticar com suas credenciais;
  3. Criar um novo notebook;
  4. Instalar a biblioteca camelot:
    !pip install camelot-py
    
  5. Instalar o Ghostscript no Ubuntu:
    !apt install ghostscript python3-tk
    
  6. Instalar a biblioteca Ghostscript:
    !pip install ghostscript
    
  7. Para checar se tudo ficou nos conformes, é preciso validar se o Ghostscript foi instalado com êxito utilizando o comando:
    from ctypes.util import find_library
    
    find_library("gs")
    
    # O resultado precisa ser: 'libgs.so.9'
    
  8. Se o resultado imprimido estiver correto, basta importar a biblioteca do camelot e ser feliz!!!
    import camelot as cm
    

Referências bibliográficas:

#camelot #ghostscript #google colab #pdf