Usando Camelot no Google Colab
Contextualizando
Esse artigo tem como objetivo apresentar como usar a biblioteca Camelot para a leitura de PDFs no Google Colab.
Para isso, basta efetuar os seguintes passos:
- Acessar o Google Colab;
- Se autenticar com suas credenciais;
- Criar um novo notebook;
- Instalar a biblioteca camelot:
!pip install camelot-py
- Instalar o Ghostscript no Ubuntu:
!apt install ghostscript python3-tk
- Instalar a biblioteca Ghostscript:
!pip install ghostscript
- Para checar se tudo ficou nos conformes, é preciso validar se o Ghostscript foi instalado com êxito utilizando o comando:
from ctypes.util import find_library find_library("gs") # O resultado precisa ser: 'libgs.so.9'
- Se o resultado imprimido estiver correto, basta importar a biblioteca do camelot e ser feliz!!!
import camelot as cm