Guia de Instalação - Apache Airflow
Guia de Instalação - Apache Airflow
- Criar a variável de ambiente contendo o diretório em que será instalado o Airflow:
export AIRFLOW_HOME=~/airflow
- Criar constante contendo a versão do Airflow desejada:
AIRFLOW_VERSION=2.3.4
- Criar constante contendo a versão do Python:
PYTHON_VERSION="$(python --version | cut -d " " -f 2 | cut -d "." -f 1-2)"
- Explicando o código:
- Coleta a versão instalada no equipamento - Ex.: "Python 3.8.10";
python --version
- Gera um array separando pelo espaço no texto "Python 3.8.10" e seleciona o segundo elemento - Ex.: "3.8.10";
cut -d " " -f 2
- Gera um novo array separando pelo ponto (".") e seleciona o primeiro e segundo elemento - Ex.: "3.8".
cut -d "." -f 1-2
- Coleta a versão instalada no equipamento - Ex.: "Python 3.8.10";
- Criar constante com a URL de download do Airflow de acordo com a versão do mesmo e do Python no equipamento.
CONSTRAINT_URL="https://raw.githubusercontent.com/apache/airflow/constraints-${AIRFLOW_VERSION}/constraints-${PYTHON_VERSION}.txt"
- Instalar o apache airflow na versão especificada na constante.
pip install "apache-airflow==${AIRFLOW_VERSION}" --constraint "${CONSTRAINT_URL}"
Executar o comando para inicializar os serviços:
- Subir tudo de uma vez só (ambiente de desenvolvimento):
airflow standalone - Subir módulo por módulo (ambiente produtivo):
Subir banco de dados:
airflow db init
Subir o servidor:
airflow webserver --port 8080
Subir o agendador:
airflow scheduler
- Subir tudo de uma vez só (ambiente de desenvolvimento):
(EXTRA) Criar usuário via linha de comando:
airflow users create \
--username admin \
--firstname Peter \
--lastname Parker \
--role Admin \
--email spiderman@superhero.org
Observações
Durante a instalação do Airflow, será gerado um arquivo “airflow.cfg”, cujo contém as configurações defaults do Airflow;
A base de dados padrão do Airflow é o SQLite;
SQLite somente permite execuções sequênciais, caso deseje paralelizá-las, será necessário utilizar outro banco de dados;
O Airflow possui N variáveis de ambiente que podem ser alteradas. Para saber quais existem e onde alterá-las, a Apache fornece um guia de referências.
Referência Bibliográfica
Tutorial traduzido da documentação oficial do Apache Airflow