Pular para o conteúdo principal

Pipeline Monitoring

The Pipeline Monitoring screen provides a detailed view of execution status and history so teams can follow activity across the platform. To access it, open the Collect module, go to "Pipelines", and click "Monitoring".

This area is organized into three main tabs, each designed for a different monitoring depth.


1. Visão Geral de Pipelines

Objetivo:

Proporcionar uma visão ampla e de alto nível sobre o status, tendências e saúde das execuções de pipelines.

Principais Recursos:

  • Métricas Resumidas:
    Visualize as métricas principais das últimas execuções:
    • Total de pipelines executados (últimas 24h, semana, mês).
    • Status mais recente das pipelines.
    • Histórico completo das execuções em um período específico.

2. Visão Temporal de Pipelines

Objetivo:

Acompanhar agendamentos, prever possíveis sobrecargas e otimizar a distribuição temporal das execuções de pipelines.

Principais Recursos:

  • Próximas Execuções Agendadas:
    Veja os horários programados de início e previsão de término , com base na mediana histórica do tempo de execução da pipeline.

  • Distribuição Horária:
    Analise a distribuição dos agendamentos ao longo do dia:

    • Gráfico de barras (BarChart) mostrando a quantidade de pipelines programadas por hora (horario_agendado).
    • Contagem das execuções por slot horário.

3. Visão Detalhada de Jobs de Pipelines de Coleta

Objetivo:

Fornecer uma visão detalhada de cada job executado, com métricas técnicas que permitem um acompanhamento preciso do desempenho e uso de recursos.

Principais Recursos:

  • Métricas Técnicas por Job:
CampoDescriçãoExemplo
allocated_job_memoryMemória alocada (MB) para o job4096 MB
replication_methodEstratégia de replicação utilizada (FULL_LOAD ou INCREMENTAL)INCREMENTAL
plugin & connectorTecnologias utilizadas para coleta de dadossnowflake, postgres
cron_scheduleFrequência de execução agendada (formato Cron)0 12 * * *
avg_collected_rowsMédia de linhas processadas por execução1,250,000
estimated_table_rowsEstimativa total de linhas na tabela de destino15,000,000
  • Detalhamento Ampliado:

    • Link Direto: Acesse a pipeline diretamente através de um link para o Dadosfera App.
    • Estratégia de Carga:
      • FULL_LOAD: Recriação completa da tabela.
      • INCREMENTAL: Atualização parcial da tabela.
  • Alocação de Recursos:

    • A relação entre a memória alocada e o volume de dados processados (collected_rows).
    • Identificação de jobs que estão subutilizando ou superutilizando recursos.