Funcionalidades

Funcionalidade	Suportado	Notas
Definir frequência da pipeline	Sim	Para mais detalhes, acesse.
Sincronização Full load	Sim
Conexão via Credenciais	Sim

📘 Este conector coleta as seguintes objetos do StatsBombs:

competitions;

player_season_stats;

team_season_stats;

matches;

lineup;

player_match;

events.

Guia rápido

Para iniciar a criação de uma Pipeline, basta ir no módulo Coletar, "Pipelines" aperte em "Nova Pipeline".

Escolha a fonte de dados

Utilize uma fonte já cadastrada ou cadastre uma nova

Parâmetros para conexão (cadastro da fonte)

Nome do campo	Exemplo
Nome	username
Senha	password

Informações da pipeline

Defina um nome e uma breve descrição para a sua pipeline, de forma que facilite a identificação do objetivo e do escopo do processo de coleta e análise de dados.

Selecione as competições

Ao coletar dados do StatsBomb, trabalhar com um subconjunto de competições tem muitas vantagens. O StatsBomb possui uma grande quantidade de dados, com um número incrivelmente grande de eventos registrados em muitas competições diferentes. Essa quantidade massiva de informação pode tornar o processo de coleta e análise de dados bastante desafiador e demorado.

Ao nos concentrarmos em um subconjunto específico de competições, podemos simplificar esse processo e torná-lo mais gerenciável. Em vez de lidar com a enorme quantidade de eventos de todas as competições, podemos filtrar e trabalhar apenas com os dados que são mais relevantes para nossas necessidades específicas. Isso pode melhorar a eficiência, reduzir o tempo de processamento e tornar a análise dos dados uma tarefa mais fácil.

Além disso, isso permite um foco mais claro em competições específicas, permitindo uma análise mais profunda e detalhada. Portanto, ao lidar com a coleta de dados do StatsBomb, trabalhar com um subconjunto de competições pode ser uma abordagem muito eficaz e eficiente.

Observação: os nomes das competições devem ser informados exatamente conforme registrados na documentação oficial do StatsBomb. O uso incorreto de nomenclaturas pode impedir a correta execução da pipeline.

Especificar os objetos

Após inserir as credenciais você estará apto a selecionar quais tabelas da fonte conectada serão importados na coleta de dados.

📘

Ao selecionar mais de uma entidade, para cada tabela ou view importada será criado um dataset diferente no catálogo.

Frequência

Por último, configure a frequência desejada para que sua pipeline rode. É possível escolher dentre as opções apresentadas ou inserir uma frequência customizada através de uma expressão cron. Para saber mais, acesse.

📘

O fuso horário padrão utilizado na frequência é o UTC.

Todos os métodos de frequência definem quando as extrações serão iniciadas. Eles não controlam por quanto tempo o trabalho de replicação será executado ou quando os dados estarão efetivamente no destino.

Pronto! Agora basta aguardar a coleta ser feita no horário e dia agendado.

Caso queira executar a pipeline imediatamente, é possível executá-la manualmente em até 30 segundos após a criação da pipeline. Vá em "Pipelines", "Lista" e "Sincronizar Pipeline".

Após alguns minutos, sua pipeline estará catalogada na aba de exploração como um Data Asset.

É possível também consultar na lista de pipelines os detalhes da pipeline, como: resumo, lista de entidades e colunas coletadas, histórico de execução e de micro-transformação, em "Ver pipeline".

Adição de novas competições ao conector

Para adicionar novas competições ao conector, siga os passos abaixo:

Verifique a disponibilidade dos dados das novas competições na API.
Acesso às Competições: Certifique-se de que você tem acesso às competições desejadas, o que pode ser feito por meio do console/admin do StatsBomb StatsBomb Data.
Contate o Suporte ao cliente Dadosfera para adicionar novas competições ou esclarecer dúvidas sobre as atualizações dos conectores.

Assim, garantimos que as novas competições sejam integradas corretamente e qualquer dúvida seja prontamente resolvida.

Guia rápido

Escolha a fonte de dados​

Parâmetros para conexão (cadastro da fonte)​

Informações da pipeline​

Selecione as competições​

Especificar os objetos​

Frequência​

Adição de novas competições ao conector​