Funcionalidades
| Funcionalidade | Suportado | Notas |
|---|---|---|
| Definir frequência da pipeline | Sim | Para mais detalhes, acesse. |
| Sincronização Full load | Sim | |
| Conexão via Credenciais | Sim |
📘 Este conector coleta as seguintes objetos do StatsBombs:
- competitions;
- player_season_stats;
- team_season_stats;
- matches;
- lineup;
- player_match;
- events.
Guia rápido
Para iniciar a criação de uma Pipeline, basta ir no módulo Coletar, "Pipelines" aperte em "Nova Pipeline".
Escolha a fonte de dados
Utilize uma fonte já cadastrada ou cadastre uma nova
Parâmetros para conexão (cadastro da fonte)
| Nome do campo | Exemplo |
|---|---|
| Nome | username |
| Senha | password |
Informações da pipeline
Defina um nome e uma breve descrição para a sua pipeline, de forma que facilite a identificação do objetivo e do escopo do processo de coleta e análise de dados.
Selecione as competições
Ao coletar dados do StatsBomb, trabalhar com um subconjunto de competições tem muitas vantagens. O StatsBomb possui uma grande quantidade de dados, com um número incrivelmente grande de eventos registrados em muitas competições diferentes. Essa quantidade massiva de informação pode tornar o processo de coleta e análise de dados bastante desafiador e demorado.
Ao nos concentrarmos em um subconjunto específico de competições, podemos simplificar esse processo e torná-lo mais gerenciável. Em vez de lidar com a enorme quantidade de eventos de todas as competições, podemos filtrar e trabalhar apenas com os dados que são mais relevantes para nossas necessidades específicas. Isso pode melhorar a eficiência, reduzir o tempo de processamento e tornar a análise dos dados uma tarefa mais fácil.
Além disso, isso permite um foco mais claro em competições específicas, permitindo uma análise mais profunda e detalhada. Portanto, ao lidar com a coleta de dados do StatsBomb, trabalhar com um subconjunto de competições pode ser uma abordagem muito eficaz e eficiente.
Observação: os nomes das competições devem ser informados exatamente conforme registrados na documentação oficial do StatsBomb. O uso incorreto de nomenclaturas pode impedir a correta execução da pipeline.
Especificar os objetos
Após inserir as credenciais você estará apto a selecionar quais tabelas da fonte conectada serão importados na coleta de dados.
📘
Ao selecionar mais de uma entidade, para cada tabela ou view importada será criado um dataset diferente no catálogo.
Frequência
- Por último, configure a frequência desejada para que sua pipeline rode. É possível escolher dentre as opções apresentadas ou inserir uma frequência customizada através de uma expressão cron. Para saber mais, acesse.
📘
O fuso horário padrão utilizado na frequência é o UTC.
Todos os métodos de frequência definem quando as extrações serão iniciadas. Eles não controlam por quanto tempo o trabalho de replicação será executado ou quando os dados estarão efetivamente no destino.
Pronto! Agora basta aguardar a coleta ser feita no horário e dia agendado.
Caso queira executar a pipeline imediatamente, é possível executá-la manualmente em até 30 segundos após a criação da pipeline. Vá em "Pipelines", "Lista" e "Sincronizar Pipeline".
Após alguns minutos, sua pipeline estará catalogada na aba de exploração como um Data Asset.
É possível também consultar na lista de pipelines os detalhes da pipeline, como: resumo, lista de entidades e colunas coletadas, histórico de execução e de micro-transformação, em "Ver pipeline".
Adição de novas competições ao conector
Para adicionar novas competições ao conector, siga os passos abaixo:
- Verifique a disponibilidade dos dados das novas competições na API.
- Acesso às Competições: Certifique-se de que você tem acesso às competições desejadas, o que pode ser feito por meio do console/admin do StatsBomb StatsBomb Data.
- Contate o Suporte ao cliente Dadosfera para adicionar novas competições ou esclarecer dúvidas sobre as atualizações dos conectores.
Assim, garantimos que as novas competições sejam integradas corretamente e qualquer dúvida seja prontamente resolvida.