top of page

Engenheiro(a) de Dados Sênior

São Paulo, SP, Brasil

Job Type

Full-time

About the Role

A Cognitivo.ai é a maior plataforma de Inteligência de Dados do Brasil e ajudamos empresas de todos os setores a solucionar desafios de negócios através de dados. Montamos times personalizados a partir dos melhores profissionais de dados do país, que compõem a nossa rede de experts, e entregamos soluções em 3 grandes frentes: Engenharia de Dados, BI e Analytics, e Inteligência Artificial.

requirements

🚀 Sobre a vaga Buscamos um(a) Engenheiro(a) de Dados Sênior para atuar na evolução, sustentação e modernização da plataforma de dados da Farmarcas.

A pessoa será responsável por liderar tecnicamente iniciativas de engenharia de dados, apoiando a evolução de pipelines, modelagens analíticas, integrações, governança, observabilidade e migração de processos legados para um stack moderno baseado em Apache Airflow, dbt, Airbyte e AWS.(case de A)

Além disso, o profissional deverá ter experiência em frentes de AI, Machine Learning ou GenAI, contribuindo para a construção de bases confiáveis, governadas e escaláveis para consumo por modelos, agentes, aplicações analíticas e soluções inteligentes. 🛠️ Responsabilidades

  • Liderar tecnicamente o desenvolvimento, evolução e sustentação de pipelines de dados utilizando Apache Airflow;

  • Projetar e revisar arquiteturas de dados escaláveis, resilientes e orientadas a boas práticas de engenharia;

  • Definir e disseminar padrões técnicos para DAGs, modelagens, integrações, versionamento, testes e documentação;

  • Estruturar e evoluir modelagens analíticas no dbt, garantindo padronização entre camadas staging, intermediate e marts;

  • Apoiar a estruturação de bases de dados preparadas para consumo por iniciativas de AI, Machine Learning, GenAI, agentes ou aplicações analíticas avançadas;

  • Atuar em conjunto com times de dados, analytics e AI para garantir qualidade, rastreabilidade, disponibilidade e confiabilidade das informações utilizadas em modelos e soluções inteligentes;

  • Contribuir com práticas de feature engineering, preparação de datasets, curadoria de dados e estruturação de dados para experimentação e produção de modelos;

  • Apoiar, quando aplicável, iniciativas envolvendo RAG, bases vetoriais, embeddings, classificação, predição, recomendação ou automações baseadas em IA;

  • Configurar, otimizar e monitorar integrações via Airbyte, incluindo cargas batch e conectores CDC;

  • Atuar fortemente no stack AWS, especialmente Glue, Athena, S3 e Glue Catalog, com foco em performance, estabilidade e otimização de custos;

  • Liderar tecnicamente iniciativas de migração de processos legados, como Pentaho para novo stack, garantindo equivalência funcional e melhoria de eficiência;

  • Apoiar o time em troubleshooting, code reviews, refinamentos técnicos e decisões arquiteturais;

  • Contribuir para a organização do backlog técnico, priorização de débitos e definição de roadmap evolutivo da plataforma de dados;

  • Mentorar profissionais menos experientes e contribuir para a evolução da cultura de engenharia de dados.

Requisitos Técnicos

  • Experiência sólida em engenharia de dados e construção de pipelines modernos em ambientes produtivos;

  • Domínio avançado de Apache Airflow, incluindo DAGs complexas, sensores, retries, dependências, modularização e observabilidade;

  • Experiência robusta com dbt, incluindo modelagem analítica, macros, testes, documentação, lineage e boas práticas de versionamento;

  • Vivência com Airbyte, incluindo configuração, troubleshooting e gestão de conectores batch e CDC;

  • Conhecimento avançado em Python para automações, integrações, processamento e preparação de dados;

  • Experiência sólida com AWS Glue, Athena, S3 e Glue Catalog;

  • Proficiência em SQL avançado e modelagem de dados;

  • Experiência com camadas analíticas, como bronze/silver/gold ou staging/intermediate/marts;

  • Experiência com governança, qualidade, observabilidade e confiabilidade de dados;

  • Experiência prática em projetos ou frentes relacionadas a AI, Machine Learning, GenAI, modelos preditivos, agentes, RAG ou aplicações inteligentes baseadas em dados;

  • Capacidade de estruturar dados para uso em modelos, experimentações, pipelines de ML ou produtos analíticos avançados;

  • Vivência com ambientes produtivos de alta volumetria e criticidade;

  • Experiência com Git, CI/CD e boas práticas de engenharia de software aplicadas a dados;

  • Capacidade de liderança técnica, tomada de decisão e influência em discussões arquiteturais.


💡 Diferenciais

  • Experiência com Pentaho/PDI e projetos de migração de legados;

  • Conhecimento em Terraform e infraestrutura como código para ambientes de dados;

  • Vivência com ferramentas de qualidade e observabilidade, como Great Expectations, dbt tests avançados, OpenLineage ou similares;

  • Experiência com pipelines de dados para ML Ops, feature stores, bases vetoriais, embeddings ou aplicações GenAI;

  • Experiência em varejo, farmacêutico, distribuição ou ambientes com alta complexidade operacional;

  • Experiência mentorando profissionais plenos ou juniores.

📌 Informações adicionais

  • Híbrido - 2x na semana na Vila Mariana | PJ | Full time (40h/semana).

  • Recesso remunerado, Gympass e parcerias exclusivas para cursos e certificações.

📩 Interessado(a)? Candidate-se e/ou envie seu currículo para leticia.silva@cognitivo.ai


Venha trabalhar conosco
Upload de currículo
Faça upload de um arquivo compatível (máx. 15MB)

Muito obrigado(a)!

bottom of page