Description and Responsibilities
Seja parte de uma empresa de tecnologia que desenvolve soluções analíticas avançadas, unindo ciência de dados, inovação e simplicidade para resolver problemas reais. Atuamos com foco em oferecer insights em tempo real, otimizar processos, identificar riscos e prevenir fraudes, sempre com suporte especializado nas áreas tributária, jurídica e de Data Science.
Nossa missão é entregar resultados concretos, com inovação, pensamento fora da caixa e compromisso em simplificar o complexo.
O que você vai fazer no dia a dia:
O profissional será responsável pelo desenvolvimento e manutenção de pipelines de dados de ponta a ponta, incluindo coleta, transformação, validação e armazenamento. Atuará na construção de workflows no Airflow, integração de bancos de dados vetoriais e suporte a arquiteturas de RAG. Também será responsável por traduzir requisitos de negócio em soluções de dados escaláveis e eficientes, garantindo alta performance, confiabilidade e qualidade dos dados em todo o processo.
Atividades e Responsabilidades:
Desenvolver e implementar pipelines de dados robustos utilizando ferramentas de ETL e orquestração.
Atuar com bancos de dados relacionais, não relacionais e bancos vetoriais, garantindo integração e performance.
Projetar e otimizar pipelines de dados eficientes e escaláveis para diferentes necessidades de negócio.
Utilizar ferramentas e frameworks de processamento de dados para garantir qualidade, consistência e confiabilidade.
Aplicar pensamento analítico para compreender requisitos de negócio e traduzi-los em soluções técnicas eficazes e de alto impacto.
Seu esforço e dedicação serão recompensados com:
Salário Atrativo (avaliamos a sua expectativa salarial e a sua expertise com o perfil da nossa oportunidade);
Oportunidade de crescimento;
Vale Refeição/Alimentação;
Plano de Saúde, Odontológico e Seguro de vida em grupo;
Convênios e parcerias com descontos exclusivos;
Cozinha equipada para refeições e cafezinhos;
Happy hours, jogos, interações e um ambiente de trabalho super agradável.
Aqui a família também importa: oferecemos uma cesta natalidade para acolher e celebrar a chegada do seu bebê.
Requirements
Experiência comprovada como Engenheiro de Dados
Domínio em Python, SQL e Git
Conhecimento em Data Lake, Data Warehouse e Lakehouse
Experiência com ETL/ELT e orquestração (Airflow)
Vivência com bancos relacionais e não relacionais
Familiaridade com Big Data e processamento distribuído (Hadoop, Spark, MinIO)
Atuação em ambientes cloud e on-premise
Uso de formatos otimizados (Parquet, Delta/Iceberg/Hudi)
Noções de monitoramento e qualidade de dados
Você vai se destacar se tiver:
Graduação completa na área de Programação ou Engenharias
Experiência com scraping e ingestão de dados via APIs públicas
Conhecimento em RAG, incluindo chunking, embeddings e bancos vetoriais
Familiaridade com parsing e processamento de documentos como XML, PDF, HTML
Conhecimento em Kubernetes
Benefits
140299
2025-12-02
2025-12-02
Confidential