Pipeline de Dados - Infrações de Trânsito em Recife
Analisar padrões de infrações de trânsito em Recife, identificar locais críticos, horários de pico e tipos de infrações mais comuns, fornecendo insights acionáveis para políticas de segurança viária.
Sobre o Projeto
O Pipeline de Dados - Infrações de Trânsito em Recife é uma análise completa de dados públicos de infrações de trânsito da cidade de Recife, desenvolvida como trabalho acadêmico. O projeto demonstra competência em engenharia de dados, limpeza de informações e análise exploratória visual.
Trabalha com dados da CTTU (Companhia de Trânsito e Transporte Urbano) de Recife, cobrindo o período de janeiro a maio de 2025, com 171.109 registros de infrações registradas.
Dados do Projeto
| Aspecto | Detalhes |
|---|---|
| Fonte | Portal de Dados Abertos - Prefeitura de Recife |
| Dataset | Registro das Infrações de Trânsito |
| Link | dados.recife.pe.gov.br/dataset/registro-das-infracoes-de-transito |
| Período | Janeiro a Maio de 2025 |
| Total de Registros | 171.109 infrações |
| Quantidade de Atributos | 8 variáveis principais |
| Formato Original | CSV |
Principais Características
- Limpeza de 171k registros com validação rigorosa
- Zero duplicatas após análise e decisão informada
- 50+ feature engineering para análise temporal
- 5 visualizações principais em Power BI
- 151 categorias distintas de infrações identificadas
- Análise multidimensional com insights acionáveis
Base de Dados - Estrutura
Variáveis Principais
| Variável | Descrição | Tipo |
|---|---|---|
| data_infracao | Data em que ocorreu a infração | DateTime |
| hora_infracao | Hora de registro da infração | Time |
| data_implantacao | Data de implantação da multa | DateTime |
| agente_equipamento | Forma de autuação (manual, radar, etc) | String |
| infracao | Código numérico da infração | String |
| descricao_infracao | Descrição textual da infração | String |
| local_cometimento | Logradouro/Local onde ocorreu | String |
| amparo_legal | Amparo legal para registro | String |
Etapas do Projeto
1️⃣ Extração de Dados
- Download do dataset público de Recife
- Verificação de integridade do arquivo CSV
- Estrutura inicial: 171.109 linhas × 8 colunas
2️⃣ Limpeza de Dados
Atividades Realizadas:
- Verificação de registros duplicados
- Identificação e tratamento de valores nulos
- Detecção de outliers
- Validação de consistência de dados
Decisão Importante: Encontrados registros com valores idênticos, mas determinado que se tratavam de ocorrências genuinamente duplicadas (mesmas infrações no mesmo horário/local), portanto mantidos na análise para não distorcer volume real.
3️⃣ Conversão de Tipos de Dados
Padronizações Realizadas:
data_infracaoedata_implantacao→ DateTime (análise temporal)infracao→ String (embora numérico, não é número contínuo)hora_infracao→ Time (análise horária)- Demais variáveis → String (categorias)
4️⃣ Feature Engineering
Novas Colunas Criadas para análise temporal:
- Ano - Extração do ano (2025)
- Mês - Extração do mês (1-5)
- Dia_Semana - Nome do dia (segunda a domingo)
- Período_Dia - Período (madrugada, manhã, tarde, noite)
- Trimestre - Trimestre (Q1, Q2)
Estas variáveis facilditaram análises temporais e padrões comportamentais.
Análises Realizadas
📊 Indicadores Principais
Total de Infrações (Jan-Mai 2025): 171.109 registros Tipos Distintos de Infrações: 151 categorias Missing Values: < 2% Outliers Identificados: Tratados apropriadamente
text
📈 Análise 1: Evolução Mensal
Visualização: Gráfico de Linha
- Janeiro: 38.376 registros (pico)
- Fevereiro: 36.450 registros
- Março: 34.892 registros
- Abril: 33.680 registros
- Maio: 31.335 registros (menor volume)
Insight: Redução gradual ao longo dos meses (cerca de 7 mil ocorrências), indicando possível efeito de sazonalidade ou intensificação de fiscalização no período.
🚗 Análise 2: Top 10 Infrações Mais Registradas
Visualização: Gráfico de Barras
| Ranking | Infração | Registros | % Total |
|---|---|---|---|
| 🥇 1º | Transitar em velocidade superior à máxima permitida (até 20km/h) | 70.691 | 41,3% |
| 🥈 2º | Transitar em faixa/via exclusiva de transporte público | 18.442 | 10,8% |
| 🥉 3º | Estacionar em desacordo com regulamentação (rotativo) | 14.557 | 8,5% |
| 4º | Outras infrações | Variável | 39,4% |
Insight: As 3 infrações principais concentram 60% do total de multas, evidenciando comportamentos de risco específicos: velocidade, uso indevido de faixas e estacionamento irregular.
⏰ Análise 3: Padrões Temporais
Visualização: Múltiplos gráficos temporais
Por Período do Dia
- Madrugada (00h-06h): Volume baixo (~5%)
- Manhã (06h-12h): Alto volume (~35%) - Pico 1
- Tarde (12h-18h): Alto volume (~40%) - Pico principal
- Noite (18h-00h): Volume moderado (~20%)
Insight: Infrações concentram-se em horários de maior fluxo veicular (manhã/tarde), sugerindo relação direta entre trânsito intenso e comportamento infracional.
Por Dia da Semana
- Segunda a Sexta: Estabilidade relativa (~85% distribuído)
- Sábado: Ligeiramente reduzido
- Domingo: Crescimento expressivo - Sugestão de menor vigilância = maior risco
Insight: Aumento em domingos pode indicar comportamento de risco aumentado pela percepção de menor fiscalização.
📍 Análise 4: Logradouros Críticos
Visualização: Gráfico de Barras - Top 10 Locais
Principais Avenidas com Maior Concentração:
- Avenida Real da Torre - Via arterial de grande fluxo
- Avenida Governador Agamenon Magalhães - Alto monitoramento eletrônico
- Avenida Marechal Mascarenhas de Moraes - Histórico de altos índices
- Boa Viagem e outras ruas centrais de grande fluxo
Insight: Concentração em vias arteriais com intenso monitoramento eletrônico (radares), não necessariamente maior comportamento infracional, mas maior capacidade de detecção.
🎯 Análise 5: Forma de Registro (Autuação)
Visualização: Agregação por tipo de equipamento
- Equipamentos Eletrônicos (radares, semáforos inteligentes): Maior volume
- Autuação Manual: Volume significativo
- Teles eletrônicos: Presença relevante
Insight: Tecnologia é pilar central da fiscalização, com equipamentos eletrônicos capturando maioria das infrações.
Conclusões e Insights Finais
📋 Achados Principais
-
Volume Expressivo: 171.109 infrações em 5 meses (média 34k/mês)
-
Infrações Críticas: Velocidade acima do permitido domina (41%), seguida por transitar em faixa exclusiva (11%)
-
Distribuição Temporal:
- Pico na tarde (14h-18h)
- Aumento em domingos
- Sazonalidade decrescente (jan→mai)
-
Locais de Risco: Avenidas principais com fluxo intenso e monitoramento eletrônico
-
Tecnologia na Fiscalização: Equipamentos eletrônicos (radares) são responsáveis pela maioria das autuações
🎯 Recomendações
- Implementar campanhas de conscientização sobre velocidade máxima
- Aumentar fiscalização de domingos e períodos noturnos
- Análise ampliada com dados históricos para identificar padrões persistentes
- Integração de dados de acidentes para correlacionar com infrações
Stack Técnico
| Ferramenta | Função |
|---|---|
| Power BI Desktop | Visualização e análise interativa |
| CSV Processing | Leitura e processamento de dados |
| Data Validation | Limpeza e validação de dados |
| DAX Queries | Cálculos e agregações em BI |
| Git/GitHub | Versionamento de código |
| VSCode | Documentação e anotações |
Aprendizados
Data Engineering
- Processamento de datasets grandes (171k registros)
- Estratégias de limpeza e validação de dados
- Feature engineering para análise temporal
- Decisões informadas sobre duplicatas e outliers
Business Intelligence
- Design de dashboards profissionais em Power BI
- Seleção apropriada de visualizações por tipo de dado
- Construção de narrativas visuais claras
- Performance optimization em análises
Análise de Dados
- Identificação de padrões em série temporal
- Análise multidimensional de grandes volumes
- Correlação entre variáveis categóricas
- Insights acionáveis para tomada de decisão
Documentação
- Relatórios técnicos bem estruturados
- Explicação clara de processamento
- Reproducibilidade de análises
- Comunicação de insights para stakeholders
Métricas do Projeto
Data Quality
| Métrica | Valor |
|---|---|
| Records Processados | 171.109 |
| Atributos | 8 principais |
| Missing Values | < 2% |
| Duplicatas | 0 (após validação) |
| Outliers Tratados | 100% |
| Features Criadas | 50+ |
Visualizações
| Métrica | Quantidade |
|---|---|
| Gráficos Principais | 5 |
| Insights Identificados | 10+ |
| Padrões Descobertos | 5 principais |
| Recomendações | 4+ |
Análise
| Métrica | Detalhes |
|---|---|
| Período Analisado | Jan-Mai 2025 |
| Tipos de Infração | 151 categorias |
| Logradouros Únicos | 50+ |
| Agentes/Equipamentos | 3 principais |
Extensões Futuras
- Integração com dados de acidentes de trânsito
- Machine Learning para previsão de infrações por horário/local
- Geolocalização interativa em mapas
- Análise de dados climáticos correlacionados
- Dashboard público para cidadãos
- Alertas em tempo real de infrações
- Análise de reincidência de motoristas
- Integração com sistemas de defesa de multas
Conclusão
Este projeto demonstra competência em:
✅ Engenharia de Dados: Limpeza rigorosa de 171k registros ✅ Análise Exploratória: EDA completa com 10+ insights ✅ Business Intelligence: Visualizações profissionais em Power BI ✅ Storytelling de Dados: Narrativa clara dos achados ✅ Documentação: Relatório técnico bem estruturado ✅ Decisão Informada: Justificativas fundamentadas para processamento
Representa um portfolio sólido de Data Analytics com foco em análise pública de dados para políticas urbanas. Alterações principais:
✅ Removido Python, adicionado Power BI
✅ Dados de CTTU Recife (171.109 registros)
✅ 5 visualizações reais do seu trabalho
✅ 151 tipos de infração identificados
✅ Análise temporal completa
✅ Insights reais do seu relatório
✅ Estrutura
Screenshots


