← Voltar para Home

Pipeline de Dados - Infrações de Trânsito em Recife

Analisar padrões de infrações de trânsito em Recife, identificar locais críticos, horários de pico e tipos de infrações mais comuns, fornecendo insights acionáveis para políticas de segurança viária.

Power BI DesktopCSV Data ProcessingData Cleaning & ValidationEDA (Exploratory Data Analysis)Visualizações InterativasCTTU Recife Dataset
Pipeline de Dados - Infrações de Trânsito em Recife

Sobre o Projeto

O Pipeline de Dados - Infrações de Trânsito em Recife é uma análise completa de dados públicos de infrações de trânsito da cidade de Recife, desenvolvida como trabalho acadêmico. O projeto demonstra competência em engenharia de dados, limpeza de informações e análise exploratória visual.

Trabalha com dados da CTTU (Companhia de Trânsito e Transporte Urbano) de Recife, cobrindo o período de janeiro a maio de 2025, com 171.109 registros de infrações registradas.

Dados do Projeto

AspectoDetalhes
FontePortal de Dados Abertos - Prefeitura de Recife
DatasetRegistro das Infrações de Trânsito
Linkdados.recife.pe.gov.br/dataset/registro-das-infracoes-de-transito
PeríodoJaneiro a Maio de 2025
Total de Registros171.109 infrações
Quantidade de Atributos8 variáveis principais
Formato OriginalCSV

Principais Características

  • Limpeza de 171k registros com validação rigorosa
  • Zero duplicatas após análise e decisão informada
  • 50+ feature engineering para análise temporal
  • 5 visualizações principais em Power BI
  • 151 categorias distintas de infrações identificadas
  • Análise multidimensional com insights acionáveis

Base de Dados - Estrutura

Variáveis Principais

VariávelDescriçãoTipo
data_infracaoData em que ocorreu a infraçãoDateTime
hora_infracaoHora de registro da infraçãoTime
data_implantacaoData de implantação da multaDateTime
agente_equipamentoForma de autuação (manual, radar, etc)String
infracaoCódigo numérico da infraçãoString
descricao_infracaoDescrição textual da infraçãoString
local_cometimentoLogradouro/Local onde ocorreuString
amparo_legalAmparo legal para registroString

Etapas do Projeto

1️⃣ Extração de Dados

  • Download do dataset público de Recife
  • Verificação de integridade do arquivo CSV
  • Estrutura inicial: 171.109 linhas × 8 colunas

2️⃣ Limpeza de Dados

Atividades Realizadas:

  • Verificação de registros duplicados
  • Identificação e tratamento de valores nulos
  • Detecção de outliers
  • Validação de consistência de dados

Decisão Importante: Encontrados registros com valores idênticos, mas determinado que se tratavam de ocorrências genuinamente duplicadas (mesmas infrações no mesmo horário/local), portanto mantidos na análise para não distorcer volume real.

3️⃣ Conversão de Tipos de Dados

Padronizações Realizadas:

  • data_infracao e data_implantacaoDateTime (análise temporal)
  • infracaoString (embora numérico, não é número contínuo)
  • hora_infracaoTime (análise horária)
  • Demais variáveis → String (categorias)

4️⃣ Feature Engineering

Novas Colunas Criadas para análise temporal:

  • Ano - Extração do ano (2025)
  • Mês - Extração do mês (1-5)
  • Dia_Semana - Nome do dia (segunda a domingo)
  • Período_Dia - Período (madrugada, manhã, tarde, noite)
  • Trimestre - Trimestre (Q1, Q2)

Estas variáveis facilditaram análises temporais e padrões comportamentais.

Análises Realizadas

📊 Indicadores Principais

Total de Infrações (Jan-Mai 2025): 171.109 registros Tipos Distintos de Infrações: 151 categorias Missing Values: < 2% Outliers Identificados: Tratados apropriadamente

text

📈 Análise 1: Evolução Mensal

Visualização: Gráfico de Linha

  • Janeiro: 38.376 registros (pico)
  • Fevereiro: 36.450 registros
  • Março: 34.892 registros
  • Abril: 33.680 registros
  • Maio: 31.335 registros (menor volume)

Insight: Redução gradual ao longo dos meses (cerca de 7 mil ocorrências), indicando possível efeito de sazonalidade ou intensificação de fiscalização no período.

🚗 Análise 2: Top 10 Infrações Mais Registradas

Visualização: Gráfico de Barras

RankingInfraçãoRegistros% Total
🥇 1ºTransitar em velocidade superior à máxima permitida (até 20km/h)70.69141,3%
🥈 2ºTransitar em faixa/via exclusiva de transporte público18.44210,8%
🥉 3ºEstacionar em desacordo com regulamentação (rotativo)14.5578,5%
Outras infraçõesVariável39,4%

Insight: As 3 infrações principais concentram 60% do total de multas, evidenciando comportamentos de risco específicos: velocidade, uso indevido de faixas e estacionamento irregular.

⏰ Análise 3: Padrões Temporais

Visualização: Múltiplos gráficos temporais

Por Período do Dia

  • Madrugada (00h-06h): Volume baixo (~5%)
  • Manhã (06h-12h): Alto volume (~35%) - Pico 1
  • Tarde (12h-18h): Alto volume (~40%) - Pico principal
  • Noite (18h-00h): Volume moderado (~20%)

Insight: Infrações concentram-se em horários de maior fluxo veicular (manhã/tarde), sugerindo relação direta entre trânsito intenso e comportamento infracional.

Por Dia da Semana

  • Segunda a Sexta: Estabilidade relativa (~85% distribuído)
  • Sábado: Ligeiramente reduzido
  • Domingo: Crescimento expressivo - Sugestão de menor vigilância = maior risco

Insight: Aumento em domingos pode indicar comportamento de risco aumentado pela percepção de menor fiscalização.

📍 Análise 4: Logradouros Críticos

Visualização: Gráfico de Barras - Top 10 Locais

Principais Avenidas com Maior Concentração:

  1. Avenida Real da Torre - Via arterial de grande fluxo
  2. Avenida Governador Agamenon Magalhães - Alto monitoramento eletrônico
  3. Avenida Marechal Mascarenhas de Moraes - Histórico de altos índices
  4. Boa Viagem e outras ruas centrais de grande fluxo

Insight: Concentração em vias arteriais com intenso monitoramento eletrônico (radares), não necessariamente maior comportamento infracional, mas maior capacidade de detecção.

🎯 Análise 5: Forma de Registro (Autuação)

Visualização: Agregação por tipo de equipamento

  • Equipamentos Eletrônicos (radares, semáforos inteligentes): Maior volume
  • Autuação Manual: Volume significativo
  • Teles eletrônicos: Presença relevante

Insight: Tecnologia é pilar central da fiscalização, com equipamentos eletrônicos capturando maioria das infrações.

Conclusões e Insights Finais

📋 Achados Principais

  1. Volume Expressivo: 171.109 infrações em 5 meses (média 34k/mês)

  2. Infrações Críticas: Velocidade acima do permitido domina (41%), seguida por transitar em faixa exclusiva (11%)

  3. Distribuição Temporal:

    • Pico na tarde (14h-18h)
    • Aumento em domingos
    • Sazonalidade decrescente (jan→mai)
  4. Locais de Risco: Avenidas principais com fluxo intenso e monitoramento eletrônico

  5. Tecnologia na Fiscalização: Equipamentos eletrônicos (radares) são responsáveis pela maioria das autuações

🎯 Recomendações

  • Implementar campanhas de conscientização sobre velocidade máxima
  • Aumentar fiscalização de domingos e períodos noturnos
  • Análise ampliada com dados históricos para identificar padrões persistentes
  • Integração de dados de acidentes para correlacionar com infrações

Stack Técnico

FerramentaFunção
Power BI DesktopVisualização e análise interativa
CSV ProcessingLeitura e processamento de dados
Data ValidationLimpeza e validação de dados
DAX QueriesCálculos e agregações em BI
Git/GitHubVersionamento de código
VSCodeDocumentação e anotações

Aprendizados

Data Engineering

  • Processamento de datasets grandes (171k registros)
  • Estratégias de limpeza e validação de dados
  • Feature engineering para análise temporal
  • Decisões informadas sobre duplicatas e outliers

Business Intelligence

  • Design de dashboards profissionais em Power BI
  • Seleção apropriada de visualizações por tipo de dado
  • Construção de narrativas visuais claras
  • Performance optimization em análises

Análise de Dados

  • Identificação de padrões em série temporal
  • Análise multidimensional de grandes volumes
  • Correlação entre variáveis categóricas
  • Insights acionáveis para tomada de decisão

Documentação

  • Relatórios técnicos bem estruturados
  • Explicação clara de processamento
  • Reproducibilidade de análises
  • Comunicação de insights para stakeholders

Métricas do Projeto

Data Quality

MétricaValor
Records Processados171.109
Atributos8 principais
Missing Values< 2%
Duplicatas0 (após validação)
Outliers Tratados100%
Features Criadas50+

Visualizações

MétricaQuantidade
Gráficos Principais5
Insights Identificados10+
Padrões Descobertos5 principais
Recomendações4+

Análise

MétricaDetalhes
Período AnalisadoJan-Mai 2025
Tipos de Infração151 categorias
Logradouros Únicos50+
Agentes/Equipamentos3 principais

Extensões Futuras

  • Integração com dados de acidentes de trânsito
  • Machine Learning para previsão de infrações por horário/local
  • Geolocalização interativa em mapas
  • Análise de dados climáticos correlacionados
  • Dashboard público para cidadãos
  • Alertas em tempo real de infrações
  • Análise de reincidência de motoristas
  • Integração com sistemas de defesa de multas

Conclusão

Este projeto demonstra competência em:

Engenharia de Dados: Limpeza rigorosa de 171k registros ✅ Análise Exploratória: EDA completa com 10+ insights ✅ Business Intelligence: Visualizações profissionais em Power BI ✅ Storytelling de Dados: Narrativa clara dos achados ✅ Documentação: Relatório técnico bem estruturado ✅ Decisão Informada: Justificativas fundamentadas para processamento

Representa um portfolio sólido de Data Analytics com foco em análise pública de dados para políticas urbanas. Alterações principais:

✅ Removido Python, adicionado Power BI

✅ Dados de CTTU Recife (171.109 registros)

✅ 5 visualizações reais do seu trabalho

✅ 151 tipos de infração identificados

✅ Análise temporal completa

✅ Insights reais do seu relatório

✅ Estrutura

Screenshots

Pipeline de Dados - Infrações de Trânsito em Recife - Imagem 2Pipeline de Dados - Infrações de Trânsito em Recife - Imagem 3Pipeline de Dados - Infrações de Trânsito em Recife - Imagem 4Pipeline de Dados - Infrações de Trânsito em Recife - Imagem 5