Resumo |
O controle do trafego de veículos em um país é muito importante, pois pode diminuir o número de acidentes nas vias de circulação, identificar veículos roubados, localizar motoristas infratores, entre outros. Existem várias formas de controlar o trânsito, como multas para motoristas infratores, guardas para controlar o fluxo, entre outras. O objetivo deste trabalho é o desenvolvimento de um sistema capaz de segmentar e reconhecer os caracteres presentes em imagens de placas de veículos adquiridas por um radar. O trabalho está sendo desenvolvido utilizando a linguagem Python e os módulos de computação científica como Numpy, Scipy, Skit-image. O sistema possui cinco etapas sendo elas a aquisição das imagens, pré-processamento, segmentação dos caracteres, extração de características e classificação. A aplicação de técnicas de pré-processamento são importantes para melhorar a qualidade das imagens que serão analisadas, modificando características de modo que as etapas seguintes possuam um resultado melhor, um exemplo desse tipo de técnica é o alargamento de contraste, que é a expansão da gama de intensidades em um intervalo a fim de melhorar a distribuição de intensidades nas imagens. Na etapa de segmentação são determinadas as regiões de interesse que serão analisadas, neste caso as regiões de interesse são os caracteres das placas. Na etapa de extração de características, são obtidas medidas quantitativas referentes aos caracteres, que são fundamentais para o reconhecimento dos cada objeto. Foram utilizadas duas técnicas de extração de características: a primeira técnica é a contagem dos pixels nos eixos X e Y da imagem e a segunda técnica consiste em converter a matriz de pixels de um caractere em um arranjo 1-D. Finalmente, na etapa de classificação, as características extraídas são utilizadas pelos algoritmos de reconhecimento de padrões, Naïve Bayes, K-Nearest Neighbors (KNN), Support Vector Machines (SVM) e Random Forest. O método foi testado usando um banco de imagens contendo 500 imagens de veículos, disponível em <http://www.cbpf.br/cat/pdsi/lpr/lpr.html> as imagens possuem a resolução de 640x240 e mostram toda a frente do veículo capturado, uma característica da base de imagens é a grande variação de iluminação no momento da captura. Os resultados foram avaliados usando validação cruzada k-fold com k=10 e os índices de Acurácia, Precisão, Recall e F1-score foram computados. Os resultados parciais demonstram uma superioridade do KNN sobre os demais classificadores, enquanto a técnica de representação dos caracteres por um arranjo 1-D tem se mostrado a melhor forma para a extração das características. |