Aplicação de Técnicas de Machine Learning e Processamento de Imagens para a Identificação de Selos Indicativos de Excessos em Embalagens Alimentícias

Autores

  • Ana L. Freitas Faculdade São Paulo Tech School - SPTech Autor
  • Isabella S. Correa Faculdade São Paulo Tech School - SPTech Autor
  • Rafaela A. Soares Faculdade São Paulo Tech School - SPTech Autor
  • Gerson Santos Faculdade São Paulo Tech School - SPTech Autor
  • Marise Miranda Faculdade São Paulo Tech School - SPTech Autor https://orcid.org/0000-0002-1775-4541
  • Domingos Sanches Faculdade São Paulo Tech School - SPTech Autor

Palavras-chave:

Processamento de Imagens, Reconhecimento Óptico de Caracteres, Redes Neurais Convolucionais, Informações Nutricionais

Resumo

https://doi.org/10.5281/zenodo.15700909

Este estudo investigou a viabilidade da aplicação de técnicas de Machine Learning e processamento de imagens em dois cenários distintos relacionados à análise de embalagens alimentícias. O estudo principal focou na detecção de selos de alerta (indicando excesso de gordura, açúcar ou sódio) utilizando uma base de dados própria com 92 imagens distintas coletadas pelas autoras em supermercados. Para o reconhecimento de padrões visuais, foram empregadas redes neurais convolucionais (CNNs), com o uso de data augmentation para aumentar a diversidade do conjunto de dados e aprimorar a robustez do modelo. Os resultados obtidos demonstraram uma acurácia de 0.83, com métricas de precisão (0.89), recall (0.89) e F1-score (0.89) para a detecção de selos em embalagens planas, como as de barras de chocolate. Antes do estudo principal, foi realizado um estudo experimental que visou a extração automática de informações nutricionais de embalagens, com o objetivo de transcrever essas informações para facilitar o acesso de pessoas com deficiência visual, analfabetos e crianças. A base de dados utilizada foi a OpenFoodFacts API. Para este estudo, foi empregado o método de Reconhecimento Óptico de Caracteres (OCR), com destaque para o uso da ferramenta Tesseract. Apesar de serem aplicadas técnicas de tratamento de imagem, como a redução de ruídos, sombras e curvaturas, foi identificado que, com o código utilizado, não era possível obter bons resultados em imagens que apresentassem sombras ou curvaturas. Essas condições adversas comprometeram o desempenho do OCR, dificultando a extração precisa do texto das embalagens. O estudo conclui que, embora o reconhecimento de texto em embalagens alimentícias exija melhorias adicionais no pré-processamento de imagens, a abordagem proposta para a detecção de selos apresenta-se promissora, com desempenho satisfatório e aplicabilidade prática no cenário analisado.

Publicado

2025-06-19