Documentação dos Datasets
Introdução
Este documento descreve os datasets utilizados no desenvolvimento da inteligência artificial para identificação de doenças em plantas. Os dados foram coletados de diversas fontes confiáveis e organizados em um novo dataset armazenado em um arquivo no Drive. Todas as imagens foram processadas para o tamanho de 256x256 pixels para treinamento da IA.
Datasets Utilizados
EMBRAPA (Mandioca)
O dataset da Embrapa foi utilizado para mandioca, contendo as seguintes classes de doenças:
Ácaro
Antracnose
Bacteriose
Mancha Branca
Mancha Parda
Mosaico Comum
Mosaico Nervuras
Oídio
Podridão das Raízes
Queima Folhas
Mandioca Saudável
Banana LSD Dataset e Plant Village (Banana)
Os datasets Banana LSD e Plant Village foram utilizados para banana, contendo as seguintes classes:
Doença do Mal do Panamá
Doença Moko
Fungo Cordana
Fungo Pestalotiopsis
Peste ou Praga dos Insetos
Sigatoka Amarela
Sigatoka Fungo
Banana Saudável
PlantVillage e Strawberry Disease Detectio Dataset (Morango)
Os datasets PlantVillage e Strawberry Disease Detection foram utilizados para morango, contendo as seguintes classes:
Folha Queimada
Mancha Angular da Folha
Mancha Foliar
Mofo Cinza
Oídio
Podridão de Frutas Antracnose
Praga das Flores
Morango Saudável
Embrapa e Guava Dataset (Goiaba)
Os datasets da Embrapa e do Guava Dataset foram utilizados para goiaba, contendo as seguintes classes de doenças:
Antracnose
Cancro de Goiaba pelo Fungo Pestalotiopsis
Crosta
Ferrugem
Ferrugem Vermelha
Fungo Phytopthora
Fungo Stylar end Rot
Mumificação
Goiaba Saudável
PlantVillage (Tomate)
O dataset PlantVillage do Kaggle foi utilizado para tomate, contendo as seguintes classes de doenças:
Vírus do Enrolamento Amarelo das Folhas
Vírus do Mosaico
Mancha Bacteriana
Mancha Foliar Septoria
Molho da Folha
Requeima Precoce-Pinta Preta
Requeima Tardia
Tomate Saudável
PlantVillage (Milho)
O dataset PlantVillage do Kaggle foi utilizado para o treinamento da IA na detecção de doenças no milho. As classes de doenças identificadas incluem:
Míldio
Mancha Marrom
Mancha Foliar Norte
Mancha Cercospora
Ferrugem
Milho Saudável
Dryad (Soja)
Os dados de soja foram extraídos de um dataset do site Dryad, contendo as seguintes classes de doenças:
Cercospora
Crestamento
Deficiência de Potássio
Ferrugem
Forgeye
Mancha Alvo
Míldio
Soja Saudável
Lettuce Diseases (Alface)
O dataset Lettuce Diseases do Kaggle foi utilizado para alface, contendo as seguintes classes:
Mancha Foliar
Míldio
Queima das Bordas
Saudável
Septoria
Roboflow (Alho)
Para o alho, utilizamos vários datasets presentes no Roboflow, que é uma plataforma de treinamento de modelos para detecção de diversos tipos. Em nosso datase temos as seguintes classes:
Xanthomas
Míldio
Mancha Stephylium
Mancha Púrpura
Ferrugem
Botrytis
Processamento de Dados
Para garantir um padrão uniforme e otimizar o treinamento da IA, todas as imagens foram redimensionadas para 256x256 pixels. Além disso, foram realizados processos de normalização e augmentação para melhorar a generalização do modelo.
Armazenamento
O dataset final foi consolidado e armazenado em um arquivo no Drive, garantindo organização e facilidade de acesso durante o treinamento da IA. Segue o Link do Drive com todos datasets reformulados e filtrados sendo escolhidos em nível de formato, qualidade de imagem e conteúdo da foto. 🔗 Dataset da IA
Referências
EMBRAPA PLANTVILLAGE. Kaggle** - Plant Disease Dataset. Disponível em: https://www.kaggle.com/datasets/emmarex/plantdisease Acesso em: 9 fev. 2025.
DRYAD. Dataset de Doenças em Soja. Disponível em: https://datadryad.org/stash/dataset/doi:10.5061/dryad.41ns1rnj3 Acesso em: 9 fev. 2025.
KAGGLE. Lettuce Diseases Dataset. Disponível em: https://www.kaggle.com/datasets/ashishjstar/lettuce-diseases Acesso em: 9 fev. 2025. EMBRAPA. Base de Dados de Doenças Agrícolas. Disponível em: https://www.embrapa.br Acesso em: 9 fev. 2025.
KAGGLE. PlantVillage Dataset. - Tomate. Disponível em: https://www.kaggle.com/datasets/abdallahalidev/plantvillage-dataset Acesso em: 9 fev. 2025.
KAGGLE. Guava Disease Dataset - Goiaba. Disponível em: https://www.kaggle.com/datasets/omkarmanohardalvi/guava-disease-dataset-4-types Acesso em: 9 fev. 2025.
KAGGLE. Guava Dataset - Goiaba. Disponível em: https://www.kaggle.com/datasets/noamaanabdulazeem/guava-dataset Acesso em: 9 fev. 2025.
KAGGLE. Strawberry Disease Detection Dataset - Morango. Disponível em: https://www.kaggle.com/datasets/usmanafzaal/strawberry-disease-detection-dataset Acesso em: 9 fev. 2025.
KAGGLE. Banana LSD Dataset - Banana. Disponível em: https://www.kaggle.com/datasets/shifatearman/bananalsd Acesso em: 9 fev. 2025.
EMBRAPA. Base de Dados de Doenças da Mandioca. Disponível em: https://www.redape.dados.embrapa.br/dataset.xhtml?persistentId=doi:10.48432/XA1OVL Acesso em: 9 fev. 2025.
ROBOFLOW. Roboflow Universe - Plant Diseases. Disponível em: https://universe.roboflow.com/ Acesso em: 9 fev. 2025.