Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://tede.bc.uepb.edu.br/jspui/handle/tede/4724
Tipo do documento: Dissertação
Título: Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão
Autor: Cordeiro, Maria Barbosa da Silva 
Primeiro orientador: Simões, Simone da Silva
Primeiro coorientador: Medeiros, Everaldo Paulo de
Primeiro membro da banca: Diniz, Paulo Henrique Gonçalves Dias
Segundo membro da banca: Vilar, Welma Thaíse Silva
Resumo: A diferenciação entre sementes geneticamente modificadas (OGM´s) e convencionais é essencial a viabilidade agroambiental nos diferentes cultivos existentes, pois pode evitar a contaminação de sementes convencionais ou extinção de espécies nativas, eliminação de plantas e insetos, assim como a resistências desses dentro do próprio ambiente produtivo. Os métodos usados para a identificação de OGMs são baseados em análises de DNA, que apesar de serem precisas e confiáveis, geralmente são caras, demoradas e pouco disponíveis. Por outro lado, as técnicas espectroscópicas, bastante utilizadas na área agrícola, para a determinação de requisitos de qualidade em sementes demonstram melhor desempenho para este fim. O uso de algoritmos para a seleção de variáveis gera um subconjunto contendo as variáveis que melhor se relacionam às propriedades de interesse e contribuem para o desenvolvimento de modelos simples e robustos. Nas últimas décadas estudo utilizando algoritmos bionspirados, tem sido explorado em diversas áreas de estudo e em especial na química. A bioinspiração consiste na busca da compreensão dos mecanismos baseados no comportamento de espécies animais ou vegetais. Diante do exposto, neste trabalho estudou-se o desempenho de alguns algoritmos bioinspirados para seleção de varáveis aplicados a dados NIR para a distinção entre sementes convencionais e transgênicas de algodão. Alguns trabalhos já demonstraram o sucesso de modelos de reconhecimento de padrões (RP) construídos utilizando os espectros completos NIR para a solução deste problema analítico. Objetivou-se nesse trabalho, a aplicação de algoritmos para avaliar a capacidade preditiva de modelos de regressão em mínimos quadrados (PLS) construídos com todo o espectro e com intervalos espectrais (iSPA-PLS e i-PLS) para a quantificação de teor de água em sementes de algodão. Além disso, modelos de análise discriminante construídos com as variáveis espectrais NIR selecionadas por algoritmos de seleção de varáveis foram construídos e validados. Para isso foram testados o algoritmo determinístico das projeções sucessivas (SPA) e também, algoritmos bioinspirados como o de colônia de formigas (AOC) e o genético (GA). O conjunto de amostras para a quantificação do teor de umidade foi composto por 30 genótipos de sementes. Já o conjunto de dados destinado aos métodos de RP foi composto por 1195 sementes transgênicas e 1195 sementes convencionais. Todas as amostras foram cedidas pela EMBRAPA algodão. A capacidade preditiva dos modelos de quantificação foi avaliada com base nos valores de figuras de mérito como REP e RMSE. Os modelos de RP consideraram a sensibilidade, seletividade e taxa de classificação correta. Os modelos construídos com as variáveis selecionadas obtiveram resultados comparáveis aos modelos com espectro completo tanto para os modelos de quantificação quanto para os modelos de classificação. No entanto, para a quantificação do teor de água em sementes o iPLS se mostrou um modelo mais robusto apresentando RMSEP = 0,20% e REP = 2,17%. Em relação aos modelos LDA construídos com as variáveis selecionadas, todos alcançaram taxas de classificação corretas superiores a 95%. O algoritmo bioinspirado AOC-LDA forneceu a melhor performance com 97% de classificação correta. Diante do exposto, conclui-se que o uso de algoritmos de seleção de variáveis aliados a métodos multivariados de quantificação ou classificação, quando aplicados a dados NIR, são eficientes. Sendo capazes de quantificar teor de água ou classificar sementes de algodão convencionais e transgênicas de forma rápida e não destrutiva.
Abstract: The differentiation between genetically modified seeds (GMOs) and conventional ones is essential for agro-environmental viability in the different existing crops, as it can avoid contamination of conventional seeds or extinction of native species, elimination of plants and insects, as well as their resistance within the production environment itself. The methods used for the identification of GMOs are based on DNA analysis, which despite being accurate and reliable, are generally expensive, time-consuming and not readily available. On the other hand, spectroscopic techniques, widely used in the agricultural area, for determining quality requirements in seeds, demonstrate better performance for this purpose. The use of algorithms for the selection of variables generates a subset containing the variables that best relate to the properties of interest and contribute to the development of simple and robust models. In recent decades, studies using bioinspired algorithms have been explored in several areas of study, especially in chemistry. Bioinspiration consists of seeking to understand the mechanisms based on the behavior of animal or plant species. Given the above, this work studied the performance of some bioinspired algorithms for selection of variables applied to NIR data for the distinction between conventional and transgenic cotton seeds. Some works have already demonstrated the success of pattern recognition (RP) models built using full NIR spectra to solve this analytical problem. The objective of this work was the application of algorithms to evaluate the predictive capacity of least squares regression models (PLS) built with the whole spectrum and with spectral intervals (iSPA-PLS and i-PLS) for the quantification of water content in cotton seeds. Furthermore, discriminant analysis models constructed with NIR spectral variables selected by variable selection algorithms were constructed and validated. For this, the deterministic algorithm of successive projections (SPA) and also bioinspired algorithms such as ant colony (AOC) and genetic (GA) were tested. The set of samples for the quantification of moisture content was composed of 30 seed genotypes. The data set for the PR methods was composed of 1195 transgenic seeds and 1195 conventional seeds. All samples were provided by EMBRAPA cotton. The predictive capacity of the quantification models was evaluated based on the values of figures of merit such as REP and RMSE. PR models considered sensitivity, selectivity and correct classification rate. The models built with the selected variables obtained comparable results to the models with full spectrum both for the quantification models and for the classification models. However, for the quantification of water content in seeds, iPLS proved to be a more robust model, presenting RMSEP = 0.20% and REP = 2.17%. Regarding the LDA models built with the selected variables, all achieved correct classification rates greater than 95%. The AOC-LDA bioinspired algorithm provided the best performance with 97% correct classification. Given the above, it is concluded that the use of variable selection algorithms combined with multivariate methods of quantification or classification, when applied to NIR data, are efficient. Being able to quantify water content or classify conventional and transgenic cotton seeds quickly and non-destructively.
Palavras-chave: Quimiometria
Análise discriminante
Sementes transgênicas
Algodão
Sementes convencionais
Chemometrics
Discriminant analysis
Área(s) do CNPq: QUIMICA::QUIMICA ANALITICA
Idioma: por
País: Brasil
Instituição: Universidade Estadual da Paraíba
Sigla da instituição: UEPB
Departamento: Pró-Reitoria de Pós-Graduação e Pesquisa - PRPGP
Programa: Programa de Pós-Graduação em Química - PPGQ
Citação: CORDEIRO, M. B. da S. Espectroscopia NIR e algoritmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão. 2023. 72 f. Dissertação (Programa de Pós-Graduação em Química - PPGQ) - Universidade Estadual da Paraíba, Campina Grande, 2023.
Tipo de acesso: Acesso Embargado
URI: http://tede.bc.uepb.edu.br/jspui/handle/tede/4724
Data de defesa: 25-Jul-2023
Aparece nas coleções:PPGQ - Dissertações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DS - Maria Barbosa da Silva Cordeiro.pdfDS - Maria Barbosa da Silva Cordeiro2.72 MBAdobe PDFBaixar/Abrir Pré-Visualizar
Termo de Depósito BDTD.pdfTermo de Depósito BDTD269.02 kBAdobe PDFBaixar/Abrir Pré-Visualizar    Solictar uma cópia


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.