@MASTERSTHESIS{ 2023:203893397, title = {Espectroscopia NIR e algorítmos de seleção de variáveis para determinação de teor de água e classificação de sementes de algodão}, year = {2023}, url = "http://tede.bc.uepb.edu.br/jspui/handle/tede/4724", abstract = "A diferenciação entre sementes geneticamente modificadas (OGM´s) e convencionais é essencial a viabilidade agroambiental nos diferentes cultivos existentes, pois pode evitar a contaminação de sementes convencionais ou extinção de espécies nativas, eliminação de plantas e insetos, assim como a resistências desses dentro do próprio ambiente produtivo. Os métodos usados para a identificação de OGMs são baseados em análises de DNA, que apesar de serem precisas e confiáveis, geralmente são caras, demoradas e pouco disponíveis. Por outro lado, as técnicas espectroscópicas, bastante utilizadas na área agrícola, para a determinação de requisitos de qualidade em sementes demonstram melhor desempenho para este fim. O uso de algoritmos para a seleção de variáveis gera um subconjunto contendo as variáveis que melhor se relacionam às propriedades de interesse e contribuem para o desenvolvimento de modelos simples e robustos. Nas últimas décadas estudo utilizando algoritmos bionspirados, tem sido explorado em diversas áreas de estudo e em especial na química. A bioinspiração consiste na busca da compreensão dos mecanismos baseados no comportamento de espécies animais ou vegetais. Diante do exposto, neste trabalho estudou-se o desempenho de alguns algoritmos bioinspirados para seleção de varáveis aplicados a dados NIR para a distinção entre sementes convencionais e transgênicas de algodão. Alguns trabalhos já demonstraram o sucesso de modelos de reconhecimento de padrões (RP) construídos utilizando os espectros completos NIR para a solução deste problema analítico. Objetivou-se nesse trabalho, a aplicação de algoritmos para avaliar a capacidade preditiva de modelos de regressão em mínimos quadrados (PLS) construídos com todo o espectro e com intervalos espectrais (iSPA-PLS e i-PLS) para a quantificação de teor de água em sementes de algodão. Além disso, modelos de análise discriminante construídos com as variáveis espectrais NIR selecionadas por algoritmos de seleção de varáveis foram construídos e validados. Para isso foram testados o algoritmo determinístico das projeções sucessivas (SPA) e também, algoritmos bioinspirados como o de colônia de formigas (AOC) e o genético (GA). O conjunto de amostras para a quantificação do teor de umidade foi composto por 30 genótipos de sementes. Já o conjunto de dados destinado aos métodos de RP foi composto por 1195 sementes transgênicas e 1195 sementes convencionais. Todas as amostras foram cedidas pela EMBRAPA algodão. A capacidade preditiva dos modelos de quantificação foi avaliada com base nos valores de figuras de mérito como REP e RMSE. Os modelos de RP consideraram a sensibilidade, seletividade e taxa de classificação correta. Os modelos construídos com as variáveis selecionadas obtiveram resultados comparáveis aos modelos com espectro completo tanto para os modelos de quantificação quanto para os modelos de classificação. No entanto, para a quantificação do teor de água em sementes o iPLS se mostrou um modelo mais robusto apresentando RMSEP = 0,20% e REP = 2,17%. Em relação aos modelos LDA construídos com as variáveis selecionadas, todos alcançaram taxas de classificação corretas superiores a 95%. O algoritmo bioinspirado AOC-LDA forneceu a melhor performance com 97% de classificação correta. Diante do exposto, conclui-se que o uso de algoritmos de seleção de variáveis aliados a métodos multivariados de quantificação ou classificação, quando aplicados a dados NIR, são eficientes. Sendo capazes de quantificar teor de água ou classificar sementes de algodão convencionais e transgênicas de forma rápida e não destrutiva.", publisher = {Universidade Estadual da Paraíba}, scholl = {Programa de Pós-Graduação em Química - PPGQ}, note = {Pró-Reitoria de Pós-Graduação e Pesquisa - PRPGP} }