Método de avaliação experimental in silico baseado em algoritmos de aprendizado de máquina para a predição de peptídeos anticâncer
Data
2023
Autores
Lorena, Isabella Caroline Sachini
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
O Câncer representa uma das principais causas de morte em todo mundo. As formas de tratamento disponíveis causam graves efeitos colaterais e resistência das células cancerígenas. Neste contexto, os Peptídeos Anti Câncer (ACP) constituem uma alternativa promissora de tratamento, uma vez que possuem efeitos como imuno moduladores e indutores da apoptose. No entanto, a identificação e caracterização de um ACP de forma experimental consiste em uma tarefa onerosa em relação ao custo monetário e tempo. Desse modo, estudos in silico, em especial, por meio de técnicas de aprendizado de máquina, tem motivado o desenvolvimento de métodos automáticos para auxiliar no processo de identificação. Entretanto, apesar de resultados promissores reportados na literatura, o mecanismo pelo qual os peptídeos apresentam atividade anticancerígena é um tema em aberto que ainda não é adequadamente compreendido. Além desse aspecto, os estudos existentes apresentam métodos diversos em termos das estratégias adotadas, tais como: descritores de características; algoritmos de aprendizado de máquina e método de avaliação. Esse cenário dificulta a análise adequada das abordagens existentes e a comparação com novas propostas. Portanto, neste trabalho, com o intuito de definir um baseline para a literatura, foi proposto um método de avaliação experimental para o qual foram analisadas diferentes estratégias de predição de peptídeos. Para alcançar esse objetivo, foi realizada uma extensa análise por meio da combinação de 18 algoritmos de aprendizado de máquina com 13 descritores de características. Como resultado desse estudo experimental, um total de 2240 modelos foram construídos e avaliados utilizando diferentes métricas. Desse modo, pela análise de resultados estatísticos obtidos, observa-se que é preferível a utilização de descritores que apresentam maior desempenho em termos de acurácia e menor dimensionalidade. Além disso, é possível constatar, que considerando as técnicas avaliadas neste estudo, o desempenho dos modelos construídos possui maior influência em relação ao tipo de descritor de característica utilizado como, por exemplo, os modelos Circular/catboost e CTD/gbc.
Abstract
Descrição
Trabalho de Conclusão de Curso apresentado ao Instituto Latino-Americano de Ciências da Vida e da Natureza da Universidade Federal da Integração Latino-Americana, como requisito parcial à obtenção do título de Bacharel em Biotecnologia.
Palavras-chave
aprendizado de máquina, peptídeos anticâncer, predição de sequências, QSAR