“Bicentenário da Independência: 200 anos de ciência, tecnologia e inovação no Brasil e 96 anos de contribuição da UFV”.

8 a 10 de novembro de 2022

Trabalho 17061

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Ciência da computação
Setor Departamento de Informática
Bolsa PIBIC/CNPq
Conclusão de bolsa Não
Apoio financeiro CNPq
Primeiro autor Igor Teixeira Brasiliano
Orientador SABRINA DE AZEVEDO SILVEIRA
Outros membros MARIA CRISTINA BARACAT PEREIRA, Rayane Monique Bernardes Loch
Título Ferramenta computacional de Machine Learning para predição de peptídeos com função dupla de penetração celular e antimicrobiana
Resumo Há duas principais classes de peptídeos que interagem com membranas, os peptídeos de penetração celular (CPP) e peptídeos antimicrobianos (AMP). Os CPPs são potentes para entrar em células alvo sem ou com dano mínimo e os AMPs são capazes de desativar patógenos, podem ser antibacterianos, antivirais, antifúngicos e antiparasitários. Tem-se então o objetivo de desenvolver uma ferramenta computacional por meio de estratégias de machine learning capaz de predizer peptídeos com dupla função, penetração celular e atividade antimicrobiana, visando identificar moléculas antibióticas. Para realizar a tarefa, precisávamos selecionar características (features) que melhor conseguiam diferenciar os peptídeos em CPP e não-CPP e AMP e não-AMP. Consultando a literatura, as seguintes características foram escolhidas: número de resíduos totais, número de arginina, número de lisina, número de glutamina, número de alanina, número de leucina, número de triptofano, massa molecular, carga líquida, hidrofobicidade, ponto isoelétrico, razão de resíduos hidrofílicos, composição dipeptídica e composição atômica. Para treinamento e validação dos modelos foram utilizados bancos de dados já presentes na literatura e de sites de domínios científicos. A validação ocorreu com auxílio da técnica de validação cruzada com 10 partições e, além disso, as métricas utilizadas foram: i) acurácia: taxa de acerto; ii) precisão: dos dados classificados como positivos, quantos são realmente positivos; iii) revocação: de todos os dados positivos, quantos foram classificados como positivos. De princípio, foi dado uma maior atenção para predição dos CPPs, que são relativamente novos e sem características claras para definição. Nesse primeiro instante foram testados 4 algoritmos popularmente conhecidos de classificação supervisionada, K-Vizinhos Mais Próximos (KNN), Naive Bayes, Extra Trees e Support Vector Machine (SVM). Dos resultados preliminares, o algoritmo de Extra Trees foi o que apresentou melhor resultado em relação às métricas escolhidas para validação. Num segundo momento, foi utilizado o mesmo algoritmo usado na classificação dos CPPs para os AMPs. Como saída, temos a classificação em relação às duas classes, CPP e AMP, além da porcentagem de se pertencer a cada uma delas. Como resultados preliminares, obtivemos 98% de acurácia, 96% de precisão e 98% de revocação para predição de AMPs e 83% de acurácia, 80% de precisão e 75% de revocação para predição de CPPs, o que foi considerado muito bom, já que não há uma regra clara na literatura para classificação de CPPs. Para a conclusão do trabalho, ainda há a verificação in vitro dos resultados obtidos pelo classificador das moléculas de interesse. Os peptídeos de penetração celular são relativamente ‘novos’ e ainda são objetos de estudo. Com isso, uma ideia adicional é, através de estratégias de visualização de dados, tornar possível a identificação de características que possam ser úteis em uma caracterização mais clara de CPPs.
Palavras-chave Machine Learning, Predição de Peptídeos, Antibióticos
Forma de apresentação..... Painel
Link para apresentação Painel
Gerado em 0,66 segundos.