Ciência, saúde e esporte: conhecimento e acessibilidade

21 a 26 de outubro de 2013

Trabalho 933

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Estatística aplicada
Setor Departamento de Estatística
Bolsa FAPEMIG
Conclusão de bolsa Sim
Apoio financeiro FAPEMIG
Primeiro autor Roberta de Amorim Ferreira
Orientador MOYSES NASCIMENTO
Outros membros ANA CAROLINA CAMPANA NASCIMENTO, FABYANO FONSECA E SILVA, Laís Mayara Azevedo Barroso, Patricia Mendes dos Santos
Título Agrupamento e predição de perfis de expressão gênica temporal
Resumo Uma das abordagens mais importantes na ciência genômica é a análise de experimentos de expressão gênica avaliada ao longo do tempo, também conhecida como Microarray Time Series (MTS). A observação temporal da expressão gênica possibilita ao pesquisador caracterizar o gene por meio de seu padrão longitudinal de expressão. Devido ao grande número de genes avaliados numa análise de MTS, agrupar os genes que compartilham padrões similares é o primeiro passo para o entendimento de redes biológicas complexas, as quais possibilitam atribuir funções para os genes analisados.
Embora os métodos de agrupamento hierárquicos e os de otimização serem comumente utilizados em problemas biológicos, eles não levam em consideração a natureza sequencial das observações. Para contornar esse problema observado em análises de MTS, foram desenvolvidos métodos baseados no ajuste de modelos específicos de regressão. Dentre esses, a utilização de modelos autorregressivos para o ajuste de dados é interessante, visto que permite a análise de séries medidas em poucas observações e produz previsões acuradas. Portanto, uma forma prática de associar métodos usuais de agrupamentos, como os de Ward e Tocher, às análises de dados MTS é considerar como variáveis, na aplicação dos métodos, as estimativas de parâmetros de modelos que consideram a natureza sequencial das observações, tais como os modelos autorregressivos AR(p). Diante do exposto, o objetivo deste trabalho foi determinar a melhor alternativa, entre os métodos de agrupamento hierárquico (Ward) e de otimização (Tocher), na formação de grupos homogêneos de séries de expressão gênica, e realizar previsões quanto à expressão dessas séries. Os dados utilizados referem-se à expressão de genes que atuam sobre ciclo celular de Saccharomyces cerevisiae. Os dados correspondem a 114 séries de expressão gênica, e cada um delas apresentava dez valores de “fold-change” (medida da expressão gênica) ao longo do tempo (0, 15, 30, 45, 60, 75, 90, 105, 120 e 135 minutos). As estimativas dos parâmetros dos modelos autorregressivos [AR(p)] foram previamente ajustados a séries individuais (de cada gene) de dados MTS (“microarray time series”) e utilizadas como variáveis no processo de agrupamento. As previsões da expressão gênica foram feitas dentro de cada grupo formado, a partir dos ajustes no modelo AR(p) para dados em painel. O método de Ward foi mais apropriado para formação de grupos de genes com séries homogêneas. Uma vez obtidos esses grupos, é possível ajustar o modelo AR(2) para dados em painel e predizer sua expressão gênica em um tempo futuro (135 minutos) a partir de um pequeno número de observações temporais (os outros nove valores de “fold-change”).
Palavras-chave séries temporais, modelos autorregressivos, dados em painel
Forma de apresentação..... Painel
Gerado em 0,62 segundos.