ISSN | 2237-9045 |
---|---|
Instituição | Universidade Federal de Viçosa |
Nível | Graduação |
Modalidade | Pesquisa |
Área de conhecimento | Ciências Exatas e Tecnológicas |
Área temática | Estatística aplicada |
Setor | Departamento de Estatística |
Bolsa | FAPEMIG |
Conclusão de bolsa | Sim |
Apoio financeiro | FAPEMIG |
Primeiro autor | Roberta de Amorim Ferreira |
Orientador | MOYSES NASCIMENTO |
Outros membros | ANA CAROLINA CAMPANA NASCIMENTO, FABYANO FONSECA E SILVA, Laís Mayara Azevedo Barroso, Patricia Mendes dos Santos |
Título | Agrupamento e predição de perfis de expressão gênica temporal |
Resumo | Uma das abordagens mais importantes na ciência genômica é a análise de experimentos de expressão gênica avaliada ao longo do tempo, também conhecida como Microarray Time Series (MTS). A observação temporal da expressão gênica possibilita ao pesquisador caracterizar o gene por meio de seu padrão longitudinal de expressão. Devido ao grande número de genes avaliados numa análise de MTS, agrupar os genes que compartilham padrões similares é o primeiro passo para o entendimento de redes biológicas complexas, as quais possibilitam atribuir funções para os genes analisados. Embora os métodos de agrupamento hierárquicos e os de otimização serem comumente utilizados em problemas biológicos, eles não levam em consideração a natureza sequencial das observações. Para contornar esse problema observado em análises de MTS, foram desenvolvidos métodos baseados no ajuste de modelos específicos de regressão. Dentre esses, a utilização de modelos autorregressivos para o ajuste de dados é interessante, visto que permite a análise de séries medidas em poucas observações e produz previsões acuradas. Portanto, uma forma prática de associar métodos usuais de agrupamentos, como os de Ward e Tocher, às análises de dados MTS é considerar como variáveis, na aplicação dos métodos, as estimativas de parâmetros de modelos que consideram a natureza sequencial das observações, tais como os modelos autorregressivos AR(p). Diante do exposto, o objetivo deste trabalho foi determinar a melhor alternativa, entre os métodos de agrupamento hierárquico (Ward) e de otimização (Tocher), na formação de grupos homogêneos de séries de expressão gênica, e realizar previsões quanto à expressão dessas séries. Os dados utilizados referem-se à expressão de genes que atuam sobre ciclo celular de Saccharomyces cerevisiae. Os dados correspondem a 114 séries de expressão gênica, e cada um delas apresentava dez valores de “fold-change” (medida da expressão gênica) ao longo do tempo (0, 15, 30, 45, 60, 75, 90, 105, 120 e 135 minutos). As estimativas dos parâmetros dos modelos autorregressivos [AR(p)] foram previamente ajustados a séries individuais (de cada gene) de dados MTS (“microarray time series”) e utilizadas como variáveis no processo de agrupamento. As previsões da expressão gênica foram feitas dentro de cada grupo formado, a partir dos ajustes no modelo AR(p) para dados em painel. O método de Ward foi mais apropriado para formação de grupos de genes com séries homogêneas. Uma vez obtidos esses grupos, é possível ajustar o modelo AR(2) para dados em painel e predizer sua expressão gênica em um tempo futuro (135 minutos) a partir de um pequeno número de observações temporais (os outros nove valores de “fold-change”). |
Palavras-chave | séries temporais, modelos autorregressivos, dados em painel |
Forma de apresentação..... | Painel |