IMPRIMIR VOLTAR
C. Ciências Biológicas - 8. Genética - 5. Genética Vegetal

COMPARAÇÃO DE ALGORITMOS DE ORDENAÇÃO DE LOCOS EM MAPAS GENÉTICOS USANDO MÉTODOS MONTE CARLO

Marcelo Mollinari 1
Gabriel Rodrigues Alves Margarido 1
Antonio Augusto Franco Garcia 1
Roland Vencovsky 1
(1. Departamento de Genética da Escola Superior de Agricultura “Luiz de Queiroz” / L)
INTRODUÇÃO:

A construção de mapas genéticos baseados em marcadores moleculares é uma etapa fundamental para o mapeamento de locos que controlam caracteres quantitativos (QTLs), os quais tem elevada importância econômica. Todavia a construção desses mapas depende da implementação de algoritmos de ordenação eficientes, uma vez que é necessário determinar a ordem dos marcadores dentro de um grupo de ligação. Muitos métodos de ordenação foram desenvolvidos: i) soma mínima das frações de recombinação adjacentes (SARF); ii) produto mínimo das frações de recombinação adjacentes (PARF); iii) soma máxima dos LOD scores adjacentes (SALOD); iv) máxima verossimilhança (ML); v) seriação (SER), e vi) delineação rápida em cadeia (RCD). Em situações práticas, os geneticistas não podem verificar se a ordem dos marcadores do mapa de ligação obtido com o uso dessas diferentes abordagens é efetivamente a ordem real. O objetivo deste trabalho é avaliar a eficiência dos métodos SER e RCD e dos critérios SARF, PARF, SALOD, ML, usando a estratégia de Monte Carlo através da simulação computacional.

METODOLOGIA:

Foi simulado um mapa de uma espécie vegetal, diplóide e monóica, contendo 1 par de cromossomos, com 24 marcadores codominantes posicionados a distâncias variadas aleatoriamente. Foram simuladas 1000 populações experimentais dos tipos F2, e 1000 populações do tipo RC (retrocruzamento). Foram simulados 200 indivíduos para ambas as populações experimentais. Destas populações previamente simuladas, foram retirados aleatoriamente 25%, 50%, e 75% dos dados. Ainda, foram utilizadas combinações de marcadores dominantes e codominantes ligados em associação e em repulsão. Considerando-se todas as combinações dos fatores estudados, foram simuladas 16000 populações experimentais no total.

Todas as simulações e combinações de algoritmos e critérios foram implementadas em linguagem C e no ambiente estatístico R, que é uma linguagem para análise de dados e gráficos. Foi utilizado ainda o algoritmo RIPPLE para o refinamento das ordens. Uma vez obtidos os mapas, foi feita a comparação dos mesmos com o mapa original simulado, através da correlação do rank entre a ordem obtida e a ordem simulada. Também foram comparadas as distâncias entre os marcadores.
RESULTADOS:
O método RCD mostrou-se bastante eficiente. Na ausência de dados perdidos, as médias das correlações foram muito próximas de 1,00. Obteve-se ainda, uma grande quantidade de ordenações corretas. Retirando-se 25% dos marcadores, todas as situações ainda apresentam correlações bastante próximas de 1,00 exceto no caso em que existiam apenas marcadores dominantes. De modo geral, a presença de marcadores codominantes foi importante para a obtenção de resultados satisfatórios. O número de ordenações corretas ficou cada vez menor a mediada que os dados foram sendo retirados. O método SER apresentou correlações bastante similares àquelas obtidas utilizando-se o método RCD, todavia o número de ordens corretas foi muito menor. Verificou-se ainda que o método SER superestima o comprimento do mapa. Os efeitos de perda de dados ocorridos com o método RCD repetem-se utilizando o método SER. Os resultados obtidos com os critérios PARF, SARF, e SALOD nos mapas preestabelecidos pelo método RCD foram similares aos obtidos apenas com o RCD. Entretanto, tais critérios são efetivos em pequenas regiões do mapa, pois o número de marcadores usados nas permutações do algoritmo é limitado devido ao “problema do caixeiro viajante”. Já nos mapas preestabelecidos pelo método SER, verificou-se que estes foram de extrema importância para a melhoria das ordens. Os resultados obtidos com o critério SALOD, no geral, foram piores do que aqueles obtidos pelos critérios SARF e PARF.
CONCLUSÕES:
Baseado nos resultados obtidos aconselha-se a utilização do método RCD, pois este tem a vantagem de ser um método extremante simples e rápido fornecendo um mapa bastante confiável. Aconselha-se também, o uso ou do critério SARF ou do critério PARF para o refinamento do mapa, uma vez que seus resultados foram bastante parecidos. Dependendo dos recursos computacionais disponíveis, o número de marcadores para a execução do algoritmo RIPPLE pode ser aumentado. Nesse caso, aconselha-se a utilização do critério SARF, pois este envolve operações mais simples e conseqüentemente o algoritmo RIPPLE torna-se mais rápido.
Instituição de fomento: CNPq
Trabalho de Iniciação Científica  
Palavras-chave: Mapas de ligação; Algoritmos genéticos; Monte Carlo.
Anais da 58ª Reunião Anual da SBPC - Florianópolis, SC - Julho/2006