IMPRIMIR VOLTAR
A. Ciências Exatas e da Terra - 2. Ciência da Computação - 6. Inteligência Artificial e Redes Neurais
Algoritmos de Associação para Mineração de Dados em Bioinformática
Thiago Bassani 1
Júlio Cesar Nievola 1
(1. Programa de Pós-Graduação em Informática Aplicada / PPGIA PUCPR)
INTRODUÇÃO:
Descobrir e desenvolver novos medicamentos é um processo oneroso, demorado e ineficiente. O custo estimado para trazer ao mercado um medicamento simples, é de 350 a 610 milhões de dólares. Esse processo requer um tempo perto de 8 a 12 anos, e é certo que a indústria farmacêutica necessita de novas tecnologias para simplificá-lo. As companhias na indústria farmacêutica estão com uma pressão acirrada para reduzir os ciclos de pesquisa e desenvolvimento, enquanto, no mesmo tempo, são implantadas novas tecnologia de instrumentação, produzindo enorme quantidade de dados experimentais (gigabytes por dia).O objetivo deste subprojeto é a implementação de um conjunto integrado de algoritmos de associação, a serem utilizados em dados de bioinformática, permitindo a determinação da relação entre os diversos atributos dos dados.
METODOLOGIA:
Os Algoritmos de Associação descrevem padrões que aparecem frequentemente em base de dados. Baseado nesses padrões, pode-se deduzir regras de associação. A idéia consiste em achar grupos de atributos com freqüência tal, a fim de usá-los para gerar uma busca específica. Assim reduzir-se-á a exploração de possibilidades que não formam parte da solução. Resultados: Com esse algoritmo, bancos de dados complexos podem ser explorados com um grau maior de detalhes, definido pelas regras de associação de baixo suporte, mas de alto significado, na aplicação de base de dados genéticos. As regras de associação também podem ser usadas para ajudar a relacionar a expressão de genes a seu ambiente celular. Em contraste, dados de expressão de mineração para regras de associação pareceriam mais úteis em ajudar descobrir redes de gene.
RESULTADOS:
Para observar a metodologia de mineração de dados numa aplicação pratica e demonstrar os passos adotados, com o estudo de um caso, foi revisado o processo de classificação molecular do câncer. Acompanhou-se o processo onde foram monitoradas as expressões de milhares de genes simultaneamente com microarrays de DNA em casos de leucemia (Golub T.R. et al, 1999). Os casos apresentavam dois subtipos: leucemia linfóide aguda (ALL, acute lymphoblastic leukaemia) ou leucemia mieloide aguda(AML, acute myeloid leukaemia). Estudos preliminares levantaram a hipótese de que os subtipos eram associados com uma específica translocação cromossômica. No entanto nada foi comprovado e a precisão da classificação da leucemia permanece imperfeita e contendo erros. Para realizar os experimentos foram separadas 38 amostras encontradas em leves tecidos de longos ossos do corpo (27 ALL e 11 AML), obtidas de pacientes com leucemia aguda no momento da amostragem. Em seguida foi preparado o RNA das células pelo método da hibridização por alta-densidade da Affymetrix de oligonucleotideos contendo 6,817 genes humanos. Porém por motivos práticos foram utilizados somente 18 genes humanos. O algoritmo Apriori atingiu 100% de confidencia e 95% de suporte em nas 12(doze) principais regras geradas.
CONCLUSÕES:
As regras de associação podem descrever como a expressão de um gene pode ser associada com a expressão de um grupo de genes. Esses conhecimentos extraídos de bases gênicas levantaram as seguintes possibilidades: cura de doenças genéticas como casos de anemia, etc., causadas por certa mutação; cura para câncer; o seqüenciamento de bactéria pode ser favorável na produção de energia, gerência de desperdício e principalmente na indústria de biotecnologia; redução dos gastos e tempo em projetos de remédios; Interferência com as leis de Natureza por seres humanos. Compila-se neste trabalho, uma ligação concisa nos aspectos variados da Bioinformática e Mineração de Dados.
Instituição de fomento: PUCPR - CNPq
Trabalho de Iniciação Científica  
Palavras-chave: Mineração de Dados; Bioinformática ; Algoritmos de Associação .
Anais da 58ª Reunião Anual da SBPC - Florianópolis, SC - Julho/2006