62ª Reunião Anual da SBPC
A. Ciências Exatas e da Terra - 2. Ciência da Computação - 3. Computação Gráfica
Auxílio computadorizado à identificação e classificação de câncer de pulmão utilizando recuperação de imagens baseada em conteúdo através de atributos de textura e registro de imagem
Pedro Augusto Almeida Ayres 1
Rodolfo Carneiro Cavalcante 1
José Raniery Ferreira Júnior 1
Marcelo Costa Oliveira 1
1. Universidade Federal de Alagoas - Campus Arapiraca
INTRODUÇÃO:
O câncer é um crescimento celular anormal, incontrolável, que invade tecidos vizinhos e os destroem. Entre todos os tipos de câncer, o câncer do pulmão é o líder mundial em causas de mortes [Li 2007]. Somente nos Estados Unidos em 2005, foram registrados 172 mil e 570 casos de câncer do pulmão que levaram a óbito 163 mil e 510 pacientes. Este total é tão expressivo que supera o número de óbitos provocado pela soma dos 3 tipos de câncer de maior incidência, o câncer de mama, colorretal e próstata. Entretanto, pacientes que são diagnosticados precocemente, logo nos primeiros meses possuem 60% a 90% de chance de sobrevivência [Bellotti 2007]. Logo, a detecção e o tratamento precoce do câncer de pulmão são formas efetivas de garantir a vida dos pacientes. Entretanto, a caracterização e diagnóstico do nódulo pulmonar são atividades complexas para os especialistas, principalmente para os radiologistas menos experientes. A Tomografia Computadorizada - CT ("Computed Tomography") acrescenta muito ao diagnóstico das neoplasias do pulmão. Este exame é o mais indicado para a detecção precoce do câncer do pulmão, pois fornece ao especialista noções precisas do tamanho, localização e níveis de invasão do tumor, além de gerar cortes com detalhes anatômicos de alta resolução, isotrópicos e menores que 1mm de espessura [Sluimer 2006]. Estas informações oferecem ao radiologista melhores condições de detectar e classificar o nódulo (benigno ou maligno) evitando que o paciente seja submetido a exames histológicos. Entretanto, a detecção precisa dos nódulos pulmonares é um problema desafiador para os profissionais da área de saúde devido à anatomia complexa do tórax e das interferências que possam surgir durante o processo de captura das imagens( ex.: ruídos, borrões ou variações de plano de fundo). O traçado manual dos limites, também conhecido como segmentação manual, é usado para separar as estruturas dos pulmões de outros órgãos. Entretanto, os métodos de segmentação manual são muito laboriosos e subjetivos, os mesmos devem ser aplicados imagem a imagem (2D), e além disso se faz necessário um grande nível de experiencia no assunto. A recuperação de imagens baseadas em conteúdo (CBIR - "Content-based image retrieval") tem sido uma das técnicas de visão computacional mais pesquisada nos últimos 10 anos. A CBIR é descrita como uma das ferramentas de maior potencial futuro nas aplicações de auxílio computadorizado ao diagnóstico. Através da CBIR é possível, a partir de uma imagem de referência (caso desconhecido), encontrar imagens similares (malignas ou benignas) contidas em uma ou diversas bases de dados utilizando atributos inerentes das imagens. Assim, se a imagem em questão for considerada similar a uma ou mais imagens benignas (ou malignas) pelo especialista, o resultado lhe direcionará com maior convicção na decisão do seu diagnóstico. Para determinar a similaridade entre exames podem ser usadas algumas técnicas, dentre elas a análise de textura. A variação de padrões da textura dos nódulos fornece fortes indicadores da natureza maligna ou benigna dos nódulos. A presença de gordura ou a calcificação são fortes indicadores de hamartoma benigno e resultam em uma distribuição irregular de textura. Nódulos malignos apresentam textura uniforme produzida pela presença de necrose. A partir da segmentação são aplicadas técnicas para análise de textura do volume de imagens, delas é extraída a matriz de co-ocorrência. A matriz de co-ocorrência é a representação da distribuição de probabilidade de ocorrência de pares de pixels com determinada intensidade e distância em uma direção. Haralick et al. definiu as funções estatísticas de segunda ordem ou Atributos de Textura que podem ser obtidas a partir da matriz de co-ocorrência com propósitos de discriminação de textura. A partir destas funções é possível calcular a Distância Euclidiana entre dois nódulos, utilizada para quantificar a similaridade entre os vetores de características das imagens da base de dados local e o da imagem de referência, ou seja, a imagem utilizada na busca, permitindo fornecer exames similares ao profissional da saúde. Uma outra abordagem, aplicada a este projeto, é a recuperação de imagens baseada em forma através de Registro de Imagens. Qualquer nódulo que apresente uma forma esférica e bem definida é provavelmente benigno. Enquanto nódulos malignos apresentam forma irregular ou espiculada. O registro de imagens consiste em um conjunto de métodos capazes de encontrar transformações espaciais necessárias para mapear pontos homólogos entre duas imagens. Estes métodos consistem em realizar operações de transformação de coordenadas entre a imagens envolvidas e realizar uma comparação (matching) entre as novas imagens até determinar o melhor cruzamento entre elas.
METODOLOGIA:
Todos os algoritmos deste projeto foram desenvolvidos em linguagem de programação JAVA. Para realizar a segmentação dos nódulos pulmonares foi desenvolvido um algoritmo de Crescimento de Região 3D este algoritmo consiste em utilizar pontos sementes(seeds) dentro dos nódulos e "crescer" em volta deles preenchendo toda a imagem tridimensional sendo possível destacar o nódulo do restante da imagem. Este crescimento é delimitado por um cilindro definido pelo profissional de saúde, para evitar a inclusão de estruturas externas ao nódulo na imagem. As imagens de Tomografia Computadorizada que foram utilizadas neste projeto possuem 4096 níveis de cinza, para fins de eficiência adaptamos estas imagens para que apresentassem apenas 256 níveis de cinza nos permitindo montar uma matriz de coocorrência, de volumes de imagens, de dimensões 256 x 256. Utilizamos 13 posições angulares do entorno de cada voxel para montar a matriz co-ocorrência de cada imagem 3D. A partir das matrizes de co-ocorrência conseguimos extrair os vetores de textura que são utilizados para calcular a distância euclidiana entre as imagens dos nódulos, provendo um nível de similaridade entre elas. Os atributos de textura utilizados neste projeto foram, energia, entropia, matiz, proeminência, variância, momento da diferença inverso, correlação e contraste. Os testes foram realizados utilizando imagens do Lung Imaging Database Consortium (LIDC).
RESULTADOS:
Foi desenvolvida uma interface para a interação do profissional com o software. O uso de matrizes de co-ocorrência 3D demonstraram uma praticidade maior na análise de imagens tridimensionais, pois tomando como exemplo uma imagem 3D que possua 5 fatias, para efetuar a extração e análise de textura desta imagem teríamos que montar 5 matrizes de co-ocorrência 2D para cada posição angular de cada uma das 5 imagens, totalizando 20 matrizes de co-ocorrência 2D a serem analisadas, enquanto que analisando tridimensionalmente só são necessárias 13 matrizes o que nos permite um ganho de performance na análise de textura. Desenvolvemos uma aplicação para cálculo de volume de nódulo, a mesma retorna valores em milímetros cúbicos, medida apropriada de acordo com o tamanho dos nódulos, que variam em média de 3 a 15 mm. O algoritmo de segmentação automática 3D demonstrou alta eficiência no processo de segmentação, os nódulos segmentados utilizando o algoritmo desenvolvido neste projeto diferem em média 3 mm de volume em relação aos mesmos nódulos segmentados de maneira manual. Entretanto este valor é desprezível já que os mesmos nódulos segmentados por profissionais diferentes diferem em até 10 mm de volume médio. O algoritmo de Recuperação de Imagens baseado em textura mostrou uma eficiência de até 70%, já o algoritmo de recuperação baseado em forma mostrou uma eficiência 14,1 superior nos primeiros testes se igualando a técnica te textura posteriormente.
CONCLUSÃO:
Concluímos com base nos resultados apresentados neste projeto que o uso de ferramentas de segmentação 3D demonstram uma precisão bastante satisfatória em relação ao uso de segmentação manual, e o uso de recuperação de imagens baseada na análise de textura pode ser uma ferramenta bastante útil ao diagnóstico dos nódulos pulmonares, fornecendo mais informações que podem levar o profissional com mais convicção ao diagnóstico preciso, além disso os algoritmos de Informação Mutual se mostraram uma nova e promissora abordagem à recuperação de imagem baseada em conteúdo podendo levar o profissional com mais segurança a um diagnóstico preciso.
Instituição de Fomento: FAPEAL
Palavras-chave: Segmentação de Imagem, Análise de Textura, Câncer de Pulmão.