IMPRIMIR VOLTAR
A. Ciências Exatas e da Terra - 2. Ciência da Computação - 6. Inteligência Artificial e Redes Neurais
USO DE TÉCNICAS COMPUTACIONAIS NA CLASSIFICAÇÃO DE REGIÕES
Leonardo Bezerra Silva Júnior 1
Leonardo Nogueira Matos 1
Marcos Aurélio Santos da Silva 2
(1. Depto. De Ciências da Computação e Estatística, Universidade Federal de Sergipe ; 2. Laboratório de Geotecnologias Aplicadas - Embrapa Tabuleiros Costeiros)
INTRODUÇÃO:
Em diferentes campos do conhecimento e para as mais diversas situações, é importante levar em consideração a posição espacial dos elementos para observação e entendimento dos mais diversos fatos. Em se tratando da geografia, um problema dessa estirpe é bastante comum: A regionalização, um procedimento de classificação de regiões. As mais diferentes regionalizações (criadas com os mais diferentes dados e focos) permitem aos pesquisadores inferir valiosas informações sobre a região estudada. Com a difusão dos meios eletrônicos para consulta e extração de dados e dos SIGs, a malha de dados geográfica tem crescido consideravelmente, permitindo novos tipos de análises de dados. Assim, novas técnicas de regionalização estão sendo desenvolvidas e otimizadas, procurando proporcionar melhores partições, criadas de forma mais eficiente. Nesse trabalho procuramos investigar a utilização de duas técnicas no problema de classificação de regiões: A AGM (Árvore Geradora Mínima), um método de particionamento de grafos, que gera regiões que respeitam uma relação de contigüidade (as regiões devem ser vizinhas no plano espacial), e o SOM (Kohonen Self-Organizing Maps), um método de aprendizagem não supervisionada de redes neurais, que gera uma distribuição onde só os dados representativos são levados em consideração. Dessa forma, procuramos contribuir, com métodos mais eficientes e simples, com a problemática da Regionalização hoje: Atrelada a métodos estatísticos de complexa execução e depuração. Utilizaremos como estudo de caso o estado de Sergipe, onde se fez necessário um estudo sobre a distribuição de terras na região para estudos exploratórios.
METODOLOGIA:
A AGM consiste em reduzir o mapa das áreas a um grafo onde cada nó representa uma área e áreas vizinhas são ligadas por uma aresta, à qual existe um custo relacionado ao grau de dissimilaridade entre as áreas. Então, são eliminadas as (n-1) arestas com maior peso, formando n grupos. O SOM consiste em mapear vetores de entrada de um espaço IRn qualquer, para um espaço vetorial menor, fazendo com que os vetores de entrada “associem-se” com o conjunto de neurônios que melhor os representam. Para validar e selecionar a melhor partição do resultado da rede, usamos o índice de validação CDbw (Compose Density between and within clusters). O índice CDbw representa a densidade dos clusters (o quão próximo os dados de um mesmo cluster estão entre si) e a distinção entre eles(o quão distante os clusters estão entre si), sendo melhor quanto maior for o seu valor. Os dados utilizados para comparação foram do censo agropecuário de 1995/1996 relacionados à utilização da terra no estado. São eles: O número de Lavouras Permanentes e Temporárias, de Pastagens Naturais e Artificiais, de Matas Naturalmente Plantadas e de Lavouras de Descanso Produtivas Não Utilizadas de cada município do estado, padronizados.
RESULTADOS:
Depois de uma busca exaustiva, fora encontrada uma rede considerada ótima (por ter um bom CDbw e um número mediano de clusters formados) para o problema abordado. Foram encontradas redes com melhor CDbw mas que por gerar número grande de grupos foram desconsiderados na pesquisa. A rede encontrada fora 14x10 com Raio Inicial de 15, CDbw: 243,127, gerando 16 Grupos, utilizando aprendizagem em Lote. Para efeito de comparação, foram gerados dois mapas, um pelo método AGM e outro pelo SOM. No mapa gerado pelo método AGM observou-se a formação de zonas, com uma distribuição regular das mesmas em toda a região. Fora observado também que, em geral, as zonas não tinham um caráter unitário. No mapa gerado pelo método SOM observou-se que apesar da condição de contigüidade intrínseca ao algoritmo AGM ser inexistente no SOM, a distribuição espacial dos dois métodos fora bastante similar, demonstrando a tendência de que regiões vizinhas tendem a serem parecidas.
CONCLUSÕES:
A condição de contigüidade imposta pelo método AGM força a adição de certos elementos que são mais afins a um outro grupo (que podem não estar necessariamente próximos fisicamente) em um dos grupos vizinhos cuja relação de dissimilaridade seja menor, ou, em um caso extremo, a criação de um grupo unitário. Por essas características, a AGM torna-se uma ferramenta ideal para problemas envolvendo zoneamento: classificação de certa região em micro-regiões contíguas, como por exemplo, a subdivisão de uma dada área em uma malha de plantios. Sem essa condição, o SOM mostra similaridades de forma mais expressiva e revela comportamentos, às vezes, inesperados dentro de uma região. Uma região pode estar em um grupo dissociado daqueles de regiões circunvizinhas. Esta característica permite que a análise exploratória de dados com SOM produza resultados mais relevantes para auxiliar tomadas de decisões, pois nem sempre a formação de grupos é influenciada pela existência de contigüidade espacial. O SOM, apesar de poder ser usada para problemas de regionalização também, já que foi verificado que as classificações resultantes (usando parâmetros apropriados) são espacialmente semelhantes, mostra-se mais útil em problemas onde seja necessária uma análise exploratória da região, como o caso de uso. Aplicadas corretamente (para o problema adequado) ambas as técnicas fornecem ótimos resultados no referente à qualidade e confiabilidade das partições, permitindo que uma gama de análises sejam feitas.
Trabalho de Iniciação Científica  
Palavras-chave: Classificação de Regiões; Redes Neurais; Regionalização.
Anais da 58ª Reunião Anual da SBPC - Florianópolis, SC - Julho/2006