IMPRIMIR VOLTAR
A. Ciências Exatas e da Terra - 2. Ciência da Computação - 8. Processamento Paralelo e Distribuído
MONITORAÇÃO DE PROCESSOS EM AGLOMERADOS DE COMPUTADORES UTILIZANDO GANGLIA
Marcelo Veiga Neves 1, Tiago Scheid 1 e Andrea Schwertner Charão 2
1- Curso de Ciência da Computação/LSC/CT/UFSM 2- Depto. de Eletrônica e Computação/CT/UFSM, UNIVERSIDADE FEDERAL DE SANTA MARIA - UFSM
Um aglomerado (cluster) de computadores é um sistema de computação paralela composto por um conjunto de computadores independentes (nós) trabalhando de forma integrada como se fosse um recurso computacional único. Os clusters estão entre as arquiteturas paralelas mais utilizadas atualmente, pois podem prover um alto poder computacional com uma boa relação de custo por desempenho. A fim de facilitar o gerenciamento de clusters, e também das aplicações que neles são executadas, é comum a utilização de ferramentas de monitoração. Dentre os sistemas de monitoração de clusters mais utilizados atualmente, destaca-se a ferramenta Ganglia. Este sistema permite monitorar federações de clusters de forma hierárquica, a partir da coleta de informações (métricas) em cada nó do sistema (uso de CPU, memória, rede, etc.). Em sua versão atual, Ganglia não permite monitorar os processos que compõem uma aplicação paralela. Neste trabalho desenvolveu-se uma extensão de Ganglia para monitorar a utilização de recursos alocados à processos. Primeiramente, foram implementadas rotinas para coleta de informações relevantes sobre um processo. Essas rotinas foram usadas na construção de um programa monitor que é lançado em todos os nós do cluster. Cada monitor localiza o processo da aplicação no nó local e acompanha sua execução colhendo métricas e enviando a Ganglia. A fim de avaliar o sistema implementado, utilizou-se uma aplicação que resolve as equações de Navier-Stokes em um caso clássico na área de mecânica dos fluidos (problema da cavidade), utilizando um método numérico multigrid. Após monitorar execuções da aplicação, foi possível identificar comportamentos que evidenciam problemas de desempenho, tais como desequilíbrios de carga e intrusão de processos externos à aplicação. É importante ressaltar que esses comportamentos não seriam facilmente detectados sem a extensão de Ganglia.
Instituição de fomento: CNPq
Trabalho de Iniciação Científica
Palavras-chave:  processamento paralelo; monitoração de aplicações

Anais da 57ª Reunião Anual da SBPC - Fortaleza, CE - Julho/2005