62ª Reunião Anual da SBPC
A. Ciências Exatas e da Terra - 5. Matemática - 5. Probabilidade e Estatística
ANÁLISE EM COMPONENTES PRINCIPAIS: ESTUDO DE PADRÕES DE VARIABILIDADE TEMPORAL DA PRECIPITAÇÃO NO ESTADO DA PARAÍBA
Elisângela da Silva Rodrigues 1
Pollyanna Kelly de Oliveira Silva 1
Fábio Azevedo de Souza 1
Josemir Ramos de Almeida 2
1. Departamento de Matemática e Estatística, Universidade Estadual da Paraíba/UEPB
2. Departamento de Estatística, Universidade Federal da Paraíba/UFPB
INTRODUÇÃO:
A teoria estatística de análise multivariada foi elaborada bem antes do advento dos computadores, mas ela estava esquecida até o momento em que o poder computacional tornou-se disponível para a execução de cálculos cada vez mais complexos. A análise multivariada é um conjunto de técnicas para análise de dados que está em crescente expansão, dentre as mais utilizadas está a análise de componentes principais que consiste em transformar um conjunto de variáveis, em um conjunto menor não correlacionado. Essas novas variáveis são combinações lineares das variáveis originais e derivadas em ordem decrescente de importância tal que, a primeira componente principal é combinação linear normalizada com variância máxima. Este método analisa quais variáveis explicam a maior parte da variabilidade total dos dados, reduz, reuni, simplifica e investiga, revelando a relação existente entre as variáveis. O método de Componentes Principais será aplicado a dados de precipitação, o qual refere-se à queda de partículas de natureza hídrica, sólidas ou líquidas, sobre a superfície da terra, avaliando a distribuição espacial e temporal da chuva no Estado da Paraíba e redimensionando o número de variáveis a serem discutidas.
METODOLOGIA:
Utilizou-se séries pluviométricas mensais de 97 estações meteorológicas distribuídas espacialmente no estado da Paraíba, que possuem no mínimo trinta (30) anos de observações (período entre 1962-2001). Estes dados foram disponibilizados pelo Departamento de Ciências Atmosféricas (DCA) da Universidade Federal de Campina Grande (UFCG). Foram feitas médias anuais e mensais da precipitação para as estações abordadas. A análise de componentes principais será feita a partir das médias mensais da precipitação que se organizaram num arquivo de trabalho disposto sobre a forma de matriz Xnxp, onde os Xij representam a i-ésima observação da j-ésima estação. Assim obteve-se uma matriz N(97x12), onde n é o numero de linhas correspondentes as 97 estações e p o número de colunas corresponde aos 12 meses do ano para a análise temporal. A matriz obtida foi os dados de entrada para software estatístico específico em microcomputador para o cálculo da Análise de Componentes Principais e a partir das informações obtidas foram gerados mapas para visualização espacial dos resultados. Foram utilizados para este fim o programa SPSS 13.0 (Statistical Package for the Social Sciences), o programa Excel 2007 e o programa SURFER.
RESULTADOS:
A aplicação da análise de componentes principais foi avaliada através do teste de esfericidade de Barllett (2457,959) e da estatística do KMO (0,873). Além disso, pelo critério da variância explicada as componentes retidas totalizam mais de 91% da variância total dos dados e pela análise do screet-plot percebe-se um forte decaimento até o terceiro autovalor tornando-se quase paralelas ao eixo das abscissas, logo retém-se apenas as duas primeiras componentes. Com o método de rotação VARIMAX, analisando apenas as duas primeiras componentes, percebe-se que a porcentagem da variância explicada da primeira componente antes da rotação é de 54,801% e após a rotação de 51,438%, já a segunda componente apresenta 36,311% antes da rotação e 38,219% depois da rotação. Observa-se ainda, que a primeira CP apresenta forte correlação positiva, superior a 0,8 nos meses de maio a outubro. A distribuição espacial correspondente a este fator tem cargas fatoriais positivas maiores que 1 no litoral leste do estado. A segunda CP apresenta forte correlação positiva, superior a 0,8 entre os meses de dezembro a abril. A configuração espacial associada a esse fator, evidência cargas fatoriais positivas maiores que 1 bem definidas na porção oeste do estado.
CONCLUSÃO:
A precipitação do Estado da Paraíba para o período de 1962 - 2001 mostram que dentre doze variáveis analisadas (meses de janeiro a dezembro) apenas duas componentes foram retidas, utilizando o critério de Kaiser e o screet-plot. Para a validação dos dados utilizou-se o teste de esfericidade de Barllett e da estatística de KMO, classificando-o como bom. As componentes retidas mostram particularidades sazonais nos dados climatológicos, evidenciando os dois principais regimes pluviométricos, bem como os sistemas meteorológicos que influenciam esses regimes no Estado da Paraíba. A primeira componente apresenta fortes correlações entre os meses de maio a novembro, atuando de forma mais significativa na parte leste do Estado, devido principalmente as Ondas de Leste e aos Sistemas de Brisas, evidenciando o período chuvoso dessa região. A segunda componente evidencia fortes correlações entre os meses de dezembro a abril, principalmente na parte oeste do estado com influência direta da ZCIT e do VCAN, além das Linhas de Instabilidade, sendo responsáveis pelas chuvas na região do sertão. Podemos afirmar ainda que a Análise de Componentes Principais, é valida para dados meteorológicos mostrando as diferenças significativas na distribuição espacial da chuva no Estado da Paraíba.
Palavras-chave: COMPONENTES PRINCIPAIS, VARIÂNCIA EXPLICADA, KMO.