61ª Reunião Anual da SBPC
A. Ciências Exatas e da Terra - 5. Matemática - 5. Probabilidade e Estatística
ANÁLISE DESCRITIVA DO DESBALANCEAMENTO ESTATÍSTICO EM DELINEAMENTOS INTEIRAMENTE CASUALIZADOS PARA TRATAMENTOS DE EFEITO FIXO
Elias Lourenço Vasconcelos Neto 1
Fábio Medeiros Ferreira 1
1. INSTITUTO DE CIÊNCIAS EXATAS E TECNOLOGIA/UNIVERSIDADE FEDERAL DO AMAZONAS
INTRODUÇÃO:

Um dos inconvenientes durante a execução de experimentos é a perda de unidades experimentais (parcelas), ocasionando, assim, o desbalanceamento estatístico. Este fato acontece com freqüência em experimentos agronômicos, cujas entidades (plantas ou animais) podem estar dispostas ao ataques de pragas e doenças, competição entre espécies de plantas na área experimental, intempéries, etc. Até o presente momento não se tem conhecimento de estudos que buscaram investigar a influência da quantidade de parcelas perdidas nas conclusões obtidas pela análise de variância e testes de comparações entre tratamentos. Sabe-se que nos experimentos inteiramente casualizados, o desbalanceamento em nada dificulta a execução das análises, no entanto, não se tem conhecimento até quanto é possível perder parcelas sem prejudicar a inferência do pesquisador, quando comparadas a um experimento balanceado. Para que o presente trabalho pudesse ser realizado, foi necessário fazer uso da simulação computacional, uma vez que avaliações com experimentos reais seriam impraticáveis, do ponto de vista temporal e financeiro. Portanto, objetivou-se averiguar se a perda de parcelas altera as pressuposições necessárias à análise de variância e, ou, modifica as conclusões sobre as comparações entre tratamentos em relação ao conjunto de dados balanceados, por meio da análise descritiva das medidas utilizadas.

METODOLOGIA:

Foram simuladas seis populações (tratamentos) seguindo distribuição normal, com médias paramétricas de 10, 12, 20, 31, 32 e 33, para uma variável hipotética. Considerou-se a homogeneidade das variâncias paramétricas, com valor igual a um (1). Os efeitos de tratamento foram considerados fixos. Dentro de cada população foram amostradas aleatoriamente cinco observações (repetições), totalizando um experimento balanceado com 30 unidades experimentais. Foram consideradas perdas de uma (3,33%) a dezoito (60%) parcelas, com a restrição de manter pelo menos duas parcelas por tratamento, permitindo assim, calcular a variância dentro de cada um deles. No processo de simulação, foram realizadas 10.000 simulações aleatórias para cada uma das situações de desbalanceamento e também para o experimento balanceado, totalizando 380.000 diferentes experimentos simulados. Em cada simulação foram computadas as respectivas análises de variância, teste de homogeneidade de variâncias (Bartlett), medidas de simetria, curtose, estimativas das médias e variâncias dos tratamentos, média geral, coeficiente de variação, teste de Tukey e todos os contrastes possíveis entre médias, além das respectivas probabilidades associadas aos testes realizados. Foram calculadas a média, mediana, variância, desvio padrão, valor mínimo e máximo, além dos percentis 2,5 e 97,5 da distribuição amostral das estatísticas utilizadas. A geração das populações e simulação dos dados foi realizada pelo programa R, disponibilizado em http://www.r-project.org/. Também se fez uso da planilha eletrônica Microsoft Excel 2007, para a compilação e análise dos dados.

RESULTADOS:

Valores médios e medianos das 10.000 simulações para os coeficientes de simetria, curtose, variância do experimento, mantiveram-se próximos para os vários cenários de perda de parcelas. Em termos médios, a média geral e o coeficiente de variação foram mantidos com a perda de parcelas, mas a variação de todas estas medidas entre as simulações tendeu a crescer à medida que se diminui o número de parcelas experimentais. A homocedasticidade foi mantida, mesmo com a perda de parcelas. Na análise de variância, o valor F calculado (Fc) decaiu com a redução do número de parcelas no experimento. No entanto, houve tendência no aumento da variação dos valores simulados de Fc com a queda do número de parcelas. De acordo com as posições das distribuições das populações, esperava-se estimar valores de Fc altamente significativos, o que ocorreu na média das simulações, para todos os cenários de desbalanceamento. Em termos médios, as simulações em todos os cenários mantiveram alta proximidade com os valores simulados em relação ao Quadrado Médio do Resíduo, médias e variâncias dos tratamentos, mesmo quando cada tratamento ficou representado por apenas 2 repetições (60% de perda), porém o aumento na perda de parcelas ocasionou maior variação entre os valores das 10000 simulações. O desbalanceamento não descaracterizou a diferenciação esperadas entre as populações, fato verificado pelo teste de Tukey. Sugere-se novas investigações sobre as influências do desbalanceamento na experimentação, para maiores valores das variâncias paramétricas dos tratamentos e, ou, heterogeneidade entre elas.

CONCLUSÃO:

Em termos gerais o desbalanceamento estatístico não traz prejuízos à inferência do experimento, mesmo considerando perdas de até 60% no número de unidades experimentais, quando comparadas ao experimento balanceamento com 30 parcelas. No entanto, à medida que se diminui o número de parcelas, aumenta-se a chance dos valores das estatísticas consideradas não traduzirem as reais características das distribuições das populações (tratamentos), aspecto percebido nas variações entre as simulações de cada cenário de desbalanceamento.

Instituição de Fomento: CNPq
Palavras-chave: simulação de dados, parcelas perdidas, estatística experimental.