63ª Reunião Anual da SBPC |
B. Engenharias - 1. Engenharia - 14. Engenharia |
MODELAGEM E ANÁLISE DE TRÁFEGO UTILIZANDO MISTURAS GAUSSIANAS – UM ESTUDO DE CASO PARA O SERVIÇO DE VoIP |
Cheila Mendes de Oliveira 1 Flávio Henrique Teles Vieira 2 Marcos Antônio de Sousa 1 Marco Aurélio de Faria Borges 1 |
1. Escola de Engenharia Elétrica e de Computação – UFG 2. Prof. Dr./Orientador – Escola de Engenharia Elétrica e de Computação – UFG |
INTRODUÇÃO: |
O objetivo deste artigo é apresentar um estudo do tráfego VoIP (Voice over IP) em redes IP. O rápido crescimento da utilização de aplicativos que geram tráfego VoIP requer que modelos adequados para este tipo de tráfego sejam empregados. Propõe-se um estudo para encontrar modelos estatísticos baseados em Misturas Gaussianas devido ao fato de que a soma de distribuições Gaussianas pode representar bem as densidades de probabilidade do tráfego VoIP. Além disso, as Misturas Gaussianas proporcionam uma modelagem precisa para vários tipos de fenômenos cujas densidades de probabilidade podem ser contínuas ou discretas. Modelos precisos podem posteriormente ser usados para maximizar o aproveitamento e o dimensionamento dos recursos da rede, provendo qualidade de serviço (QoS) aos fluxos da rede. Dados reais de tráfego VoIP são coletados em uma rede IP e alguns modelos estatísticos são avaliados. Através de simulações computacionais algumas séries sintéticas são geradas para modelar os dados reais coletados. As abordagens EM (Expectation-Maximization), MDL (Minimum Description Length) e MA (Misturas Adaptativas) são confrontadas com análise estatísticas que medem a qualidade das respostas oferecidas por cada método. |
METODOLOGIA: |
Foram coletados dados em três chamadas usando o software Skype. Mistura Gaussiana é uma modelagem de séries temporais que consiste no agrupamento de densidades de probabilidades gaussianas com características individuais. Para que uma pdf gere uma série semelhante à série coletada é necessário estimar os parâmetros da mistura gaussiana (número de gaussianas, o fator de ponderação, a média e a matriz de covariância). Para estimá-los foram realizadas simulações computacionais usando algoritmos, no software MatLab, baseados nas abordagens: algoritmo EM que executa um cálculo iterativo de estimadores de máxima verossimilhança; no algoritmo MA a idéia básica é obter um ponto de cada vez e determinar a distância a partir da observação de cada componente de densidade dos dados no modelo; e o algoritmo MDL que se baseia no fato de que se existe alguma regularidade nos dados a mesma pode ser usada para comprimi-los. O algoritmo EM foi usado para gerar séries variando o número de gaussianas de 01 até 20, os algoritmos MA e MDL geraram uma série cada. Das séries geradas calcularam-se os valores da média, da variância e do desvio padrão. Para identificar a série sintética com maior semelhança foi calculado o erro percentual para cada abordagem e construído gráficos de densidade das séries. |
RESULTADOS: |
A abordagem EM e a MDL foram as que mostraram os melhores resultados, sendo que em séries que apresentem dados com maior regularidade a abordagem MDL se destaca. A compactação em subclasses dos dados proporciona um número menor de divisões e consequentemente menos parâmetros serão necessários para caracterizar as mesmas, ou seja, na abordagem MDL a carga computacional para estimativa da densidade é menor. A abordagem EM se destacou para aquelas séries com poucas regularidades, mas necessitou de um tempo de processamento maior para estimar a densidade. Observando os gráficos de densidade das séries geradas, nas abordagens EM e MDL, nota-se que os valores das mesmas estão bem próximos da série coletada, com uma pequena vantagem para o MDL. A abordagem das MA apresentou os maiores valores para os erros percentuais entre as médias das séries nas três chamadas. Os gráficos de densidade das séries geradas para as três chamadas, na abordagem das MA, são os que apresentam a maior discrepância nos valores calculados. O método, também, apresentou o maior valor para o número de gaussianas, o que aumenta o volume de informação a ser armazenada e, também, a carga computacional para avaliar as estimativas de densidade. |
CONCLUSÃO: |
Na tentativa de aperfeiçoar os serviços e minimizar os custos muitos modelos de tráfego de redes são criados. Um modelo de tráfego que reconheça todas as características do tráfego real permite controlar o congestionamento e pode evitar uma subestimação ou superestimação no desempenho da rede. Com um bom modelo pode-se fazer previsões das necessidades do presente e do futuro para uma rede. Neste trabalho, o estudo de caso mostrou que é possível obter séries sintéticas com características semelhantes das séries coletadas utilizando misturas gaussianas. Os resultados mostram que a melhor estratégia é fazer o uso das abordagens MDL e do Algoritmo EM, em conjunto, para obter o número ideal de gaussianas para gerar a amostra sintética. Esta estratégia evita a necessidade de se determinar o quanto de regularidade possui a série, para uma posterior escolha do método a ser usado na modelagem do tráfego. |
Palavras-chave: VoIP, Modelagem de Tráfego, Misturas Gaussianas. |