60ª Reunião Anual da SBPC




A. Ciências Exatas e da Terra - 2. Ciência da Computação - 10. Redes

APLICANDO MÉTODOS DE CLUSTERING NA MODELAGEM DE TRÁFEGO DE VÍDEO

Rubens de Souza Matos Júnior1
Ricardo José Paiva de Britto Salgueiro1

1. Departamento de Computação - UFS


INTRODUÇÃO:
A alocação eficiente de recursos para o tráfego de vídeo através de redes de computadores é um desafio. Os padrões de compactação de vídeo digital possuem características próprias, cujo impacto nas redes de computadores vêm merecendo atenção. A maioria destes padrões atribui ao fluxo de dados um comportamento variável, implicando em maiores dificuldades na previsão deste comportamento e conseqüentemente na garantia da qualidade das aplicações de vídeo em rede. Serviços como videoconferência, vídeo sob demanda e IPTV, que exigem gerenciamento rigoroso do tempo de atraso, necessitam de atenção especial para o dimensionamento de buffers e controle de congestionamento. Para auxiliar a modelagem e simulação deste tipo de tráfego, uma abordagem muito utilizada é o agrupamento dos dados do fluxo de vídeo em clusters, para reduzir os efeitos negativos que a variabilidade pode causar aos modelos gerados. Este trabalho apresenta uma análise estatística de vídeos codificados e aborda algumas técnicas de clustering, aplicando-as aos fluxos de vídeo já analisados. Uma nova técnica é introduzida, baseada nos métodos clássicos existentes, a fim de obter um conjunto de clusters mais representativo do fluxo de vídeo original, o que pode levar à melhoria dos resultados da modelagem do tráfego.

METODOLOGIA:
Durante o período desta pesquisa, foram assimilados alguns conhecimentos estatísticos, necessários para o entendimento e realização de análises sobre tráfego de rede. Dentre esses conceitos estão as medidas de tendência central, medidas de dispersão e dependência de longo alcance em séries temporais. Para a implementação de algoritmos de cálculos estatísticos, como o parâmetro de Hurst, houve a colaboração de João Marco Cardoso, bolsista de iniciação científica, cuja pesquisa envolve os conceitos de auto-similaridade e dependência de longo alcance, necessários também para a análise de tráfego de vídeo aqui relatada. Também houve a colaboração do Grupo de Pesquisa em Redes de Computadores - GPRCom, da Universidade Federal de Sergipe - UFS, para o qual este trabalho também apresentou contribuições. Para a ambientação com os fundamentos ligados à produção e tráfego de vídeo e aos métodos de clustering, foram lidos vários artigos científicos da área. Buscou-se também compreender e diferenciar as propriedades dos principais padrões de codificação de vídeo, como MPEG e H263. Partiu-se então para a análise estatística de algumas seqüências de vídeo comumente estudadas na literatura, cujos resultados embasaram propostas para técnicas de clustering adequadas ao fluxo de vídeo codificado.

RESULTADOS:
Dentre os fatores apresentados pelas seqüências de vídeo analisadas, podem ser destacadas a variabilidade intensa, a grande explosividade e a dependência de longo alcance. Verificou-se também que os vídeos com mais mudanças de cena possuem coeficientes de variação maiores do que aqueles que apresentam cenários de fundo pouco variáveis. Algoritmos de clustering como k-means e k+Means são comumente utilizados durante processos de modelagem de fluxo de vídeo, para contornar sua variabilidade. Porém, buscou-se neste trabalho a adição a esses algoritmos de um melhor critério de parada, que garantisse um conjunto de clusters mais coesos, com base nas características do vídeo codificado. O critério testado foi o SIQR (Semi-Interquartile Range, ou distância semi-interquartil). Esta medida, por ser relacionada aos percentis, é mais adequada a distribuições de dados assimétricas, como é o caso observado nos vídeos analisados. Utilizou-se, mais precisamente, a redução dessa medida entre iterações consecutivas, para estabelecer quando o conjunto de clusters atingido já está bastante estável. Os resultados demonstraram que o uso do SIQR, como um critério de parada para o k+Means contribui para que sejam obtidos clusters com menor variação, sem um grande aumento na quantidade total de clusters.

CONCLUSÕES:
Na análise realizada, confirmou-se características do fluxo de vídeo codificado já encontradas na literatura. Destacam-se entre elas a alta variabilidade e a autocorrelação entre quadros distantes. Para que tal variabilidade possa ser modelada, vários autores citam ser essencial efetuar uma classificação que extraia, desse tipo de fluxo de dados, classes com uma variação interna menor. Neste trabalho, foi demonstrada a eficiência do algoritmo k+Means em obter clusters com tal característica. Porém, observou-se a forte dependência desse algoritmo quanto ao coeficiente de variação, que não se trata da métrica mais indicada para o tipo de distribuição de dados apresentado pelo fluxo de vídeo. Desta forma, foi proposta uma variante desse algoritmo, que adiciona a verificação da distância semi-interquartil (SIQR), mais adequada à distribuição assimétrica do vídeo codificado. O algoritmo, nomeado k+Means-SIQR, obteve menores taxas de variação em comparação ao k+Means, sem um grande aumento no número de clusters resultantes. Em trabalhos futuros, serão buscadas novas alternativas aos métodos de clustering trabalhados até então. Também serão avaliados modelos estocásticos que possam aproveitar as qualidades do algoritmo k+Means-SIQR e de outros métodos que venham a ser desenvolvidos.

Instituição de fomento: CNPq

Trabalho de Iniciação Científica

Palavras-chave:  clustering, tráfego de vídeo, explosividade

E-mail para contato: rubens.matos@gmail.com