Embrapa Monitoramento por Satélite


ANÁLISE ESTATÍSTICA



9.5.3 Análise de Cluster

Os resultados da análise de cluster foram consolidados em quatro partes: um dendrograma de apresentação dos agrupamentos definidos (Anexo 5), uma tabela relacionando detalhadamente os municípios e o comportamento das as variáveis contidas em cada um dos sub-grupos, a caracterização desses conjuntos de municípios, desenvolvida através da observação do comportamento e distribuição das variáveis utilizadas na sua gênese e, finalmente, um mapa da distribuição dos agrupamentos.

O dendrograma lista os 139 municípios e apresenta diferentes possibilidades de análise, segundo a definição de um maior ou menor Coeficiente de Determinação Múltipla (R2), relacionado ao comportamento das variáveis em cada um dos agrupamentos propostos (Valentin, 2000, p. 52).

O valor de R2 varia de 0 a 1. Quando a variação não explicada constitui uma grande percentagem da variação total, ou seja, a variação explicada é um valor de porcentagem pequeno, o R2 será pequeno. Inversamente, quando a dispersão em torno da reta de regressão é pequena em relação à variação total dos valores, isto significa que a variação explicada responde por uma grande percentagem da variação total, e o R2 será muito mais próximo de 1,0 (Stevenson, 1981, p. 359-360).

A discussão sobre qual valor de Coeficientes de Determinação Múltipla (R2) escolher, para desenvolver a análise dos agrupamentos, levou em consideração o fato de que valores muito pequenos, como R2 = 0,2 ou R2 = 0,4, proporcionaram a formatação de um menor número de agrupamentos, no caso 3 e 4 grupos consecutivamente. Em contrapartida, esses valores de R2 explicaram muito pouco da variação dos dados, isto é, apenas 20% e 40%, consecutivamente.

Por outro lado, a adoção de valores muito elevados de R2, como uma estratégia para explicar a maior variação de dados possível trouxe como conseqüência negativa a formação de um número extremamente grande de agrupamentos, chegando até o limite onde, para explicar 100% da variação dos dados, foi necessário adotar um R2 igual 1,0, com o qual cada município constituiu um "agrupamento" individual isolado, não sendo reconhecida nenhuma similaridade entre eles.

Neste caso, após a avaliação dos custos da interpretação e do ganho de informação, foi definido o valor de R2 igual a 0,8, com o qual houve a geração de 11 agrupamentos.

Para a verificação do comportamento das variáveis em relação aos agrupamentos definidos pela adoção de diferentes valores de R2, as variáveis foram distribuídas em quatro classes, segundo o critério de quebras naturais, onde a identificação de vales e picos definiu os intervalos de classes mais adequados para cada variável.

A Tabela 27 lista os onze agrupamentos de municípios definidos e mostra o resultado da classificação das variáveis, representadas em ordem crescente dos valores, pelas cores verde, amarelo, laranja e vermelho.

Tabela 27: Agrupamentos formados e distribuição das classes de variáveis.

Logicamente, a escolha do valor R2 igual a 0,8 contou com uma considerável dose de subjetividade, em detrimento da possível escolha de valores como 0,75 ou 0,85. Ainda que a opção escolhida não signifique que a análise dos agrupamentos não poderia ter sido desenvolvida, considerando-se outros valores, ela mostrou ser exagerada e detalhista para adoção de valores de R2 maiores e genérica para adoção de valores menores.


back previous next