Cluster {MVar.pt} | R Documentation |
Realiza analise de cluster hierarquico e nao hierarquico em um conjunto de dados.
Cluster(data, titles = NA, hierarquico = TRUE, analise = "Obs", corabs = FALSE, normaliza = FALSE, distance = "euclidean", method = "complete", horizontal = FALSE, numgrupos = 0, lambda = 2, casc = TRUE)
data |
Dados a serem analizados. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
hierarquico |
Agrupamentos hierarquicos (default = TRUE), para agrupamentos nao hierarquicos (method K-Means), somente para caso analise = "Obs". |
analise |
"Obs" para analises nas observacoes (default), "Var" para analises nas variaveis. |
corabs |
Matriz de correlacao absoluta caso analise = "Var" (default = FALSE). |
normaliza |
Normaliza os dados somente para caso analise = "Obs" (default = TRUE). |
distance |
Metrica das distancias caso agrupamentos hierarquicos: "euclidean" (default), "maximum", "manhattan", "canberra", "binary" ou "minkowski". Caso analise = "Var" a metrica sera a matriz de correlacao, conforme corabs. |
method |
Metodo para analises caso agrupamentos hierarquicos: "complete" (default), "ward.D", "ward.D2", "single", "average", "mcquitty", "median" ou "centroid". |
horizontal |
Dendrograma na horizontal (default = FALSE). |
numgrupos |
Numero de grupos a formar. |
lambda |
Valor usado na distancia de minkowski. |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Varios graficos.
tabres |
Tabela com as similaridades e distancias dos grupos formados. |
groups |
Dados originais com os grupos formados. |
resgroups |
Resultados dos grupos formados. |
sqt |
Soma do quadrado total. |
mtxD |
Matriz das distancias. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
MINGOTI, S. A. analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
FERREIRA, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
RENCHER, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
data(DataQuan) # conjunto de dados quantitativos data <- DataQuan[,2:8] rownames(data) <- DataQuan[1:nrow(DataQuan),1] Res <- Cluster(data, hierarquico = TRUE, analise = "Obs", corabs = FALSE, normaliza = FALSE, distance = "euclidean", method = "ward.D", horizontal = FALSE, numgrupos = 2) print("Tabela com as similaridades e distancias:"); Res$tabres print("Grupos formados:"); Res$groups print("Tabela com os resultados dos grupos:"); Res$resgroups print("Soma do quadrado total:"); Res$sqt print("Matriz de distancias:"); Res$mtxD write.table(file=file.path(tempdir(),"SimilarityTable.csv"), Res$tabres, sep=";", dec=",",row.names = FALSE) write.table(file=file.path(tempdir(),"Groupeddata.csv"), Res$groups, sep=";", dec=",",row.names = TRUE) write.table(file=file.path(tempdir(),"GroupResults.csv"), Res$resgroups, sep=";", dec=",",row.names = TRUE)