Analisis Cluster

Analisis cluster ialah suatu analisis statistik peubah ganda yang bertujuan untuk mengklasifikasikan sekelompok obyek kedalam beberapa cluster/kelompok berdasarkan ukuran kemiripan atau persamaan karakteristik umum antar obyek-obyek tersebut sehingga obyek-obyek yang berada dalam satu cluster akan mempunyai kemiripan satu dengan yang lainnya. Obyek bisa berupa produk (barang dan jasa), orang (responden, konsumen, dll), serta benda (tumbuhan, hewan, dsb).

Tujuan analisis Cluster adalah :

  1. Mengetahui ada tidaknya perbedaan yang nyata (signifikan) antar kelompok yang terbentuk, dalam hal ini cluster yang dihasilkan.
  2. Melihat profil serta kecenderungan-kecenderungan dari masing-masing cluster yang terbentuk.
  3. Melihat posisi masing-masing obyek terhadap obyek lainnya dari cluster yang terbentuk.

Cluster dikatakan baik jika mempunyai :

  • Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster (within-cluster)
  • Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster lainnya (between cluster).

Asumsi yang harus dipenuhi pada analisis cluster :

  1. Data yang representatif, sample yang diambil benar-benar bisa mewakili populasi yang ada.
  2. Multikolinearitas, yaitu kemungkinan adanya korelasi antar objek, sebaiknya tidak ada. Jika ada, besarnya multikolinearitas tersebut tidaklah tinggi (kurang dari 0.5)

Analisis Cluster ini terdiri dari beberapa proses dasar, yaitu :

  • Mengukur kesamaan antar obyek (similarity), biasanya menggunakan metode Euclidean Distance (mengukur jarak antara dua obyek).
  • Dilakukan proses standardisasi, jika satuan data (variabel) bervariasi.
  • Membuat Cluster, ada dua metode :
  1. HIERARCHICAL METHOD, ialah metode yang memulai pengelompokannya dengan dua atau lebih obyek yang mempunyai kesamaan paling dekat, kemudian proses dilanjutkan ke obyek lain yang mempunyai kedekatan kedua. Demikian seterusnya sehingga cluster akan membentuk semacam ”pohon” dimana ada hierarki (tingkatan) yang jelas antar obyek, dari yang paling mirip sampai dengan yang paling tidak mirip.
  2. NON-HIERARCHICAL METHOD, ialah metode yang dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan dan kemudian baru dilakukan proses cluster tanpa mengikuti proses hierarki. Biasa disebut metode K-Means Cluster.
  • Melakukan interpretasi terhadap cluster yang telah terbentuk.
  • Melakukan validasi dan profiling cluster.

1 Response to “Analisis Cluster”


  1. 1 sofya laeli Januari 28, 2014 pukul 8:54 am

    Terima kasih. Sangat membantu sekali artikelnya🙂


Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s




Calendar

Maret 2011
S S R K J S M
« Nov   Nov »
 123456
78910111213
14151617181920
21222324252627
28293031  

%d blogger menyukai ini: