Fuzzy Clustering

            Fuzzy clustering adalah salah satu teknik untuk menentukan cluster optimal dalam suatu ruang vektor yang didasarkan pada bentuk normal Euclidan untuk jarak antar vektor. Fuzzy clustering sangat berguna bagi pemodelan fuzzy terutama dalam mengidentifikasikan aturan – aturan fuzzy.

             Proses clustering pada dasarnya merupakan proses pembuatan gugus atau himpunan yang memiliki anggota elemen-elemen yang akan dicluster. Pada algoritma clustering non–fuzzy, nilai keanggotaan suatu elemen terhadap gugus    atau cluster dinyatakan sebagai 0 atau 1, artinya setiap dokumen hanya bisa menjadi anggota satu cluster (1 sebagai anggota dan 0 bukan anggota). Padahal, jika informasi tentang data ditinjau kembali, satu data dapat menjadi anggota lebih dari satu cluster dengan derajat keanggotaan tertentu. Dengan fuzzy clustering, data dapat menjadi anggota beberapa cluster sekaligus.

Fuzzy C–Means (FCM)

            Ada beberapa algoritma fuzzy clustering, salah satu diantaranya adalah Algoritma Fuzzy C–Means (FCM). FCM adalah suatu teknik clustering data dengan keberadaan setiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981.

            Konsep dasar FCM, pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi rata–rata untuk tiap–tiap cluster. Pada kondisi awal, pusat cluster ini belum akurat. Setiap titik data memiliki derajat keanggotaan untuk setiap cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan setiap titik data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimisasi fungsi objektif yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut. Output Fuzzy C–Means (FCM) adalah deretan pusat cluster dan derajat keanggotaan terhadap setiap cluster.

Flowchart Fuzzy Clustering C-Means

Fuzzy Substractive Clustering (FSC)

            Fuzzy Substractive Clustering (FSC) didasarkan atas ukuran kerapatan    (potensi) titik–titik data dalam suatu ruang (variabel). Konsep dasar dari pengklasteran subtraktif adalah menentukan daerah–daerah dalam suatu variabel yang memiliki potensi tinggi terhadap titik–titik di sekitarnya. Titik–titik dengan jumlah tetangga terbanyak akan dipilih sebagai pusat cluster.  Titik yang sudah terpilih sebagai pusat cluster ini kemudian akan dikurangi potensinya. Kemudian algoritma akan memilih titik lain yang memiliki tetangga terbanyak untuk dijadikan pusat cluster yang lain. Hal ini akan dilakukan berulang–ulang hingga semua titik diuji.

             Fuzzy C–Means (FCM) adalah algoritma clustering yang terawasi, sebab pada Fuzzy Substractive Clustering (FCM) kita  harus terlebih dahulu menentukan banyaknya cluster yang akan dibentuk. Menentukan banyaknya cluster yang tepat merupakan permasalahan utama dalam pendekatan ini. Apabila banyaknya cluster belum diketahui, maka kita harus menggunakan algoritma yang tidak terawasi (banyak cluster ditentukan oleh algoritma). Fuzzy Substractive Clustering (FSC) merupakan algoritma clustering yang tidak terawasi yang diperkenalkan pertama kali oleh Chiu pada tahun 1994.

            Algoritma subtractive clustering dibangun berdasarkan ukuran kepadatan (density) titik data dalam suatu ruang (peubah). Konsep dasar subtractive  clustering adalah menentukan daerah peubah yang memiliki kepadatan data yang tinggi. Titik dengan jumlah tetangga terbanyak akan dipilih sebagai pusat cluster. Titik yang terpilih akan dikurangi tingkat kepadatannya. Kemudian algoritma akan memilih titik lain yang memiliki tingkat kepadatan tertinggi lainnya untuk dijadikan sebagai pusat cluster yang lain.

           Penerimaan dan penolakan suatu titik data menjadi pusat cluster ditentukan oleh nilai rasio terima dan rasio tolak. Rasio adalah perbandingan nilai densitas data pada perulangan ke-i (i > 1) dengan nilai densitas data pada perulangan pertama (i = 1). Rasio terima dan rasio tolak merupakan konstanta bernilai antara 0 dan 1 yang digunakan sebagai ukuran untuk menerima dan menolak sebuah titik data kandidat pusat cluster menjadi pusat cluster.

            Kondisi yang mungkin terjadi pada rasio terima dan rasio tolak :

  1. Jika rasio > rasio terima, maka titik data tersebut dapat diterima sebagai pusat cluster baru.
  2. Jika rasio tolak < rasio < rasio terima, maka kandidat pusat cluster dapat diterima sebagai pusat cluster jika kandidat pusat cluster memiliki jarak yang cukup jauh dengan pusat cluster terdekat (rasio + jarak dengan pusat cluster terdekat ≥ 1)
  3. Jika rasio ≤ rasio tolak, maka sudah tidak ada lagi titik data yang akan dipertimbangkan sebagai pusat cluster, perulangan dihentikan.

Tulisan terkait:

Pengelompokan Citra Sampel Air Sungai Dengan Metoda Fuzzy Clustering C-Means

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s