Berikut ini merupakan hasil skripsi saya sendiri tentang Implementasi Metode Decision Tree Untuk Menentukan Klasifikasi Bangunan Rumah Tinggal Di Bandar Lampung. Semoga halaman ini dapat membantu teman-teman yang ingin mencari referensi dan belajar tentang Algoritma C.45.
Mantul
==ABSTRAK==
Properti merupakan salah satu objek bisnis yang sangat menguntungkan karena kemungkinan penambahan nilai jual yang sangat besar dari waktu ke waktu. Pertumbuhan penduduk di Indonesia setiap tahunnya selalu bertambah sehingga jumlah permintaan kebutuhan akan tempat tinggal juga meningkat. Namun untuk memilih sebuah rumah biasanya konsumen tidak mengetahui klasifikasi dan penilaian bangunan rumah, sehingga menghambat dalam proses pemilihan sebuah rumah.
Pada penggunaan metode “Decision Tree” dalam kasus klasifikasi bangunan rumah tinggal, dengan algoritma C4.5 dapat menentukan klasifikasi dan nilai bangunan rumah tinggal. Metode “Decision Tree “ mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan. Kasus klasifikasi bangunan rumah tinggal dimulai dengan memproses data training menggunakan algoritma C4.5 untuk menjadi pohon keputusan yang merepresentasikan aturan dalam menentukan klasifikasi dan nilai bangunan rumah tinggal.
Dalam proses klasifikasi bangunan rumah tinggal menggunakan metode “Decision Tree “ dan algoritma C4.5 ini dapat menentukan klasifikasi dan penilaian bangunan rumah tinggal serta mengurangi penilaian yang bersifat subjektif.
'''Kata Kunci : Decision Tree, Algoritma C4.5, Klasifikasi Bangunan Rumah'''
==PENDAHULUAN==
'''Latar Belakang'''
Properti merupakan salah satu objek bisnis yang sangat menguntungkan. Properti seperti misalnya rumah, tanah maupun ruko juga merupakan salah satu investasi yang banyak diminati oleh para pebisnis karena kemungkinan penambahan nilai jual yang sangat besar dari waktu ke waktu. Salah satu bagian dari properti adalah bangunan, baik bangunan berupa rumah, gedung, toko dsb. Bangunan rumah ialah salah satu penilaian yang digunakan konsumen untuk menentukan proses pemilihan sebuah rumah.
Seiring berjalannya waktu, pertumbuhan penduduk di Indonesia setiap tahunnya selalu bertambah sehingga jumlah permintaan kebutuhan akan tempat tinggal juga meningkat. Ini terbukti dengan semakin banyak dibangun perumahan baru untuk memenuhi kebutuhan tempat tinggal masyarakat. Namun untuk memilih sebuah rumah biasanya bangunan rumah yang dijual tidak sesuai dengan penilaian (misalnya: ada orang yang ingin membeli rumah tetapi rumah yang dijual bangunannya tidak sesuai kriteria). Hal ini disebabkan, karena konsumen tidak mengetahui klasifikasi dan penilaian bangunan rumah, sehingga menghambat dalam proses pemilihan sebuah rumah.
Padahal, jika masyarakat mengetahui klasifikasi bangunan rumah yang dijual tersebut akan mempermudah dalam proses pemilihan bangunan rumah sesuai yang diinginkan. Situasi tersebut dapat dihindari jika masyarakat memiliki pengetahuan tentang klasifikasi dan penilaian bangunan rumah. Pengetahuan tersebut dapat diperoleh dari buku atau situs-situs yang membahas tentang klasifikasi bangunan rumah. Akan tetapi untuk mempelajari hal tersebut tidaklah mudah, karena selain memerlukan waktu untuk memahaminya, sumber-sumber tersebut juga belum tentu benar.
==METODE PENELITIAN==
'''Sistem Pendukung Keputusan'''
Menurut (Kusrini 2007) ”Pendukung keputusan merupakan sistem informasi interaktif yang menyediakan informasi, pemodelan, dan pemanipulasian data. Sistem itu digunakan untuk membantu pengambilan keputusan dalam situasi yang semiterstruktur dan situasi yang tidak terstruktur, dimana tak seorang pun tahu secara pasti bagaimana keputusan seharusnya dibuat.
'''''Data Mining'''''
''Data mining'' adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan komputer (''machine learning'') untuk menganalisis dan mengekstraksi pengetahuan (''knowledge'') secara otomatis (Hermawati 2013).
'''Klasifikasi'''
Klasifikasi adalah menentukan sebuah ''record'' data baru ke salah satu dari beberapa kategori(''class'') yang telah didefinisikan sebelumnya. Teknik ini dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan hasilnya untuk memberikan sejumlah aturan. Salah satu contoh yang mudah dan popular adalah dengan ''decision tree'' yaitu salah satu metode klasifikasi yang paling populer karena mudah untuk diinterpretasi.
'''''Decision Tree'''''
Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal. Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan. Aturan dapat dengan mudah dipahami dengan bahasa alami. Dan mereka juga dapat diekspresikan dalam bentuk bahasa basis data seperti ‘’Structured Query Language’’ untuk mencari ‘’record’’ pada kategori tertentu (Kusrini 2009).
'''Algoritma C4.5'''
Secara umum Algoritma C4.5 digunakan untuk membangun pohon keputusan adapun langkah-langkah nya sebagai berikut:
Pilih atribut sebagai akar
Buat cabang untuk masing-masing nilai
Bagi kasus dalam cabang
Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama.
Untuk memilih atribut sebagai akar, didasarkan pada nilai Gain tertinggi dari atribut-atribut yang ada. Untuk menghitung Gain digunakan rumus seperti tertera dalam rumus 1 berikut.
Gain(S, A) = Entropy (S) - ∑_(i=1)^n▒(| S_i |)/(| S |) * Entropy(Si) (1)
Dengan:
S : Himpunan kasus
A : Atribut
n : Jumlah partisi atribut A
|Si| : Jumlah kasus pada partisi ke i
|S| : Jumlah kasus dalam S
Sedangkan penhitungan nilai Entropy dapat dilihat pada rumus 2 berikut:
Entropy(S) = ∑_(i=1)^n▒- pi * 〖log〗_2 pi (2)
Dengan :
S : Himpunan Kasus
A : Fitur
n : Jumlah partisi S
pi : Proporsi dari Si terhadap S
'''Metode Waterfall'''
Metode ‘’waterfall’’ merupakan salah satu metode dalam SDLC yang mempunyai ciri khas pengerjaan setiap fase dalam ‘’waterfall’’ harus diselesaikan terlebih dahulu sebelum melanjutkan ke fase selanjutnya. Artinya fokus terhadap masing-masing fase dapat dilakukan maksimal karena tidak adanya pengerjaan yang sifatnya paralel.
'''Tahapan Pengembangan Sistem'''
'''Planning'''
Planning merupakan tahap awal dari pengembangan sistem. Dalam hal ini menentukan proses pengambilan keputusan yang akan dibuat dengan cara menggambarkan sistem, sehingga pengguna dapat mengetahui tentang klasifikasi bangunan rumah yang ditempati.
'''Analysis'''
Analisis dilakukan berdasarkan tahapan Data Knowledge Discovery in Database (KDD). Digunakan untuk menjelaskan proses penggalian informasi tersembunyi dalam suatu basis data yang besar. Dan berikut adalah tahapan dalam keseluruhan proses KDD yaitu :
'''''Knowladge Discovery in Database'''''
'''Data Selection'''
Tahap ini adalah langkah awal untuk menentukan data klasifikasi bangunan rumah. Pengambilan data yang mempengaruhi klasifikasi bangunan rumah yaitu pondasi, struktur bangunan, rangka atap, penutup atap, plafond, dinding, pintu & jendela serta lantai yang dilakukan dalam tahap penggalian informasi dalam Knowledge Discovery in Database.
'''Pre-processing / Cleaning'''
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data selection yang terdiri dari pondasi, struktur, rangka, penutup, plafond, dinding, pintu & jendela dan lantai yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi).
'''Transformation'''
Mentransforamsikan data ke dalam bentuk yang lebih sesuai untuk data mining dalam bentuk coding dari data selection yaitu pondasi, struktur, rangka, penutup, plafond, dinding, pintu & jendela dan lantai yang akan menghasilkan klasifikasi bangunan rumah tinggal dan data yang telah dilakukan cleaning atau pre-processing untuk mempersiapkan data yang akan di masukan ke dalam database yang akan menjadi data training dan di olah untuk klasifikasi bangunan rumah tinggal sesuai dengan metode Decision Tree.
'''Data mining'''
Berikut ini adalah perhitungan pembentukan pohon keputusan dengan menggunakan Algoritma C4.5 pada Gambar 2.3.
Menghitung jumlah kasus, jumlah kasus untuk keputusan Sederhana, jumlah kasus untuk keputusan Menengah Mewah, dan Entropy dari semua kasus dan kasus yang dibagi berdasarkan atribut Pondasi, Struktur, Rangka atap, Penutup atap, Plafond, Dinding, Pintu & Jendela dan Lantai. Setelah itu lakukan perhitungan Gain untuk masing-masing atribut.
Perhitungan Entropy menggunakan rumus 2 :
Entropy (Total) = 0.996791632
Entropy (Pondasi-Tapak) = 0.811278124
Entropy (Pondasi-Struktur) = 0.747784151
Entropy (Struktur-Beton) = 0.863120569
Entropy (Struktur-Rangka) = 0.650022422
Entropy (Rangka-Beton) = 0.811278124
Entropy (Rangka-Kayu) = 0.811278124
Entropy (Penutup-Kodok) = 0.811278124
Entropy (Plafond-Kayu) = 0.811278124
Entropy (Dinding-B.Bata) = 0.970950594
Entropy (Dinding-Batako) = 0.918295834
Entropy (Dinding-Spndex) = 0.918295834
Entropy (Pintu-Kusen III) = 0.721928095
Entropy (Pintu-K.Bening) = 0.811278124
Entropy (Lantai-Marmer) = 0.811278124
Perhitungan Gain menggunakan rumus 1 :
Gain(Total,Pondasi) = 0.996791632 -((8/15*0.811278124)+(7/15*0.747784151) = 0.215144028
Gain(Total,Struktur) = 0.333993065
Gain(Total,Rangka) = 0.347769132
Gain(Total,Penutup) = 0.780450799
Gain(Total,Plafond) = 0.780450799
Gain(Total,Dinding) = 0.3058231
Gain(Total,Pijen) = 0.5398081
Gain(Total,Lantai) = 0.813132465
[https://tourtoba.com wisata danau]
Dari hasil tersebut dapat diketahui bahwa atribut dengan Gain tertinggi adalah Lantai yaitu sebesar 0.813132465. Dengan demikian Lantai dapat menjadi node akar. Dari kelima nilai atribut tersebut, nilai atribut Semen Ekspose, Keramik 30 X 30 sudah mengklasifikasikan kasus menjadi Sederhana dan Keramik 40 X 40, Keramik 60 X 60 sudah mengklasifikasikan kasus menjadi Menengah Mewah, sehingga tidak perlu dilakukan perhitungan lebih lanjut, tetapi untuk nilai atribut Marmer masih perlu dilakukan perhitungan lagi.
Setelah melakukan proses perhitungan node 1, terdapat nilai atribut yang tidak menuju ke hasil. Atribut tersebut perlu dilakukan proses perhitungan untuk menentukan node akar selanjutnya. Perhitungan node selanjutnya yaitu dengan menghitung jumlah kasus yang diawali lantai-marmer yang menuju keputusan Sederhana dan Menengah Mewah. Dan Entropy dari semua kasus yang dibagi berdasarkan atribut Pondasi, Struktur, Rangka atap, Penutup atap, Plafond, Dinding, Pintu & Jendela. Setelah itu lakukan perhitungan Gain dan Entropy seperti perhitungan node 1 untuk masing-masing atribut. Dari hasil tersebut dapat diketahui bahwa atribut dengan Gain tertinggi adalah Penutup atap, Plafond, Dinding, Pintu & Jendela yaitu sebesar 0.918295834. Karena nilai Gain tertinggi lebih dari satu, dengan demikian dapat memilih atribut secara acak. Plafond dapat menjadi node akar selanjutnya. Ada 3 nilai atribut dari Plafond yaitu Triplek, Gypsumboard, Kayu(lambressering).
'''Interpretation / Evaluation'''
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD yang disebut interpretation.
==HASIL PENELITIAN DAN PEMBAHASAN==
'''Hasil Penelitian'''
Pada pembahasan ini menjelaskan hasil perancangan klasifikasi bangunan rumah tinggal di Bandar Lampung yang dirancang untuk memudahkan dalam proses pemilihan rumah.
Pembahasan
Implementasi metode ‘’decision tree’’ untuk menentukan klasifikasi bangunan rumah tinggal di Bandar Lampung ini menjelaskan, masyarakat dapat menetukan klasifikasi bangunan rumah tinggal dengan memilih material bangunan rumah. Setelah selesai memilih material bangunan, maka sistem akan memunculkan hasil klasifikasi bangunan rumah apakah jenis bangunan rumah tersebut Sederhana atau Menengah Mewah serta material yang dipilih oleh user. Sistem klasifikasi bangunan rumah tinggal ini memiliki kelebihan dan kekurangan.
Kelebihan sistem yang berjalan :
Sistem klasifikasi bangunan rumah tinggal ini dapat menentukan jenis bangunan rumah tinggal Sederhana dan Menengah Mewah.
Sistem ini dapat membantu dalam pemilihan bangunan rumah sesuai kriteria.
Sistem ini dapat melakukan perbandingan hasil data training dan data testing.
Kekurangan sistem yang berjalan :
Jumlah data training yang hanya 15 sample.
Sulitnya mengetahui material bangunan rumah seperti pondasi dan struktur pada bangunan rumah yang sudah jadi.
User harus mengetahui tentang material bangunan rumah.
Pengujan Sistem
Setelah tahap pembuatan dilakukan, maka program perlu diuji.
Pengujian dilakukan dengan menjalankan sistem dengan menggunakan laptop dengan alamat local http:/localhost/klasifikasi. Proses berjalan dengan baik, semua tampilan dan menu dapat di akses.
Pengujian dilakukan dengan membandingkan hasil data training dengan hasil data testing.
'''SIMPULAN'''
Simpulan
Berdasarkan latar belakang serta pembahasan-pembahasan pada bab sebelumnya, maka dapat disimpulkan bahwa :
Aplikasi yang dibuat dapat digunakan untuk menentukan klasifikasi bangunan rumah tinggal.
Pada aplikasi klasifikasi bangunan rumah tinggal ini tidak memberikan hasil yang optimal, dikarenakan aplikasi yang dibuat hanya menentukan klasifikasi bangunan rumah tinggal sederhana dan menengah mewah.
==DAFTAR PUSTAKA==
Andriani, A. 2013. ''Sistem Pendukung Keputusan Berbasis Decision Tree Dalam Pemberian Beasiswa Studi Kasus : AMIK BSI Yogyakarta'', Jurnal Seminar Nasional Teknologi Informasi dan Komunikasi, ISSN: 2089-9815 : 163-167. https://fti.uajy.ac.id/sentika/publikasi/makalah/2013/2013_23. (Diakses 21 Juni 2016 10:52 wib)
Augusto, J, dan Mudjihartono. P. 2012. ''Analisis Efektivitas Algoritma C4 .5 dalam Menentukan Peserta Pemenang Tender Projek,'' Jurnal Seminar Nasional Teknologi Informasi dan Komunikasi, ISBN: 978-602-19837-0-6, 7-11. http://demo.pohonkeputusan.com/files/Analisis_Efektivitas_Algoritma_C4.5 dalam_Menentukan_Peserta_Pemenang_Tender_Projek. (Diakses 21 Juni 2016 10:41 wib)
Azmi, Z. et al. 1978. ''Decision Tree Berbasis Algoritma Untuk Pengambilan Keputusan,'' Jurnal Ilmiah Saintikom, 12(3): 157–164. http://lppm.trigunadharma.ac.id/public/fileJurnal/hp7mJurnal%2012-3-2013_1%20zulfian. (Diakses 21 Juni 2016 10:52 wib)
Dipaloka, A. 2016. ''Penerapan Decision Tree untuk Penentuan Pola Data Penerimaan Mahasiswa Baru.'' Jurnal Penelitian Sitrotika, 7(1), ISSN: 1693-9670. https://www.researchgate.net/profile/Aradea_Dipaloka/publication/267757302_Penerapan_Decision_Tree_untuk_Penentuan_Pola_Data_Penerimaan_Mahasiswa_Baru/links/5459dd200cf2bccc4912d6a8.pdf?origin=publication_detail. (Diakses 21 Juni 2016 10:47 wib)
Hermawati, F.A., 2013. ''DATA MINING'', Surabaya: Andi.
Jogiyanto, 2005. ''Analisis dan Desain Sistem Informasi : Pendekatan Terstruktur Teori dan Praktik Aplikasi Bisnis'', Yogyakarta: Andi.
Kusrini, 2009. ''Algoritma Data Mining'', Yogyakarta: Andi.
Kusrini, 2007. ''Konsep dan Aplikasi Sistem Pendukung Keputusan'', Yogyakarta: Andi.
|