Langsung ke konten utama

Postingan

Menampilkan postingan dari Desember, 2017

Contoh Data Mining: Keputusan Bermain Tenis Dengan Algoritma C 4.5

Algoritma  C  4.5  adalah  salah  satu  metode  untuk  membuat  decision  tree berdasarkan  training  data  yang  telah  disediakan.  Algoritma  C  4.5  merupakan pengembangan  dari  ID3.  Beberapa  pengembangan  yang  dilakukan  pada  C  4.5 adalah sebagai  antara  lain  bisa  mengatasi  missing  value, bisa  mengatasi  continue data, dan pruning. Pohon  keputusan  merupakan  metode  klasifikasi  dan  prediksi  yang  sangat kuat  dan  terkenal.  Metode  pohon  keputusan  mengubah  fakta  yang  sangat  besar menjadi  pohon  keputusan  yang  merepresentasikan  aturan.  Aturan  dapat  dengan mudah dipahami  dengan bahasa alami.  Dan  mereka juga dapat  diekspresikan dalam bentuk  bahasa  basis  data  seperti  Structured Query  Language  untuk  mencari record    pada    kategori    tertentu.   Pohon    keputusan   juga    berguna    untuk mengeksplorasi  data,  menemukan  hubungan  tersembunyi  antara  sejumlah  calon variabel input dengan sebuah variabel target.Karena  pohon  keputusa

Tahapan Preproscessing/Cleaning Pada Data Mining

Assalamualaikum wr wb Tidak berasa perkuliahan sudah memasuki tahapan akhir tentu memulai mencari dan mengumpulakan data serta menyusunan metode yang tepat dalam menyusun tesis, bahan dari tesis  harus benar dalam bentuk penelitian dan bermanfaat tentunya. Masih bingung kira- kira akan mengambil judul atau metode apa ya? Boleh kok klo memakai metode-metode dalam data mining seperti clastering moupun decicion tree. Bertepatan dengan tugas yang diberikan bapak dosen untuk membahas beberapa judul bahasan tentang Tahapan data mining diantaranya:data cleaning/prepossessing,data integrase,data seleksi,data transformasi,paterrern evolusi  saya akan memilih preprosesing pada data mining. Untuk pengertian,fungsi dan lainnya tentang data mining  bisa dibahas kapan-kapan ya viewer J Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data yang menjadi fokus KDD ( knowledge discovery in Data) . Proses cleaning mencakup antara lain membuang duplikasi data, me