Başlık:
Veri madenciliği yöntemleri ve R uygulamaları : kavramlar, modeller, algoritmalar
Yazar:
Altunkaynak, Bülent.
ISBN:
9789750253478
9789750275180
Yazar Ek Girişi:
Basım Bilgisi:
Genişletilmiş 2. baskı.
Fiziksel Tanımlama:
254 sayfa ; 2019.
Seri:
Seçkin Yayıncılık Fen Bilimleri ; no: 51.
Genel Not:
Özellik Seçim Yöntemleri - Sınıflandırma Yöntemleri - Sınıflandırma Kalitesinin Ölçümü - Birliktelik Kuralları - Kümeleme Yöntemleri - Kümeleme Kalitesinin Ölçümü - İkili Kümeleme (Biclustering) Algoritmaları - İkili Kümeleme Değerlendirme Ölçüleri - Gen Verileri - R Uygulamaları
İçerik:
İçindekiler 7 Önsöz 11 Bölüm 1 GİRİŞ 13 1.1. TANIM 13 1.2. KULLANIM ALANLARI 15 1.3. KULLANILAN YÖNTEMLER 17 1.3.1. Özellik seçim 17 1.3.2. Sınıflandırma 18 1.3.3. Birliktelik 18 1.3.4. Kümeleme 18 SORULAR 19 Bölüm 2 ÖZELLİK SEÇİM YÖNTEMLERİ 21 2.1. RELIEF 23 2.2. Kİ-KARE 24 2.3. ERGS 29 2.3.1. Etkin aralıkların hesaplanması 29 2.3.2. Algoritma 30 2.4. IFSER 31 SORULAR 32 Bölüm 3 SINIFLANDIRMA YÖNTEMLERİ 35 3.1. KARAR AĞACI ALGORİTMALARI 35 3.1.1. ID3 Algoritması 38 3.1.2. C4.5 (J48) Algoritması 50 3.1.3. CART Algoritması 59 3.1.4. CHAID Algoritması 92 3.1.4.1. Ki-kare istatistiğinin hesaplanması 93 3.1.5. Karar Ağacının Budanması 102 3.2. KURAL TEMELLİ ALGORİTMALAR 110 3.2.1. ZeroR Yöntemi 110 3.2.2. OneR Yöntemi 112 3.3. BAYES SINIFLANDIRMA 119 3.4. k KOMŞU YÖNTEMİ 127 3.5. SINIFLANDIRMA KALİTESİNİN ÖLÇÜMÜ 130 3.5.1. Veride Ayrıştırma 131 3.5.1.1. Yüzdesel Bölme (Percentile Split) 131 3.5.1.2. n-Bölme (n-fold) 131 3.5.1.3. Tekrarlı n-Bölme (Repeated n-fold) 132 3.5.1.4. 1 Eksiltme (Leave-one-out) 132 3.5.2. Sınıflandırma Kalitesine İlişkin Ölçüler 135 SORULAR 138 Bölüm 4 BİRLİKTELİK KURALLARI 141 4.1. APRIORI ALGORİTMASI 141 2.1.1. Destek (support) 142 2.1.2. Güven (confidence) 143 2.1.3. Kaldıraç (lift) 143 4.2. AYIRMA ALGORİTMASI 151 SORULAR 153 Bölüm 5 KÜMELEME YÖNTEMLERİ 155 5.1. TANIMLAR 156 5.1.1. Centroid 156 5.1.2. Medoid 156 5.1.3. Radius 156 5.1.4. Diameter 156 5.2. UZAKLIK ÖLÇÜLERİ 161 5.2.1. Gözlemler arasındaki uzaklıkların hesaplanması 161 5.2.2. Kümeler arasındaki uzaklıkların hesaplanması 164 5.3. BÖLÜNMELİ KÜMELEME YÖNTEMLERİ 167 4.3.1. k-Ortalama 167 4.3.2. k-Medoid 170 5.4. HİYERARŞİK KÜMELEME YÖNTEMLERİ 173 5.4.1. Birleştirici hiyerarşik kümeleme (AGNES) 173 5.4.2. Ayrıştırıcı hiyerarşik kümeleme (DIANA) 178 5.5. YOĞUNLUK TABANLI KÜMELEME YÖNTEMLERİ 185 5.5.1. DBSCAN 185 5.6. KÜMELEME KALİTESİNİN ÖLÇÜMÜ 191 5.6.1. Dışsal (External) Ölçüler 192 5.6.1.1. Saflık (Purity) ölçüsü 194 5.6.1.2. F-ölçüsü 194 5.6.1.3. Koşullu entropi 197 5.6.1.4. Karşılıklı bilgi ölçüsü 198 5.6.1.5. Bilgi değişimi ölçüsü 198 5.6.2. İçsel (Internal) Ölçüler 203 5.6.2.1. BetaCV ölçüsü 206 5.6.2.2. C-indeksi 207 5.6.3. Göreli (Relative) Ölçüler 209 5.6.3.1. Calinski-Harabasz indeksi 209 SORULAR 213 Bölüm 6 İKİLİ KÜMELEME (BICLUSTERING) 215 6.1. GİRİŞ 215 6.1.1. İkili Küme Türleri 217 6.1.2. İkili Kümelerin Yapıları 218 6.2. CC ALGORİTMASI 219 6.2.1. Kümeleme sonuçlarının incelenmesi 229 6.3. GEN VERİLERİ 232 Bölüm 7 R: TEMEL BİLGİLER 235 7.1. TEMEL ARİTMETİK İŞLEMLER 237 7.2. VEKTÖRLER VE MATRİSLER 238 7.3. TEMEL İSTATİSTİKSEL ANALİZLER 244 7.4. TEMEL GRAFİK İŞLEMLERİ 247 Kaynaklar 249 Kavram Dizini 253
Özet:
İlk baskısı kısa sürede tükenen kitabın genişletilmiş 2. baskısında ilk baskıdan farklı olarak iki yeni bölüm eklenmiştir. Bu bölümlerden birincisi özellik seçim yöntemleridir (Bölüm 2). Bu bölümde, özellik seçimiyle ilgili güncel filtreleme algoritmalarından bazıları sunulmuştur. İkinci bölüm ise son yıllarda oldukça popüler çalışma alanlarından birisi olan ikili kümeleme (biclustering) yöntemleri ile ilgilidir (Bölüm 6). İkili kümeleme yöntemlerin gen verilerinde yaygın bir şekilde kullanılmaya başlanmasından dolayı bu bölüm gen analizleriyle ilgili çalışan araştırmacılar için temel teşkil edecektir. Kitap, özellikle İstatistik, Endüstri Mühendisliği, Bilgisayar Mühendisliği, İşletme, Ekonometri ve Biyoistatistik gibi bölümlerde gerek lisans gerekse lisansüstü okutulan "Veri Madenciliği" dersinin içeriğine uygundur. Kitap, bu alanlara ek olarak büyük veri analizi, biyoinformatik, resim işleme gibi alanlarında çalışan araştırmacılar için de yardımcı kaynak niteliğindedir. Bu kitap öğrenciler ve araştırmacılar tarafında anlaşılması kolay bir dille yazılmıştır. Veri madenciliği algoritmaları adım adım verilerek uygulamalarla birlikte desteklenmiştir. Elde çözümü yapılan her bir örneğin, R ortamında da çözülmesi ve yorumlanmasıyla konuların daha iyi bir şekilde anlaşılması hedeflenmiştir.
Copies:
Mevcut:*
Library | Materyal Türü | Demirbaş | Yer Numarası | Durumu / Lokasyon / İade Tarihi |
---|---|---|---|---|
Arıyor... | Kitap | EKOBKN0010803 | 001.422 ALT 2019 | Arıyor... |
Arıyor... | Kitap | EKOBKN0012835 | 001.422 ALT 2022 | Arıyor... |