Klasterlash va tasniflash o'rtasidagi asosiy farq shundaki, klasterlash - bu shunga o'xshash misollarni xususiyatlar asosida guruhlarga ajratadigan nazorat qilinmaydigan o'quv uslubi, tasniflash esa oldindan belgilab qo'yilgan teglarni xususiyatlar asosida instansiyalarga belgilab qo'yadigan nazorat qilingan o'quv uslubidir.

Klasterlash va tasniflash o'xshash jarayonlar bo'lib ko'rinsa ham, ularning ma'nosiga ko'ra ular orasida farq bor. Ma'lumotlar qazib olish dunyosida klasterlash va tasniflash ikki xil o'rganish usulidir. Ikkala usul ham bir yoki bir nechta xususiyatlar bo'yicha ob'ektlarni guruhlarga ajratadi.

MUNDARIJA

1. Umumiy nuqtai nazar va asosiy farq 2. Klasterlash nima o'zi? 3. Tasniflash nima? 4. Yonma-yon taqqoslash - Jadval shaklida klasterlash va tasniflash 5. Xulosa

Klasterlash nima?

Klasterlashtirish - shunga o'xshash xususiyatlarga ega ob'ektlar birlashadigan va o'xshash xususiyatlarga ega bo'lgan ob'ektlar bir-biridan ajraladigan tarzda shunday guruhlash usuli. Bu mashina o'rganish va ma'lumotlarni qidirish uchun statistik ma'lumotlarni tahlil qilishning keng tarqalgan uslubidir. Izlanish ma'lumotlarini tahlil qilish va umumlashtirish ham klasterlashni ishlatadigan sohadir.

Klasterlash nazoratsiz ma'lumot qazib olishga tegishli. Bu yagona o'ziga xos algoritm emas, lekin bu vazifani hal qilishning umumiy usuli. Shuning uchun turli xil algoritmlardan foydalangan holda klasterlashga erishish mumkin. Tegishli klaster algoritmi va parametr sozlamalari individual ma'lumotlar to'plamiga bog'liq. Bu avtomatik vazifa emas, lekin bu kashfiyotning iterativ jarayoni. Shuning uchun, natija kerakli xususiyatlarga erishmaguncha ma'lumotlarni qayta ishlash va parametrlarni modellashtirishni o'zgartirish kerak. K-klasterlash va ierarxik klasterlash ma'lumot olishda ikkita keng tarqalgan klasterlash algoritmidir.

Tasniflash nima?

Tasniflash - bu ob'ektlarni aniqlash, farqlash va tushunish uchun ma'lumotlar to'plamidan foydalanadigan tasniflash jarayoni. Tasniflash - bu o'qitiladigan va to'g'ri aniqlangan kuzatuvlar mavjud bo'lgan nazorat qilinadigan o'quv uslubidir.

Tasniflashni amalga oshiruvchi algoritm tasniflagich, kuzatishlar esa misoldir. K-Yaqin qo'shnilar algoritmi va qaror daraxti algoritmlari ma'lumotlarni qidirishda eng mashhur tasniflash algoritmidir.

Klasterlash va tasniflash o'rtasidagi farq nima?

Klasterlash nazoratsiz o'quv uslubi bo'lsa, Klaster nazorat qilishsiz o'rganishdir. U o'xshash misollarni xususiyatlar asosida guruhlaydi, tasniflash esa oldindan belgilab qo'yilgan teglarni xususiyatlar asosida taqsimlaydi. Klasterlash shunga o'xshash xususiyatlarga ega misollarni guruhlash uchun ma'lumotlar to'plamini pastki qismlarga ajratdi. Unda yorliqli ma'lumotlar yoki o'quv to'plami ishlatilmaydi. Boshqa tomondan, yangi ma'lumotni mashg'ulotlar to'plamining kuzatuvlari bo'yicha ajratib oling. Trening to'plami etiketlanadi.

Klasterlashtirishning maqsadi ob'ektlar to'plamini ular o'rtasida o'zaro bog'liqlik bor yoki yo'qligini aniqlash uchun guruhlashdir, shu bilan birga tasniflash yangi ob'ekt oldindan belgilangan sinflar to'plamidan qaysi sinfga tegishli ekanligini topishga qaratilgan.

Xulosa - Klasterlash va tasniflash

Klasterlash va tasniflash o'xshash bo'lib ko'rinishi mumkin, chunki har ikkala algoritm ma'lumotlarini quyi qismlarga ajratadi, ammo ular ma'lumotni yig'ishda ma'lumotlarning yig'indisidan ishonchli ma'lumot olish uchun ikki xil o'rganish usulidir. Klasterlash va tasniflash o'rtasidagi farq shundaki, klasterlash - bu shunga o'xshash misollarni xususiyatlar asosida guruhlarga ajratadigan nazorat qilinmaydigan o'quv uslubi, tasniflash esa - bu belgilar asosida instansiyalarga oldindan belgilangan teglarni tayinlaydigan nazorat qilinadigan o'quv uslubidir.

Rasmga muloyimlik: