Information and Communication Engineering | Conference paper | Published 2023
Hozirgi vaqtda matnli axborot hajmining Internet tarmogʻida tez oʻsib borishi munosabati bilan tabiiy tildagi matnlarni (NLP-matnlar) avtomatik qayta ishlash uchun dasturiy taʼminot tizimlarini (ilovalarni) jadal rivojlantirish zarurati tugʻilmoqda. Bunday muammolarni hal qilish uchun ilovalarni ishlab chiqish bir qator qiyinchiliklarga duch keladi, birinchi navbatda, NLP-matnni qayta ishlash algoritmlarini amalga oshiradigan koʻp sonli dasturiy taʼminot komponentlarini birlashtirish zarurati, uning turli darajalarida (soʻzlarni, jumlalarni, paragraflarni qayta ishlash) ishlaydi. Ushbu tezisda tabiiy tildagi matnlarni tahlil qilish uchun masʼul boʻlgan alohida quyi tizimlarni yaratish uchun zarur boʻlgan maʼlumotlar berilgan. Matnli maʼlumotlarni tasniflash va klasterlash tizimlarini qurish masalalari, matnli axborotning fraktal nazariyasi asoslari koʻrib chiqilgan. Asosiy lingvistik obyektlar va tahlil birliklarining talqinlari keltirilgan.