Information and Communication Engineering | Conference paper | Published 2023

TABIIY TILLI MATNLARNI AVTOMATIK QAYTA ISHLASH TIZIMLARI TAHLILI

Authors:

Elmira Nazirova

Collection: МАТЕМАТИК МОДЕЛЛАШТИРИШ, АЛГОРИТМЛАШ ВА ДАСТУРЛАШНИНГ ДОЛЗАРБ МУАММОЛАРИ
Keywords: NLP, TreeTagger, Pymorphy2, Trigramma, sintez.

Abstract

Hozirgi vaqtda matnli axborot hajmining Internet tarmogʻida tez oʻsib borishi munosabati bilan tabiiy tildagi matnlarni (NLP-matnlar) avtomatik qayta ishlash uchun dasturiy taʼminot tizimlarini (ilovalarni) jadal rivojlantirish zarurati tugʻilmoqda. Bunday muammolarni hal qilish uchun ilovalarni ishlab chiqish bir qator qiyinchiliklarga duch keladi, birinchi navbatda, NLP-matnni qayta ishlash algoritmlarini amalga oshiradigan koʻp sonli dasturiy taʼminot komponentlarini birlashtirish zarurati, uning turli darajalarida (soʻzlarni, jumlalarni, paragraflarni qayta ishlash) ishlaydi. Ushbu tezisda tabiiy tildagi matnlarni tahlil qilish uchun masʼul boʻlgan alohida quyi tizimlarni yaratish uchun zarur boʻlgan maʼlumotlar berilgan. Matnli maʼlumotlarni tasniflash va klasterlash tizimlarini qurish masalalari, matnli axborotning fraktal nazariyasi asoslari koʻrib chiqilgan. Asosiy lingvistik obyektlar va tahlil birliklarining talqinlari keltirilgan.

References

  1. 1. Автоматическая обработка текстов на естественном языке и компютерная лингвистика : учеб. пособие / Болшакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. — М.: МИЭМ, 2011, ст – 106-140.
  2. 2. Автоматическая обработка текстов на естественном языке и анализ данных : учеб. пособие / Болшакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С.
  3. 3. Резникова Т. И. и Копотев М. В.. Лингвистически аннотированные корпуса русского языка (обзор общедоступных ресурсов). Нatsiоналный корпус русского языка: 2003—2005, страницы 31–61, 2005.
  4. 4. Schmid, H.: Probabilistic part-of-speech tagging using decision trees. In.: Proceedings of the international conference on new methods in language processing. (1994) 44-49.
  5. 5. Сокирко А.В. Быстрословар: предсказание морфологии русских слов с исползованием болших лингвистических ресурсов // Труды международной конференции «Диалог-2010. Компютерная лингвистика и интеллектуалные технологии». М.: Издателский центр РГГУ, 2010. С. 450.
  6. 6. Зализняк А. А. русского языка. Словоизменение. — М.: Русский язык, 1977.
  7. 7. A.M.Norov O‘zbek lingvistikasining kompyuterga yo‘naltirilgan modellari. Texnika fanlari bo‘yicha falsafa doktort (PhD) – dissertatsiya – Qarshi – 2020.
Loading...
0

Views

0

Reads

0

Comments

0

Reviews

0

Liked

0

Shared

0

Bibliography

0

Citations

Like and share on

Cite this publication

Copy text below and use in your article