π 45 sahifa
O'ZBEKISTON RESPUBLIKASI OLIY TA'LIM, FAN VA INNOVATSIYALAR VAZIRLIGI
NAMANGAN DAVLAT CHET TILLARI INSTITUTI
FILALOGIYA FAKULTETI
KAFEDRA
"KOMPYUTER LINGVISTIKASI"
fanidan
Korpusda polisemiyani avtomatik aniqlash
mavzusida
KURS ISHI
Bajardi: KLA-AU-23 guruh talabasi
Shoxnazarova Mohinabonu
Qabul qildi: Raximov Hasanboy
Toshkent - 2026
1-sahifa
π 2-sahifa: Mundarija
MUNDARIJA
KIRISH3
I-BOB. : Polisemiyani avtomatik aniqlashning nazariy-metodologik asoslari8
1.1. Asosiy tushunchalar va nazariy yondashuvlar8
1.2. Xalqaro tajriba tahlili14
1.3. O'zbekiston konteksti va dolzarb muammolar19
II-BOB. : Korpusda polisemiyani avtomatik aniqlash bo'yicha amaliy tadqiqot va tahlil28
2.1. Tadqiqot metodologiyasi va hozirgi holat tahlili44
2.2. Risk tahlili va moliyaviy asoslash49
2.3. Natijalar, tavsiyalar va strategik reja54
I-bob bo'yicha xulosa13
II-bob bo'yicha xulosa38
UMUMIY XULOSA41
FOYDALANILGAN ADABIYOTLAR45
2-sahifa
π 3-sahifa: Kirish
KIRISH
KIRISH
O'zbekistonda so'zlarni qayta ishlashga oid dasturiy ta'minot bozorining hajmi 2023-yilda 250 milliard so'mdan oshdi va yillik o'sish sur'ati 18% ni tashkil etmoqda [1]. Global miqyosda esa tabiiy tilni qayta ishlash (NLP) bozori 2023-yilda 27.5 milliard AQSH dollariga yetdi va 2028-yilga borib 91.8 milliard dollarga yetishi prognoz qilinmoqda, bu esa yillik o'rtacha 27.2% o'sishni anglatadi [2]. Bu ko'rsatkichlar sun'iy intellekt va til texnologiyalariga bo'lgan talabning naqadar yuqori ekanligini ko'rsatadi. Ushbu sohaga kiritilayotgan investitsiyalar, ayniqsa O'zbekiston kabi rivojlanayotgan mamlakatlarda, mahalliy tillar uchun resurslar va texnologiyalarni yaratish zaruratini yanada kuchaytirmoqda. So'zlarning ko'p ma'noliligi (polisemiya) tabiiy tilni tushunish va qayta ishlashda eng katta qiyinchiliklardan biri bo'lib qolmoqda, chunki u avtomatik tarjima, axborotni qidirish va semantik tahlil tizimlarining samaradorligini sezilarli darajada pasaytirishi mumkin. Shuning uchun, korpus asosida polisemiyani avtomatik aniqlash usullarini rivojlantirish til texnologiyalarining kelajagi uchun muhim ahamiyat kasb etadi.
Ushbu tadqiqot mavzusi O'zbekistonda raqamli transformatsiya jarayonlarining jadallashuvi fonida alohida dolzarblikka ega. Mamlakatimizda hukumat tomonidan qabul qilingan "Raqamli O'zbekiston β 2030" strategiyasi doirasida davlat xizmatlarini raqamlashtirish, elektron hukumat tizimini rivojlantirish va ma'lumotlarga asoslangan qarorlar qabul qilish mexanizmlarini joriy etishga katta e'tibor qaratilmoqda [3]. Bu esa o'zbek tilidagi matnli ma'lumotlarni tahlil qilish, tasniflash va ulardan samarali foydalanish imkoniyatlarini kengaytirishni talab qiladi. Polisemiya muammosini avtomatik hal etish, masalan, o'zbek tilidagi sud qarorlari, tibbiy hisobotlar yoki ijtimoiy tarmoq xabarlaridagi ma'nolarni to'g'ri izohlashda yordam beradi, bu esa ma'muriy yukni 30% gacha kamaytirishi va ma'lumotlarni qayta ishlash tezligini 2 barobargacha oshirishi mumkin [4]. Biroq, o'zbek tilining morfologik murakkabligi va resurslarining cheklanganligi sababli, polisemiya muammosi yetarlicha chuqur o'rganilmagan. Mavjud tizimlar ko'pincha umumiy maqsaddagi korpuslarga asoslanadi va ixtisoslashgan sohalardagi ma'lumotlar bilan ishlashda 20-30% ga past samaradorlik ko'rsatadi [5]. Shuning uchun, bu bo'shliqni to'ldirish va o'zbek tiliga xos bo'lgan polisemiya h
...
Davomini ko'rish uchun ro'yxatdan o'ting
To'liq hujjatni Word formatida yuklab olish yoki o'zingizga mos variantini yaratish uchun bepul ro'yxatdan o'ting.