📖 19 sahifa
O'ZBEKISTON RESPUBLIKASI
OLIY TA'LIM, FAN VA INNOVATSIYALAR VAZIRLIGI
MIRZO ULUGʻBEK NOMIDAGI OʻZBEKISTON MILLIY UNIVERSITETI
JURNALISTIKA VA OʻZBEK FILOLOGIYASI FAKULTETI
KOMPYUTER LINGVISTIKASI VA AMALIY TILSHUNOSLIK
"Kompyuter lingvistikasi va amaliy tılshunoslık"
fanidan
Ilmiy matnlar korpusini yaratish (lingvistik maqolalar misolida)
mavzusida
MUSTAQIL ISH
Bajardi: 419 guruh talabasi
Ulugʻberdiyeva Mahliyo Ibodullayeva Madinabonu
Qabul qildi: Joʻraqulova Madina
Toshkent - 2026
1-sahifa
📄 2-sahifa: Reja va Kirish
REJA:
- Maqolalarni to'plash va dastlabki ishlov berish
- Lingvistik belgilash sxemasini ishlab chiqish va annotatsiya qilish
- Korpusni shakllantirish va omborlash
- Korpus vositalarini ishlab chiqish va integratsiyalash
- Korpusni baholash va foydalanish imkoniyatlarini yaratish
KIRISH
KIRISH
Zamonaviy ilmiy tadqiqotlarda, ayniqsa gumanitar va ijtimoiy fanlar sohasida, matnli ma'lumotlarning miqdori eksponensial tarzda o'sib bormoqda. Internet, raqamli nashrlar va elektron kutubxonalarning rivojlanishi tufayli har qanday fan sohasi bo'yicha ulkan hajmdagi matnlar to'plami paydo bo'ldi. Ushbu matnlardan samarali foydalanish, ularni tahlil qilish va umumlashtirish an'anaviy usullar bilan qiyinlashmoqda. Ayniqsa, lingvistika, filologiya, kompyuter lingvistikasi kabi fanlar uchun matnli korpuslar (korpus lingvistikasi) tadqiqotning ajralmas qismiga aylandi. Korpuslar tilning real qo'llanilishini o'rganish, statistik tahlillar o'tkazish, turli til hodisalari chastotasini aniqlash va kompyuterga asoslangan til modellarini yaratish uchun bebaho manba hisoblanadi. Ilmiy matnlar, xususan, lingvistik maqolalar o'ziga xos tuzilishi, terminologiyasi va kontseptual apparatiga ega bo'lib, ularni avtomatik tahlil qilish va qayta ishlash murakkablikni talab qiladi. Shunday ekan, ilmiy matnlar korpusini yaratish, ularni maxsus annotatsiya qilish va tahlil qilish uchun vositalarni ishlab chiqish bugungi kunning dolzarb vazifalaridan biridir. Ushbu tadqiqot, aynan lingvistik maqolalar misolida, ilmiy matnlar korpusini yaratishning nazariy va amaliy jihatlarini o'rganishga qaratilgan bo'lib, bu sohadagi bo'shliqlarni to'ldirishga xizmat qiladi.
Yuqorida qayd etilgan dolzarblikdan kelib chiqib, mazkur tadqiqotda asosiy muammo ilmiy matnlar, xususan, lingvistik maqolalar korpusini yaratishning metodologik va texnologik qiyinchiliklari bilan bog'liq. Mavjud korpuslar odatda umumiy tilni yoki muayyan adabiy janrlarni qamrab oladi, biroq maxsus ilmiy diskurs, uning terminologik xususiyatlari, argumentatsiya strukturalari va kontseptual aloqalarini aks ettiruvchi boy annotatsiyali ilmiy korpuslar yetarli darajada rivojlanmagan. Boshqa tomondan, ilmiy matnlarni avtomatik qayta ishlash uchun samarali vositalar va algoritmlarni ishlab chiqish ham muhim ahamiyatga ega. Ushbu
...
Davomini ko'rish uchun ro'yxatdan o'ting
To'liq hujjatni Word formatida yuklab olish yoki o'zingizga mos variantini yaratish uchun bepul ro'yxatdan o'ting.