კორპუსული ენათმეცნიერება

კორპუსული ენათმეცნიერება (ინგლ. Corpus Linguistics) — შეისწავლის ლინგვისტური კორპუსების მოდელირებისა და კვლევებში მისი გამოყენების თანამედროვე სტრატეგიებს. ჯერჯერობით დაზუსტებული არ არის კორპუსული ენათმეცნიერება მხოლოდ კვლევის მეთოდოლოგიაა, თუ დამოუკიდებელი დისციპლინა.[1]

კორპუსი და კორპუსის მიზნები რედაქტირება

კორპუსი არის ბუნებრივი მეტყველების ამსახველი მასალის ან ტექსტების მანქანურად წაკითხვადი კოლექცია.[2][3] კორპუსი შესაძლოა შეიქმნას ენობრივი მასალის დეტალური შესწავლის მიზნით, ლინგვისტური თეორიების შესამუშავებლად, ან უკვე არსებული ლინგვისტური თეორიებისა თუ ჰიპოთეზების გადამოწმების მიზნით.[4]

კორპუსული ენათმეცნიერება და ტრადიციული ენათმეცნიერება რედაქტირება

ტრადიციული ენათმეცნიერებისგან განსხვავევით, კორპუსული ენათმეცნიერების ძირითადი დანიშნულება და მიზანია მეტყველების შესწავლა, მისი აღწერა იმ სახით, რომლითაც ის მეტყველებაში გამოიყენება. კორპუსული ენათმეცნიერების პრინციპია ემპირიულობა, განსხვავებით ტრადიციულისგან, რომელსაც ახასიათებს რაციონალისტური მიდგომა; კორპუსული ენათმეცნიერებისთვის უცხოა ტრადიციული ენათმეცნიერებისთვის დამახასიათებელი თვისებრივი კვლევები და დედუქცია, მას ახასიათებს რაოდენობრივი კვლევები და ინდუქცია; კორპუსული კვლევა ეფუძნება ტექსტების კორპუსების მონაცემებს, ხოლო ტრადიციული ენათმეცნიერების შემთხვევაში კვლევა ეყრდნობა თეორიას.en

მსოფლიოს ძირითადი ლინგვისტური კორპუსები რედაქტირება

მსოფლიოში არაერთი ლინგვისტური კორპუსია შექმნილი. თითოეული მათგანი ერთმანეთისგან განსხვავდება სხვადასხვა მახასიათებლით. ცხრილში წარმოდგენილია მსოფლიოს 5 ლინგვისტური კორპუსი (ინგლისური ენის კორპუსი, საშუალი ინგლისურის კოლექცია, რუსული ენის კორპუსი, ჰელსინკის ანოტირებული კორპუსი დაარქივებული 2018-03-06 საიტზე Wayback Machine. , ზეპირი, პროფესიული ამერიკულ-ინგლისური კორპუსი) და მათი მახასიათებლები.


ინგლისური ენის კორპუსი საშუალი ინგლისურის კოლექცია რუსული ენის კორპუსი ჰელსინკის ანოტირებული კორპუსი დაარქივებული 2018-03-06 საიტზე Wayback Machine. ზეპირი, პროფესიული ამერიკულ-ინგლისური კორპუსი
მონაცემების სახე შერეული წერილობითი შერეული წერილობითი ზეპირი
ტექსტის ენა ინგლისური ინგლისური რუსული რუსული ინგლისური
ტექსტის ტიპი (პარალელური კორპუსები) მონოლინგვური მონოლინგვური ბილინგვური (ინგ-რუს, რუს-ინგ, გერმ-რუს, უკრ-რუს, რუს-უკრ, ბელ-რუს, რუს-ბელ) და მულტილინგვური მონოლინგვური მონოლინგვური
ენობრივი თავისებურება ლიტერატურული, სალაპარაკო, ტერმინოლოგიური... ლიტერატურული ლიტერატურული, დიალექტური, სალაპარაკო... ლიტერატურული სალაპარაკო, პროფესიული
ტექსტის ჟანრი ლიტერატურული ნაწარმოებები, აუდიოვიზუალური და გასართობი მედიების ტექსტები... ლიტერატურული ნაწარმოებები ლიტერატურული ნაწარმოებები, კინემატოგრაფია... ლიტერატურული ნაწარმოებები პროფესიული
დანიშნულება სამეცნიერო სამეცნიერო სამეცნიერო, საილუსტრაციო სამეცნიერო სამეცნიერო
მონიშვნა მოუნიშნავი მოუნიშნავი მონიშნული მონიშნული მოუნიშნავი
მონიშვნის ტიპი N/A N/A მორფოლოგიური, სემანტიკური მორფოლოგიური, სინტაქსური N/A
ტექსტების ზომა ტექსტის ფრაგმენტი სრული ტექსტი ტექსტის ფრაგმენტი ტექსტის ფრაგმენტი სრული ტექსტი
ქრონოლოგიური ასპექტი სინქრონული სინქრონული დიაქრონული სინქრონული სინქრონული
დამატებითი ინფორმაცია კორპუსი დაყოფილია ქვეკორპუსებად, მაგალითად: ამერიკული საპნის ოპერების კორპუსი, ფილმების კორპუსი და ა.შ. აქვს ლექსიკურ-გრამატიკული საძიებელი, რომელშიც, მაგალითად, ბრძანებით “S & (nom|acc)” მოიძებნება ნომინატივსა და აკუზატივში მდგარი არსებითი სახელები. კორპუსი არის კომერციული.


მსოფლიოს სხვა კორპუსების სია რედაქტირება

ინგლისური ეროვნული კორპუსი

ფრანგული კორპუსი

გერმანული ეროვნული კორპუსი

გერმანული მასმედიის ანოტირებული კორპუსი დაარქივებული 2021-04-14 საიტზე Wayback Machine.

ესპანური ეროვნული კორპუსი

ჩეხური ეროვნული კორპუსი დაარქივებული 2012-07-12 საიტზე Wayback Machine.

პოლონური ეროვნული კორპუსი დაარქივებული 2019-09-08 საიტზე Wayback Machine.

ჩინური ეროვნული კორპუსი

ქართული ენისა და დიალექტების კორპუსები რედაქტირება

საქართველოში რამდენიმე ლინგვისტური კორპუსი არსებობს: ქართული ენის ეროვნული კორპუსი, ქართული ენის კორპუსი და GEDA(დიდი ქართული დიალექტური ბაზა და ქართული დიალექტების ელექტრონული ატლასი) დაარქივებული 2021-01-15 საიტზე Wayback Machine. .

ქართული ენის ეროვნული კორპუსი რედაქტირება

ქართული ენის ეროვნული კორპუსის მიზანია ქართულ ენაზე შექმნილი ენობრივი რესურსების მომცველი ისეთი კორპუსის შექმნა, რომელიც დაეხმარება სხვადასხვა დარგის მეცნიერებს (ენათმეცნიერებს, ლიტერატურათმცოდნეებს, ისტორიოგრაფებს, პოლიტოლოგებს და ა.შ.) როგორც სინქრონიული, ისე დიაქრონიული ასპექტით კვლევისას. კორპუსი ანოტირებულია მორფოლოგიურად და სინტაქსურად.

ქართული ენის კორპუსი რედაქტირება

2009-2016 წლებში შექმნილი ქართული ენის კორპუსი ილიას სახელმწიფო უნივერსიტეტის ლინგვისტურ კვლევათა ცენტრის პროექტია. კორპუსი  შედგება მონოლინგვური და ბილინგვური ბლოკებისგან. მონოლინგვურ ბლოკში ორი ქვეკორპუსია:

  • ახალი და თანამედროვე ქართული ენა;
  • ძველი და საშუალი ქართული ენა.

ბილინგვურ ბლოკში განთავსებულია „ვეფხისტყაოსნისა“ (ქართულ-ინგლისური) და „ქართლის ცხოვრების“ (ქართულ-სომხური) პარალელური კორპუსები.

კორპუსი ანოტირებულია ქართული ენის მორფოლოგიური ანალიზატორის დახმარებით.

GEDA რედაქტირება

GEDA დაარქივებული 2021-01-15 საიტზე Wayback Machine. , ანუ დიდი ქართული დიალექტური ბაზა და ქართული დიალექტების ელექტრონული ატლასი, ქართული დიალექტების მოუნიშნავი კორპუსია ზეპირი მასალებით. ოფიციალურად პროექტი 2006 წელს დაიწყო შოთა რუსთაველის ეროვნული სამეცნიერო ფონდის დაფინანსებით. მისი შევსება, გამრავალფეროვნება და სრულყოფა დღესაც გრძელდება.

თემატური ლიტერატურა და ბმულები რედაქტირება

სქოლიო რედაქტირება

  1. თანდაშვილი, მანანა. კორპუსლინგვისტიკის მიზანი. დიგიტალური ქართველოლოგია. http://tandaschwili.com/thema-2...
  2. Bennett, R. Gena. Using Corpora in the Language Learning Classroom: Corpus Linguistics for Teachers. Michigan ELT. 2010. https://www.press.umich.edu/pdf/9780472033850-part1.pdf
  3. McEnery T., Xiao R. And Yukio Tono. 2006. Corpus-Based Language Studies. An Advanced Resource Book. London and New York: Routledge.
  4. McCarthy, John & Wright, Peter. 2004. Technology as Experience. 10.1145/1015530.1015549.