Կոլոկացիա (անգլ.՝ Collocation) (Լեզվաբանական կորպուսում), բառերի կամ արտահայտությունների շարք, որոնց հաճախակի կից կիրառվելը պատահականության արդյունք չէ։ Դարձվածաբանության մեջ կոլոկացիան արտահայտության/դարձվածքի ենթատեսակ է։ Մայքլ Հոլիդեյը[1] քննարկել է անգլերեն «strong tea» դարձվածքային կոլոկացիայի օրինակը։ Չնայած նույն իմաստը հնարավոր է փոխանցել «powerful tea» համարժեք արտահայտությամբ, անգլախոսներն այն համարում են չափազանցություն և ոչ այնքան կիրառելի։ Պատկերը հակառակն է տեխնոլոգիայի ոլորտում՝ powerful computer (հզոր համակարգիչ) արտահայտությունը գերադասելի է strong computer-ից։ Դարձվածային կոլոկացիաները չպետք է շփոթել իդիոմատիկ արտահայտությունների հետ. իդիոմի իմաստը պատճառաբանված չէ և այն կիրառվում է այլ բանի վերաբերությամբ, մինչդեռ կոլոկացիայի հիմքում բարձր հաճախականությամբ կապակցման գաղափարն է։

Գոյություն ունեն կոլոկացիաների մոտ 6 հիմական տեսակներ.ածական + գոյական, գոյական + գոյական, բայ + գոյական, մակբայ + ածական, բայ + նախդրավոր կառույց և բայ + մակբայ։

Կոլոկացիայի դուրս բերումը հաշվարկային տեխնիկա է ինչի օգնությամբ վեր են հանվում փաստաթղթում կամ կորպուսում առկա բառակապակցությունները՝ օգտագործելով հաշվողական լեզվաբանության տարբեր միջոցներ, ինչպես տվյալների վերլուծության դեպքում։

Ընդլայնված սահմանում խմբագրել

Կոլոկացիաները մասամբ կամ ամբողջությամբ ֆիքսված արտահայտություններ են, որոնք ձևավորվում են կրկնվող համատեքստային կիրառման արդյունքում, ինչպես «crystal clear», «middle management», «nuclear family» «cosmetic surgery» կապակցությունների դեպքում։

Կոլոկացիայի բաղադրիչները կարող են լինել շարահյուսական կապի մեջ (օրինակ՝ բայ – խնդիր՝ «կայացնել» և «որոշում»), բառային կապի մեջ (օրինակ ՝ հականիշություն), կամ հնարավոր է՝ լեզվաբանական որևէ կոնկրետ կապ դիտարկելի չլինի։ Կոլոկացիաների իմացությունը շատ կարևոր է լեզվի գրագետ օգտագործման համար։ Քերականորեն ճիշտ կազմված նախադասության կիրառումն անարդյունավետ կլինի, եթե խախտվեն կոլոկացյիոն նախապատվությունները։ Հենց սա էլ կոլոկացիան դարձնում է լեզվի ուսուցման հետաքրքիր ուղղություն։

Կորպուսային լեզվաբանները համատեքստում առանձնացնում են հանգուցային բառը (KWIC) և դրա հետ կապակցվող հարևան բառերը։ Սրա միջոցով հնարավոր է դառնում գաղափար կազմել բառերի կիրառման եղանակի մասին։

Կոլոկացիաների մշակումը ներառում է մի շարք չափորոշիչներ, որոնցից ամենակարևորը զուգորդման չափումն է. գնահատվում է՝ արդյոք կապակցումը զուտ պատահական է, թե վիճակագրորեն հիմնավորած։ Լեզվի ոչ պայմանական բնույթով պայմանավորված՝ կոլոկացիաների մեծ մասը հաճախականության հիմքի վրա են ձևավորված, և զուգորդման միավորները պարզապես օգտագործվում են արդյունքները կարգայնացնելու համար։ Զուգորդման սովորաբար օգտագործվող միջոցները ներառում են փոխադարձ տեղեկություն, t-միավորներ և հավանականության գործառույթ[2][3]։

Մեկ սահմանում դիտարկելու փոխարեն՝ Գլեդհիլը[4] առաջարկում է կոլոկացիան ներկայացնել առնվազն երեք տարբեր մոտեցմամբ.

  • վիճակագրական մոտեցում, ըստ որի՝ կոլոկացիան բառային հանգույցի և դրա հետ կապակցվող միավորների պարբերաբար միասին կիրառվելն է[5][6][7]։
  • կառուցվածքային մոտեցում, համաձայն որի՝ կոլոկացիան բառույթի և բառաքերականական օրինաչափության հարաբերությունն է[8], կամ հիմքի և դրա հետ կապակցվող տարբերակների միջև կապը[9]։
  • գործաբանական մոտեցում, ըստ որի՝ կոլոկացիան արտահայտման պայմանական միավոր է՝ անկախ ձևից[10][11]։

Այս տարբեր մոտեցումները հակադարձում են դարձվածային արտահայտությունների ուսումնասիրություններում կոլոկացիայի ընդունված սահմանմանը։ Իրականում, կոլոկացիան նկարագրվում է միանգամից այս 3 մոտեցումների հրման վրա՝ հետևյալ տեսքով՝

ազատ կապակցություն ↔ սահմանազատված բառակապակցություն ↔ կայուն արտահայտություն։

Բառարաններում խմբագրել

1933 թվականին Հարոլդ Փալմերը անգլերեն բառակապակցությունների մասին երկրորդ միջանկյալ զեկույցում ընդգծեց կոլոկացիայի նշանակությունը՝ որպես բնական հնչող խոսքի բանալի միջոց նրանց համար, ովքեր սովորում են օտար լեզու[12]։ Այսպիսով, 1940-ական թվականներից սկսած կոլոկացիաների մասին տեղեկություն պարունակելը դարձավ միալեզու բառարանների ստանդարտ հատկանիշ։ Քանի որ այս բառարանները դառնում էին «պակաս բառակենտրոն և ավելի արտահայտչակենտրոն»[13], ավելի մեծ ուշադրություն էր դարձվում կոլոկացիային։ 21-րդ դարի սկզբից այս միտմանն աջակցում էին խոշոր տեքստային կորպորացիաները և կորպուս մուտք գործելու հարցումով ինտելեկտուալ ծրագրակազմը` հնարավորություն ընձեռելով բառարաններում ավելի համակարգված նկարագրել կոլոկացիան։ Օգտագործելով այս գործիքները՝ բառարանները, ինչպիսիք են Macmillan անգլերեն բառարանը և Longman ժամանակակից անգլերենի բառարանը, առանձին դաշտով ներկայացնում էին հաճախակի կիրառություն ունեցող կոլոկացիաների ցուցակը[14]։

Գոյություն ունեն նաև մի շարք մասնագիտական բառարաններ, որոնք նվիրված են լեզվում հաճախակի օգտագործվող կոլոկացիաների նկարագրմանը[15]։ Դրանք են՝ իսպ.՝ Redes. Diccionario combinatorio del español contemporaneo (2004), ֆր.՝ Le Robert: Dictionnaire des combinaisons de mots (2007), և անգլ.՝ LTP Dictionary of Selected Collocations (1997) և the Macmillan Collocations Dictionary (2010)[16]:

Վիճակագրորեն հիմնավորված կոլոկացիա խմբագրել

«Student's t-test»-ը կիրառվում է` պարզելու, թե արդյոք կորպուսում կոլոկացիայի առաջացումը վիճակագրորեն հիմնավորված է, թե ոչ[17]։   կապակցության դեպքում   բանաձևը ներկայացնում է     քանակով կիրառման հավանականությունը կորպուսում, իսկ   բանաձևը՝  -ինը։   կապակցության համար t-հաշիվը հաշվարկվում է այպես.

 

որտեղ,  -ի կիրառման միջին նշումն է,   -ի դեպքերի քանակն է,  -ը զրոյական վարկածի դեպքում  -ի հավանականությունն է, որ   առանձին-առանձին հայտնվեն տեքստում, իսկ   օրինակի շեղումն է։ Մեծատառ  –ի հետ t-թեստը համարժեք է z-թեստին։

Ծանոթագրություններ խմբագրել

  1. Halliday, M.A.K., 'Lexis as a Linguistic Level', Journal of Linguistics 2(1) 1966: 57–67
  2. Dunning, Ted (1993): "Accurate methods for the statistics of surprise and coincidence". Computational Linguistics 19, 1 (Mar. 1993), 61–74.
  3. Dunning, Ted (2008 թ․ մարտի 21). «Surprise and Coincidence». blogspot.com. Վերցված է 2012 թ․ ապրիլի 9-ին.
  4. Gledhill C. (2000): Collocations in Science Writing, Narr, Tübingen
  5. Firth J.R. (1957): Papers in Linguistics 1934–1951. Oxford: Oxford University Press.
  6. Sinclair J. (1996): "The Search for Units of Meaning", in Textus, IX, 75–106.
  7. Smadja F. A & McKeown, K. R. (1990): "Automatically extracting and representing collocations for language generation", Proceedings of ACL'90, 252–259, Pittsburgh, Pennsylvania.
  8. Hunston S. & Francis G. (2000): Pattern Grammar — A Corpus-Driven Approach to the Lexical Grammar of English, Amsterdam, John Benjamins
  9. Hausmann F. J. (1989): Le dictionnaire de collocations. In Hausmann F.J., Reichmann O., Wiegand H.E., Zgusta L.(eds), Wörterbücher : ein internationales Handbuch zur Lexikographie. Dictionaries. Dictionnaires. Berlin/New-York : De Gruyter. 1010–1019.
  10. Moon R. (1998): Fixed Expressions and Idioms, a Corpus-Based Approach. Oxford, Oxford University Press.
  11. Frath P. & Gledhill C. (2005): "Free-Range Clusters or Frozen Chunks? Reference as a Defining Criterion for Linguistic Units(չաշխատող հղում)," in Recherches anglaises et Nord-américaines, vol. 38 :25–43
  12. Cowie, A.P., English Dictionaries for Foreign Learners, Oxford University Press 1999:54–56
  13. Bejoint, H., The Lexicography of English, Oxford University Press 2010: 318
  14. «MED Second Edition – Key features – Macmillan». macmillandictionaries.com. Արխիվացված է օրիգինալից 2020 թ․ սեպտեմբերի 28-ին. Վերցված է 2021 թ․ փետրվարի 26-ին.
  15. Herbst, T. and Klotz, M. 'Syntagmatic and Phraseological Dictionaries' in Cowie, A.P. (Ed.) The Oxford History of English Lexicography, 2009: part 2, 234–243
  16. «Macmillan Collocation Dictionary – How it was written - Macmillan». macmillandictionaries.com. Արխիվացված է օրիգինալից 2018 թ․ դեկտեմբերի 21-ին. Վերցված է 2021 թ․ փետրվարի 26-ին.
  17. Manning, Chris; Schütze, Hinrich (1999). Foundations of Statistical Natural Language Processing. Cambridge, MA: MIT Press. էջեր 163–166. ISBN 0262133601.

Արտաքին հղումներ խմբագրել