Մաթեմատիկական լեզվաբանություն

Մաթեմատիկական լեզվաբանություն, լայն առումով՝ լեզվաբանական մեթոդների համակարգ (լեզվամաթեմատիկա), որի օգնությամբ ուսումնասիրվում են լեզվական առարկաներն (օբյեկտները) ու երևույթները՝ լեզվական, լեզվաբանական ու անդրլեզվաբանական կաղապարների կիրառմամբ, նեղ առումով՝ մաթեմատիկայի հատուկ բնագավառ, որը զբաղվում է այդ կաղապարների կառուցման ու նկարագրման համար ձևային մեթոդների մշակմամբ։

Մաթեմատիկական լեզվաբանության ծնունդը (20-րդ դարի 50-ական թվականներ) պայմանավորված է լեզվաբանական նորագույն ուղղությունների (մասնավորապես, կառուցվածքային լեզվաբանության) առաջացմամբ, որոնք, հիմք ընդունելով լեզվի համակարգ լինելու գաղափարը, խնդիր դրեցին հասնելու նրա ճշգրիտ նկարագրությանը։ Ամեն մի համակարգի ուսումնասիրություն պահանջում է պարզել՝

նրա տարրական միավորները,
այդ միավորների պատկանելությունը,
դրանց համակարգման կանոնները՝ վերլուծության տարբեր մակարդակներում։

Մաթեմատիկական լեզվաբանության մեջ օգտագործվում են երեք կարգի կաղապարներ խմբագրել

լեզվական, որոնք դիտարկում են լեզվական կոնկրետ պրոցեսներն ու երևույթները, նմանակում մարդու խոսքային գործունեությունը,
լեզվաբանական, որոնք դիտարկում են այս կամ այն լեզվական երևույթները բացահայտող ընթացակարգերը և նմանակում լեզվաբանի գործունեությունը,
անդրլեզվաբանական, որոնք դիտարկում են արդեն մշակված լեզվաբանական կաղապարներ։

Գծագիր 1

Գծագիր 2

Գծագիր 3

Այս առումով անդրլեզվաբանական կաղապարը տեսության տեսություն է կամ անդրտեսություն. սա հնարավորություն է տալիս նախօրոք մշակված հայտանիշերի ու տեսական ապացույցների (անդրլեզու կամ մետալեզու) հիման վրա տրված կաղապարներից ընտրել լավագույնը։ Կաղապարման էությունը պարզաբանենք ամենից ավելի տարածված լեզվաբանական կաղապարների հիման վրա։ Սրանք բաժանվում են երկու խմբի՝

վերլուծության կաղապարներ, որոնք հնարավորություն են տալիս վերջավոր թվով կանոնների օգնությամբ վերլուծության ենթարկել տվյալ լեզվի նախադասությունները՝ անվերջ բազմությամբ,
համադրության կաղապարներ, որոնք հնարավորություն են տալիս վերջավոր թվով կանոնների օգնությամբ սերել (կազմել) որևէ լեզվի նախադասություններ անվերջ բազմությամբ։

Յուրաքանչյուր կաղապարի հիմքում ընկած է որևէ ձևային քերականություն, որը վերջավոր թվով օբյեկտների և այդ օբյեկտների նկատմամբ վերջավոր թվով գործողությունների, մասնավորապես, արտածման կանոնների հավաքածու է։

Վերլուծության կաղապարներ խմբագրել

Վերլուծության կաղապարները հենվում են առաջին հերթին անմիջական բաղադրիչների կամ շարահյուսական կախումների, իսկ համադրության կաղապարները՝ սերող ձևային քերականությունների վրա։ Անմիջական բաղադրիչների ձևային քերականությունը նկատի ունի այն փաստը, որ նախադասության մեջ կարելի է անջատել բառախմբեր, որոնք կատարում են մեկ բառի շարահյուսական ֆունկցիա։ Այսպես, նախադասության անմիջական բաղադրիչներն են անվանական ու բայական բառախմբերը, որոնց շարահյուսական ֆունկցիաները, համապատասխանաբար, համընկնում են ենթակայի ու ստորոգյալի շարահյուսական ֆունկցիաների հետ։ Անվանական բառախմբի մեջ կարելի է առանձնացնել բաղադրիչներ, որոնց շարահյուսական ֆունկցիաները կհամընկնեն ենթակայի (գոյականի) ոչ որոշիչի շարահյուսական ֆունկցիաների հետ և այլն։

Շարահյուսական կախումների ձևային քերականության համար հիմք է ծառայում նախադասության մեջ բառերի անմիջական շարահյուսական կախման առկայությունը։

Օրինակ, ընդունված է, որ նախադասության մեջ ենթական շարահյուսորեն անմիջապես կախման մեջ է գտնվում ստորոգյալից, խնդիրներն ու պարագաները՝ ստորոգյալից (անմիջապես կամ կապի միջոցով), ենթակայի լրացումը՝ ենթակայից և այլն։

Թե՝ անմիջական բաղադրիչների և թե՝ շարահյուսական կախումների քերականության միջոցով կատարված վերլուծությունը կարելի է պատկերել լեզվական տարբեր կարգի միավորների ծառաձև միացությունների տեսքով։ Առաջին դեպքում այն կոչվում է անմիջական բաղադրիչների ծառ, իսկ երկրորդ դեպքում՝ կախումների ծառ։ Օրինակ, երիտասարդ երկրաբանները գնացին դեպի հանքերը նախադասության անմիջական բաղադրիչների և կախումների ծառերը կունենան հետևյալ տեսքը՝

Անմիջական բաղադրիչների ծառի վրա (տես գծ. 1) պարզ երևում է, որ նախադասությունը կազմում են երկու բաղադրիչներ՝ անվանական բառախումբը (երիտասարդ երկրաբանները) և բայական բառախումբը (գնացին դեպի հանքերը). անվանական բառախումբը կազմված է երիտասարդ և երկրաբանները բառերից, իսկ բայական բառախումբը՝ գնացին բայից և անվանական բառախմբից (դեպի հանքերը), որն իր հերթին կազմված է դեպի և հանքերը բառերից։

Կախվածությունների ծառի սկզբնակետը համապատասխանում է նախադասության ստորոգյալին։ Երկրորդ գծագրից երևում է, որ տրված նախադասության ստորոգյալից անմիջական շարահյուսական կախման մեջ են գտնվում ենթական (երկրաբանները) և կապը (դեպի), ենթակայից անմիջական կախման մեջ է գտնըվում նրա լրացումը (երիտասարդ), իսկ կապից՝ պարագան (հանքերը)։

Սերող քերականությունը, որի հիման վրա կառուցվում են համադրության կաղապարներ, հնարավորություն է ընձեռում միակերպ ընթացակարգերի օգնությամբ կազմելու տվյալ լեզկփն հատուկ նախադասություններ։ Ընդհանուր տեսքով սերող քերականությունը դիտարկվում է որպես $<\Sigma ,\mathrm {\Digamma} >$ համակարգ, որտեղ $\Sigma$ -ն լեզվական միավորների վերջավոր բազմություն է, իսկ $\mathrm {\Digamma}$ -ը՝ $\psi \rightarrow \phi$ տեսքի արտածման կանոնների վերջավոր բազմություն։ Արտածման կանոնների տեսքը ցույց է տալիս, որ սերման ընթացքում սլաքի ձախակողմյան միավորը փոխարինվում է աջակողմյան միավորով։ Քանի որ $\Sigma$ բազմության մեջ ներառվում են ոչ ծայրագույն միավորներ (որոնք համապատասխանում են բառախմբերին) և ծայրագույն միավորներ (որոնք համապատասխանում են առանձին բառերին), ապա նախադասության սերման պրոցեսը կավարտվի, եթե սերված բառաշղթան բաղկացած լինի միայն ծայրագույն միավորներից, այսինքն՝ առանձին բառերից

Եթե որպես $\Sigma$ բազմության տարրեր ընտրենք $S$ (նախադասություն), $VP$ (բայական բառախումբ), $NP$ (անվանական բառախումբ), $N$ (գոյական), $V$ (բայ), $A$ (ածական), $C$ (կապ), երկրաբանները, հանքերը, գնացին, երիտասարդ, դեպի միավորները, իսկ որպես $\mathrm {\Digamma}$ բազմության տարրեր՝ $S\rightarrow NPVP,NP\rightarrow AN,NP\rightarrow CN,VP\rightarrow VNP,$ $N$ -երկրաբանները, $N$ -հանքերը, $A$ -երիտասարդ, $C$ -դեպի արտածման կանոնները, ապա «Երիտասարդ երկրաբանները գնացին դեպի հանքերը» նախադասությունը կարելի է ներկայացնել Գծագիր 3-ով։

Հաշվողական լեզվաբանություն խմբագրել

Գիտության զարգացման յուրաքանչյուր փուլում գոյություն ունեն լեզվի տարբեր ըմբռնումներ, որոնք հանդես են գալիս լեզվաբանական հոսանքների ու հայեցակարգերի ձևով։

Լեզվաբանությունը, ինչպես գիտության մյուս բնագավառները, հասարակության որոշ կարգի պահանջմունքները (լեզու սովորելու, կիրառելու, ուսումնասիրելու և այլն) բավարարելու նպատակ ունի։ Լեզվաբանության ուսումնասիրության առարկան մարդկային լեզուն է։ Եվ ինչպես գիտենք, մարդկային գիտելիքներն առաջին հերթին դրսևորվում են լեզվի միջոցով, բացի այդ՝ տրամաբանական և հոգեկան երևույթներն էլ իրենց նյութական արտահայտությունն են ստանում լեզվի մեջ, այսինքն՝ պետք է նկատի ունենալ, որ հասարակության պահանջմունքները միայն գործնական բնույթ չունեն. եթե սկզբնապես գիտության զարգացումը նպատակ ուներ բավարարելու հասարակության գործնական պահանջմունքները, ապա աստիճանաբար առաջ են գալիս նաև տեսական հետաքրքրություններ։ Հետևաբար՝ լեզվաբանների առաջնային խնդիրն է այդ պահանջմունքների բավարարումը^[1]։

Գիտության զարգացման յուրաքանչյուր փուլում գոյություն ունեն լեզվի տարբեր ըմբռնումներ, որոնք հանդես են գալիս լեզվաբանական հոսանքների ու հայեցակարգերի ձևով։ Լեզվաբանները լեզվի բնույթի, ծագման, զարգացման ու գործառման հարցերը քննելիս ելնում են գոյություն ունեցող ընդհանուր ըմբռնումներից կամ առաջ են քաշում սեփական ըմբռնումներ, որոնք լեզվաբանության զարգացման տարբեր փուլերում տարբեր կերպ են դրսևորվում։ 20-րդ դարի երկրորդ կեսին թե՛ արտաքին, թե՛ ներքին գործոնների ազդեցությամբ սկսվեց և 21-րդ դարում արդեն հաղթահարվեց լեզվի միակողմանի ուսումնասիրությունը^[1]։

Լեզվաբանները սկսեցին գիտակցել, որ լեզվաբանությունը մեծ հաջողությունների կարող է հասնել այն դեպքում, եթե մի ուղղության ձեռքբերումները կիրառվեն մյուս ուղղության ներկայացուցիչների կողմից։ Լեզվաբանության պատմության նորագույն շրջանը բնորոշվեց ուսումնասիրության նոր բնագավառների և գիտակարգերի առաջացմամբ։ Մի կողմից ի հայտ եկան հիմնական և հարակից գիտակարգեր, մյուս կողմից՝ սկսեցին սահմանազատվել տեսական և կիրառական լեզվաբանության ուսումնասիրության բնագավառները, մեծացավ անդրտեսության և անդրլեզվաբանության դերը. դա նաև մի բնագավառի կարևոր ձեռքբերումները դարձրեց մյուսների ձեռքբերումները։ Եվ այսպես, լեզվաբանության մեջ ի հայտ եկան նոր միտումներ, իսկ դրան զուգընթաց՝ արվեցին լեզվաբանական գիտակարգերի դասակարգման առաջին փորձերը^[1]։

Ներկայումս լեզվաբանությունը ազատ փոխգործակցում է այլ գիտությունների հետ։ Հետևաբար կարելի է ենթադրել, որ ներփակ լեզվաբանությունը վերածվում է միջգիտակարգային, մարդաբանական լեզվաբանության։ Լեզվի ուսումնասիրության մեջ ավելի ու ավելի գերիշխող է դառնում քանակական մոտեցումը։ Կորպուսային լեզվաբանությունը սկսում է կենտրոնական դեր գրավել լեզվաբանական հետազոտությունների բնագավառում, ինչպես նաև աճում է փորձարարական հետազոտությունների դերը թե՛ քերականության բոլոր բնագավառներում, թե՛ հնչյունաբանությունից մինչև պրագմատիզմ։ Լեզվի տիպաբանությունը նույնպես ավելի քանակական է դառնում, կարևորվում է բարդ վիճակագրության կիրառումը^[1]։

Ինչպես գիտենք, «կիրառական լեզվաբանություն» տերմինն առաջին անգամ պաշտոնապես հանդես է եկել Միչիգանի համալսարանում 1946 թվականին։ Սկզբնական շրջանում, կիրառական լեզվաբանություն ասելով, հասկանում էին մի բնագավառ, որը զբաղվում է օտար լեզուների ուսուցման, անգլերենը օտարախոսներին սովորեցնելու մեթոդաբանության հարցերով։ 1950-ականների վերջերին և 1960-ականների սկզբին տերմինի կիրառության ոլորտն աստիճանաբար ընդլայնվեց՝ ընդգրկելով այնպիսի բնագավառ, ինչպիսին «ավտոմատ թարգմանությունն» է։ Շուտով ձևավորվեց Կիրառական լեզվաբանության միջազգային ասոցիացիան, որը սովորաբար կոչվում է ֆրանսերեն հապավումով՝ AILA: Այդ շրջանում կիրառական լեզվաբանության ուսումնասիրությունն ընդգրկում էր երկու հիմնական ուղղություն՝ օտար լեզվի ուսուցում և ավտոմատ թարգմանություն։ Այժմ կիրառական լեզվաբանությունը բավական լայն ընդգրկում ունի։ Կիրառական լեզվաբանության միջազգային ասոցիացիան՝ AILA-ն նշում է. «Որպես հասարակական կյանքի հատուկ խնդիրները լուծելու բնագավառ՝ կիրառական լեզվաբանությունը հետաքրքրվում է հասարակության բազմաթիվ և բարդ այն ոլորտներով, որոնցում լեզուն կարևոր դեր ունի»։ Այսինքն՝ կիրառական լեզվաբանության ոլորտին են վերագրվում թե՛ լեզվի ուսուցման հարցերը, թե՛ լեզվաբանության մեջ տեղեկատվական տեխնոլոգիաների կիրառումը, թե՛ լեզվի գործառման հարցերի քննությունը^[1]։

Էլեկտրոնային հաշվողական մեքենաների ստեղծումից հետո մաթեմատիկական լեզվաբանության հիմքի վրա ծագեց ու զարգացավ, այսպես կոչված, հաշվողական լեզվաբանությունը։ Հաշվողական լեզվաբանության ուսումնասիրության հիմնական օբյեկտը արհեստական լեզուներն են, որոնք լայնորեն օգտագործվում են խնդիրների ծրագրավորման համար, ապահովում մարդու և հաշվողական մեքենայի երկխոսությունը։ Հաշվողական լեզվաբանությունը նոր հեռանկարներ է բացում հաշվողական մեքենաների արդյունավետության բարձրացման ու կիրառման ոլորտի ընդարձակման համար^[2]։

20-րդ դարի վերջում տեղեկատվական տեխնոլոգիաները դիտարկվում էին որպես օրենքների, մեթոդների, տեղեկույթի պահպանման, փոխանցման, մշակման, տարածման միջոց համակարգիչների օգնությամբ։ Նկատելով տեղեկատվական տեխնոլոգիաների և լեզաբանության կապը, կարելի է ասել, որ լեզվաբանության մեջ տեղեկատվական տեխնոլոգիաները մեթոդների ամբողջություն են, որոնք օգնում են պահպանել, փոփոխել, տարածել այն տեղեկույթը, որը կապված է հենց լեզվաբանության, լեզվի գորխախաման օրենքների և ձևերի հետ՝ համակարգիչների օգնությամբ^[2]։

Ըստ հետազոտողների տեղեկատվական տեխնոլոգիաները լեզվաբանության մեջ հիմնականում առնչվում են կիրառական լեզվաբանության խնդիրների հետ։ Դրանց թվին են դասվում

արհեստական բանականության համակարգերի ստեղծումը,
մեքենական թարգմանության համակարգերի ստեղծումը,
տեքստերի ավտոմատ սեղմագրման համակարգերի ստեղծումը,
տեքստերի ստեղծման համակարգերի ստեղծումը,
լեզու սովորելու համար համակարգերի ստեղծումը,
բանավոր խոսքի ընկալման համար համակարգերի ստեղծումը,
ավտոմատ որոնողա-տեղեկատվական համակարգերի ստեղծումը,
հումանիտար գիտությունների համար տարբեր տվյալների բազաների (բառարակկերի, քարտերի, կատալոգների) ստեղծումը,
տարբեր տեսակի էլեկտրոնային բառարանների ստեղծումը և մշակումը,
համացանցում տեղեկույթի փոխանցման համակարգերի մշակում և այլն^[2]։

Մեքենական թարգմանության խնդիրներ խմբագրել

Մեքենական թարգմանության խնդիրները լայն են ու բազմազան։ Մեքենական թարգմանության ծննդյան թիվը համարվում է 1947թ. մարտը, իսկ հեղինակները՝ Ուորեն Ուիվերը և Նորբերտ Վիները։ Էլեկտրոնային հաշվիչ մեքենաների հայտնվելուց հետո բնական լեզուների թարգմանության համար սկսեցին կիրառել համակարգիչներ^[3]։

Համակարգիչ

ՄԹ սկզբնական համակարգերը ունեին միայն ընդարձակ երկլեզվյան բառարաններ, որտեղ տրված էին մուտքային լեզվի զլխաբառերը, իսկ դրանց դիմաց ելքային լեզվի համապատասխան բառերը, տրված էին նաև քերականական որոշ կանոններ, հիմնականում շարադասության վերաբերյալ։ Շատ շուտով պարզ դարձավ, որ շարադասության մասին տրված կանոնները խիստ անմշակ են, և կարիք կա շարահյուսական վերլուծության համակարգված մեթոդի։ Ստեղծվեցին բազմաթիվ ծրագրեր ժամանակակից լեզվաբանության հնարավորություններով, հատկապես ձևային քերականության օրինակներով կատարյալ թարգմանության համար։ Ուսումնասիրության առաջին տասնամյակում մասնագետները լավատեսությամբ էին լցված, մինչ կհանդիպեին անլուծելի թվացող իմաստաբանական խնդիրների^[3]։

Նշված ժամանակահատվածում կային երկու համակարգեր՝ Մարկ II համակարգը, որը ստեղծվել էր IBM ֊ի և Վաշինգտոնի համալսարանի կողմից, և Ջորջթաունի համալսարանի ստեղծած համակարգը, սակայն այդ երկուսի արդյունքներն էլ հիասթափեցնող էին, որոնք հիմնականում վերաբերում էին քիմիային։ 1964 թվականին ԱՄՆ ծրագրի հովանավորները սկսեցին մտահոգվել համակարգերի անհաջողությամբ։ Նրանք հիմնեցին ALPAC-ը (Automatic Language Processing Advisory Committee), որը 1966 թվականի զեկույցով եկավ այն եզրակացության, որ ՄԹ ավելի դանդաղ է, պակաս ճշգրիտ և կրկնակի թանկ, քան մարդու կատարած թարգմանությունը, և որ ՄԹ հեռանակար չունի, և հարկ չկա ներդրում անել մեքենական թարգմանության ոլորտում, և դրա փոխարեն նրանք առաջարկեցին ներդրումներ անել մարդ-թարգմանչի աշխատանքին օժանդակող միջոցներ՝ ավտոմատ բառարաններ, ստեղծելու համար, ինչպես նաև համակարգչային լեզվաբանության, զարգացման համար։ ALPAC-ի զեկույցի պատճառով ԱՄՆ-ում շուրջ մեկ տասնամյակ դադարեց մեքենական թարգմանության աշխատանքը^[3]։

Մեքենական թարգմանության անհաջողությունը ուներ մի շարք պատճառներ։ Այդ տարիներին խիստ սահմանափակ էին սարքավորումների հնարավորությունները, հիշողության, արագագործության և ծրագրային միջոցները, ինչպես նաև լեզվաբանական խնդիրների լուծման տեսական հիմունքները։ Այս ամենի արդյունքում մեքենական թարգմանության համակարգը տեքստը թարգմանում էր բառացի և չէր պահպանում դրա շարահյուսական և իմաստային ամբողջությունը։ Հարկ է նշել, որ մեքենական թարգմանության առաջին համակարգերը կատարում էին թարգմանություն միայն զույգ լեզուների միջև /բինար թարգմանություն/ և մշակված ձևաբանական ու շարահյուսական սահմւսնափակ կանոններ ունեին։ Հետագայում մեքենական թարգմանության համակարգերի մշակման համար սկսեցին կիրառել կառուցվածքային և մաթեմատիկական լեզվաբանության արդյունքները։ Ուշադրությունը կենտրոնացվեց ՄԹ ընդհանուր կաղապարների մշակման և կատարելագործման վրա, որպեսզի հնարավոր լինի դրանք կիրառել տարբեր լեզուների համար։ Այդ ժամանակահատվածում ՄԹ զարկ ստացավ նաև ԽՍՀՄ-ում, Եվրոպայում և Ճապոնիայում։ ՄԻ քանի տարվա ընթացքում գործի դրվեց SISTRAN համակարգը USAF-ի (1970) կողմից, որը նախասահմանված է Եվրոխորհուրդի օրենսդրական և վարչական փաստաթղթերը թարգմանելու համար։ Ներկայումս համակարգը աշխատում է տասնյոթ զույգ լեզուներով։ Թեև սկզբնական շրջանում համակարգի մեջ եղած անհաջող թարգմանության պատճառով համակարգին թերահավատորեն էին վերաբերվում, սակայն այժմ ոչ ոք չի կարող ժխտել դրա կարևորությունը և օգուտը, փաստաթղթերի արագ նախնական թարգմանությունը, պատվիրատուի մեկ հարցման թարգմանության արագությունը մոտավորապես տաս րոպե է։ Այժմ SISTRAN-ը կիրառվում է երեք գլխավոր գործողությունների համար՝ ինֆորմացիային ծանոթանալու, տարբեր լեզուներով փաստաթղթեր կազմելու և թարգմանության նախնական մշակման^[3]։

1970 թվականին Կանադայի Մոնրեալ համալսարանը ստեղծեց METEO համակարգը եղանակի տեսության թարգմանության համար։ 1960-ական թվականներին ԱՄՆ-ում և ԽՍՀՄ-ում ՄԹ հիմնականում կապված էր գիտական և տեխնիկական փաստաթղթերի ռուս-անգլերեն և անգլերեն-ռուսերեն թարգմանությունների հետ։ 1970-ական թվականների կեսերին մեծացավ ՄԹ պահանջարկը՝ պայմանավորված բազմալեզու համայնքներով և բազմազգ առևտրով Եվրոպայում, Կանադայում և Ճապոնիայում։ 1980-ական թվականներին ՄԹ համակարգերը շատացան, շատ ավելի երկրներ ընդգրկվեցին ՄԹ ստեղծման գործում։ SISTRAN-ից բացի սկսեցին ստեդծվեցին այլ համակարգեր ևս՝ Լոգոս համակարգը /գերմաներեն-անգլերեն և անգլերենֆրանսերեն/, METAL համակարգը /գերմաներեն-անգլերեն/: Անգլերեն-ճապոներեն և ճապոներեն-անգլերեն թարգմանությունների համար ճապոնական համակարգչային կազմակերպությունները ևս ստեղծեցին համակարգեր^[3]։

1978 թվականին ՀՊՃՀ-ի պրոֆեսորադասախոսական անձնակազմի և գիտական աշխատողների միջոցով ստեղծվե[ է ISMA համակարգը, որի ղեկավարներն են է. Մանուկյանը և Ս. Մանուկյանը։ Համակարգի նպատակն Է մշակել տվյալների և գիտելիքների բազաների կառավարման և արհեստական բանականության համակարգեր։ 2000 թվականից ծրագրի անձնակազմը հիմականում զբաղվել է տեքստային ինտելեկտուալ վերլուծիչների մշակմամբ^[3]։

Դեռևս 1996 թվականին Միավորված Ազգերի Կազմակերպությանը կից համալսարանի Տոկիոյի առաջատար տեխնոլոգիաների ինստիտուտում Հ. Ուչիդայի կողմից սկսվել Են UNL միջնորդ լեզվի մշակման աշխատանքները, որին այսօր մասնակցում են Բրազիլիան, Չինաստանը, Եգիպտոսը, Ֆրանսիան, Գերմանիան, Հնդկաստանը, Ինդոնեզիան, Իտալիան, Ճապոնիան, Լատվիան, Ռուսաստանը /ընդամենը 17 երկիր/: Հայաստանը ևս անդամակցել Է ընկերությանը։ Հայաստանի Գիտությունների ազգային ակադեմիայի ինֆորմատիկայի և ավտոմատացման պրոբլեմների ինստիտուտը ղեկավարում Է UNL-ի գծով Հայաստանում տարվող աշխատանքները։ Աշխատանքներին մասնակցում Է նաև Հայաստանի Գիտությունների ազգային ակադեմիայի լեզվի ինստիտուտը^[3]։

UNL-ը Universal Networking Language «Համընդհանուր ցանցային լեզու» արտահայտության հապավումն է։ UNL-ը համակարգչային լեզու է, որի միջոցով հնարավոր Է մշակել տեղեկատվություն և գիտելիք հաղթահարելով լեզվական պատնեշները։ Այն արհեստական լեզու է, որն ընդօրինակում է բնական լեզուների հաղորդակցման գործառույթները և հնարավորություն է ընդձեռում արտահայտելու բնական լեզուների հաղորդած ամբողջ գիտելիքը։ Այն համակարգչին ընձեռում է փոխհաղորդակցվելու հնարավորություն՝ մարդկանց տրամադրելով լեզվական ենթակաոուցվածք՝ բազմալեզու տեղեկատվություն ստանալու, հասկանալու և հաղորդելու համար։ UNL-ը բնական լեզուներից անկախ և համընդհանուր կառուցվածք է։ Բնական լեզուներով արտահայտված գիտելիքը և տեղեկատվությունը փոխարկման կանոններով կարելի Է արտահայտել UNL համակարգով և հակառակը, UNL-ով ներկայացված գիտելիքը և տեղեկատվությունը կարելի Է վերարտադրել բնական լեզուներով։ Սրա համար անհրաժեշտ նախապայման է ունենալ համակարգիչների համար մատչելի բնական լեզվի ձևային նկարագրություն և փոխարկման համապատասխան կանոններ։ UNL-ն ունի բնական լեզվին համապատասխանող բոլոր բաղադրիչները։ Այն կազմված Է հասկացություններ արտահայտող բառերից, որոնք կոչվում են «համընդհանուր բառեր»։ Համընդհանուր բառերից Է կազմված UNL-ի բառարանը։ Այն ոչ միայն իմաստաբանական և շարահյուսական միավոր Է հասկացություն արտահայտելու համար, այլև նախադասության և պարբերության UNL արտահայտությունը կառուցող հիմնական բաղադրիչ։ UNL նախադասությունը կազմվում է «համընդհանուր բառերի» փոխկապակցումներով, որոնք կոչվում են «հարաբերություններ»։ Իսկ հեղինակի կողմից UNL ներմուծված սուբյեկտիվ նշանակություններն արտայտվում են «բնութագրերի» միջոցով, որոնք ցույց են տափս խոսքային գործողություն, դատողական վերաբերմունք և այլն։ «Բնութագրեր»-ն օգտագործվում են նաև մի շարք հասկացական կարգեր արտահայտելու համար, օրինակ՝ սեռի քերականական կարգը^[3]։

Այսպիսով, «համընդհանուր բառեր»-ն ու «հարաբերություններ» օգտագործվում են նախադասության օբյեկտիվ ինֆորմացիան նկարագրելու համար, իսկ «բնութագրեր»-ը բնորոշում են «համընդհանուր բառեր»-ը կամ իմաստային ցանցերը՝ սուբյեկտիվ տեղեկություն արտահայտելու համար։ UNL համակարգը կազմված է երեք հիմնական մասերից' լեզվական ռեսուրսներից, լեզվական ռեսուրսները աշխատեցնող համակարգչային ծրագրերից, լեզուն աշխատեցնող համակարգչային ծրագրերը և լեզվական ռեսուրսները պահպանող և կիրառող միջոցներից ու համակարգերից^[3]։

Լեզվական ռեսուրսները բաժանվում են լեզվից կախյալ և լեզվից անկախ մասերի։ Լեզվից կախյալ ռեսուրսներ են բառային բառարանները, կանոնները և լեզվի օգտագործման համար ստեղծված համակարգչային ծրագրերը, որոնք պահվում են յուրաքանչյուր լեզվի սերվերում։ Լեզվից անկախ ռեսուրս է հասկացությունների վերաբերյալ լեզվական գիտելիքը, որը պահվում է UNLKB-ի ընդհանուր հենքում։ Հարկ է նշել, որ UNL տեքստի պատրաստումը ամբողջությամբ ավտոմատ չէ, ամբողջ աշխատանքը բաժանված է համակարգչի և մարդ-մասնագետի միջև։ Սրանով UNL-ը տարբերվում է մեքենական մյուս թարգմանություններից։ Ինչպես տեսնում ենք, ՄԹ համար ստեղծված յուրաքանչյուր համակարգ կամ դեռևս ծրագիր չի կատարում կատարյալ կամ գոնե ճշգրիտ թարգմանություն։ Իհարկե, ՄԹ յուրաքանչյուր ծրագրի անկատար թարգմանությունը պայմանավորված է տարբեր պատճառներով կամ խնդիրներով։ Մեր նշած ծրագրերի մեջ կարող ենք առանձնացնել մի քանի պատճառներ, բայց նախ նշենք, որ ցանկացած ՄԹ ծրագրի համար անհրաժեշտ է կոնկրետ լեզվի ձևային նկարագրություն և փոխարկման համապատասխան կանոններ։ Հայերենի քերականության ձևային կամ կաղապարային նկարագրության ուղղությամբ նախկինում կատարվել են որոշակի աշխատանքներ։ Գ. Ջահուկյանը նշված աշխատությունում մշակել է համընդհանուր լեզվաբանական կաղապարը և մասամբ կիրառել հայերենի նկատմամբ։ Սակայն որևէ լեզվի քերականության ձևային ամբողջական նկարագրություն ունենալու համար պարտադիր է քերականական կառուցվածքի բոլոր մակարդակների ներառումը տվյալ լեզվով տեղեկատվության ստացման, պահպանման, մշակման, Փոխակերպման և հաղորդման պահանջները առավելագույնս բավարարելու համար^[3]։

ՍԹ ծրագրերի նկարագրությունից պարզ Է առաջացած խնդիրների բնույթը, որը հիմնականում պայմանավորված է քերականության ձևային նկարագրության խնդիրներով։ Ինչպես գիտենք, յուրաքանչյուր բնական լեզու բարդ և ոչ միատարր կառուցվածք ունի և ձևայնացումը այնքան էլ հեշտ չէ։ Բնական լեզվի ձևայնացումը զգալի բարդություններ ունի ամենից առաջ ձևերի բազմիմաստության և միևնույն իմաստների բազմաձևության պատճառով։ Այդ դժվարությունները հաղթահարելու համար պետք է ընտրել որոշակի սկզբունքներ։ Նախ, նկարագրության օբյեկտը պետք է լինի կանոնարկված գրական լեզուն՝ առանց բարբառային, ժարգոնային, հնացած ձևերի, այլ կերպ ասած՝ լեզվի ստանդարտ վիճակը։ Ապա՝ նկարագրությունը պետք է լինի լրիվ, ներառելով բոլոր բացառությունները, անկանոն ձևերն ու շեղումները (նկատի ունենք միևնույն համակարգի սահմաններում), նկարագրությունը պետք է լինի անհակասական և իզոմորֆ, այսինքն լեզվի տարբեր մակարդակներ պետք է ներկայացվեն միևնույն միասնական սկզբունքներով և վերջապես, նկարագրությունը պետք է լինի խնայողական, այն իմաստով, որ սահմանափակ թվով կանոնների օգնությամբ հնարավոր լինի ներկայացնել միավորների առավելագույն քանակ։ Նշենք ձևային նկարագրության փորձերի մեջ առաջացած խնդիրներ՝

ա. մինչ այս արված փորձերն ունեն մասնավոր խնդիրներ կամ հատվածական են,
բ. նախատեսված չեն համակարգչային ծրագրերին ծառայելու համար,
գ. նկարագրությունները լրիվ կամ ամբողջական չեն,
դ. ներառված չեն բոլոր բացառությունները, անկանոն ձևերն ու շեղումները,
ե. նկարագրությունները խնայողական չեն, այսինքն՝ միավորների առավելագույն քանակը ներկայացված չէ սահմանափակ թվով կանոնների օգնությամբ^[3]։

Տես նաև խմբագրել

Ծանոթագրություններ խմբագրել

↑ ^1,0 ^1,1 ^1,2 ^1,3 ^1,4 ԿԻՐԱՌԱԿԱՆ ԼԵԶՎԱԲԱՆՈՒԹՅԱՆ ԶԱՐԳԱՑՈՒՄԸ ԵՎ ԽՆԴԻՐՆԵՐԸ ՀԱՅԱՍՏԱՆՈՒՄ, Բանասիր. գիտ. թեկնածու Մ. Ա. Սարգսյան
↑ ^2,0 ^2,1 ^2,2 Зубов А.В., Зубова И.И. Информационные технологии в лингвистике
↑ ^3,00 ^3,01 ^3,02 ^3,03 ^3,04 ^3,05 ^3,06 ^3,07 ^3,08 ^3,09 ^3,10 ՄԵՔԵՆԱԿԱՆ ԹԱՐԳՄԱՆՈՒԹՅԱՆ ԽՆԴԻՐՆԵՐԸ, ՇՈՒՇԱՆ ԱՍԻԼԲԵԿՅԱՆ

Այս հոդվածի կամ նրա բաժնի որոշակի հատվածի սկզբնական կամ ներկայիս տարբերակը վերցված է Քրիեյթիվ Քոմմոնս Նշում–Համանման տարածում 3.0 (Creative Commons BY-SA 3.0) ազատ թույլատրագրով թողարկված Հայկական սովետական հանրագիտարանից (հ․ 7, էջ 138)։

Վիքիպահեստն ունի նյութեր, որոնք վերաբերում են «Մաթեմատիկական լեզվաբանություն» հոդվածին։

[:0-1] 1,0 ^1,1 ^1,2 ^1,3 ^1,4 ԿԻՐԱՌԱԿԱՆ ԼԵԶՎԱԲԱՆՈՒԹՅԱՆ ԶԱՐԳԱՑՈՒՄԸ ԵՎ ԽՆԴԻՐՆԵՐԸ ՀԱՅԱՍՏԱՆՈՒՄ, Բանասիր. գիտ. թեկնածու Մ. Ա. Սարգսյան

[:1-2] 2,0 ^2,1 ^2,2 Зубов А.В., Зубова И.И. Информационные технологии в лингвистике

[:2-3] 3,00 ^3,01 ^3,02 ^3,03 ^3,04 ^3,05 ^3,06 ^3,07 ^3,08 ^3,09 ^3,10 ՄԵՔԵՆԱԿԱՆ ԹԱՐԳՄԱՆՈՒԹՅԱՆ ԽՆԴԻՐՆԵՐԸ, ՇՈՒՇԱՆ ԱՍԻԼԲԵԿՅԱՆ

[1]

[2]

[3]