Մասնակից:Aletajanamyan/Ավազարկղ1

Բանավոր խոսքի կորպուս խմբագրել

Խոսքի կորպուսը (կամ խոսակցական կազմը) խոսքի աուդիո ֆայլերի և տեքստերի վերծանումների շտեմարան է: Խոսքի տեխնոլոգիայում խոսքի կորպուսները, ի թիվս այլ նպատակների, օգտագործվում են ձայնային մոդելներ ստեղծելու համար (որոնք այնուհետև կարող են օգտագործվել խոսքի ճանաչման կամ բարձրախոսի նույնականացման մեխանիզմով) [1] : Լեզվաբանության մեջ բանավոր խոսքի կորպուսները օգտագործվում են հնչյունաբանական, խոսակցական վերլուծության, բարբառագիտության և այլ ուղղոիթյուններով հետազոտություններ կատարելու համար: Կորպուսը նման տվյալների բազաներից մեկն է: Կորպորացիան corpus- ի հոգնակի թիվն է (այսինքն `այդպիսի բազում շտեմարանե): Խոսքի կորպուսները լինում են երկու տեսակի. Հնրող խոսքի վերծանում, որը ներառում է. Գրքերի հատվածներ Հեռարձակվող նորություններ Բառացուցակներ Թվերի հաջորդականություններ Սպոնտան խոսք - որը ներառում է. Երկխոսություն - երկու կամ ավելի մարդկանց միջև (ներառում է հանդիպումներ); Պատմվածքներ - անձը ներկայացնում է որևէ պատմություն (այդպիսի կորպուսներից մեկը Buckeye Corpus- ն է); Քարտեզ-առաջադրանքներ.Անձ քարտեզի հիման վրա երթուղին բացատրում է մյուսին. Պայմանավորվածության հաստատում. Երկու մարդ փորձում են գտնել հանդիպման հարմար ժամանակ ՝ հիմնվելով անձնականն ժամանակացույցի վրա: Բանավոր խոսքի կորպուսների հատուկ տեսակ են ոչ բնիկների խոսքի շտեմարանները, որոնք արտացոլում են խոսքը՝ օտար շեշտադրմամբ:

Տես նաև խմբագրել

  • Լեզվի մահ
  • Անհետացող լեզուներ


Ծանոթագրություններ խմբագրել

  1. Langslow, D.R. 2002 "Approaching bilingualism in corpus languages" in James Noel Adams, Mark Janse, Simon Swain (edd.) Bilingualism in Ancient Society: Language Contact and the Written Text Oxford: OUP