Ժեստերի ճանաչումը (անգլ․՝ gesture recognition) համակարգչային գիտությունների և լեզվական տեխնոլոգիայի թեմա է, որի նպատակն է մարդկային ժեստերը մեկնաբանել մաթեմատիկական ալգորիթմների միջոցով։ Ժեստերը կարող են ծագել ցանկացած մարմնական շարժումից կամ վիճակից, բայց սովորաբար ծագում են դեմքի կամ ձեռքի շարժումից։ Ոլորտում ներառված են հույզերի ճանաչումը(emotion recognition) դեմքի միջոցով և ձեռքի ժեստերի ճանաչումը(hand gesture recognition): Օգտատերերը կարող են պարզ ժեստերի միջոցով կառավարել կամ ազդել սարքավորումների վրա՝ առանց ֆիզիկապես դրանց դիպչելու։ Նշանակությունների լեզուն (sign language) մեկնաբանելու համար բազմաթիվ տարբերակներ են կիրառվել ՝ օգտագործելով տեսախցիկներ և համակարգչային տեսլականների ալգորիթմներ: Այնուամենայնիվ, կեցվածքի, քայլքի, պրոքսեմիայի և մարդու վարքագծի նույնականացումը և ճանաչումը նույնպես ժեստերի ճանաչման տեխնիկայի առարկա են: [1]Ժեստերի ճանաչումը կարելի է դիտարկել որպես համակարգիչների՝ մարդու մարմնի լեզուն հասկանալ սկսելու միջոց՝ այդպիսով կառուցելով ավելի ուժեղ կամուրջ մեքենաների և մարդկանց միջև, քան պարզունակ տեքստային օգտվողի միջերեսները(text user interfaces) կամ նույնիսկ GUI- ներն են (graphical user interfaces), և դրանք փոխազդում են բնական կերպով՝ առանց մեխանիկական սարքերի:

Ժեստերի ճանաչման առանձնահատկությունները խմբագրել

  • Ավելի ճշգրիտ
  • Բարձր կայունություն
  • Սարքը բացելու համար ժամանակի խնայողություն

Ներկայիս ժեստերի ճանաչման հիմնական կիրառական ոլորտների սցենարը հետևյալն է.

  • Ավտոմոբիլային ոլորտ
  • Սպառողական էլեկտրոնիկայի ոլորտ
  • Տարանցիկ ոլորտ
  • Խաղային ոլորտ
  • Սմարթֆոնները բացելը
  • Պաշտպանություն [2]
  • Տան ավտոմատացում
  • Ավտոմատ նշանաբառերի թարգմանություն

Ժեստերի տեսակները խմբագրել

Համակարգչային ինտերֆեյսում, երկու տեսակի ժեստեր են առանձնանում:[3]

  • Անցանց ժեստեր. Այն ժեստերը, որոնք մշակվում են օբյեկտի հետ օգտագործողի փոխազդեցությունից հետո: Օրինակ՝ մենյուն ակտիվացնելու ժեստը:
  • Առցանց ժեստեր. Ուղղակի մանիպուլյացիայի ժեստեր: Դրանք օգտագործվում են շոշափելի առարկան մասշտաբելու կամ պտտելու համար:

Մուտքային սարքեր խմբագրել

Անձի շարժումները հետևելու և նրա ժեստերը որոշելու ունակությանը կարելի է հասնել տարբեր գործիքների միջոցով: Կինետիկ օգտագործողի միջերեսները (KUIs) ինտերֆեյսերի զարգացող տեսակներ են, որոնք թույլ են տալիս օգտվողներին փոխազդել հաշվարկային սարքերի հետ՝ օբյեկտների և մարմինների շարժման միջոցով:[4] KUI- ների օրինակները ներառում են շոշափելի ինտերֆեյսեր և շարժման մասին տեղեկացված խաղեր, ինչպիսիք են Wii- ն, Microsoft- ի Kinect- ը և այլ ինտերակտիվ նախագծեր: Չնայած կան մեծ քանակությամբ հետազոտություններ, որոնք արվել են պատկերի / վիդեոյի վրա հիմնված ժեստերի ճանաչման գործընթացում, ներդրումների միջև օգտագործվող գործիքների և միջավայրերի միջև կա որոշակի տարբերություն:

Ալգորիթմներ խմբագրել

Կախված մուտքային տվյալների տեսակից, ժեստ մեկնաբանելու մոտեցումը կարող է իրականացվել տարբեր եղանակներով: Այնուամենայնիվ, տեխնիկայի մեծ մասը ապավինում է 3D ցուցանշանային համակարգում ներկայացված հիմնական ցուցիչներին: Ելնելով դրանց համեմատական շարժումից `ժեստը կարող է հայտնաբերվել մեծ ճշգրտությամբ` կախված մուտքի որակից և ալգորիթմի մոտեցումից: Մարմնի շարժումները մեկնաբանելու համար հարկավոր է դրանք դասակարգել ըստ ընդհանուր հատկությունների և այն հաղորդագրության, որը կարող են արտահայտել շարժումները: Օրինակ ՝ նշանների լեզվով յուրաքանչյուր ժեստ ներկայացնում է որևէ բառ կամ արտահայտություն: Տաքսոնոմիան, որը մարդկային-համակարգչային փոխազդեցության համար շատ տեղին է թվում, առաջարկել է Քուեքը «Դեպի տեսլականի վրա հիմնված ձեռքի ժեստերի միջերես»—ում:[5] Նա ներկայացնում է մի քանի ինտերակտիվ ժեստերի համակարգ ՝ ժեստերի ամբողջ տարածքը գրավելու համար․
1. Մանիպուլյատիվ
2. ԿիսաֆորիկԽոսակցակա
3. Խոսակցական

Մարտահրավերներ խմբագրել

Կան բազմաթիվ մարտահրավերներ, որոնք կապված են ժեստերի ճանաչման ծրագրակազմի ճշգրտության և օգտակարության հետ: Պատկերի վրա հիմնված ժեստերի ճանաչման համար կան սահմանափակումներ օգտագործված սարքավորումների և պատկերի աղմուկի վրա: Նկարները կամ տեսանյութերը կարող են լինել հաստատուն լուսավորության տակ կամ նույն վայրում: Հետնաշերտի տարրերը կարող են բարդացնել ճանաչումը: Պատկերների վրա հիմնված ժեստերի ճանաչման համար իրականացվող բազմազանությունը կարող է նաև խնդիր առաջացնել տեխնոլոգիայի կենսունակության ընդհանուր օգտագործման համար: Օրինակ՝ մեկ ֆոտոխցիկի համար տրամաչափված ալգորիթմը կարող է չաշխատել այլ խցիկի համար: Ֆոնային աղմուկի քանակը նույնպես առաջացնում է հետևելու և ճանաչելու դժվարություններ, հատկապես, երբ տեղի են ունենում խցանումներ (մասնակի և լրիվ): Ավելին, խցիկից հեռավորությունը և տեսախցիկի լուծաչափը և որակը նույնպես առաջացնում են ճանաչման ճշգրտության տատանումներ։ Տեսողական տվիչների միջոցով մարդկային ժեստերը գրավելու համար անհրաժեշտ են նաև համակարգչային տեսլականների ուժեղ մեթոդներ, օրինակ ՝ ձեռքի հետապնդման և ձեռքի կեցվածքի ճանաչման համար կամ գլխի, դեմքի արտահայտությունների , հայացքների ուղղության շարժումները գրավելու համար:

«Գորիլայի բազուկը» խմբագրել

«Գորիլայի բազուկը» ուղղահայաց կողմնորոշված սենսորային էկրան օգտագործելու կողմնակի ազդեցություն էր: Երկարատև օգտագործման ժամանակահատվածում օգտագործողների ձեռքերը սկսեցին հոգնածություն և անհարմարություն: Այս էֆֆեկտը նպաստեց սենսորային էկրան մուտքի անկմանը, չնայած նախնական հայտնիությանը 1980-ականներին:[6] Ձեռքի հոգնածությունը և «Գորիլայի բազուկի» կողմնակի ազդեցությունը չափելու համար հետազոտողները մշակեցին տեխնիկա, որը կոչվում է «Սպառված տոկունություն»:

Ծանոթագրություններ խմբագրել

  1. [1] Matthias Rehm, Nikolaus Bee, Elisabeth André, Wave Like an Egyptian – Accelerometer Based Gesture Recognition for Culture Specific Interactions, British Computer Society, 2007
  2. [2] "Patent Landscape Report Hand Gesture Recognition PatSeer Pro". PatSeer. Retrieved 2017-11-02.
  3. [3]Dietrich Kammer, Mandy Keck, Georg Freitag, Markus Wacker, Taxonomy and Overview of Multi-touch Frameworks: Architecture, Scope and Features Archived 2011-01-25 at the Wayback Machine
  4. [4] V. Pallotta; P. Bruegger; B. Hirsbrunner (February 2008). "Kinetic User Interfaces: Physical Embodied Interaction with Mobile Pervasive Computing Systems". Advances in Ubiquitous Computing: Future Paradigms and Directions. IGI Publishing.
  5. [5] Quek, F., "Toward a vision-based hand gesture interface" Proceedings of the Virtual Reality System Technology Conference, pp. 17-29, August 23–26, 1994, Singapore
  6. [6] Rupert Goodwins. "Windows 7? No arm in it". ZDNet.

Արտաքին հղումներ խմբագրել


Գրականություն խմբագրել

  • Saha, Sriparna (2018). Gesture Recognition: Principles, Techniques and Applications (Studies in Computational Intelligence). (անգլ.)
  • Athitsos, Vassilis (2017). Gesture Recognition (The Springer Series on Challenges in Machine Learning). (անգլ.)
  • M., Philip (2019). The 2020-2025 World Outlook for Gesture Recognition Technologies. (անգլ.)
  • Chaudhary, Ankit (2018). Robust Hand Gesture Recognition for Robotic Hand Control ). (անգլ.)
  • Nirantar, Sriparna (2012). Smart and Energy-Efficient Home Automation using Gesture Recognition: Controlling home appliances and devices with the flick of your hand. (անգլ.)