Ձեռագիր տեքստի ճանաչումը համակարգչային հնարավորություն է, որը թույլ է տալիս ստանալ և թարգմանել տեքստը գրավոր փաստաթղթերից, լուսանկարներից, թաչ֊սքրին էկրաններից և այլ սարքրից։ Տեքստի ճանաչումը կարող է կատարվել «օֆլայն» մեթոդով, որը գրված է թղթի վրա գրված տեքստից կամ «առցանց» եղանակով, հաշվի առնելով գրիչի կամ մատի ծայրի շարժումները, օրինակ, հատուկ համակարգչի էկրանին մակերեսին[1]։

Տեքստի ճանաչումը կարող է կատարվել «օֆլայն», «անցանց» կամ «առցանց» եղանակով։Ձեռագրերի ճանաչումը ներառող առևտրային ապրանքները ներկայացվել են 1980-ականների սկզբին։ 1990-ականների սկզբին որոշ սարքավորումներ արտադրողներ, ներառյալ NCR, IBM և EO, արտադրում էին պլանշետային համակարգիչներ PenPoint օպերացիոն համակարգով, որը մշակվել է GO Corp - ի կողմից. IBM Tablet PC- ն առաջինն էր, ով օգտագործեց ThinkPad անունը և օգտագործեց IBM- ի ձեռագրերի ճանաչման համակարգը, որը հետագայում փոխանցվեց Microsoft- ի Windows- ին `Pen Computing- ի համար։ Այս ապրանքները չեն հասել առևտրային հաջողությունների։ Անցանց ճանաչման հիմնական խնդիրներն են կերպարների ճանաչումը և բառի ճանաչումը:Այս ճանաչման տեսակը համարվում է ավելի բարդ, քան առցանցն է։ Անցանց ճանաչումը պահանջում է մարդու կողմից կատարվող դասընթաց կամ պատրաստի ուսուցման նմուշ։ Փաստաթղթերի վերլուծությունը ճանաչման անհրաժեշտ նախնական քայլ է, որը տեղակայում է համապատասխան տեքստը, երբ աշխատում են բարդ դասավորություններ։ Առցանց ձեռագրերի ճանաչումը ներառում է տեքստի ավտոմատ փոխարկումը, քանի որ այն գրված է հատուկ թվանշանի կամ PDA- ի վրա։

Առցանց ճանաչում

խմբագրել

Առցանց ճանաչման ինտերֆեյսը սովորաբար բաղկացած է հետևյալից.

  • գրիչ կամ ստիլուս, որով օգտագործողը կատարում է մուտք
  • մակերես, որը զգայուն է հպումներին և որը ինտեգրվում է էկրանին
  • ծրագրային ապահովում, որը վերծանում է սթայլուս֊ի շարժումները գրվող մակերեսի վրա, թարգմանելով տողերը թվային տեքստում
  • Handwriting ճանաչումը լայնորեն կիրառվում է գրպանի համակարգիչ (pocket PC)-ներում։

Առաջին ձեռագրերը ճանաչող առաջին pocket PC- ն Apple Newton- ն է։

Օպտիկական նիշերի ճանաչումը (OCR) ձեռագրերի ճանաչման համար օգտագործվող ամենատարածված մեթոդն է։ Սա կատարվում է փաստաթղթի տեքստի սկանավորումով։ Այն աշխատում է նաև ձեռքով գրված տեքստի նկարի համար[2]։

Անցանց (offline) ճանաչում

խմբագրել

Այս ճանաչման տեսակը համարվում է ավելի բարդ, քան առցանցն է։ Անցանց ճանաչումը պահանջում է մարդու կողմից կատարվող դասընթաց կամ պատրաստի ուսուցման նմուշ։ Նման մեխանիզմը կիրառվում է ABBYY FineReader-ում ։ Ճանաչման որակը կարող է բարելավվել `օգտագործելով կառուցվածքային փաստաթղթեր ։ Բացի այդ, դուք կարող եք բարելավել որակը, նվազեցնելով հնարավոր մուտքագրման նիշերը։ Offline ճանաչումը օգտագործվում է այն տարածքներում, որտեղ անհրաժեշտ է մշակել բազմաթիվ ձեռագիր փաստաթղթեր, օրինակ, ապահովագրական ընկերություններում։

1990-ականների սկզբին սարքավորումների արտադրողները, ներառյալ NCR, IBM-ը և EO-ն, սկսեցին արտադրել GO Corp-ի կողմից մշակված պլանշետային համակարգիչներ, որոնք պարունակում էին PenPoint օպերացիոն համակարգ։ PenPoint-ը թույլ է տալիս օգտագործել ձեռագիր գրվածք ամբողջ ընթացքում և ապահովել երրորդ կողմի ծրագրակազմի համատեղելիությունը։ IBM- ի Tablet PC-ն առաջինն էր, որ օգտագործեց ThinkPad-ը և IBM-ի ձեռագրերի ճանաչումը։ Այս ճանաչման համակարգը հետագայում օգտագործվեց Microsoft Windows-ում, Pen Computing-ի և IBM-ի Pen OS / 2-ի համար։ Այս տեխնոլոգիաներից ոչ մեկը առևտրային տեսանկյունից հաջող չէր։ Ժամանակակից ձեռագրերի ճանաչման համակարգը ներառված է պլանշետային համակարգիչներում օգտագործվող Microsoft օպերացիոն համակարգերում (Windows XP Tablet PC Edition և Windows Vista): Այն հիմնված է Մայքրոսոֆթ-ի կողմից ստեղծված «Inferno» TDNN դասակարգչի վրա։

Ձեռագրքի ճանաչումը ունի ակադեմիական ակտիվ համայնք, որն ուսումնասիրում է այն։ Ձեռագրքի ճանաչման ամենամեծ կոնֆերանսներից է` ձեռագրերի ճանաչման սահմանապահների միջազգային կոնֆերանսը[3] և Փաստաթղթերի վերլուծության և ճանաչման միջազգային համաժողովը (ICDAR): Երկու կոնֆերանսները հավանության են արժանացել IEEE-ի և IAPR-ի կողմից։ Հետազոտության ակտիվ ոլորտներն են`

  • Առցանց ճանաչում
  • Ստորագրությունների հաստատում
  • Փոստային հասցեի մեկնաբանություն
  • Բանկի ստուգման գործընթացներ գրողի ճանաչում

Սարքեր

խմբագրել

Էլեկտրոնիկայի զարգացումը թույլ է տվել, որ ձեռագրերի ճանաչման համար անհրաժեշտ հաշվարկային ուժը լինի փոքր չափսերով, քան պլանշետային համակարգիչները, և օգտագործի ձեռագրերի ճանաչումը որպես PDA- ների ներդրման գործիք։ Առաջին PDA- ն, որը տրամադրեց գրավոր ներդրումը, Apple Newton- ն էր, որը հանրությանը ցույց տվեց այս տեսակի օգտագործողի միջերեսի առաքինությունները։ Այնուամենայնիվ, սարքը կոմերցիոն առումով հաջողված չէր համակարգչային թերությունների պատճառով, որոնք պետք է փորձեին սովորել օգտագործողի գրելու ոճը։ Apple Newton - ի հետ կոտրվելուց հետո տեխնոլոգիան տեղափոխվեց Mac OS X 10.2 , իսկ ավելի ուշ ՝ Inkwell տեխնոլոգիա։

Ձեռագրերի ճանաչման ժամանակակից համակարգ ընդգրկված է պլանշետային համակարգիչներում օգտագործվող Microsoft գործավար համակարգերում ։ Այն հիմնված է Microsoft- ի կողմից ստեղծված «Inferno» կոչվող TDNN դասակարգչի վրա։ Ավելի ուշ, Նյութոն ՕՀ 2.0-ում օգտագործված ՝ CalliGrapher- ի ՝ ձեռագրերի ճանաչման ծրագրաշարի տարբերակն ընդգրկվեց որպես երկրորդական ճանաչիչ։ PhiWare- ի կողմից ներկայումս մշակվում է CalliGrapher- ի նոր սերունդ ՝ Windows Mobile- ի համար։

Պլանշետային համակարգիչը նոութբուք է, որը հագեցած է թվանշանակիչով և ստիլուսով, ինչը թույլ է տալիս օգտագործողին ձեռքով գրել տեքստը էկրանին։ Օպերացիոն համակարգը ճանաչում է ձեռագիր տեքստը և այն վերածում մեքենայական տեքստի։ Windows Vista- ն և Windows 7-ը ներառում են անհատականացման առանձնահատկություններ, որոնք ուսումնասիրում են օգտագործողի ձեռագրերի և բառարանների առանձնահատկությունները անգլերեն, ճապոներեն, չինարեն ավանդական, չինարեն պարզեցված, կորեերեն և այլ լեզուների համար։ (Windows 7-ը կարող է ռուսերեն ճանաչել ձեռագիր տեքստը)։ «Անհատականացման հրաշագործը» հնարավորություն է տալիս վերապատրաստել համակարգը `համակարգչի հատուկ օգտագործողի կողմից գրված ձեռագիր տեքստի ավելի բարձր ճշգրտության համար։

2000-2004 թվականներին EverNote կորպորացիայի կողմից մշակված «երրորդ սերնդի» RiteScript ձեռագրերի ճանաչման տեխնոլոգիան ներառված է RitePen և EverNote: RitePen- ը նաև ներառում է տեխնոլոգիա, որը համատեղում է RiteScript- ը ինտեգրված Windows Vista ձեռագրերի ճանաչման հետ `բարելավելու յուրաքանչյուր ձեռագիր ճանաչման շարժիչը:Այս համակարգը տարբերվում է քիչ զարգացած ձեռագրերի ճանաչման համակարգից, որն օգտագործվում է Windows Mobile - ում։

Ծանոթագրություններ

խմբագրել
  1. «Handwriting recognition» (անգլերեն). 2018 թ․ նոյեմբերի 2. {{cite journal}}: Cite journal requires |journal= (օգնություն)
  2. Chung, Jonathan (2018 թ․ սեպտեմբերի 4). «Handwriting OCR: handwriting recognition and language modeling with MXNet Gluon». Medium. Վերցված է 2019 թ․ հունվարի 8-ին.
  3. ICFHR