Խոսքի (ձայնի) ճանաչում
Առաջարկվում է այս և [[:{{{1}}}|{{{1}}}]] հոդվածները միացնել իրար: (քննարկում) |
Առաջարկվում է այս և [[:{{{1}}}|{{{1}}}]] հոդվածները միացնել իրար: (քննարկում) |
Խոսքի ճանաչում(անգլ.՝ Speech Recognition)Խմբագրել
Խոսքի ճանաչումը (անգլ․՝ Speech Recognition[1] ) ձայնային ազդանշանների փոխակերպումն է թվայնացված տեղեկույթի։ Այլ կերպ՝ խոսքի ճանաչումը մեքենային հնարավորությունն է տալիս ճանաչել և հասկանալ մարդու արտահայտած բառերը, թվերը, արտահայտությունները և դրանք փոխակերպել մեքենային հասկանալի լեզվով։
ՊատմությունԽմբագրել
Գիտնականները միշտ փորձել են ստեղծել մեքենա, որն ի վիճակի կլինի նմանակել մարդու վարքագիծը և հատկապես նրա խոսելու և պատասխանելու կարողությունը։
Խոսքի տեխնոլոգիաները մեծ փոփոխություն են կրել սկսած Ալեքսանդր Գրեյհամ Բելլի ձայնագրման սարքից(Dictation machine[2]) մինչև այսօրվա խելացի վիրտուալ օգնականները, ինչպիսիք են Apple-ի Siri-ն[3], Amazon-ի Alexa-ն, Yandex-ի Alice[4]-ն և այլն։
Առաջին խոսք ճանաչող մեքենան ստեղծվել է 1952 թվականին Bell Labs-ի կողմից և կոչվել է Աուդրի համակարգ (Audrey system): Այս մեքենան միայն կարողացել է ճանաչել և հասկանալ մարդու կողմից արտաբերված 1-ից մինչև 10 թվերը։
1961-1962 [5] թվականներին IBM-ը ստեղծեց Shoebox[6] մեքենան, որը կարողանում էր հասկանալ մարդու կողմից արտաբերված 16 անգլերեն բառ, 10 թվեր և 6 թվաբանական գործողություններ։
Հզոր միկրոպրոցեսորների շնորհիվ 1990 թվականին Dragon-ը[7] ստեղծեց առաջին խոսք ճանաչող մեքենան սպառողների համար։ 7 տարի հետո ստեղծվեց այս մեքենայի կատարելագործված տարբերակը՝Dragon NaturallySpeaking-ը։ Այս ծրագիրը հասկանում էր շարունակական խոսքը՝ մարդը կարող էր խոսել օգտագործելով րոպեում 100 բառ։
1992[8] թվականին Apple-ը ստեղծեց իր խոսքի ճանաչման համակարգը, որն ուներ 20 հազար բառից բաղկացած բառապաշար։
2010 [9] թվականին Google-ը ներկայացրեց իր մասնագիտացված խոսք ճանաչող ծրագիրը Android համակարգերի վրա, որը հասկանում էր ավելի քան 230 միլիարդ անգլերեն բառ և արտահայտություն։
Բոլոր խոսքի ճանաչման համար ստեղծված մեքենաները կամ ծրագրերը աշխատում են մինչև 99% ճշտությամբ։ Այս համակարգերն ունեն սահմանափակ բառապաշար և կարողանում են հասկանալ մարդու արտահայտած խոսքը եթե այն հստակ է, շատ արագ չէ և եթե տվյալ մեքենան իր բառապաշարում պարունակում է արտաբերված խոսքում օգտագործված բառերը։
Խոսք ճանաչող մեքենաները կամ ծրագրերը առանձնացվում են հետևյալ հատկություններով։
- Բառապաշարի մեծությամբ(որքան մեծ է բառապաշարը, այդքան բարձր է նրա աշխատանքի ճշտությունը։)
- Խոսողից կախվածությամբ(արտահայտվող խոսքի արագությամբ, ձայնի հստակությամբ։)
- Խոսքի տեսակով(տարբեր բնագավառներին առընչվող խոսքերում օգտագործվում են տարբեր բառապաշարներ։)
- Նշանակությամբ(թելադրանք,հրամանի համակարգեր։)
- Օգտագործվող ալգորիթմով(նեյրոնային ցանցեր, դինամիկ ծրագրավոորում։)
- Ըստ կառուցվածքային միավորի տեսակի (բառեր, արտահայտություններ, հնչյուններ։)
ԿիրառությունԽմբագրել
- Ձայնի վերահսկում
- Ձայնային հրամաններ
- Ձայնի միջոցով տեքստի մուտքագրում
- Ձայնի միջոցով որոնումների կատարում
Տես նաևԽմբագրել
- https://www.textfromtospeech.com/ru/voice-to-text/
- https://www.pcworld.com/article/235848/best_voice_recognition_apps_for_your_smartphone.html
- https://www.youtube.com/watch?v=q67z7PTGRi8
- https://www.youtube.com/watch?v=g-sndkf7mCs
- https://www.youtube.com/watch?v=HyUtT_z-cms
- https://www.youtube.com/watch?v=RBYTKrM5rjE
- https://www.youtube.com/watch?v=UMh9EmgkN6w
- https://www.youtube.com/watch?v=PF6q8hUdKz8
- https://www.youtube.com/watch?v=BpTXT1nKNJ4
- https://www.youtube.com/watch?v=UTbkVrtC0sY
- https://en.wikipedia.org/wiki/List_of_speech_recognition_software
ԳրականությունԽմբագրել
- Fundamental of Speech Recognition - (Lawrence Rabiner - Biing Hwang Juang) հղումը՝ https://www.academia.edu/4924307/Fundamental_of_Speech_Recognition_-_Lawrence_Rabiner_-_Biing_Hwang_Juang_
- И.Б. Тампель, А.А. Карпов АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ РЕЧИ հղումը՝ https://books.ifmo.ru/file/pdf/1921.pdf
- Компьютерные системы распознавания речи И. Л. Мазуренко հղումը՝ http://intsys.msu.ru/magazine/archive/v3(1-2)/mazurenko.pdf
- Speech Recognition over digital channels. Robustness and Standards - A.M.Peinado, J.C.Segura [2006]
- Statistical Methods For Speech Recognition - Frederick Jelinek [1998]
- Automatic Speech Recognition – A Brief History of the Technology Development B.H. Juang# & Lawrence R. Rabiner հղումը՝http://www.ece.ucsb.edu/Faculty/Rabiner/ece259/Reprints/354_LALI-ASRHistory-final-10-8.pdf
- Readings in Speech Recognition edited by Alexander Waibel, Kai-Fu Lee հղումը՝ https://books.google.am/books?id=iDHgboYRzmgC&pg=PA551&lpg=PA1&dq=darpa+harpy&source=bl&ots=ja6SEQTlgF&sig=YkBDHyTTK-8_0FnR_94sbsoS6IQ&hl=en&ei=1oupTpekCanZ0QHP6vy_Dg&sa=X&oi=book_result&ct=result&redir_esc=y#v=onepage&q&f=false
Արտաքին հղումներԽմբագրել
- https://asa.scitation.org/doi/abs/10.1121/1.1906946
- http://www.happyscribe.co/blog/history-voice-recognition/
- https://xakep.ru/2005/06/01/26846/
- https://www.academia.edu/28354015/speech_recognition_statistical_methods_.pdf
- https://www.pcworld.com/article/243060/speech_recognition_through_the_decades_how_we_ended_up_with_siri.html
- https://www.revolvy.com/page/Speech-recognition
ԾանոթագրություններԽմբագրել
Այս հոդվածը կատեգորիայի կարիք ունի։ Դուք կարող եք օգնել նախագծին՝ կատեգորիա գտնել կամ ստեղծել ու ավելացնել հոդվածին։ |
- ↑ Speech recognition(անգլ.) // Wikipedia. — 2019-09-25.
- ↑ Dictation machine(անգլ.) // Wikipedia. — 2019-08-09.
- ↑ «What Makes Siri Special?»։ PCWorld (անգլերեն)։ 2011-10-24։ Վերցված է 2019-10-23
- ↑ Alice (virtual assistant)(անգլ.) // Wikipedia. — 2019-06-12.
- ↑ LLC Revolvy։ «"IBM Shoebox" on Revolvy.com»։ www.revolvy.com (անգլերեն)։ Վերցված է 2019-10-23
- ↑ IBM Shoebox(անգլ.) // Wikipedia. — 2019-07-21.
- ↑ «Speech Recognition Through the Decades: How We Ended Up With Siri»։ PCWorld (անգլերեն)։ 2011-11-02։ Վերցված է 2019-10-23
- ↑ app! Get exclusive content, get the (2017-02-18)։ «In 1992 Before Apple’s Siri, There Was Casper.»։ @ReadMultiplex (անգլերեն)։ Վերցված է 2019-10-23
- ↑ «Voice Search gets personal»։ Վերցված է 2019-10-23