Մասնակից:Varazdat Poghosyan/Արհեստական բանականության տեսողությունը

Համակարգչային տեսողությունը (computer vision) շուրջ 50 տարի է անցել է, բայց վերջերս մենք տեսնում ենք հետաքրքրության մեծ հարստություն այն մասին, թե ինչպես են մեքենաները «տեսնում» և ինչպես համակարգչային տեսողությունը կարող է օգտագործվել սպառողների և բիզնեսի համար ապրանքներ կառուցելու համար: Նման դիմումների մի քանի օրինակ են `Amazon Go, Google Ոսպնյակներ, ինքնավար տրանսպորտային միջոցներ, դեմքի ճանաչում: Այս ամենի հիմնական շարժիչ գործոնը Computer Vision- ն է: Ամենապարզ իմաստով ՝ Computer Vision- ը Արհեստական ինտելեկտի լայն շրջանակի կարգապահությունն է, որը սովորեցնում է մեքենաներին տեսնել: Դրա նպատակը պիքսելներից իմաստը քաղելն է: Կենսաբանական գիտության տեսանկյունից նրա նպատակը մարդու տեսողական համակարգի հաշվարկային մոդելների մշակմանը: Տեխնիկական տեսանկյունից, համակարգչային տեսողությունը նպատակ ունի կառուցել ինքնավար համակարգեր, որոնք կարող են կատարել որոշ առաջադրանքներ, որոնք կարող են կատարել մարդու տեսողական համակարգը (և նույնիսկ շատ դեպքերում գերազանցելու է այն): Deep Learning- ը դուրս է եկել 2012 թվականից: Խորը ուսումը մեքենայական ուսուցման ենթահամակարգ է, որտեղ արհեստական նյարդային ցանցերը, մարդու ուղեղով ներշնչված ալգորիթմները, սովորում են տվյալների մեծ քանակությունից: Էներգետիկորեն առաջարկող համակարգերը, լուսանկարներում ընկերներին նույնականացնել և պիտակավորել, ձեր ձայնը տեքստային փոխել, տեքստը թարգմանել տարբեր լեզուների, Deep Learning- ը փոխակերպել է համակարգչային տեսլականը `առաջնորդվելով դեպի բարձրակարգ կատարման: Խորը ուսուցման վրա հիմնված համակարգչային տեսողության ալգորիթմները, ինչպիսիք են (Convolutional) նյարդային ցանցերը, սկսել են խոստումնալից արդյունքներ տալ առավելագույն ճշգրտություններով ՝ նույնիսկ գերազանցելով որոշ խնդիրների վրա մարդու մակարդակի ճշգրտությունը:

Տես նաև խմբագրել

Սմարթֆոններ. QR կոդեր, հաշվողական լուսանկարչություն (Android Lens Blur, iPhone Դիմանկարների ռեժիմ), պանորամայի կառուցում (Google Photo Sphere), դեմքի հայտնաբերում, արտահայտման հայտնաբերում (ժպիտ), Snapchat ֆիլտրեր (դեմքի հետևում), Google Lens, Night Sight (Pixel) Վեբ. Պատկերների որոնում, Google- ի լուսանկարներ (դեմքի ճանաչում, օբյեկտի ճանաչում, տեսարանի ճանաչում, տեսողության աշխարհաքանակացում), Facebook (պատկերների նկարագրում), Google քարտեզներ օդային պատկերներ (պատկերների ձևավորում), YouTube (բովանդակության դասակարգում) VR / [[AR. Արտաքին հետևում (HTC VIVE), ներսում հետևում (միաժամանակ տեղայնացում և քարտեզագրում, HoloLens), օբյեկտի խցանում (խիտ խորության գնահատում) Բժշկական պատկերացում. CAT / MRI- ի վերակառուցում, օժանդակ ախտորոշում, ավտոմատ պաթոլոգիա, կոնեկտոմիկա, AI- ով առաջնորդվող վիրահատություն

Արտաքին հղումներ խմբագրել

https://towardsdatascience.com/computer-vision-an-introduction-bbc81743a2f7 https://machinelearningmastery.com/what-is-computer-vision/ https://www.forbes.com/sites/bernardmarr/2019/04/08/7-amazing-examples-of-computer-and-machine-vision-in-practice/ https://www.iotforall.com/computer-vision-applications-in-daily-life/ Net

Ծանոթագրություններ խմբագրել

Համակարգչային տեսողությունը բարելավում է սոցիալական մեդիայի օգտագործողի փորձը Snapchat- ի օգտվողները սիրում են ծածկել նապաստակի ականջները և հեքիաթային փոշին, օրինակ, ընկերների պատկերների վրա, մինչ սիրողական լուսանկարիչները քայլում կամ կատակել են իրենց բջջային հեռախոսները: Այն, ինչ թվում է, թե այդպիսի պարզ գործողությունն իրականում ապավինում է համակարգչային տեսողության ալգորիթմներին: Հաշվարկները անընդհատ ընկնում են տվյալների հսկայական քանակի տվյալների մասին պատկերների հոսքի տարրերի օբյեկտների և տարրերի հարաբերական դիրքի վերաբերյալ:

Pinterest- ը ունի բջջային հեռախոսի ծրագիր, որը կոչվում է Ոսպնյակներ, որոնք օգտագործում են համակարգչային տեսողությունը: Հավելվածը կարող է ասել օգտվողներին, որտեղ, օրինակ, լուսանկարում գտնվողը գնել է զարմանալի զույգ սպորտային կոշիկ, որը նա կրում է: Համակարգչային տեսողության դիմումը կարող է ցուցադրել նաև կոշիկներ, որոնք համապատասխանում են ապրանքի ձևավորմանը և ոճին:

Համակարգչային տեսողություն սպառողների համար Ամբողջ աշխարհի բանկերն այժմ օգտագործում են համակարգչային տեսողությունը `հեռակա ստուգումները պահելու համար: Բանկային հաճախորդները իրենց բջջային սարքի հետ լուսանկարում են թղթի ստուգման լուսանկարը: Բանկային ծրագրում համակարգչային տեսողության ծրագրակազմը գրավում է բանկում ավանդի համար նախատեսված չեկի պատկերը, այնուհետև ստուգում է, թե արդյոք չեկի ստորագրությունը իրական է: Ֆոնդերը սովորաբար մատչելի են դառնում ստուգման աշխատանքային օրվա ընթացքում օգտագործման համար:

2017-ի գարնանը Amazon- ը դուրս հանեց իր Echo Look արտադրանքը: Echo Look- ը fashionistas- ին հնարավորություն է տալիս ամբողջությամբ վերցնել սելֆի: Համակարգչային տեսողության առաջարկի հետևում գտնվող AI- ն այնուհետև համեմատում է հանդերձանքը իր առաջարկած տարբերակների հետ և օգտվողին տալիս է ընդհանուր ոճային վարկանիշ:

Մինչդեռ, սպառողները կարող են զգալ, որ իրենց բոլոր հարմարանքները ապահովված են տանը `ցածր գներով անվտանգության տեսախցիկներով, որոնք օգտագործում են համակարգչային տեսողությունը` տնային տնտեսությունը ուժեղացնելու համար: Օրինակ ՝ Netatmo– ի ներկայության բացօթյա հսկողության արտադրանքը ահազանգում է տան սեփականատերերին, որ մեքենան, անձը կամ կենդանին եկել են գույքի վրա: Netatmo Welcome տեսախցիկները ՝ ընկերության ներքին արտադրանքը, օգտագործում են դեմքի ճանաչման ծրագրակազմ ՝ ողջունելու այցելուներին անցանկալի ներխուժումներից:

Համակարգչային տեսլականը միայն տնային անվտանգության համար չէ: Իրավապահ մարմինները տեսել են դրա առավելությունները ճանապարհին քաղաքացիներին պաշտպանելու մեջ:

Համակարգչային տեսողությունը օգնում է պաշտպանել հասարակությանը Ըստ IEEE- ի ՝ Միացյալ Նահանգների ոստիկանության ստորաբաժանումների 70 տոկոսից ավելին օգտվում են պետհամարանիշների դետեկտորներից: Զեկույցում ասվում է, որ «Մոնտգոմերի շրջանային շրջանի մեկ ոստիկաններ, օգտագործելով պետհամարանիշի ընթերցման տեխնոլոգիան, 27 օրվա ընթացքում 96 ժամվա ընթացքում ավելի քան 48,000 մեքենա սկանավորելու համար, հնարավորություն տվեց սպան կատարել 255 երթևեկության մեջբերում, նույնականացնել լիցենզավորված 26 վարորդներին, բռնել տրանսպորտային միջոցների արտանետումների 16 խախտում, գտնել չորս հափշտակված ավտոմեքենա և նույնականացնել մեկ ժամկետանց համարանիշը »:

Իրավապահները օգտագործում են նաև դեմքի ճանաչման ԱԻ-ն `կասկածյալ հանցագործներին հայտնաբերելու համար: Ամերիկացիների կեսից ավելին իրենց վարորդական իրավունքի լուսանկարներն ունեն ազգային տվյալների բազայում: Երբ ոստիկանությունը հանցագործության մեջ կասկածվողի լուսանկար ունի, բայց ոչ անձի անունը, նրանք կարող են հենց լուսանկարով որոնել լիցենզիայի կատալոգը ՝ գտնելու առավելագույն հավանականության համընկնումները, ներառյալ անուններն ու կոնտակտային տվյալները:

Համակարգչային տեսողություն արդյունաբերական կանխարգելիչ սպասարկումներում Ընկերությունները գնալով օգտագործում են համակարգչային տեսողությունը `վերահսկելու և զեկուցելու ենթակառուցվածքի կարգավիճակը, որը կարևոր է զանգվածային արդյունաբերական համալիրների շահագործման համար:

Այն հարմարությունների ցանկը, որոնք օգտագործում կամ քննարկում են համակարգչային տեսողության օգտագործումը ՝ մարդկանց կանխարգելիչ պայմանների մասին նախազգուշացնելու համար, անվերջ է: Որոշ օրինակներ ներառում են ՝ նավթային և գազային պլատֆորմներ, քիմիական գործարաններ, նավթավերամշակման գործարաններ և նույնիսկ ատոմակայաններ:

Նավթի և գազի այնպիսի ընկերություններ, ինչպիսիք են Chevron- ը, Shell- ը և Suncor Energy- ը, օգտագործում են ցուցիչներ և տեսախցիկներ ՝ համեմատելու ներկայիս վիճակը, օրինակ, փականները սարքավորումների օպտիմալ վիճակի հետ, որի տեղեկատվությունը պահվում է առցանց: ԱՀ ծրագրակազմը ահազանգում է սպասարկման վարչությանը `միջոցներ ձեռնարկել չնչին սթրեսի դեպքում, որը համակարգչային տեսողության կիրառությունը հայտնաբերում է սարքավորումների կառուցվածքում:

Համակարգչային տեսողություն «Հորիզոնում» Պահեստի գույքագրման կառավարումը անհավատալիորեն ինտենսիվ է: Մասերի և արտադրանքի ստուգումն ու հաշվարկը կարող են օրեր տևել որոշ հաստատություններում և հարյուրավոր անձի ժամերով:

Մարկ Գյոնգյոզին առաջարկել է գույքագրման կառավարման ապագա, որում անօդաչու սարքերը, որոնք հագեցած են համակարգչային տեսիլքով, ուժեղացնում են մարդկային աշխատանքը: Տասնյակ անօդաչու թռչող սարքեր, որոնք նախատեսված էին օբյեկտների հատակագծով, թռչում էին պահեստների միջոցով ՝ մարդկային հերթափոխերի միջև, գույքագրումը պարզելու և հաշվարկելու համար:

«Դուք չեք հավատա, թե որքան հաճախ են իրերը կորչում [սովորական պահեստներում]: Երբ նրանք գնում և որոնում են իրերը, նրանք պետք է գնան և բարձրանան ամբարձիչներ և սանդուղքներ: Նրանք նույնիսկ հեռադիտակում են բերում իրեր գտնելու համար », - ասաց Գյոնգյոզին TechCrunch- ի խանգարված կոնֆերանսի լսարանին:

Անօդաչու սարքերը կարող են ստուգել նաև ամպային սերվերներում մեծ տվյալների ֆայլերի դեմ պաշարների վիճակը:

Համակարգչային տեսողության առավել լայնածավալ առավելություններից մեկը առողջապահության ոլորտում է: Microsoft- ի InnerEye համակարգչային տեսողության ծրագիրը, որը սկսվել է 2008 թ.-ից, նախատեսում է ավելի արագ, ավելի ճշգրիտ ախտորոշումներ և նույնիսկ խորհուրդ կտար քաղցկեղի բուժում բժիշկներին:

Տեխնոլոգիան կախված է բժշկության մեջ տեսողական հայտնաբերման մեթոդներից պրոֆեսիոնալներ օրգանների անսարքությունների և հիվանդների վրա տառապող քաղցկեղի տեսակի որոշման հարցում:

Թեև համակարգչային տեսողությունը տարիներ շարունակ մեզ հետ էր, առանց մեզանից շատերը դա իմանալու են, տեխնոլոգիան խոստանում է ավելի մեծ օգուտներ մեզ բոլորիս կյանքի որակի և բարեկեցության համար:

Գրականություն խմբագրել

Համակարգչային տեսողության ապագան:

Համաձայն հաշվետվության, Computer Vision շուկան 2017 թվականին գնահատվել է 2,37 միլիարդ ԱՄՆ դոլար, և նախատեսվում է մինչև 2023 թվականը հասցնել 25,32 միլիարդ ԱՄՆ դոլարի, CAGR- ի 47,54% -ի սահմաններում: Աշխարհը անցնում է խոր թվային փոխակերպման, հատկապես Հնդկաստանում, որը դանդաղեցման նշաններ չի ցույց տալիս: Միայն ioիոյի տվյալների ամսական միջին սպառումը կազմում է 10.8 ԳԲ: Համաձայն այս զեկույցի ՝ ամեն րոպե Օգտագործողները դիտում են 4,146,600 YouTube տեսանյութեր Instagram- ի օգտատերերը տեղադրում են 46,740 լուսանկար Snapchat- ի օգտվողները համօգտագործում են 527,760 լուսանկար Որոնք բոլորն էլ հսկայական հնարավորություն են տալիս համակարգչային տեսողության որոնման օրինակներին և իմաստավորել դրանց մասին: Նույնիսկ բոլոր հետաքրքրաշարժ զարգացումներով, ԱԻ-ն և համակարգչային տեսողության ոլորտը հատուկ պետք է լուծեն ներկայումս դրա հետ կապված խնդիրները, ինչպիսիք են կողմնակալությունը, ռիսկի անտեղյակությունը և բացատրելիության բացակայությունը: Նման խնդիրները լուծելու համար Ping An- ի նման ընկերությունները սկսել են մանկական քայլեր ձեռնարկել ՝ օգտագործելով Symbolic AI- ն, որը հանդիսանում է AI- ի վաղ ձև, ժամանակակից AI ալգորիթմներում ՝ իր որոշման բացատրությունը տալու համար, բայց դեռ ճանապարհ կա:

Ինչպես է աշխատում համակարգչային տեսողությունը:

Neuroscience- ի և Machine Learning- ի գլխավոր բաց հարցերից մեկն այն է, թե ինչպես են ճիշտ աշխատում մեր ուղեղը, և ինչպե՞ս կարող ենք դա մոտեցնել մեր սեփական ալգորիթմներին: Իրականությունն այն է, որ ուղեղի հաշվարկի շատ քիչ և համապարփակ տեսություններ կան. այնպես որ, չնայած այն հանգամանքին, որ Neural Nets- ը պետք է «ընդօրինակեն ուղեղի աշխատանքը», ոչ ոք վստահ չէ, որ իրականում դա իրական է: Հոքկինսն ունի այս թեմայով մի ամբողջ գիրք ՝ «On Intelligence»:

Նույն պարադոքսը ճիշտ է նաև համակարգչային տեսողության համար. Քանի որ մենք որոշում չենք կայացնում, թե ինչպես են ուղեղը և աչքերը նկարագրում պատկերները, դժվար է ասել, թե որքանով են արտադրության մեջ օգտագործված ալգորիթմները մոտենում մեր ներքին հոգեկան գործընթացներին: Օրինակ ՝ ուսումնասիրությունները ցույց են տվել, որ գորտերի ուղեղում իրականում տեղի են ունենում որոշ գործառույթներ, որոնք մենք կարծում ենք, որ տեղի են ունենում: Մենք հեռու ենք երկկենցաղներից, բայց նման անորոշություններ կան մարդկային ճանաչողության մեջ:

Մեքենաները նկարները շատ պարզ են մեկնաբանում. Որպես պիքսելների մի շարք `յուրաքանչյուրը իր գույնի արժեքների մի շարք: Դիտարկենք ստորև ներկայացված պարզեցված պատկերը, և թե ինչպես են մոխրագույն արժեքների արժեքները վերածվում թվերի պարզ զանգվածի.

Оրինակներ խմբագրել

Մտածեք մի պատկերի ՝ որպես տարբեր քառակուսիների կամ պիքսելների հսկա ցանց: Նկարի յուրաքանչյուր պիքսել կարող է ներկայացվել մի թվով, սովորաբար 0-ից 255-ից: Աջ կողմում գտնվող թվերի շարքն այն է, ինչ ծրագիրը տեսնում է, երբ պատկեր եք մուտքագրում: Մեր պատկերի համար կա 12 սյուն և 16 տող, ինչը նշանակում է, որ այս պատկերի համար կա 192 մուտքային արժեք:

Երբ սկսում ենք գույն ավելացնել, իրերն ավելի բարդանում են: Համակարգիչները սովորաբար կարդում են գույնը `որպես 3 արժեքների շարք` կարմիր, կանաչ և կապույտ (RGB) `նույն 0 - 255 մասշտաբով: Այժմ յուրաքանչյուր պիքսել իրականում ունի 3 արժեք, որպեսզի համակարգիչը բացի իր դիրքից պահելու համար: Եթե մենք պատկերացնեինք Նախագահ Լինքոլնին (կամ Հարի Փոթերի ամենավատ վախը), դա կհանգեցներ 12 x 16 x 3 արժեքների կամ 576 համարների:

Համակարգչային տեսողությունը մեքենայական ուսուցման այն ոլորտներից է, որտեղ հիմնական հասկացություններն արդեն ինտեգրվում են հիմնական արտադրանքներին, որոնք մենք օգտագործում ենք ամեն օր: Google- ը օգտագործում է քարտեզներ ՝ իրենց պատկերների տվյալները լծելու և փողոցների անունները, ձեռնարկությունները և գրասենյակային շենքերը հայտնաբերելու համար: Facebook- ը օգտագործում է համակարգչային տեսողություն ՝ մարդկանց լուսանկարներում հայտնաբերելու համար, և այդ տեղեկատվությամբ մի շարք բաներ է անում:

Հավաքման ժամանակ պատկերն սկանավորվում է պիքսելների սահմանված լայնությամբ, և այդ պիքսելների առավելագույնը, գումարը կամ միջինը վերցվում է որպես պատկերի այդ մասի ներկայացում: Այս գործընթացը հետագայում նվազեցնում է խաղարկային քարտեզի (ներ) ի չափը ըստ որևէ չափի գործոնի:

Այս բոլոր գործողությունները `Convolution, ReLu և Pooling - հաճախ օգտագործվում են անընդմեջ երկու անգամ անընդմեջ, նախքան առանձնահատկությունների արդյունահանման գործընթացը ավարտելը: Այս ամբողջ գործընթացի արդյունքը, այնուհետև, անցվում է դասակարգման համար նյարդային ցանց:

Convolutional նյարդային ցանցերը (CNNs) խորը ուսուցման հատուկ տեսակ են, որոնք իսկապես լավ են գործում համակարգչային տեսողության խնդիրների վրա: Բազմաթիվ նախաքննական աշխատանքներ են արվում մուտքային պատկերների վրա `դրանք ավելի լավ օպտիմիզացնելու համար նյարդային ցանցի ամբողջովին կապակցված շերտերի համար: