AlphaZero
AlphaZero, ծրագիր նյարդային ցանցի համար, մշակված DeepMind ընկերության կողմից, որը օգտագործում է AlphaGo Zero-ի ընդհանրացված տարբերակը։ 2017 թվականի դեկտեմբերի 5-ին AlphaZero 24 ժամվա ընթացքում սովորեց խաղալ գերմարդկային մակարդակի շախմատ, սյոգի և գո, դրանով հաղթելով Stockfish և Elmo-ին[1]։
Տարբերությունը AlphaGo Zero-իցԽմբագրել
AlphaZero (AZ)-ն AlphaGo Zero (AGZ)-ի ալգորիթմի ընդհանրացված տարբերակն է, որը բացի գոից, կարողանում է խաղալ սյոֆի և շախմատ։ AZ և AGZ-ն իրարից տարբերվում են․
- AGZ-ն ունի առաջադրանքների կատարման հստակ կանոնակարգ։
- Նյարդային ցանցը թարմացվում է անընդհատ։
AlphaZero-ն ընդդեմ Stockfish և ElmoԽմբագրել
Այն ժամանակ երբ ավանդական ծրագրերը գնահատում են դիրքը խաղում շնորհիվ գրոսսմեյստերների փորձի, AlphaZero-ն օգտագործում է գնահատման խոր նյարդային ցանցը, որն էլ պահանջում է մեծ ժամանակ մի դիրքի համար։ AlphaZero-ն կարողանում է հաշվարկել 80 000 շախմատային դիրք մի վայրկյանում և 40 000 դիրք սյոգի համար։ Այն դեպքում երբ Stockfish կարողանում է հաշվարկել 70 միլլիոն, իսկ Elmo-ն 35 միլլիոն մեկ վայրկյանում։
ԱրդյունքներԽմբագրել
ՇախմատԽմբագրել
Շախմատ խաղալիս AlphaZero և Stockfish-ը ամեն քայլի համար ունեին մեկ րոպե ժամանակ։ AlphaZero-ն ուներ ավելի լավ ծրագրային ապահովում քան Stockfish-ը։ 100 խաղից AlphaZero-ն 25 պարտյա հաղթեց սպիտակներով, 3-ը սևերով և 72 անգամ խաղն ավարտվեց ոչ ոքի[2]։
ՍյոգիԽմբագրել
Հարյուր խաղերի ընթացքում AlphaZero-ն հաղթեց 90 անգամ, 8 անգամ պարտվեց և 2 անգամ խաղը ավարտվեց ոչ ոքի։
ԳոԽմբագրել
8 ժամ ինքնուրույն սովորելուց հետո, AlphaZero-ն իր նախկին տարբերակի հետ պայքարում հաղթեց 60 անգամ և պարտվեց 40 անգամ։
ՔննադատությունԽմբագրել
Որոշ գրոսսմեյստերներ, նշեցին, որ չարժե գերագնահատել AlphaZero-ի ուժերը, քանի, որ արդյունքները տարբեր կլնիենեին, եթե ծրագիրը հասանելիություն ունենար դեբյուտային բազային (քանի-որ Stockfish ծրագրված էր նույն կերպ)[3]։ AlphaZero-ն հաղթել է Stockfish-ին, վերջինիս զրկելով դեյբյուտային բազաից և էնդշպիլային աղյուսակից, խաղալով ավելի լավ համակարգչային սարքավորումներով[4][5]։ Stockfish նաև սահմանափակված է եղել ժամանակով մինչև քայլ կատարելը՝ մեկ րոպեն բավարար չէր, որպեսզի խորը մտածի կրիտիկական իրավիճակներում։ Բացի դա, օգտագործվել է Stockfish 8-ը որը թողարկվել էր դրանից մեկ տարի առաջ։
Սյոգի խաղի համակարգչային տարբերակի ծրագրավորղների խումբ նույնպես, լիովին բավարարված չէր խաղի արդյունքով[6][7]։
ԾանոթագրություններԽմբագրել
- ↑ Silver David և այլք: (դեկտեմբերի 5, 2017)։ Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
- ↑ «'Superhuman' Google AI claims chess crown»։ BBC News։ 2017-12-06։ Վերցված է 2017-12-07
- ↑ «Google's AlphaZero Destroys Stockfish In 100-Game Match»։ Chess.com։ Վերցված է 2017-12-07
- ↑ Knapton Sarah (2017-12-06)։ «Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours» (անգլերեն)։ Telegraph.co.uk։ Վերցված է 2017-12-06
- ↑ Vincent James (2017-12-06)։ «DeepMind’s AI became a superhuman chess player in a few hours, just for fun»։ The Verge։ Վերցված է 2017-12-06
- ↑ «コンピュータ将棋 レーティング»։ Արխիվացված է օրիգինալից 2017-12-08-ին։ Վերցված է 2020-06-23
- ↑ Silver David, Hubert Thomas, Schrittwieser Julian, Antonoglou Ioannis, Lai Matthew, Guez Arthur, Lanctot Marc, Sifre Laurent, Kumaran Dharshan, Graepel Thore, Lillicrap Timothy, Simonyan Karen, Hassabis Demis (դեկտեմբերի 5, 2017)։ Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm