Xelata Turing Ji bo Mîmarên Fêrbûna
Qeyîmkirinê
Destpêk
Xelata ACM A.M. Turing ku yek ji xelatên herî prestîj ên qada zanîna
kompûterê ye û bi rêkûpêk "Nobela zanîna kompûterê" tê zanîn û danîn,
di sala 2024an de ji Andrew G. Barto û Richard S. Sutton re hat standin. Ev
herdu zanyaran bi beşdariyên xwe yên vekirî di qada hişê çêkirî (artificial
intelligence) de û bi danîna bingehên têgihîştî û algorîtmên fêrbûna qeyîmkirinê (reinforcement learning)
ev xelata girîng qezenc kirin.
Navê Xelatê û Girîngiya Wê
Xelata Turing navê bîrkar û zanayê kompûterê yê îngilîz Alan M. Turing
(1912-1954) hilgirtiye û ji aliyê Google ve bi 1 milyon dolar tê dayîn. Alan
Turing di sala 1950an de gotara xwe ya navdar "Computing Machinery and Intelligence"
(Hiş û Makîneyên Hesabkirinê) nivîsand û pirsî "Gelo makîne dikarin
bifikirin?" û ji bo yekem caran bi rêbazeke zanistî şirove kir.
Fêrbûna Qeyîmkirinê û Girîngiya Wê
Di qada hişê çêkirî HÇ (AI) de bo pergalên zîrek "nûner" (agent)
tên gotin û ev nûneran li gorî daneyan tevger û reftarên xwe saz dikin. Nûneran
zîrek, ji bo gihîştina armanceke diyar, rêyên çalakiyê yên bandortir hildibijêrin.
Têgihên derûnnasî û noronnasî yên ku ji xelatan hatine wergirtin, di qada
fêrbûna qeyîmkirinê de weke "sînyala xelatê" (reward signal) tê zanîn
ku li ser nûnerekê tê dayîn. Heta ku nûner xelata zêdetir bistînin, rêya
fêrbûnê ya pêşxistî pêş de diçe.
Zanyarên Xelatgir
Richard S. Sutton di heman demê de li Zanîngeha Alberta (University
of Alberta) profesorê zanistên kompûterê ye û xebatên xwe yên giştî li ser
şîrketa Keen Technologies û Alberta Machine Intelligence Institute de weke
şêwirmendê zanistî dimeşîne.
Andrew G. Barto li Zanîngeha Massachusetts Amherst (UMass Amherst)
Beşa Zanistên Kompûterê de xebat dike û di warê fêrbûna qeyîmkirinê de
lêkolînên pêşîn kirine/dike.
Dîroka Geşedanê
Di salên 1980an de Barto û Sutton dest bi nivîsandina gotarên yekem ên li
ser bingehên bîrkariyê (matematik) kirin û algorîtmên girîng pêşxistin. Kitêba wan a sala 1998an
"Reinforcement Learning: An Introduction" (Fêrbûna Qeyîmkirinê:
Destpêkek) ji bo polên dersê bûye çavkaniyeke bingehîn û zêdetirî 75,000 caran
bûye çavkanî.
Ev herdu zanyaran algorîtmên
fêrbûna qeyîmkirinê çend salan berî ku ev beş di qadê de biguherin pêşxistibûn.
Ev geşedan, têkiliya kûr a fêrbûnê bi fêrbûna kûr (deep learning) re
çêkir û rê ji bo pêşiyên weke Yoshua Bengio, Geoffrey Hinton û Yann LeCun vekir
ku di sala 2018an de xelata Turing bi dest xistin.
Serfiraziyên Girîng
Yek ji girîngtirîn serfiraziyên fêrbûna qeyîmkirinê AlphaGo bû ku di salên
2016 û 2017an de lîstika Goyê rast şikest. Îro fêrbûna qeyîmkirinê di gelek
warên de tê bikaranîn: Kontrola torê, sêwirandina reklaman, xweseriya torê,
çêkirina hunermendiyê, kontrola robotan û pergalên weke ChatGPT û hwd de.
Encam
Barto û Sutton bi salan xebatên xwe yên rêkûpêk û têgihîştî, ne tenê di
lêkolînên zanistî û teknolojîk de, bal û baldarî di jiyana rojane de jî
veguherîneke girîng çêkiriye. Pergalên hişê çêkirî yên ku îro mirov bi wan re
dijîn, bi bingehên ku ev zanyaran danîn hatine avakirin û di dîroka zanîna
kompûterê de ciheke girîng girtiye.
Çavkanî
- New
Scientist: Andrew Barto and Richard Sutton win Turing Award for AI
breakthrough
- ACM
Turing Award Official Website: https://amturing.acm.org/
- Communications
of the ACM: 2024 Turing Award Announcement
Termên Sereke
Hişê Çêkirî (Artificial Intelligence): Pergalên
zîrek ên ku weke mirovan bifikirin û biryar bidin in. Ev pergalanan dikarin fêr
bibin, kêşeyan çareser bikin û bi hawîrdorê xwe re têkiliyê deynin. Mînak,
robotên ku dikarin biaxifin, pergalên ku wêneyan nas dikin yan jî (software)yên
ku bi zimanê mirov re dipeyivin.
Fêrbûna Qeyîmkirinê (Reinforcement Learning): Rêbazek
taybet a fêrbûnê ye ku pergal bi ceribandina û çewtiyê fêr dibe. Pergal
çalakiyekê dike, encamê dibîne û li gorî wê encamê xelat yan cezayê distîne. Bi
vî awayî, weke zarokek ku bi ceribandinan fêr dibe, pergal jî baştir dibe.
Mînak, weke ku mirov fêrî lîstika kişikê dibe û her caran baştir dibe.
Nûner (Agent): Pergaleke zîrek e ku li hawîrdorê xwe dinêre, biryaran
dide û çalakiyan dike. Ev dikare robotek, (software) yan jî pergaleke
dijîtal be. Nûner weke hokerek e ku di cihanê de tevdigere û armancên xwe yên
diyar hene.
Sînyala Xelatê (Reward Signal): Agahdariya ku ji nûnerî
re dibêje ka çalakiya wî baş an xerab bûye. Ev wek xelat û cezayê ye ku rêya
fêrbûnê diyar dike. Mînak, heke pergal rastiyê bike, xelatê distîne; heke çewtiya
bike, cezayê distîne.
Fêrbûna Kûr (Deep Learning): Celebeke hişê
çêkirî ye ku bi torên noronî yên kûr û tevlihev dixebite. Ev teknolojî dikare
wêne, deng û nivîsan bi awayekî pir zelal nas bike û fêm bike. ChatGPT û
pergalên wêneçêker bi vê teknolojiyê dixebitin.
Hiş û Makîneyên Hesabkirinê (Computing Machinery and
Intelligence): Gotara navdar a Alan Turing e ku di sala 1950an de
hate nivîsîn û pirsî "Gelo makîne dikarin bifikirin?" ji bo yekem car
bi awayekî zanistî şirove kir. Ev gotar bingeha zanîna hişê çêkirî danî.
Algorîtma (Algorithm): Rêbazeke diyar e ku
pergal bi şopandina wê kêşeyan çareser dike. Weke bernameya aşpêjiyê ye ku her
gav hatiye diyarkirin. Algorîtmên
fêrbûna qeyîmkirinê rê li ber pergalan vedike ku fêr bibin û baştir bibin.
Comments
Post a Comment