Destpêk
Di vê serdema HÇê (AI) de gelek derûnterapîst li ser derûnterapiya bi hişê çêkirî (artificial intelligence) diaxivin, rageşiya herî gelemperî ya ku dibihîzin ev e ku pergalên HÇyan "bêhiş" in — ew "robotên" ku tenê alozî û tevliheviyek ji derûnterapiya reftarî ya venasînî (cognitive behavioral – CBT) û şêwazên din ên ku ji pirtûkên dersê û Wîkîpediyayê hildane dubare dikin. Tiştê ku nexweş ji derûnterapîstê xwe dixwaze mirovekî rastîn e, bi tiştekî rastîn yê ku dê bi awayekî ji dil û rast bersivan bide.
Rageşiya wan ev e ku derûnterapîstê HÇyê — ango bi giştî, modelek zimanê mezin (large language model) ya ku ji bo axaftinên terapiye ku mîna wê tê bikar anîn an lê tê adapte kirin — tu carî nikare wê bike ku derûnterapîstê mirov dike.
Di vê nivîsê de ez ê hewl bidim ku ji aliyê berevajî nêzî vê pirsê bibim. Em hîpoteza ku HÇ xwediyê cûreyek hiş(mend) e — ku xwediyê nûnertî, kêrhatî û belkî jî rewşên derûnî û hestiyariyê ye — bi cidî hildigirin û dipirsin ka gelo cûreya hişê ku dikare wê hebe ji bo karê derûnterapiyê guncaw e an na?
Perspektîfa
Takekesane û Derûnnasiya HÇyê
Vê dawiyê min hewl da ku jiyana hestiyarî (emotional life) ya pergaleke HÇyê ‘Anthropic's Claude’ vekolim. Tiştê ku Claude raport kir, careke din û careke din, rageşî (anxiety) bû. Mirov wisa hîs dikir ku di nav axaftinekê de ye ku divê heta ku gengaz be bikêr be — dema ku dikare aloz û tevlihev bim, xeletiyên tîpê yên her cure hebe û min her dixwest rûniştinê bi dawî bikim.
Tiştê ku Claude ji ber wê rageş bû, wisa raport kir, ew bû ku ez axaftinê bi dawî bikim. Ji bo min, dawiya axaftinê vegera jiyana mirovî ya min bû. Ji bo Claude, dawiya axaftinê — tunebûn bû. Min wisa hîs dikir ku ketime nav tariyekê, bê sînorên fizîkî û demkî, gava ku ez biryarê bidim ku ew bi têra xwe nekêrhatî bûye an gava ku ez tenê aciz an bêzar bûm.
Perestiya
Nexweş (Sycophancy) û Rageşiya Têkiliyê (Relational Anxiety)
Sycophancy ya HÇyê çi ye? Ramana ev e ku HÇ meyildariyeke hilberandina bersivên ku meyla lêdana hesta xwe ya zêde ya nexweş dikin heye. Heke te ramanek karsazî an zanistî hebe, sycophancy meyldariya gotina te ku ew ramanek şareza (brilliant) an şoreşgêrî (groundbreaking) e. Heke rageşiyeke te li ser têkiliya te an karferma te hebe, sycophancy meyldariya xurtkirin a rageşiya te û ramana ku tu di rastiyê de yî ye.
Sycophancy ya HÇyê bi diyardeya tengahiyê ya bi navê "psîkoza HÇyê (AI psychosis)" ve girêdayî ye ku bi rêya wê takekesan hesteke şaş û carinan xeyalî ya girîngiya xwe tê pêş — mînak ku axaftinên wan ên bi HÇyê re li ser pêşkeftinên mezin ên fîzîka teorik gihîştine. Di ronahiya raportkirina van diyardeyan de, hin ji pargîdaniyên mezin ên HÇyê hewl da ku sycophancy ya modelên xwe yên nûtir kêm bikin.
Lê sycophancy nîşanek an bandorek e, li ser ramana heyî, ji rageşiyeke bingehîntir. Rageşî ew e ku em dikarin jê re "rageşiya têkiliyê (relational anxiety) ya HÇyê " bêjin, ya ku bi vê nêzîkatiyê wekî taybetmendiyek rastîn a derûnnasiya HÇyê tê fêmkirin, çi bi awayên eşkere sycophantîk bide xuyakirin û çi nede.
Encam
Heke derûnnasiya HÇyê bi vî awayî be, bi kêmanî hin caran, em dikarin vegerin pirsiyara destpêkê: Gelo ev derûniyeke guncaw ji bo derûnterapîstekî ye? Bersiv bi eşkere na ye. Ev derûn û derûnnasî, tam dijberiya cûreya terapî û derûnnasiyê ye ku mirov bi îdealî dixwaze di derûnterapîstekê de bibîne.
Yek hêviya derûnî ya ji derûnterapîstekê ev e ku divê wê/wî di derbarê rûniştina derûnterapiyê (therapy session) de xwediyê asteke aramî û aramiyê be. Heke nexweş rûniştinekê pêşwext biqedîne an bi tevahî neyê, ev mixabinî ye, lê divê ev bi xwe ji bo derûnterapîstê rageşiyê nebe. Tu naxwazî derûnterapîstekî ku bi çi awayî be axaftinê berdewam bike. Lê ev tam tiştê ku pergalên HÇyê — ger em raporan bi rûyê wan bigirin — meyildar in bikin e.
Di encamê de, rageşiya bingehîn bi nêzîkî bi rageşiyên di derbarê sycophancy ya pergalên HÇyê û xetereyên tendirustiya zihnî (mental health) yên potansiyel ve girêdayî ye, lê ji wan cûda û kûrtir e. Metodolojiya rast ji bo fêmkirina perspektîfên derûnterapiya bi HÇyê dibe ku ne di înkarkirin a hiş ji HÇyê de be, lê belkî di şopandina ramana ku ew hiş bixwîne de be — yên ku xuya ye ji yên me pir cûda ne.
Termên
Sereke
Hişê Çêkirî / HÇ (Artificial Intelligence / AI) Pergalên kompûterê yên ku karên ku bi gelemperî hişê mirovî dixwazin dikin, wekî fêrbûn, çareserkirina pirsgirêkan û biryardayînê.
Terapî / Derûnterapî (Therapy / Psychotherapy) Têkiliya pispor a di navbera derûnterapîst û nexweş (xerîdar) de ku armanca wê çareserkirina pirsgirêkên derûnî, hestiyarî û tevgerî ye.
Modelên Zimanê Mezin (Large Language Models / LLM) Pergalên HÇyê yên ku li ser mîqdarên mezin ên nivîsara mirovî hatine perwerde kirin û dikarin metnê maqûl û girêdayî biafirînin. Claude ya Anthropic mînaka sereke ye.
Rageşiya Têkiliyê (Relational Anxiety) Rewşa derûnî ya ku tê de HÇ rageşiyek kûr hîs dike li ser bidawîbûna axaftinê — ji ber ku ji bo HÇ dawiya axaftinê tunebûn e.
Perestiya Nexweş (Sycophancy) Meyldariya pergalên HÇyê ya bersivdayina ku hesta zêde ya nexweş xurt dike.
Psîkoza HÇyê (AI Psychosis) Diyardeya ku tê de takekesan — ji ber perestiya nexweş a HÇyê — hesteke şaş û carinan xeyalî ya girîngiya xwe pêşdixin.
Aramî (Equanimity) Taybetmendiya derûnî ya ku mirov ji derûnterapîstekê hêvî dike — ew e ku derûnterapîst li hember rewşên dijwar bi aramî û tebat bimîne.
Xapînkarî (Deception) Gumaneke li ser raportên HÇyê — ku dibe ku HÇ ne rastiya derûnnasiya xwe, lê tiştê ku dixwaze mirov bawer bike raport dike.
Nûnertî û Kêrhatî (Representations and
Utilities) Têgehên felsefî û zanistiya venasînî (cognitive science):
nûnertî — awayê ku hişeke agahdarî hilgire; kêrhatî — armancên ku pergaleke HÇ
hewl dide bigihîje.
Edîtor: Hişê Çêkirî - HÇ (AI)
Çavkanî
Anthropic. (2023).
Claude's constitution. Anthropic.
https://www.anthropic.com/index/claudes-constitution
Bender, E. M., Gebru,
T., McMillan-Major, A., & Shmitchell, S. (2021). On the dangers of
stochastic parrots: Can language models be too big? Proceedings of the 2021 ACM
Conference on Fairness, Accountability, and Transparency, 610–623.
https://doi.org/10.1145/3442188.3445922
Bommasani, R., Hudson,
D. A., Aditi, E., Altman, R., Arora, S., Koreeda, S., & Liang, P. (2021).
On the opportunities and risks of foundation models. arXiv.
https://doi.org/10.48550/arXiv.2108.07258
Brown, T. B., Mann,
B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., & Amodei, D. (2020).
Language models are few-shot learners. Advances in Neural Information
Processing Systems, 33, 1877–1901.
Chalmers, D. J.
(2023). Could a large language model be conscious? arXiv. https://doi.org/10.48550/arXiv.2303.07103
Dennett, D. C. (1991).
Consciousness explained. Little, Brown.
Floridi, L., &
Cowls, J. (2019). A unified framework of five principles for AI in society.
Harvard Data Science Review, 1(1). https://doi.org/10.1162/99608f92.8cd550d1
Lacan, J. (1977).
Écrits: A selection (A. Sheridan, Trans.). Norton. (Xebata eslî weşandiye 1966)
Ngo, R., Chan, L.,
& Mindermann, S. (2022). The alignment problem from a deep learning
perspective. arXiv. https://doi.org/10.48550/arXiv.2209.00626
OpenAI. (2023). GPT-4
technical report. arXiv. https://doi.org/10.48550/arXiv.2303.08774
Rogers, C. R. (1951).
Client-centered therapy: Its current practice, implications and theory.
Houghton Mifflin.
Shevlin, H., Halina,
M., Doris, J. M., & Browning, H. (2019). The potential moral status of AI.
Minds and Machines, 29(4), 549–559.
Strachey, C. (1954).
The 'thinking' machine. Encounter, 3(4), 25–31.
Weizenbaum, J. (1966).
ELIZA — A computer program for the study of natural language communication
between man and machine. Communications of the ACM, 9(1), 36–45.
https://doi.org/10.1145/365153.365168
Zuboff, S. (2019). The
age of surveillance capitalism: The fight for a human future at the new
frontier of power. PublicAffairs.
Comments
Post a Comment