null Hoe gaan we verder nu chatbots Turings imitatiespel winnen

Hoe gaan we verder nu chatbots Turings imitatiespel winnen

Webcolumn Cultuurwetenschappen - door dr. Karin van Leersum - oktober 2023

De Britse wiskundige Alan Mathison Turing (1912-1954) wordt gezien als computerpioneer en grondlegger van computertechnologie en kunstmatige intelligentie (AI) vanwege zijn werk naar rekentheorie, de Turing machine en de Turing test (Cooper & van Leeuwen 2013). Velen zien Turing als een raadsel waartoe we ons nog steeds aangetrokken voelen in de huidige eeuw.

Een voor de hand liggende reden voor de belangstelling naar Turing komt voort uit Turings interesse in rekenkracht en beperkingen van machines en menselijke hersenactiviteit. Met de opkomst van AI in onze maatschappij worden er steeds meer vergelijkingen gemaakt tussen machines en mensen. Wordt er gesproken over samenwerking en hoe de mens te versterken, maar ook hoe machines de maatschappij over kunnen nemen.

Turings eerste werk 'On Computable Numbers…' richtte zich nog vooral op rekenkracht en de Turing Machine (Turing 1936). Dit werk was mogelijk zijn grootste prestatie en de fundatie voor onze huidige kennis en wetenschap naar computers en digitale technologie. Hij had de ambitie om de eerste 'moderne' computer te creëren. De meesten kennen Turing van zijn bijdrage aan het analyseren en decoderen van het Enigma tijdens de Tweede Wereldoorlog. De film 'The Imitation Game' uit 2014 vertoont een filmische versie van dit gedeelte uit zijn leven, maar verwijst ook naar zijn eerste werk richting AI. In zijn werk naar AI richtte hij zich op het vergelijken van rekenkracht en de kracht van de menselijke hersenen (Hodges 1983). Hij verwachtte dat een computer uiteindelijk de rivaal kon worden van onze hersenen op alle puur intellectuele terreinen (Turing 1950). 'Het lijkt waarschijnlijk dat hij [Turing] fysieke actie in het algemeen - waartoe ook de actie van het menselijk brein behoort - altijd reduceerde tot een mogelijke Turingmachine-actie' (vertaling van Penrose 1994). In 1950 scheef Turing de paper 'Computing Machinery and Intelligence', waar hij zich vooral richtte op de vraag 'Kan een machine denken?' (Turing 1950).

Bepalen of een machine kan denken

De Turing Test, ook wel imitatiespel, was een manier om na te denken over de vraag of machines kunnen denken. Volgens Turing (1950) gaat het er niet om dat machines iets uitvoeren dat omschreven zou kunnen worden als denken, maar dat een machine het imitatiespel op bevredigende wijze kan spelen. Bij het spel gaat het erom dat de machine probeert om antwoorden te geven die normaal door een mens gegeven zouden worden. Om de test te kunnen winnen moet een machine niet alleen antwoorden geven, maar 'allerlei trucjes uithalen om meer menselijk over te komen, zoals even wachten voordat hij antwoord geeft, of spelfouten maken' (Turing 1952 in Copeland 2004). Op het moment dat Turing hierover nadacht waren deze machines er nog niet, maar hij voorspelde een toekomst waarin machines uiteindelijk op alle puur intellectuele vlakken met mensen zullen concurreren.

In 1950 zei Turing: 'Ik geloof dat het over ongeveer vijftig jaar mogelijk zal zijn computers zo te programmeren dat ze het imitatiespel zo goed spelen dat een gemiddelde ondervrager niet meer dan 70 procent kans heeft om te slagen. De oorspronkelijke vraag: 'Kunnen machines denken!' vind ik te betekenisloos voor een discussie. Niettemin geloof ik dat aan het einde van de eeuw het woordgebruik en de algemeen ontwikkelde opinie zo sterk veranderd zullen zijn dat men zal kunnen spreken van 'machines denken' zonder te verwachten dat het wordt tegengesproken.' Dit zou betekenen dat we rond de afgelopen eeuwwisseling, het jaar 2000, geconfronteerd zouden worden met de eerste machines die het imitatiespel kunnen winnen. Behalve in zijn werk uit 1950 heeft Turing in 1952 deze uitspraak iets minder strak verwoord en voorspelde dat het zeker 100 jaar zou duren (Copeland 2004).

Doorstaan nieuwe chatbots de Turing test?

We zouden kunnen zeggen dat de woorden van Turing ertoe geleid hebben dat er veel ontwikkelingen volgden naar machines die menselijk gedrag vertonen of nabootsen. Daarnaast zorgt de opzet van zijn imitatiespel ervoor dat we met een kritische blik kijken naar deze machines. Hierbij gaat het er volgens Turing dus niet om of de machines echt kunnen denken, maar dat wij geloven dat de antwoorden gegeven worden door een mens.

Op dit moment zitten we precies tussen de 50 en 100 jaar uit de prognoses van Turing in. In deze afgelopen 73 jaar zijn er veel ontwikkelingen geweest naar machines die meer en minder de mens kunnen imiteren, maar in hoeverre kunnen deze machines concurreren met de mens? Turing voorzag twee verschillende ontwikkelingsrichtingen. Een richting met machines die abstracte activiteit kunnen uitvoeren of een richting met machines die uitgerust zijn met zintuigen en vervolgens een taal leren begrijpen en spreken (Turing 1950). In de onderzoeken en ontwikkeling van AI zijn beide richtingen gevolgd met mooie voorbeelden. Als eerste de bekende voorbeelden van de schaakcomputer 'Deep Blue' die in 1996 Garry Kasparov, de beste schaker ter wereld, twee keer versloeg en de spelcomputer 'AlphaGo' die professioneel Go-speler Fan Hui versloeg in 2015 tijdens een vijf game Go-wedstrijd.
Als tweede de ontwikkelingsrichting van spraakherkenning, taalverwerking en chatbots. Een generatieve vooraf getrainde transformator (GPT) is een machine met als taak teksten en gesprekken uit te voeren. We kennen ze ook wel als chatbots. Gebruikers van chatbots kunnen een gesprek voeren dat meer en minder lijkt op een gesprek met een echt persoon. Ze worden bijvoorbeeld ingezet bij klantenservice diensten of in huisartsenpraktijken.

De meest bekende chatbot op dit moment is ChatGPT. Op 29 November 2022 werd ChatGPT gelanceerd. De mogelijkheden met deze chatbot werden door vele geïnteresseerden direct uitgetest. Een nieuw record werd gevestigd, want binnen vijf dagen waren er één miljoen gebruikers. Volgens sommigen is het één van de eerste chatbots die de Turing test met vlag en wimpel lijkt te doorstaan. Echter is deze test wel de uitkomst die we zoeken als we nadenken over wenselijke AI? ChatGPT spreekt namelijk niet altijd de waarheid en deze chatbots hebben (nog) geen capaciteit om te redeneren zoals een mens (Biever 2023). Wat voor soort taken zouden ze in de maatschappij op zich kunnen nemen en hoe zouden wij dit willen?

De reactie op alle bliksemsnelle ontwikkelingen

Velen zeggen dat Turing veel te jong is overleden en dat hij nog veel had kunnen betekenen in zijn theorieën over AI. Gelukkig hebben andere wetenschappers niet stilgestaan en zijn er vele kleine en grote machines ontworpen. Er werden veel pogingen gedaan om in de buurt te komen van mens imiterende machines. Terugkomend op de ontwikkeling van chatGPT, deze voor de meesten nu bekende chatbot, heeft allerlei voorlopers gehad die dichter en dichter in de buurt kwamen van mensachtige interacties. In 2014 hebben we al kennis kunnen maken met 'Eugene Goostman', de eerste machine die de Turing test doorstond. Tijdens de test was 33% van de juryleden ervan overtuigd dat Eugene een mens was. Dit is net boven de 30% die Turing had verwacht (Turk 2014). Hierna stond de ontwikkeling echter niet stil en de machines werden steeds geavanceerder met grotere geheugens en capaciteiten.

Naast alle technologische vorderingen waren er ook maatschappelijke veranderingen. Digitalisering heeft in alle industrieën invloed gehad op onder andere werkomstandigheden. Ondanks dat de mogelijkheden tot inzet van machines in het huidige digitale landschap groeit, is het niet voor alle groepen in onze maatschappij gemakkelijk, denk bijvoorbeeld aan personen met lage digitale vaardigheden, geen toegang tot internet en ouderen. Kunnen we onze maatschappij machineklaar maken voor iedereen? Ook onder de personen die toegang hebben tot een apparaat met internet zal niet iedereen machines direct omarmen en spelen vragen rondom bijvoorbeeld privacy een rol.
Hiervoor lijkt wet- en regelgeving nodig, maar ondanks de vele ontwikkelingen op micro niveau en het huidige digitale landschap waarin wij leven, lijkt beleid onvoorbereid (Meerstadt 2023). Je zou kunnen zeggen dat implementatie nu niet via de 'normale' wegen loopt en dat we in verschillende sectoren worden overrompeld door ChatGPT. Denk bijvoorbeeld aan het onderwijs waar ChatGPT door scholieren gebruikt wordt om huiswerk te maken. Hoe willen we hiermee omgaan en mogelijk het onderwijs anders vormgeven? Ook wetenschappers onderzoeken de mogelijkheden om ChatGPT in te schakelen. Kan ChatGPT data analyseren en goede artikelen schrijven? Gordijn en ten Have (2023) pleiten ervoor dat redacteurs van tijdschriften hun beleid moeten aanpassen om ChatGPT gerelateerde vraagstukken in wetenschap en het schrijven van artikelen aan te pakken.

We moeten niet alleen praten over de vragen wat we met AI kunnen, maar we zouden vooral het gesprek met elkaar aan moeten gaan over de vraag hoe we ermee om willen gaan en hoe we gebruik en implementatie zo inclusief mogelijk kunnen houden. Mogelijk dat een coalitie, zoals de in 2019 opgerichte Nederlandse AI coalitie, hierin iets kan doen (NL AI Coalitie 2023). Het beleid van deze coalitie is erop gericht om te bepalen hoe we AI toepassen door het proactief in te zetten en er zo voordeel uit te halen. In Amerika heeft op 13 september 2023 een eerste bijeenkomst plaatsgevonden met congresleden en prominente tech ondernemers, omdat zij het erover eens waren dat de overheid moet ingrijpen om potentiële valkuilen van AI te voorkomen. Na zes uur overleg was er echter nog geen consensus bereikt over AI beleid (Zakrzewski, Lima en DiMolfetta 2023). Daadwerkelijk beleid blijft op dit moment achter en ons rest nog steeds de vraag hoe we implementatie van AI vorm willen geven en in kunnen spelen op de continue en onvoorspelbare ontwikkelingen.

Machines voor ons laten werken

Turing voorspelde dat machines uiteindelijk op intellectueel vlak zouden kunnen wedijveren met de mens. Het lijkt erop dat de eerste machines die zijn imitatiespel kunnen verslaan ontwikkeld zijn. In de interactie zullen ze nog niet iedereen overtuigen van menselijke intelligentie, maar chatbots zoals ChatGPT zijn steeds overtuigender. Velen in de huidige maatschappij hebben de digitale mogelijkheden en grijpen de kans aan om met AI te werken. Toch geldt dit niet voor iedereen en blijft beleid achter met betrekking tot wenselijk gebruik.

Hoe kunnen we deze machines zo inclusief mogelijk maken en inzetten, wat verwachten we en wat zouden we willen? Deze vragen worden niet beantwoord door het imitatiespel en zouden ondersteund kunnen worden door beleid gericht op machines. Klein (2023) beargumenteert dat we ontwikkeling anders in kunnen steken: 'We zouden machines moeten bouwen die voor ons werken, in plaats van onze maatschappij machineklaar maken.' Ook deze redenering is technologisch gericht en de vraag op welke manier we de machines voor ons willen laten werken blijft bestaan. Daarnaast is het niet zeker of we de ontwikkeling van nieuwe machines wel zo strak in de hand kunnen houden.

Referenties

Biever, Celeste, 'ChatGPT broke the Turing test - the race is on for new ways to assess AI. Lage language models mimic human chatter, but scientists disagree on their ability to reason', Nature, 25 juli 2023. https://www.nature.com/articles/d41586-023-02361-7, laatste geraadpleegd op 12 september 2023.
Cooper, S. Barry, en Jan van Leeuwen, Alan Turing, his work and impact (Amsterdam 2013).
Copeland, B. jack, The essential Turing: Seminal writings in computing, logic, philosophy, Artificial Intelligence, and artificial life plus the secrets of Enigma. The ideas that gave birth to the computer age (Oxford 2004).
Gordijn, Bert en Henk ten Have, 'ChatGPT: evolution or revolution.' Medicine, health Care and Philosophy 26 (2023) 1-2.
Hodges, Andrew, Alan Turing: the Enigma (London 1983).
Klein, Naomi, 'AI machines aren’t ‘hallucinating'. But their makers are', The Guardian, 8 mei 2023. https://www.theguardian.com/commentisfree/2023/may/08/ai-machines-hallucinating-naomi-klein, laatste geraadpleegd op 14 september 2023.
Meerstadt, Claar, 'ChatGPT - reconstructie van haar snelle opkomst en de politieke reacties in Europa', Considerati, 18 juli 2023. https://www.considerati.com/nl/kennisbank/reconstructie-opkomst-chatgpt.html, laatste geraadpleegd op 12 september 2023.
NL AI Coalitie. 'Over de NL AIC. De Nederlandse AI Coalitie zet zich in om AI-ontwikkelingen in Nederland te versnellen en AI-initiatieven met elkaar te verbinden', NL AI Coalitie. https://nlaic.com/over-nl-aic/, laatste geraadpleegd op 14 september 2023.
Penrose, Roger, Shadows of the Mind (Oxford 1994).
Turing, Alan. 'On computable numbers, with an application to the Entscheidungsproblem.' Proceedings of the London Mathematical Society 42 (1936) 230-265.
Turing, Alan. 'Computing machinery and intelligence.' Mind a quarterly review of psychology and philosophy LIX (1950) 433-460.
Turk, Victoria. 'How a computer beat the Turing Test by pretending to be a 13-year-old boy', Vice, 9 juni 2014. https://www.vice.com/en/article/gvyy5m/how-a-computer-beat-the-turing-test-by-pretending-to-be-a-13-year-old-boy, laatste geraadpleegd op 12 september 2023.
Zakrzewski, Cat, Cristiano Lima en David DiMolfetta, ‘Tech leaders including Musk, Zuckerberg call for government action on AI’, The Washington Post, 14 september 2023. https://www.washingtonpost.com/technology/2023/09/13/senate-ai-hearing-musk-zuckerburg-schumer/, laatste geraadpleegd op 15 september 2023.