De Utrechtse onderzoeker Uwe Peters en zijn Cambridge-collega Benjamin Chin-Yee analyseerden 4.900 door chatbots gemaakte wetenschappelijke samenvattingen. Wat bleek: in 26 tot 73 procent van de gevallen trekken deze te grote, onjuiste conclusies.
AI-relatieadvies
Ruzie met een vriend? Is de vonk uit je relatie? Sinds kort kun je voor relatieadvies terecht bij ch...
Laat AI geen onderzoeken voor je samenvatten
Vergeleken met door mensen geschreven samenvattingen waren de chatbots bijna vijf keer meer geneigd om te generaliserend te zijn over de uitkomsten. Verrassend was ook dat juist de nieuwe modellen, zoals ChatGPT-4.5, meer geneigd waren om te generaliseren dan oudere modellen als Claude.
De oudere modellen beantwoordden simpelweg geen vragen die te complex waren, terwijl nieuwere modellen vaak misleidende, autoritaire maar onjuiste antwoorden gaven.
De chatbot vragen zo nauwkeurig mogelijk te zijn, zorgde verrassend genoeg voor nóg slechtere prestaties. Een mogelijke verklaring hiervoor, zeggen de onderzoekers, is het ‘ironic rebound’-effect.
Hoe AI de doden levend houdt (en waarom dat volgens sommige rouwdeskundigen problematisch is)
Via AI en deepfake-technologie zijn de doden dichterbij dan ooit. Als virtuele geesten mengen ze zic...
Dit is het psychologische fenomeen waarbij je juist aan een roze olifant denkt wanneer iemand zegt dat je dat níet moet doen. Dit moet echter nog verder worden onderzocht.
En ook schrijven kun je beter zelf doen
Tegenwoordig is de verleiding groot om ChatGPT in te schakelen voor het schrijven van teksten – essays, artikelen, noem maar op. Binnen enkele seconden, zonder dat je zelf hoeft na te denken, zet Chat een gestructureerd en helder verhaal voor je klaar. Wie wil dat nou niet?
Een studie aan MIT onderzocht de effecten van het gebruik van ChatGPT tijdens het schrijven van essays op ons brein. Hiervoor werden drie groepen studenten vier maanden lang gevolgd terwijl zij essays schreven. Groep één mocht alleen ChatGPT gebruiken, groep twee mocht zoekmachines zoals Google gebruiken, maar zonder AI-functionaliteiten, en groep drie moest volledig op hun eigen denkkracht vertrouwen.
Weinig verrassend was de bevinding dat de hersenen van de studenten die uitsluitend ChatGPT mochten gebruiken, de minste betrokkenheid en hersenactiviteit vertoonden. Ook bleken zij relatief weinig te onthouden van wat ze eerder in hun essays hadden geschreven, en werden ze met elke sessie steeds passiever, wat resulteerde in veel kopiëren en plakken.
De groep die hun essays volledig op eigen denkkracht schreef, vertoonde duidelijk het hoogste niveau van neurale connectiviteit. De onderzoekers zagen bij deze groep vooral alfa-, theta- en delta-activiteit: hersengolven die geassocieerd worden met creatieve ideeën, geheugenbelasting en semantische verwerking. Bovendien waren deze studenten meer betrokken en nieuwsgierig, en voelden zij meer voldoening en eigenaarschap.
Maar, er zit ook een positieve kant aan ChatGTP
Tijdens het onderzoek werden de groepen na de derde sessie gewisseld: de ChatGPT-groep moest voortaan op eigen denkkracht schrijven, terwijl de andere groep juist wél ChatGPT mocht gebruiken. Wat bleek? De groep die nu met ChatGPT werkte, ging vooruit in de kwaliteit van hun schrijfwerk.
Dit resultaat laat zien hoe belangrijk het is om, vóór je ChatGPT om hulp vraagt, eerst zelf denkwerk te verrichten. Weet waar je tekst over gaat en laat het niet klakkeloos door een AI-systeem schrijven. Zo kun je het inzetten als een hulpmiddel dat je verder helpt en je werk verbetert – in plaats van als iets dat je kennis, creativiteit en kritisch denkvermogen ondermijnt.