De Dopamine RPE, Reward Prediction Error coding-theorie van Wolfram Schultz biedt ons inzicht in het waarom van dopamine en verslavingsmechanismen. Zij biedt een neurobiologisch fundament om verslavingen te begrijpen, zowel verslaving aan producten als aan gedrag zoals gokken of sex. Dit artikel is gratis volledig te downloaden : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4826767/
Wolfram Schultz is professor neuroscience aan de universiteit van Cambridge. Met dit overzichtsartikel van 2016 stelt hij dat ‘beloning’ dat is wat we willen herhalen. Evolutionair gezien zijn dat doorgaans handelingen die ons, of onze soort, doen overleven. Daardoor zijn ze gekoppeld aan krachtige leermechanismen, waardoor we er voortdurend beter in worden. De auteur toont aan dat dit leereffect een neurologische basis heeft in de activiteit van neuronen in de middenhersenen met uitlopers naar prefrontale cortex en de motorcortex (mesolimbische systeem). Deze neuronen brengen signalen over met behulp van de neurotransmitter dopamine. Van die molecule is geweten dat zij actief is na inname van verslavende middelen zoals alcohol, nicotine en sommige drugs. Deze activiteit is kunstmatig en bijgevolg krachtiger dan de normale activiteit en ze duurt langer. Daarom is het interessant om de natuurlijke manier werkingsmechanismen van dopamine beter te leren kennen.
De rol van de neurotransmitter dopamine.
Sinds halverwege de jaren '80 weten we dat verhoogde dopamine in de middenhersenen (ventrale striatum of nucleus accumbens) samengaat met het verorberen van voedsel en bij seksuele activiteit. Dat is een tonische verhoging na inname van voedsel, geen piek maar een bult, die meer dan een uur kan aanhouden. Er zijn echter ook dopaminepieken waargenomen die de inname van voedsel voorafgaan. Deze noemen we fasische dopaminepieken. Ze doen zich voor wanneer er voedsel opduikt, of andere gewilde gebeurtenissen zich voordoen. De activiteit die deze dopaminepieken initieert is aandacht richten en toenaderingsgedrag. Er blijkt ook een leer effect aan gekoppeld. Eerder neutrale stimuli die vaak samen met het belonende voorkomen wekken dezelfde dopaminepieken op die dan niet meer voorkomen bij het contact met het voedsel. Het zijn als het ware signalen die de beloning aankondigen. Schultz ontdekte dat dit mechanisme meer was dan een signaal van aanwezigheid van van iets dat een biologische behoefte kon stellen.
De hoogte van deze dopaminepieken, of de optelsom van alle dopamineneuronen die dan tegelijkertijd vuurden (actief waren of dopamine uitstootten), waren niet lineair verbonden met de hoeveelheid beloning. Dat wil zeggen dat ze soms hoger of lager waren bij dezelfde hoeveelheid voedsel die aangeboden werd (aan het proefdier). De hoogte van de Dopaminepieken kwamen overeen met het rekenkundig verschil tussen de aangeboden beloning en de verwachte beloning. Bijvoorbeeld, als de aangeboden beloning groter is dan de verwachte dan geeft dat een positief resultaat. Een hogere dopaminepiek en dus meer gedragsreactie op dat voedsel (beweging, geluid, salivatie, enz.) Omgekeerd bij minder beloning dan verwacht (dan de vorige keer) was de activiteit van de dopamineneuronen ook lager. Schultz noemde dit mechanisme de Reward Prediction Error RPE. Heel wat hersenactiviteit is een gevolg van een afweging van wat er verwacht wordt te gebeuren en wat effectief gebeurd. Onze hersenen zijn een voorspellende machine waardoor we anticiperen op wat er zich in onze omgeving afspeelt. Daardoor gaan we zuinig om met hersenactiviteit die hoger is wanneer er zich andere dingen voordoen dan verwacht.
Met dit dopaminemechanisme wordt een 'subjectief' element ingebouwd in de gedragsneurobiologie. Waar een meetinstrument de aan- of afwezigheid van voedsel kan constateren en daarop op een stereotype manier reageren, houden onze hersenen ook rekening met verwachtingen. Hiermee worden ook andere factoren in rekening gebracht: risico, voldaan zijn, andere contextuele signalen.
Economic utility
Schultz besluit dat de dopamineactiviteit de economische gebruikswaarde signaleert, de kostenbaten analyse, economic utility. Dat mechanisme doet ons streven naar steeds meer ‘beloning’. Als de lekkernij hetzelfde blijft en risicoloos voorspelbaar is daalt de dopamine activiteit en bijgevolg het gedrag om de beloning te verwerven. De beloning is perfect voorspeld, we moeten er niets bijzonder voor doen. Als de kost te groot is om iets te verwerven, de beloning is in verhouding minder groot dan verwacht, dan zakt activiteit om er achteraan te gaan.
Dit mechanisme zou je het motivationele deel kunnen noemen van het beloningscentrum. Dopamine als 'utility prediction error'. (Met error wordt hier geen fout bedoeld maar wel dat het 'verschil', de afwijking voor actie zorgt.) Wat leert ons dit mechanisme over verslaving?
Van alcohol, nicotine en drugs is bekend dat ze kunstmatig dopamine verhogen. DAt innamegedrag grijpt direct in op de dopamineneuronen waardoor er een positieve voorspelfout optreedt. De hersenen blijven bij herhalen die producten zien als waardevol en verassend waardoor ze actief gezocht moeten worden.
Meer uitleg op de website neuroscientificallychallenged.
Belang.
Het belang van Wolfram Schultz onderzoek wordt naar mijn aanvoelen nog onderschat ook al won hij de belangrijke Brain Prize voor 2017. De reward prediction theorie bevestigt dat verslaafden de beschikbaarheid van hun product anticiperen waardoor de verwachting hoog kan zijn en de drang moeilijk te weerstaan. Vraagt het te veel moeite om het product te verwerven, dan zakt de drang tot 'beheersbare 'proporties, men kan er zich dan wel tegen verzetten. Dat onderschrijft het belang van het hindernissen inbouwen: maak alcohol duur, niet overal te koop, gebruik geen kortingen om aankoopimpulsen op te wekken, enz.

Personalia Paul Van Deun:

