Etter Nash, hvem trenger Adam Smith?

Hentet fra Canva

Etter Nash, hvem trenger Adam Smith?

Karakteren John F. Nash i filmen A Beautiful Mind (2001) sier til sine studievenner:

Adam Smith needs revision … Adam Smith said the best result comes from everyone in the group doing what’s the best for himself … he is wrong.

Om Nash faktisk har sagt dette vet jeg ikke. Når Nash-karakteren i filmen forklarer likevekten, er det i en sosial dilemmasituasjon: Når hver spiller bare tenker på seg selv ender de opp i det verste utfallet. Smiths usynlige hånd fungerer altså ikke. Økonomer forklarer ofte likevekten ved å si at hver spiller maksimerer sin egen nytte, gitt spillerens «forventning» til strategien til de andre spillerne. I tråd med denne forklaringen karakteriseres Nash-likevekten av at spillerne har konsistente forventninger om hverandres strategier. Men likevekten sier ingenting om hvordan slike forventninger realiseres. Denne artikkelen forklarer at Adam Smiths The Theory of Moral Sentiments (1759) nettopp handler om hvordan vi danner forventninger om hverandres oppførsel. Smiths moralteori bygger på en premiss om at vi, i tillegg til å være drevet av egeninteresse, har en genuin interesse for andre mennesker. Basert på vår genuine interesse for hverandre, forklarer Smith hvordan normer utvikles som opprettholder samarbeid mellom mennesker, også i sosiale dilemmasituasjoner.

Etter Nash, hvem trenger Adam Smith?1

1. INNLEDNING

I år er det 75 år siden John F. Nash publiserte sin banebrytende artikkel «Equilibrium Points in n-Person Games». Nashs likevekt var avgjørende for utviklingen av spillteori2. I dag er spillteori standardverktøy innen økonomifaget, men det brukes også i fag som statsvitenskap, filosofi og psykologi. Spillteori brukes til å analysere sosiale dilemmaer, som fangens dilemma og allmenningens tragedie, hvor individuelle rasjonelle beslutninger fører til et kollektivt dårligst mulige utfall. 

Nash brukte et fikspunktsteorem til å vise eksistensen av likevekt i et spill. Et fikspunktsteorem er et matematisk teorem med røtter tilbake til begynnelsen av 1900-tallet.  For en avbildning («mapping» på engelsk) f, som avbilder hvert punkt x i en mengde X til et punkt f(x) i X, er x* et fikspunkt når det avbildes på seg selv; det vil si at f(x*) = x*. Under spesifikke forutsetninger for avbildningen f og mengden X, viser fikspunktsteoremet at det alltid vil eksistere et fikspunkt. Nash (1950) brukte Kakutani’s fikspunktsteorem til å bevise eksistensen av en likevekt: I et spill med et endelig antall spillere er beste svar til spiller i gitt med avbildningen: si = Ri (s-i) hvor vektoren s-i representerer de andre spillernes sine strategier. Strategiene kan være rene strategier, eller blandede strategier som er en sannsynlighetsfordeling over rene strategier. Nashlikevekten er definert som mengden av strategier s* som er slik at si* = Ri(s-i*) for alle spillere i.

I definisjonen av likevekt som et fikspunkt ligger det at hver spiller optimaliserer sin strategi «gitt» de andre spillernes strategier, eller som Nash uttrykker det: «if the strategies of the others are held fixed».3 Men når økonomer skal forklare dette brukes ofte ord som «vet», «tror» eller «forventer» om de andre spilleren sine strategier i stedet for «gitt». I tråd med slike forklaringer blir Nash-likevekten karakterisert som at spillerne har konsistente forventninger om hverandres strategier.4 Ifølge Leif Johansen, kan slike tolkninger av Nash-likevekten være «villedende».5 Han fortsetter med å si at dette kanskje kan virke noe pedantisk for noen lesere, men at det er viktig. Jeg er enig med ham i at det er tolkningen av Nash-likevekten, ikke de matematiske egenskapene i seg selv, som er problemet. Ord som «vet», «tror» eller «forventer» gir inntrykk av at Nash-likevekten forteller noe mer enn den faktisk gjør. Det skaper inntrykk av en innsikt som vi ikke har. For å unngå villedende tolkninger foreslår Johansen å presisere rasjonalitetsantagelsene for Nash-likevekten, noe jeg kommer tilbake lengre frem i artikkelen.

I 1759, nesten 200 år før Nash publiserte sin banebrytende artikkel, publiserte Adam Smith sin moralteori, The Theory of Moral Sentiments (TMS).  Forventninger om hverandres strategier er et påheng til Nash-likevekten, ikke en integrert del av den.  Smiths moralteori, derimot, har forventninger om andres oppførsel som kjernen i teorien; hans teori handler om prosessen om hvordan slike forventninger dannes. Smith kaller disse forventningene for oppførselsregler, «rules of conduct» som han skriver. Smiths moralteori forklarer hvordan slike oppførselsregler begrenser vår naturlige egeninteresse, og hvordan dette derfor kan bidra til at mennesker håndterer sosiale dilemmaer, selv om det ikke nødvendigvis er intensjonen bak dannelsen av slike oppførselsregler.

I denne artikkelen skal jeg forklare hvordan Smiths moralteori kan belyse økonomiske og sosiale situasjoner der Nash-likevekt brukes. For ordens skyld: dette er ingen kritikk av Nash og hans likevekt. Tvert imot mener jeg at Nash-likevekten fortjener all den anerkjennelsen den kan få. Dette er snarere et forsøk på å få moderne økonomer til å løfte blikket, og se tilbake på Smiths gamle tekster. Jeg håper å vise hvordan hans teorier kan kaste lys over situasjoner som allmenningens tragedie og fangenes dilemma, hvor økonomer ofte benytter Nash-likevekt for å belyse situasjonen. Jeg tror at Smiths moralteori kan gi oss dypere innsikt i de sosiale situasjonene der Nash-likevekten brukes. Jeg bygger videre på andre forskere som drøfter sammenhengen mellom Smiths moralteorier og spillteori (se for eksempel Brown (2011) og Serdarevic (2021). Min artikkel her tar utgangspunkt i avsnittet «Etter Nash, hvem trenger Adam Smith» i boken min Adam Smith: Marked og moral.6 Artikkelen introduserer nye faglige momenter og utdyper argumentasjonen i boken for å belyse forskjellen mellom de to teoriene, og hvorfor økonomifaget bør gi plass til Smiths moralteori på sin pensumliste.

2.            MENNESKER ER SOSIALE, IKKE BARE NYTTEMAKSIMERENDE

Både Smiths moralteori og Nash-likevekten er teorier. Språket er forskjellig; Nash-likevekten bruker matematikk, mens Smiths moralteori bruker ord.

Premissene i de to teoriene er også ulike. Et premiss i spillteori er at alle spillere maksimerer sin egen payoff eller nytte.  Spillerens nytte kan inkludere nytten til andre, for eksempel at noen spillere har altruistiske preferanser. Noen lærebøker forklarer hvordan mennesker løser sosiale dilemma som fangenes dilemma ved å endre preferansene til spillerne til altruistiske.7 Å endre spillernes preferanser til å inkludere altruistiske preferanser «løser» likevel ikke fangenes dilemma. Når premisset er at fangene har altruistiske preferanser er det ikke lenger et fangenes dilemma-spill, men et annet spill som økonomen Ken Binmore har påpekt.8 Sosiale dilemma er reelle og forsvinner ikke ved å endre spillernes preferanser.

I Smiths teorier er mennesker også motivert av egeninteresse, men i tillegg har vi en genuin interesse for andre mennesker.  Det premisset slår han allerede fast i første setning i hans moralteori:  

How selfish soever man may be supposed, there are evidently some principles in his nature, which interest him in the fortune of others, and render their happiness necessary to him, though he derives nothing from it except the pleasure of seeing it.9

Smith skriver at vi er interessert i andre mennesker, men ikke nødvendigvis at vi bryr oss om dem. Vår interesse for andre er ikke instrumentell, det vil si at vi ikke er interessert i dem kun fordi det gagner oss selv – selv om det noen ganger kan skje. Et sentralt premiss i Smiths moralteori er altså at vi mennesker fra naturens side har en genuin interesse for hverandre. 

Har vi en genuin interesse for andre mennesker? La oss ta noen spørsmål basert på eksempler fra Smith. Hvorfor ler vi av noen vitser, mens andre ganger synes vi vitsen er flau og ikke ler? Hvorfor uttrykker vi sorg sammen med en fremmed mann som forteller at han nettopp har mistet faren? Hvorfor blir vi som tilskuere sinte når vi ser en fremmed bli slått og føler at gjerningspersonen fortjener straff? Smiths svar på alle disse spørsmålene bunner i vår genuine interesse for andre mennesker. Uansett om du tror på Smiths premiss om at vi har en genuin interesse for andre, er dette et sentralt premiss i hans moralteori.

Noen vil kanskje innvende at premisset i Smiths moralteori er at mennesker har en naturlig godhet for andre.10 Men premisset i Smiths moralteori er som sagt at vi har en genuin interesse for hverandre. Dette sosiale aspektet ved menneskets natur gjør at vi utvikler en samvittighet som motiverer oss til å gjøre godt mot andre uten at vi forventer å få noe tilbake.  Denne formen for godhet overfor andre er derfor en prediksjon fra Smiths moralteori, ikke et premiss.

Smith insisterte på at premissene i hans teori skulle reflektere hvordan mennesker faktisk er, med våre svakheter og ufullkomne natur, ikke som perfekte vesener. I teorien der han beskriver hvordan en tilskuer dømmer om en skadelig handling fortjener straff eller ikke, skriver Smith om sin moralteori:

We are not … examining upon what principles a perfect being would approve of the punishment of bad actions; but upon what so weak an imperfect creature as man actually and in fact approves of it.11

Smiths teori forklarer, med utgangspunkt i menneskers sosiale natur, hvordan vi utvikler oppførselsregler som tøyler egeninteressen.  Disse oppførselsreglene tøyler også egeninteressen i spillsituasjoner, der mennesker verken kan samarbeide eksplisitt eller kommunisere med hverandre, slik som i spillteori.  Dette innebærer at fangens dilemma og allmenningens tragedie, innenfor rammen av Smiths moralteori, blir mindre av et dilemma og mindre av en tragedie.

For å sammenligne Smiths moralteori med Nash-likevekt, vil jeg først forklare det sentrale i hans moralteori.

3.            SMITHS MORALTEORI12

Smiths moralteori er en teori om hvordan vi moralsk dømmer hverandre og oss selv.  Det er ikke en teori om hvordan vi bør dømme hverandre og oss selv; det er en teori om hvordan vi faktisk dømmer hverandre og oss selv.

Hvorfor dømmer vi andre mennesker? Hvis vi møter en gråtende fremmed mann som forteller oss at han nettopp har fått vite at faren hans er død, vil vi trolig akseptere hans gråt. Men hvis han forteller oss at han gråter fordi han har mistet hansken sin, vil vi kanskje tenke for oss selv at det ikke er noe å gråte for – du er jo en voksen mann.  Hvis vi ser en ung gutt reise seg for å gi setet sitt til en eldre dame på bussen, tenker vi med oss selv at han er en kjekk ungdom. Kanskje vil vi til og med si det til ham. Men hvorfor dømmer vi? Vi kjenner verken den gråtende mannen, gutten, eller den eldre damen, og det er lite trolig at vi vil møte dem igjen. Smith sier at vi gjør det fordi vi er genuint interessert i andre mennesker. Det er denne genuine interessen for andre mennesker som fører til at vi moralsk dømmer andre, og at andre dømmer oss. 

Ifølge Smith dømmer vi først hverandre og deretter oss selv. Uten erfaringen av at vi dømmer andre, og at andre dømmer oss, kan vi ikke dømme oss selv. 

3.1.                                            Vi dømmer om en handling er passende eller upassende

Når vi som tilskuere dømmer handlingen til en person, dømmer vi om handlingen er passende eller upassende.  Smith forklarer dette med en situasjon hvor en mann opplever at ingen ler av vitsen han forteller, mens han selv ler hjertelig. Da dømmer tilhørerne vitsen som upassende.  Mange av oss har nok erfart å fortelle en vits som ingen ler av, eller har blitt beklemt ved at andre har fortalt en upassende vits.  Smith slår fast at den som ikke ler av vitsen, dømmer vitsen som upassende, og den som ler av vitsen dømmer vitsen som passende.  Erfaringen av at ingen lo av vitsen vil få vitsefortelleren til å unngå å fortelle den samme vitsen i en lignende situasjon senere. De som ikke lo, vil også ta med seg erfaringen og tenke at slike vitser er upassende, i hvert fall i slike situasjoner.

Gjennom våre erfaringer med å dømme andre samt å bli dømt selv, utvikler vi en anelse av hva som er passende, og hva som er upassende i ulike situasjoner.  Når vi dømmer om en handling er passende eller upassende, sammenligner vi med det som Smith kaller anstendighetspunktet; det som normalt forventes i situasjonen. Avvik fra anstendighetspunktet blir dømt som upassende. For eksempel kan vi dømme en handling som egoistisk når en person tar for mye hensyn til seg selv. Men vi kan også dømme en handling som underdanig eller selvutslettende når den tar for lite hensyn til seg selv. Tipsing på restaurant er et annet eksempel. Anstendighetspunktet for tips varierer mellom kulturer. Hvis å tipse 20 til 25 prosent for utmerket service er det normale, vil avvik bli fordømt. Dersom det ikke tipses i det hele tatt, dømmer vi mangel på tips som «kjip». Men vi fordømmer også hvis det tipses for mye, for eksempel 50 prosent, med ord som «ekstravagant».

3.2.                                            Vi dømmer også konsekvensen av handlingen

Når vi dømmer konsekvensen av handlingen, skiller Smith mellom velgjerninger og skadelige handlinger. Når tilskuere dømmer velgjerninger, vurderer de om handlingen fortjener belønning. For at en velgjerning skal fortjene belønning må den være velmenende. Gode intensjoner er likevel ikke nok til å fortjene belønning. I tillegg må tilskueren, når han setter seg inn i situasjonen til personen som mottar velgjerningen, føle takknemlighet overfor personen som utførte handlingen. Personen som utsettes for handlingen trenger ikke selv føle takknemlighet for at en handling skal anses å fortjene belønning. Tenk på en situasjon der en venn gir en flaske vin som gave til en tørrlagt alkoholiker, her kan den tørrlagte alkoholiker kanskje sette pris på gesten. Tilskueren derimot, ved å sette seg i den tørrlagte alkoholikerens situasjon, ville følt sinne. Gaven fortjener da ikke takknemlighet, men snarere klander. 

Når vi som tilskuer dømmer skadelige handlinger, vurderer vi om handlingen fortjener straff. For at en handling fortjener straff må den både være ondsinnet og tilskueren må, når han setter seg inn i offerets posisjon, kjenne på et sinne.

I Smiths moralteori er det altså en tredjepart, tilskuerne sin dømming, som er grunnlaget for om en handling fortjener belønning eller ikke, samt om en handling fortjener straff eller ikke. 

3.3.                                            Hvordan vi dømmer oss selv

Som nevnt innledningsvis er det først når vi har erfaringer med å dømme andre og bli dømt av andre, at vi kan dømme oss selv. Smith illustrerer dette gjennom et tankeeksperiment med en ung person som vokser opp på en øde øy. Denne ungdommen kan ikke utvikle en oppfatning av hva som er rett og galt, på samme måte som han ikke kan vurdere om kroppen hans er vakker eller stygg – et speil mangler. Uten erfaring fra å bli dømt av andre, og fra å dømme andre, har ungdommen ingen referanser. Smith avslutter tankeeksperimentet med å forestille seg at ungdommen blir innlemmet i samfunnet. Når tilskuerne noen ganger aksepterer ungdommens handlinger og andre ganger ikke aksepterer dem, fører disse responsene til nye ønsker og aversjoner. Når vi opplever at tilskuere roser bestemte handlinger og klandrer andre, streber vi etter å utføre handlinger som blir rost, samtidig som vi unngår de som blir klandret. I prosessen med å dømme oss selv utvikler vi samvittighet.

Sentralt i prosessen med å dømme oss selv og utvikling av samvittighet ligger våre lengsler om å bli elsket og være elskverdige; vi ønsker å bli rost, men vi har også et ønske om å være verdig rosen skriver Smith. De to ønskene likner på hverandre og blir ofte blandet sammen, men de er ulike.  Vårt ønske om å være rosverdig er genuint. Vi kan late som om vi er rosverdig for å oppnå ros fra andre. I så fall er vår lengsel etter å være rosverdige ikke genuin. Likevel kan det å motta ros for noe vi vet vi ikke fortjener ros for føles ubehagelig. Tenk på en situasjon der mor roser storebror for å gi en leke til lillebror. En storebror på tre år vil sannsynligvis være fornøyd med mors ros. Men etter hvert som storebror blir eldre vil han gjennom erfaring med å dømme andres handlinger og bli dømt av andre, gradvis utvikle evne til å skille mellom genuin ros og overfladisk ros. Han vil kunne kjenne på ubehaget ved å bli rost for noe som han selv anser som ikke verdig rosen. Gjennom våre erfaringer med moralsk dømming av hverandre lærer vi etter hvert å skille ros og rosverdig. Etter hvert skaper det et ønske om å være verdig ros, selv om ingen faktisk roser vår oppførsel. Når faktiske tilskuere likevel roser oss, bekrefter det vår egen dømming av vår oppførsel.

I tråd med Smiths moralteori frykter vi både å bli klandret og å være klanderverdig. Frykten for å være klanderverdig er genuin, i den forstand at vi frykter å være klanderverdig selv om ingen faktisk klandrer oss. En treåring som slår lillebroren sin, frykter mors klander når hun sier «ikke slå». Om mor legger til «fordi det skader lillebror» er det ikke fornuften som får storebror til å la være å slå, men mors klander.  Etter hvert som gutten vokser opp og møter jevnaldrende i barnehagen og skolegården, lærer han å skille mellom klander og det å være genuint klanderverdig. Det er ubehagelig for gutten å bli klandret for noe han vet han ikke fortjener å bli klandret for, og dette oppleves som verre enn å bli klandret for noe han vet er klanderverdig. Han vil etter hvert føle ubehag ved å ha gjort noe galt, selv om ingen klandrer ham for det. Gjennom erfaringene i skolegården begynner gutten på det Smith beskriver som «the great school of self-command»; en skole for utvikling av samvittighet, som ifølge Smith varer livet ut.

I prosessen med å utvikle samvittighet dømmer vi oss selv.  I prosessen med å dømme oss selv sammenligner vi vår oppførsel med det som vanligvis forventes i situasjonen, det som Smith kaller anstendighetspunktet. I tillegg sammenligner vi dette med det ideelle anstendighetspunktet. Gjennom erfaringene med å dømme hverandre og oss selv, danner vi gradvis en fornemmelse av det ideelle anstendighetspunktet som noe å strekke oss etter.   Siden mennesker har erfaring fra ulike miljøer, kan både hva som oppfattes som anstendighetspunkt, og hva som er det ideelle anstendighetspunktet, variere.  

For eksempel kan en person med erfaring fra et kriminelt miljø anse det perfekte anstendighetspunktet å alltid være taus overfor politiet, mens personer med erfaring fra ikke-kriminelle miljø kan anse det perfekte anstendighetspunktet som alltid å snakke sant til politiet.

Dette kan også forandre seg over tid. Under den tyske okkupasjonen av Norge i perioden 1940–1945 anså gode nordmenn det perfekte anstendighetspunktet som å ikke avsløre noe for det tyske sikkerhetspolitiet Gestapo. I dag kan vi beundre fanger som motstod Gestapos tortur og ikke avslørte noe, men vi klandrer ikke dem som ikke klarte å stå imot. Jeg skriver «vi» selv om jeg er født etter krigen, fordi kjernen i Smiths moralteori er tilskueres innlevelse i situasjonen. Dette betyr at selv om vi ikke levde under krigen, kan vi likevel moralsk dømme handlinger under krigen ved å leve oss inn i krigssituasjonen.

3.4.                                            Abstrakte oppførselsregler
I prosessen med å dømme hverandre og oss selv utvikles det regler, eller gjensidige forventninger om hvordan vi skal oppføre oss. Disse oppførselsreglene er abstrakte; de uttrykker fornemmelser av at visse typer handlinger enten aksepteres eller ikke.  Ordet «sentiments» i tittelen til Smiths moralteori viser til fornemmelser og anelser; det abstrakte i oppførselsreglene.

Disse fornemmelsene gjør oss i stand til å dømme om en spesifikk handling er akseptabel eller ikke, selv om vi aldri selv har stått i den spesifikke situasjonen.
Når jeg forleser om dette pleier jeg – etter avtale med en student – å ta vannflasken fra henne og late som jeg skal begynne drikke av den. Få eller ingen av studenter har opplevd at læreren har gjort noe slikt, men alle vil umiddelbart dømme handlingen min som uakseptabel. Gjennom erfaring har vi utviklet en fornemmelse av forskjellen på «ditt» og «mitt». Disse fornemmelsene og anelsene er abstrakte, vi er derfor i stand til å gjenkjenne forskjellen mellom «mitt» og «ditt» selv i situasjoner vi aldri har opplevd tidligere.

Ifølge Smith korrigerer oppførselsreglene, som utvikles gjennom at vi dømmer hverandre og oss selv, vår naturlige selvopptatthet. Resultatet av denne prosessen er at vi, selv om det ikke var vår intensjon, blir i stand til å håndtere sosiale dilemmaer som allmenningens tragedie og fangenes dilemma.

4.            SMITHS MORALTEORI VERSUS NASH-LIKEVEKT


Å ha felles forventninger om oppførsel er helt grunnleggende for at et samfunn skal fungere. Disse felles forventningene er ofte usagte, og det er derfor lett å ta dem for gitt, noe som kan gjøre det vanskelig å forstå hvor sentralt de er for at samfunnet skal fungere. Hvordan disse felles forventningene dannes, er som allerede sagt det sentrale i Smiths moralteori.

Smiths moralteori er en prosess, ikke statisk som Nash-likevekten.13 Nash-likevekten er statisk i natur, noe som følger direkte av at likevekten er et fikspunkt. Det som skjer utenfor likevekten, altså prosessen mot likevekt, blir ikke fanget opp i teoriene. Selv i evolusjonær spillteori, hvor ordet «evolusjonær» antyder en prosess, er likevekten fortsatt statisk av natur.14

Som allerede nevnt, kan forklaringene av Nash-likevekten ifølge Leif Johansen (1982) være «villedende» når vi forklarer likevekten med at hver spiller «vet», «tror» eller «forventer» om de andre spillernes strategier. Han foreslår derfor å presisere rasjonalitetsantagelsene som ligger til grunn for Nash-likevekten: Hver spiller maksimerer sin preferansefunksjon ui (s1,s2, …, sn), der spillerens strategi si må velges fra mulige strategimengde Si, er basert på at hver spiller har perfekt informasjon om både de andre spillernes preferansefunksjoner og deres mulighetsmengder.15 Med slike rasjonalitetspremisser et det unødvendig å bruke ord som «vet», «tror» og «forventer» om de andre spillernes strategier. I stedet kan hver spiller rasjonelt basert på perfekt informasjonen om de andre spillerens preferanser og mulighetsområder, slutte seg til hva de andre vil gjøre.

Premisset i Smiths moralteori er at det er umulig for andre å ha samme informasjon om preferanser og mulighetsområder som vi selv har. Smith insisterer på at hans moralteori bygger på premisser om hvordan mennesker faktisk er, og derfor vil det alltid være en avstand mellom hvordan vi oppfatter våre egne preferanser og mulighetsområder, sammenlignet med hvordan andre oppfatter dem. Når oppførselsregler, eller forventninger om hvordan vi skal oppføre oss utvikles, vil denne avstanden reduseres, men den vil aldri forsvinne.16

Hvis vi antar at spillerne i Nash-likevekt har perfekt informasjon om hverandres preferanser og muligheter, vil nødvendigvis sosiale dilemmaer som forvaltningen av en allmenning ende i tragedie. Garett Hardin i sin artikkel Tragedy of the common beskriver denne nødvendigheten med at fordi hvert menneske er låst inn i et system – kun drevet av egeninteresse – vil det lede til tragedie.17 Med vår fornuft skjønner vi at forvaltningen av allmenningen fører til tragedie, men siden vi er innelåst i dette systemet, kan vi ikke gjøre noe med det.

I Smiths moralteori er forvaltningen av allmenningene reelle sosiale dilemmaer fordi det alltid vil være en avstand mellom hvordan vi oppfatter våre preferanser og muligheter, og hvordan utestående oppfatter dem. Oppførselsregler som dannes i Smiths teorier, er ikke perfekte og vi mennesker er heller ikke det.  Andre mennesker kan i enkelte situasjoner oppføre seg annerledes enn vi forventer. Denne dissonansen i forventinger kan enten være at våre forventinger avviker fra det som allment forventes, eller at andre mennesker i denne situasjonen oppfører seg annerledes enn det som er allment akseptert.   

4.1.                                            Kontekst er sentralt i Smiths moralteori, mens det er irrelevant i Nash-likevekten

Tilsynelatende ulike situasjoner, som fellesgodespillet, som handler om å bidra til fellesskapet, og allmenningens tragedie, som handler om å utnytte fellesskapet, har egentlig den samme strukturen. Begge handler om enten å samarbeide (enten ved frivillig å bidra til et fellesgode, eller ved å la være å ta for mye ressurser ut av allmenningen), eller å ikke samarbeide (enten ved å være gratispassasjer, eller ved å ta ressurser ut av allmenningen for egen vinning). Fangens dilemma har igjen samme struktur med allmenningens tragedie.18 Siden den underliggende strukturen er like i de tre spillene, er likevekten – ikke-samarbeid – Nash-likevekt i fellesgodespillet, allmenningens tragedie og fangens dilemma.
Det er kanskje nettopp denne egenskapen som gjør disse spillene så attraktive. Fangens dilemma brukes for eksempel til å beskrive svært ulike situasjoner som konkurranse mellom bedrifter i markeder og internasjonale avtaler om reduksjon av klimagassutslipp, skatteunndragelse. Nash-likevekten i alle disse ulike situasjonene er «ikke-samarbeid», mens det felles beste ville vært «samarbeid».  I Smiths teorier er det åpenbart at alle disse situasjoner er forskjellige og må belyses i konteksten.

Som jeg allerede har påpekt, er Smiths oppførselsregler abstrakte i sin natur. At de er abstrakte, gjør at konteksten er helt sentral. I Smiths moralteori er det for eksempel en forskjell mellom å frivillig bidra med egne ressurser til et fellesgode og å ta ressurser fra en allmenning til seg selv, selv om disse i spillteori har samme strategiske struktur.  I Smiths moralteori, handler det første om å gi noe til fellesskapet, mens det andre handler om å ta noe fra fellesskapet. Å gi er en velgjørende handling; det innebærer å gjøre noe godt for andre mennesker. Å ta noe fra andre derimot, er å skade dem, det er å gjøre urett. Oppførselsreglene knyttet til velgjerninger er forskjellige fra dem som er knyttet til det å ikke skade andre.

Ifølge Smith er de abstrakte reglene for velgjerninger vage og ubestemte. De tillater mange unntak og modifikasjoner, noe som gjør det vanskelig å la vår oppførsel bli styrt av dem. Han sammenligner velgjerningsreglene med litteraturkritikernes vurdering av sublimitet og eleganse i en tekst. Disse reglene gir oss heller en idé om hvilke velgjerninger vi bør strebe etter, enn en bestemt regel å følge. Velgjerninger er frivillige, og mangel på velgjerninger blir ikke straffet. Reglene for å ikke skade andre, det vil si rettferdsreglene, er negative og peker på hva vi ikke bør gjøre. Smith sammenligner disse oppførselsreglene med grammatikkregler; de er presise og nøyaktige. På grunn av deres presisjon og nøyaktighet er de enklere å følge enn andre oppførselsregler. Å følge rettferdsreglene er en plikt, og brudd på slike regler kan bli straffet.

Smiths moralteori predikerer altså at mennesker vil oppføre seg annerledes i situasjoner som frivillige bidrag til fellesgoder og i allmenningens tragedie. Prediksjonene fra Nash-likevekt er at de skal oppføre seg på samme måte siden spillene har samme strategiske struktur. Resultater fra eksperimenter støtter disse prediksjonene fra Smiths moralteori. Men siden Smiths oppførselsregler er avhengige av kontekst kan også deltakere oppføre seg annerledes i en eksperimentell situasjon enn i faktiske situasjoner. Vi bør derfor være varsomme med å overføre resultater fra eksperimentelle situasjoner til virkelige situasjoner.

4.2.                                            Gjentatte spill og trussel om straff
Fangenes dilemma er et klassisk eksempel på sosiale dilemma, hvor Nash-likevekten, når fangene følger sine egeninteresser, ikke gir det beste utfallet.19 Sett i lyset til Smiths moralteori er fangene i fangens dilemma kriminelle som følger kriminelle normer, som «aldri tyste» eller «aldri snakk med politiet.» Ved å følge slike regler kan fangene løse sitt dilemma, ikke på en perfekt måte, men så noenlunde.20

Innenfor rammene av spillteoriens logikk kan fangens dilemma løses når spillet gjentas. De løser sitt dilemma hvis begge følger en strategi som innebærer samarbeid så lenge den andre også samarbeider, men straffer den andre ved å avbryte alt samarbeid for fremtiden hvis den andre ikke samarbeider nå. Trusselen om fremtidig straff fra medfanger bidrar til å løse dilemmaet.

Smiths moralteori om utviklingen av oppførselsregler bygger på at tredjeparter er villige til å straffe i stedet for de direkte involverte som i spillteori.21 Når utenforstående tilskuere dømmer en spesifikk handling tar de hensyn til både personen som handler og personen som utsettes for handlingen. Basert på dette dømmer tilskuere om manglende samarbeid skal fortjener straff eller ikke. Normene og verdier som utvikles, reflekterer nettopp denne tredjeparts moralske dømming.  At tredjeparts vilje til å straffe lovbrudd er sentral, kan illustreres med det som senere ble kjent som Stockholmsyndromet. Hendelsen fant sted under et bankran i Stockholm i 1973, hvor raneren tok gisler og forskanset seg i banken i seks dager. Over tid utviklet det seg et tillitsforhold mellom gisseltakeren og gislene, og noen av gislene motsatte seg politiets forsøk på å frigjøre dem. I den påfølgende rettssaken nektet flere av gislene å vitne mot gisseltakeren.  Strafferettens bestemmelser reflekterer prediksjonen fra Smiths moralteori om at tredjeparter, gjennom aktorer og dommere, avgjør om det skal reises sak mot dem som begår urett, og om de fortjener straff, selv når ofrene for uretten motsetter seg dette.

Selvfølgelig kan også de direkte involverte partene straffe hverandre for brudd på forventet oppførsel. Adam Smith forklarte at kontinuerlig handel i markeder bidrar til å disiplinere sosiale dilemmaer i markeder.22Ethvert markedsbytte åpner muligheten for at uærlige aktører kan utnytte sine handelspartnere for kortsiktige gevinster. Selv en enkel situasjon som hjemlevering av pizza åpner for muligheten til upålitelig oppførsel fra begge parter. Pizzaleverandøren kan levere en lavere kvalitet enn det kjøperen med rimelighet kan forvente, og kjøperen kan kreve refusjon ved å påstå at kvaliteten på pizzaen er dårligere enn den faktisk er. Men ifølge Smith vil hyppig handel mellom parter og frivillighet i transaksjonene disiplinere begge. Begge vil dermed strebe etter å oppfyllede forventningene om oppførsel som situasjonen tilsier. Som jeg har forklart, er disse forventningene om oppførsel, ifølge Smiths moralteori, abstrakte i sin natur. Det er gjennom erfaringer fra markedsprosessen at vi utvikler tillit til at vår handelspartner opptrer i henhold til forventet oppførsel. Disse forventningene er ikke knyttet til personen som leverer pizzaen, selv om det også kan skje, men heller til selve prosessen med hjemlevering av pizza, uavhengig av personen som leverer eller selskapet som står bak.

4.3.       Ord binder, ikke «bare prat»   
Premisset for Nash-likevekt er at spillerne ikke kommuniserer med hverandre.23Det er altså umulig for spillerne å inngå en avtale på forhånd om hva de skal gjøre i spillet. Dersom spillerne snakker sammen på forhånd og inngår en avtale uten muligheter for sanksjoner som de faktisk holder, er det fordi de beste strategiene for alle spillerne er å holde avtalen. Spillerne vil altså opprettholde avtalen uavhengig av løftene. Hvis spillerne snakker sammen på forhånd, kalles det derfor «bare prat» («cheap talk»).  Ingenting av det som sies på forhånd, forplikter spillernes adferd senere i spillet. Men selv om «bare prat» ikke binder atferden direkte, kan kommunikasjon hjelpe spillerne med å koordinere seg mot en bestemt likevekt når det finnes flere likevekter. En avtale vil imidlertid alltid mislykkes hvis én spiller har insentiv til å bryte den.

Økonomene Joseph Farrell og Matthew Rabin skriver at selv om «bare prat» kan være informativ i noen spill, vil spillerne «ruthlessly lie when it suits them».24At mennesker ville lyve som det passer dem uten trusselen om straff for avtalebrudd, er en tanke som i hvert fall går tilbake til Thomas Hobbes’ Leviathan (1661). I naturtilstanden – uten en Leviathan til å straffe avtalebrudd – er ord bare ord, tomme løfter.25 

Kanskje overraskende for dagens økonomer, så Smith sin moralteori som et alternativ til Hobbes’ teori.26 At mennesker holder løfter, er grunnleggende for at samfunn skal fungere, noe både Hobbes og Smith er enige om. Uenigheten mellom Hobbes og Smith handler om hva som skal til for at mennesker faktisk holder løfter. Hobbes argumenterer for at mennesker frykter et samfunn i naturtilstanden, der alles kamp mot alle råder, og hvor menneskelivet vil være «trist, brutalt og kort». Gjennom fornuft forstår menneskene at de må gi fra seg noe av sin individuelle frihet i bytte mot at Leviathan, gjennom makt, sørger for at folk holder sine løfter.

Ifølge Smith vil mennesker imidlertid, selv i en naturtilstand – uten eksplisitte sanksjoner – ha en tendens til å holde løfter. Dette skyldes menneskets sosiale dimensjon, som jeg har forklart foran. Smith erkjenner at mennesker har insentiver til «bare prat» og til ikke å holde ord. Mennesker har likevel et sterkt ønske om å være ordholdne, ikke fordi de gjennom et slikt rykte vil oppnå andres tillit, men fordi de genuint ønsker å holde ord.

Premissene i spillteori og Smiths moralteori er forskjellige. Spillerne i spillteori er kun drevet av egeninteresse; det er ingenting som stopper dem fra å lyve skamløst når det passer dem, bortsett fra trusselen om straff. Premissene i Smiths moralteori er derimot at mennesker er sosiale vesener; de er motivert av egeninteresse, men i tillegg har mennesker en genuin interesse for andre. Denne sosiale siden ved menneskets natur forklarer hvordan vi utvikler oppførselsregler og samvittighet som korrigerer vår selvopptatthet. Samvittigheten vil også begrense oss fra å lyve, selv om det ikke finnes noen straff for det.

5.AVSLUTNING


Nash-likevekten har, siden Nash publiserte sin banebrytende artikkel for 75 år siden, fått en naturlig plass i økonomers verktøykasse for å studere sosiale interaksjoner mellom mennesker. Jeg tror det er ukontroversielt å hevde at Smiths moralteori har en beskjeden plass i verktøykassen, og for mange økonomer ingen plass i det hele tatt. Men jeg håper at dette vil endre seg. Jeg tror det vil endre seg fordi premisset i Smiths moralteori om menneskets genuine interesse for andre – menneskets sosiale natur – harmonerer med menneskets faktiske natur.  Denne empiriske forankringen gjør, ifølge Edmund Burke, Smiths venn og åndsfrende, at Smiths moralteori blir mer bestandig enn andre teorier basert på forskernes egne oppfatninger om menneskets natur, som vil og bør bli glemt.27Jeg håper og tror at fremtidens økonomer vil rydde plass til Smiths moralteori i sine verktøykasser. 

6.REFERANSER

Binmore, K. (1992). Fun and games: A text om game theory. D C. Heath & Co.
Binmore, K. (1994). Game theory and social contract, volume 1. The MIT Press.
Brown, V. (2011). Intersubjectivity, The Theory of Moral Sentiments and The Prisoner’s Dilemma.
The Adam Smith Review, 6, 172–190.
The Core Team (2017).  The Economy Economics for a Changing World. Oxford University Press.
Farell, J. og M. Rabin (1996).  Cheap talk.  Journal of Economic Littérature, 10(3), 103-118.
Fudenberg, D. og J. Tirole (1991).  Game theoy. MIT Press.
Güth, W. og H. Kliemt (1998). The indirect evolutionary approach: Bridging the gap between rationality and adaptation.
Rationality and Society 10(3), 377–399.
Haavelmo, T. (1958). Hva kan statiske likevektsmodeller fortelle oss? Annex til Nationaløkonomisk
Tidsskrift 96, 138–143.
Hardin, G. (1968). The Tragedy of the Common. Science 131, 1292-1297.
Hobbes, T. (1651/2008). Leviathan. Oxford University Press.
Johansen, L. (1982).  On the Status of the Nash Type of Noncooperative Equilibrium in Economic Theory.
The Scandinavian Journal of Economics, 84(3), 421-441.
Myerson, R. B. (1999).  Nash equilibrium and the history of economic theory.
Journal of Economic Literature, 37, 1067-1082.
Nash, J. F. (1950). Equilibrium Points in n-Person Games,
Proceedings of the National Sciennces of the United States of America, 36(1), 48-49.
Nash, J. F. (1951). Non-cooperative games. Annals of Mathematics, 54(2), 286-295.
Riis, C. og E.R. Moen (2018).  Moderne mikroøkonomi. Fjerde utgave. Gyldendal, Oslo.
Ostroem, E. (1990). Governing the Commons. Cambridge University Press.
Serdarevic, N., E.A. Strømland og S. Tjøtta (2021). It pays to be nice: The benefits of cooperating in markets.
Journal of Behavioral and Experimental Economics, 90, 1–13
Serdarevic, N. (2021).  «Economic experiments and moral sentiments.
Smithian insight about self-regarding and other-regarding behaviour».
PhD avhandling, Institutt for økonomi, Universitetet i Bergen.
Smith, A. (1759/1976). The Theory of Moral Sentiments. The Glasgow Edition, Liberty Fund.
Smith, A. (1776/1976). An Inquiry into the Nature and Causes of Wealth of Nations. The Glasgow Edition, Liberty Fund.
Strømland, E. A., G. Torsvik og S. Tjøtta (2018). Mutual choice of partner and communication in a repeated prisoner’s dilemma.
Journal of Behavioral and Experimental Economics, 75, 12–23.
Tjøtta, S. (2021). Adam Smiths markedsteori: mistet og funnet. Samfunnsøkonomen, 2, 21-33.
Tjøtta, S. (2024).  Adam Smith: Marked og moral. Cappelen Damm Akademisk, Oslo
Tucker, A. W. (1983). The Mathematics for Tucker: A Sampler.
The Two-Year College Mathmatical Journal, 14(3), 228-232. 
Weibull J.W. (1995). Evolutionary Game Theory. The MIT Press.

7.FOTNONTER
 

  1. Takk til alle kommentarer og deltakere på et seminar ved Institutt for økonomi, UiB og på Forskermøtet i NTNU i 2024. En spesiell takk til Odd Rune Straume, Frode Meland og Teis Lunde Lømo for samtaler om Nash-likevekt og fikspunkter. En spesiell takk til Bjørn Sandvik for kommentarene til en tidligere versjon, samt til redaktør Lars-Erik Borge og en anonym fagfelle. Deres tilbakemeldinger har bidratt til å gjøre teksten bedre. Takk til Camilla Heggedal fra Scribbr for korrekturlesning. ↩︎
  2. Myerson (1999) forklarer hvorfor Nash-likevekten står sentralt i utviklingen av spillteori.
    ↩︎
  3. Nash (1951, s. 287).
    ↩︎
  4. For forklaringer av Nashlikevekten om at spillernes har konsistente forventninger i strategier, se for eksempel Fudenberg og Tirole (1991, s. 13) samt Binmore (1992, s. 408).  En norsk lærebok i mikroøkonomi, (Riis og Moen, 2018, s. 279) skriver om hvordan den enkelte spiller kan «gjøre seg oppfatninger om» andre spillere sine forventinger. I min bok, (Tjøtta, 2024, s. 218) forklarer jeg Nash-likevekten med at spillerne har konsistente forventinger. ↩︎
  5. Johansen (1982, s. 421 og s. 425) skriver «misleading». Takk til Haakon Vennemo for å vise meg til artikkelen til Johansen.  ↩︎
  6. Tjøtta (2024, s. 217-221) ↩︎
  7. For eksempel The Core Team (2017, s. 147–148). ↩︎
  8. Binmore (1994, s. 102-114).  ↩︎
  9. TMS (I.i.1, s. 10): Referansen til Smiths arbeider følger den opprinnelige oppdelingen sammen med avsnittsnummereringen som er lagt til i Glasgow-utgaven. For eksempel: TMS (I.i.1, s. 10) betyr Part I, Section i, Chapter 1, avsnitt 1 og side 10 i Glasgow-utgaven. ↩︎ ↩︎
  10. I det som senere er kalt «Das Adam Smith Problem», påstås det at det er en inkonsistens mellom premissene om menneskets natur i Smiths moralteori, hvor mennesker er drevet av godhet overfor andre, og i hans økonomiske teori i An inquiry into the nature and causes of the Wealth of Nations,  hvor mennesker er drevet av bare egeninteresse. De fleste Smith-forskere avviser imidlertid en slik inkonsistens; se min bok, Tjøtta (2024, s. 22). ↩︎ ↩︎
  11. TMS (II.i.5.10, s. 77). ↩︎
  12. Denne delen bygger på Del II Smiths moralteori i min bok, (Tjøtta, 2024, s. 23-131). ↩︎
  13. Likevekt i moderne markedsteori er også statisk i sin natur, noe som ble påpekt av Haavelmo allerede i 1958. Jeg har tidligere forklart i Tjøtta (2021) at Smiths markedsteori i Smith (1776) er en prosess, ikke statisk. Eksistensen av Walras-likevekten kan også vises med et fikspunktsteorem. ↩︎
  14. Se for eksempel Weibull (1995, s. 35) og Güth og Kliemt (1998, s. 391). ↩︎
  15. Dette er postulat 1 i Johansen (1982, s. 432). Postulat 2 sier at hver spiller antar at de andre spillerne er rasjonelle på samme måte som spilleren selv. I tillegg finnes det tre andre postulater. ↩︎
  16. Se min bok (Tjøtta, 2024, s. 35-40, s. 66-67) for en mer utdypende forklaring av dette. ↩︎
  17. Hardin (1968, s. 1244). ↩︎
  18. Se for eksempel Ostroem (1990, s. 6) om hvorfor den strategiske formen er den samme i de tre nevnte spillene. ↩︎
  19. Albert W. Tucker, Nashs PhD-veileder, er kreditert for å ha vært den første som skriftlig presenterte fangenes dilemma. I 1950 holdt Tucker et innlegg om spillteori ved Institutt for psykologi på Stanford, hvor han brukte fangenes dilemma som eksempel og skrev et kort notat om det. Notatet ble senere publisert i Tucker (1983), hvor Tucker forklarer at han kom over spillet på tavlen til kollegaene Merrill Flood og Melvin Dresher. ↩︎
  20. Jeg skriver «noenlunde» fordi i det moderne økonomifaget tyr økonomer ofte til «perfekte» som målestokk – enten det gjelder markeder eller sosiale dilemmaer i Nash-likevekten. Å sammenligne faktisk sosial interaksjon med det «perfekte» er fremmed i Smiths teorier, som sammenligner faktiske institusjoner med andre faktiske institusjoner. ↩︎
  21. Denne forskjellen tar jeg også opp i min bok (Tjøtta, 2024, s. 220-221). Jeg kjenner ikke til andre forskere som belyser denne forskjellen mellom Nash-likevekten og Smiths moralteori. ↩︎
  22. Jeg utdyper dette i «Erfaringer i markedsprosessen fremmer tillit til fremmede og marked» i min bok (Tjøtta, 2024, s. 163-165). Sammen med medforfattere har jeg undersøkt dette eksperimentelt i Strømland m.fl. (2018) og Serdervic m.fl. (2021)  ↩︎
  23. Hver spiller «acts independently, without collaboration of communication with any of the others», Nash (1951, s. 286).  ↩︎
  24. Farrell og Rabin (1996, s. 104) ↩︎
  25. Hobbes skriver: «Covenants, without the sword, are but words and of no strength to secure a man at all» (Hobbes, 1661/1996, Kap. 17, avsnitt 2, s. 111). I statsvitenskap brukes fangenes dilemma til å illustrere Hobbes’ naturtilstand. ↩︎
  26. Jeg forklarer forskjellen mellom Hobbes’ og Smiths teorier for statsdannelse i min bok (Tjøtta, 2024, s. 115-120). ↩︎
  27. Når det gjelder referanser til Burke’s vurdering av Smiths moralteori, se min bok Tjøtta (2024, s. 228). ↩︎