Intertemporale Entscheidung

Zur optimalen Lösung von intertemporalen Entscheidungsproblemen ist eine Präferenzfunktion vonnöten. Zur Sicherung der Existenz einer (additiven) Präferenzfunktion werden Axiomen an die Präferenzen des Akteurs gestellt. Das im Folgenden vorgestellte Axiomensystem ähnelt dem Axiomensystem für multikriterielle Entscheidungsprobleme. Eine andere grundlegende Axiomatik des diskontierten Nutzens geht auf den amerikanischen Wirtschaftswissenschaftler und Physiker Tjalling C. Koopmans zurück.[1] Dieses Axiomensystem wurde in den Folgejahren weiterentwickelt bzw. variiert.[2] Weitere Axiomensystems stammen von Lancaster[3] und von Dyckhoff.[4] Im Folgenden wird die Darstellung von Müller[5] verwendet.

Ergebnisse, Präferenzen und Nutzen

Es gelten folgende Annahmen und Notationen:

  • Es existiert eine endliche Menge bekannter Perioden N = { 1 , 2 , 3 , . . . , n } {\displaystyle N=\lbrace 1,2,3,...,n\rbrace } mit p N {\displaystyle p\in N} .
  • Zeit wird in identische äquidistante Abschnitte unterteilt, d. h. jede Periode ist gleich lang.
  • Die Menge A {\displaystyle A} ist durch die drei Alternativen A = { x , y , z } {\displaystyle A=\lbrace x,y,z\rbrace } definiert.
  • Jede Alternative wird durch einen Ergebnisvektor beschrieben. Die Alternative x {\displaystyle x} z. B. wird durch den Vektor x = ( x 1 , x 2 , x 3 , . . . , x n ) {\displaystyle x=(x_{\scriptscriptstyle 1},x_{\scriptscriptstyle 2},x_{\scriptscriptstyle 3},...,x_{\scriptscriptstyle n})} beschrieben, wobei x p {\displaystyle x_{\scriptscriptstyle p}} das Ergebnis der Periode p {\displaystyle p} beschreibt.
  • Die Menge P p {\displaystyle P_{\scriptscriptstyle p}} mit p N {\displaystyle p\in N} beschreibt die bekannten Ergebnisse, die in der Periode p {\displaystyle p} mit Sicherheit aus den verschiedenen Alternativen resultieren. Für p = 1 {\displaystyle p=1} folgt z. B.: P 1 = { x 1 , y 1 , z 1 } {\displaystyle P_{\scriptscriptstyle 1}=\lbrace x_{\scriptscriptstyle 1},y_{\scriptscriptstyle 1},z_{\scriptscriptstyle 1}\rbrace } . P 1 {\displaystyle P_{\scriptscriptstyle 1}} bezeichnet die Menge der Ergebnisse der Alternativen in der Periode 1, P 2 {\displaystyle P_{\scriptscriptstyle 2}} ist die Menge der Ergebnisse der Alternativen der Periode 2 usw.
  • Es resultiert das kartesische Produkt P n = P 1 × P 2 × . . . × P n = p = 1 n P p {\displaystyle P^{n}=P_{\scriptscriptstyle 1}\times P_{\scriptscriptstyle 2}\times ...\times P_{\scriptscriptstyle n}=\displaystyle \prod _{p=1}^{n}P_{p}} .
  • Auf diese Weise entsteht die Ergebnismatrix (vgl. Tabelle 1).
Tabelle 1: Grundstruktur der intertemporalen Ergebnismatrix. Quelle: Müller (2022:188).
Periode
Alternative p = 1 {\displaystyle p=1} p = 2 {\displaystyle p=2} p = 3 {\displaystyle p=3}     . . .     {\displaystyle ~~...~~} p = n {\displaystyle p=n}
x x 1 {\displaystyle x_{1}} x 2 {\displaystyle x_{2}} x 3 {\displaystyle x_{3}}     . . .     {\displaystyle ~~...~~} x n {\displaystyle x_{n}}
y y 1 {\displaystyle y_{1}} y 2 {\displaystyle y_{2}} y 3 {\displaystyle y_{3}}     . . .     {\displaystyle ~~...~~} y n {\displaystyle y_{n}}
z z 1 {\displaystyle z_{1}} z 2 {\displaystyle z_{2}} z 3 {\displaystyle z_{3}}     . . .     {\displaystyle ~~...~~} z n {\displaystyle z_{n}}
{\displaystyle \vdots } {\displaystyle \vdots } {\displaystyle \vdots } {\displaystyle \vdots }     . . .     {\displaystyle ~~...~~} {\displaystyle \vdots }


  • Neben der Berücksichtigung der Gesamtmenge sämtlicher Perioden N {\displaystyle N} ist es möglich bzw. erforderlich, lediglich Teilmengen (z. B. R {\displaystyle R} oder S {\displaystyle S} ) zu betrachten. Um die Teilmengen zu unterscheiden, wird die Menge I N {\displaystyle I\subseteq N} eingeführt, welche die Zeitpunkte indiziert. Die Menge S = p I P p {\displaystyle S=\displaystyle \prod _{p\in I}^{}P_{p}} beschreibt eine nichtleere Teilmenge und R = p I P p {\displaystyle R=\displaystyle \prod _{p\notin I}^{}P_{p}} stellt die Komplementärmenge R = P n S {\displaystyle R=P^{n}\backslash S} dar. Eine Auszahlung bzw. ein Ergebniswert von P R {\displaystyle P_{\scriptscriptstyle R}} wird mit x R {\displaystyle x_{\scriptscriptstyle R}} bezeichnet.

Ein allgemeingültiger erster Schritt besteht in der Umwandlung der Ergebnismatrix in eine Nutzen- bzw. Entscheidungsmatrix. Dabei muss für die Ergebnisgrößen eine Nutzenfunktion bekannt sein oder ermittelt werden, so dass folgt: u ( x p ) = f ( x p ) {\displaystyle u(x_{\scriptscriptstyle p})=f(x_{\scriptscriptstyle p})} . Mit dieser Funktion wird also die Höhenpräferenz des Akteurs abgebildet.

Im weiteren Verlauf wird eine Nutzenfunktion der Form u ( x p ) = x p {\displaystyle u(x_{\scriptscriptstyle p})=x_{\scriptscriptstyle p}} unterstellt. Bei den Ergebnissen handelt es sich deshalb um positiv-ökonomische Absolutwerte, wie z. B. Gewinn, Umsatz, Einzahlungen. Das bedeutet nicht, dass der Zahlenwert positiv sein muss, sondern dass die verwendete Rechengröße ökonomisch erstrebenswert ist. Dies ist z. B. bei Auszahlungen oder Kosten nicht der Fall.

Für den zweiten Schritt wird geprüft, ob dominierte Alternativen vorhanden sind.[6]

Im dritten Schritt muss festgelegt werden, wie für die effizienten Alternativen die „Brutto-Nutzengrößen“ aus den verschiedenen Zeitpunkten transformiert und aggregiert werden. Das bedeutet, die Zeitpräferenz muss festgelegt werden. Anschließend müssen die so bewerteten Werte, also die „Netto-Nutzengrößen“ bzw. die Barwerte, zusammengefasst werden.

Grundlagen des additiven Nutzens

Grundständig ist die Forderung nach vollständiger, reflexiver und transitiver Ordnung (vgl. Anforderung 1).

Anforderung 1 (Ordnung):

Die Präferenzrelation {\displaystyle \succsim } auf P n {\displaystyle {\it {P^{n}}}} ist:
  • vollständig, wenn für jedes Paar an Ergebnissen x , y P n {\displaystyle {\it {x,y\in P^{n}}}} mit x y {\displaystyle {\it {x\neq y}}} festgelegt wird: entweder x y {\displaystyle {\it {x\succsim y}}} oder y x {\displaystyle {\it {y\succsim x}}} oder beides,
  • reflexiv, wenn gilt: x x {\displaystyle {\it {x\succsim x}}} für jedes x P n {\displaystyle {\it {x\in P^{n}}}} ,
  • transitiv, wenn aus x y {\displaystyle {\it {x\succsim y}}} und y z {\displaystyle {\it {y\succsim z}}} für jede Kombination x , y , z P n {\displaystyle {\it {x,y,z\in P^{n}}}} mit x y {\displaystyle {\it {x\neq y}}} , x z {\displaystyle {\it {x\neq z}}} und y z {\displaystyle {\it {y\neq z}}} folgt: x z {\displaystyle {\it {x\succsim z}}} .


Die nächste Anforderung postuliert Stetigkeit (vgl. Anforderung 2).

Anforderung 2 (Stetigkeit):

Die Präferenzrelation {\displaystyle \succsim } auf P n {\displaystyle {\it {P^{n}}}} ist stetig, wenn für jedes beliebige x y z {\displaystyle {\it {x\succ y\succ z}}} ein \it λ ] 0 , 1 [ {\displaystyle \lambda \in ]0,1[} existiert, so dass gilt: λ x + ( 1 λ ) z y {\displaystyle {\it {\lambda \cdot x+\left(1-\lambda \right)\cdot z\sim y}}} .

Im Zusammenhang mit der Bewertung von Ereignissen zu unterschiedlichen Zeitpunkten muss sichergestellt sein, dass die Präferenz ausschließlich aufgrund der Ausprägung der Werte zwischen zwei betrachteten Zeitpunkten beurteilt wird, ohne dass die Ausprägung von Ergebnissen zu anderen Zeitpunkten eine Rolle spielt. Darauf wurde schon frühzeitig hingewiesen. Die Präferenzen für verschiedene Zeitpunkte müssen voneinander unabhängig, also separierbar sein.[7] Zur Veranschaulichung dient Beispiel 1.

Beispiel 1:

Es wird die Wahl des Hauptgerichtes betrachtet. Ein Akteur soll heute den Speiseplan für die gesamte nächste Woche zusammenstellen und kann dafür als Hauptgericht zwischen Pizza, Steak oder Fisch wählen. Unabhängigkeit bzw. Separierbarkeit würde von einem Akteur, der Pizza lieber mag als Steak, fordern, dass er die gesamte Woche lang Pizza präferiert. Dies wird jedoch kaum der Fall sein.

Die Unabhängigkeit der Präferenz für die Zeitpunkte wird bei Alltagsentscheidungen i. d. R. nicht erfüllt sein. Die Präferenzen sind im Beispiel 1 also nicht separierbar, was daran liegen dürfte, dass die Zeitpunkte nicht „weit genug voneinander entfernt“ sind.[8]

Die Unabhängigkeit kann auf sämtliche Zeitpunkte ausgeweitet werden, was erforderlich ist, um das Präferenzfunktional additiv zu gestalten. Dies wird als wechselseitige Unabhängigkeit bezeichnet.[9]

Anforderung 3 (Wechselseitige Unabhängigkeit):

Die Relation {\displaystyle \succsim } auf P n {\displaystyle {\it {P^{n}}}} ist wechselseitig unabhängig, wenn für jedes S P n {\displaystyle {\it {S\subseteq P^{n}}}} und R = P n S {\displaystyle R=P^{n}\backslash S} für alle x R , y R P R {\displaystyle {\it {x_{\scriptscriptstyle R},y_{\scriptscriptstyle R}\in P_{\scriptscriptstyle R}}}} und für alle z , w P S {\displaystyle {\it {z,w\in P_{\scriptscriptstyle S}}}} gilt:
( x R , z ) ( y R , z ) ( x R , w ) ( y R , w ) . {\displaystyle (x_{\scriptscriptstyle R},z)\succsim (y_{\scriptscriptstyle R},z)\Leftrightarrow (x_{\scriptscriptstyle R},w)\succsim (y_{\scriptscriptstyle R},w).}

Die bisherigen Annahmen sichern die Existenz eines additiven Präferenzfunktionals nach dem Additivitäts-Theorem von Debreu.[10]

Merksatz 1:

Wenn in einem Entscheidungsproblem mit mindestens 3 wesentlichen Perioden die Präferenzen des Akteurs die Axiome Ordnung (Anforderung 1), Stetigkeit (Anforderung 2) und wechselseitige Unabhängigkeit (Anforderung 3) erfüllen, dann existieren Nutzenfunktionen u 1 , . . . , u n {\displaystyle {\it {u_{\scriptscriptstyle 1},...,u_{\scriptscriptstyle n}}}} auf P 1 , . . . , P n {\displaystyle P_{\scriptscriptstyle 1},...,P_{\scriptscriptstyle n}} mit u p : P R {\displaystyle {\it {u_{\scriptscriptstyle p}:P\rightarrow \mathbb {R} }}} , die die Präferenzrelation {\displaystyle \succsim } auf P n {\displaystyle {\it {P^{n}}}} mit n 3 {\displaystyle {\it {n\geq 3}}} so repräsentieren, dass gilt:
p = 1 n u p ( x p ) p = 1 n u p ( y p ) x y . {\displaystyle \sum \limits _{p=1}^{n}u_{\scriptscriptstyle p}(x_{\scriptscriptstyle p})\geq \sum \limits _{p=1}^{n}u_{\scriptscriptstyle p}(y_{\scriptscriptstyle p})\Leftrightarrow x\succsim y.}
Jede andere Funktion v p {\displaystyle {\it {v_{\scriptscriptstyle p}}}} mit: v p ( x p ) = α u p ( x p ) + β {\displaystyle {\it {v_{\scriptscriptstyle p}(x_{\scriptscriptstyle p})=\alpha \cdot u_{\scriptscriptstyle p}(x_{\scriptscriptstyle p})+\beta }}} , wobei α > 0 {\displaystyle {\it {\alpha >0}}} und α , β R {\displaystyle {\it {\alpha ,\beta \in \mathbb {R} }}} , bildet ebenfalls die Präferenzrelation ab.


Im Merksatz 1 beschreibt die Nutzenfunktion u p {\displaystyle u_{\scriptscriptstyle p}} den Nutzen des Ergebnisses der Alternative in dieser Periode. Für jede Periode existiert eine solche Nutzenfunktion. Demzufolge werden p = 1 , . . . , n {\displaystyle p=1,...,n} Nutzenfunktionen – für jede Periode p {\displaystyle p} eine Nutzenfunktion u p {\displaystyle u_{\scriptscriptstyle p}} – additiv zusammengefasst.

Berücksichtigung der Zeit

Im hier vorliegenden Fall stellt sich jedoch die Frage, wie die Nutzenfunktionen der verschiedenen Perioden aggregiert werden können. Dazu muss die Entwicklung bzw. Veränderlichkeit von Präferenzen im Zeitablauf berücksichtigt werden. Dazu wird folgendes Vorgehen gewählt:[11]

  • In einem ersten Schritt wird angenommen, es existiert eine einheitliche Nutzenfunktion u 0 ( x p ) {\displaystyle u_{\scriptscriptstyle 0}(x_{\scriptscriptstyle p})} . Damit wird die heutige Höhenpräferenz für die gesamte Planungszeit quasi „eingefroren“.
  • Um zeitliche Unterschiede abzubilden, werden die Werte dieser Einheitsnutzenfunktion im zweiten Schritt für jede Periode durch den Faktor g p > 0 {\displaystyle g_{\scriptscriptstyle p}>0} gewichtet. Damit kann das Präferenzfunktional für die Alternative x {\displaystyle x} wie folgt formuliert werden: Φ ( x ) = p = 1 n g p u 0 ( x p ) {\displaystyle \Phi (x)=\sum \limits _{p=1}^{n}g_{\scriptscriptstyle p}\cdot u_{\scriptscriptstyle 0}(x_{\scriptscriptstyle p})} .
  • Diese Vorgehensweise erfordert jedoch eine zusätzliche Anforderung an die Präferenzen des Akteurs. Diese Anforderung – die Stationarität – wird im dritten Schritt erläutert.

Das wird mit der Eigenschaft der Stationarität erreicht, die in Anforderung 4 beschrieben ist.[12]

Anforderung 4 (Stationarität):

Die Präferenzrelation {\displaystyle \succsim } auf P n {\displaystyle {\it {P^{n}}}} ist stationär, wenn es ein e P {\displaystyle {\it {e\in P}}} gibt, so dass gilt:
( x 1 , . . . , x n 1 , e ) ( y 1 , . . . , y n 1 , e ) ( e , x 1 , . . . , x n 1 ) ( e , y 1 , . . . , y n 1 ) {\displaystyle (x_{\scriptscriptstyle 1},...,x_{\scriptscriptstyle n-1},e)\succ (y_{\scriptscriptstyle 1},...,y_{\scriptscriptstyle n-1},e)\Leftrightarrow (e,x_{\scriptscriptstyle 1},...,x_{\scriptscriptstyle n-1})\succ (e,y_{\scriptscriptstyle 1},...,y_{\scriptscriptstyle n-1})} .

Die Stationarität impliziert die Zeitkonsistenz. Damit wird die Besonderheit der intertemporalen Entscheidung erfasst.

Die Entscheidung in t = 0 {\displaystyle t=0} über die beiden Alternativen darf nur von der Höhe der Zahlungen x {\displaystyle x} und y {\displaystyle y} sowie von der relativen Zeitdistanz zwischen diesen Zahlungen abhängen.

Hingegen darf die Entfernung dieser Zeitdistanz vom heutigen Entscheidungspunkt keine Rolle bei der Entscheidung spielen. Beispiel 2 erläutert die Grundidee dieser Eigenschaft.

Tabelle 2: Stationarität von Präferenzen. Quelle: Müller (2022:199).
Periode
Alternative p = 1 {\displaystyle p=1} p = 2 {\displaystyle p=2} p = 3 {\displaystyle p=3} p = 4 {\displaystyle p=4}     . . .     {\displaystyle ~~...~~}
A x 1 {\displaystyle x_{1}} x 2 {\displaystyle x_{2}} x 3 {\displaystyle x_{3}} x 4 {\displaystyle x_{4}}     . . .     {\displaystyle ~~...~~}
B y 1 {\displaystyle y_{1}} y 2 {\displaystyle y_{2}} y 3 {\displaystyle y_{3}} y 4 {\displaystyle y_{4}}     . . .     {\displaystyle ~~...~~}
C x 2 {\displaystyle x_{2}} x 3 {\displaystyle x_{3}} x 4 {\displaystyle x_{4}}     . . .     {\displaystyle ~~...~~}     . . .     {\displaystyle ~~...~~}
D y 2 {\displaystyle y_{2}} y 3 {\displaystyle y_{3}} y 4 {\displaystyle y_{4}}     . . .     {\displaystyle ~~...~~}     . . .     {\displaystyle ~~...~~}

Beispiel 2

Es werden die vier Alternativen der Tabelle 2 betrachtet.
Der Zeitpunkt der Entscheidung liegt in t = 0 {\displaystyle {\it {t=0}}} , weshalb gilt 0 {\displaystyle {\it {\succsim _{\scriptscriptstyle 0}}}} . Stationarität fordert in diesem Fall: A {\displaystyle {\it {A}}} wird gegenüber B {\displaystyle {\it {B}}} schwach präferiert, wenn C {\displaystyle {\it {C}}} ebenfalls gegenüber D {\displaystyle {\it {D}}} schwach vorgezogen wird. Es gilt: A 0 B C 0 D {\displaystyle {\it {A\succsim _{\scriptscriptstyle 0}B\Leftrightarrow C\succsim _{\scriptscriptstyle 0}D}}} . Damit wird gefordert, dass jede Frage nach einer Änderung der Präferenzen in der Zukunft für die heute zu treffende Entscheidung irrelevant sein soll.

Koopmans als Begründer dieser Eigenschaft fordert damit, dass diejenigen Zeitpunkte von Zahlungsströmen irrelevant für die Präferenzordnung sind, die jeweils identische Ausprägungen aufweisen.[13] Aufgrund der Stationarität kann definiert werden:[14] g p = δ p 1 {\displaystyle g_{\scriptscriptstyle p}=\delta ^{\scriptscriptstyle p-1}} , wobei δ = 1 1 + r {\displaystyle \delta ={\frac {1}{1+r}}} . Dieses Gewicht δ p 1 {\displaystyle \delta ^{\scriptscriptstyle p-1}} wird auch als Diskontierungsfaktor bezeichnet. Damit folgt:

Φ ( x ) = p = 1 n g p u 0 ( x p ) = p = 1 n δ p 1 u 0 ( x p ) {\displaystyle {\begin{array}{llll}\Phi (x)&=&\sum \limits _{p=1}^{n}g_{\scriptscriptstyle p}\cdot u_{\scriptscriptstyle 0}(x_{\scriptscriptstyle p})\\&=&\sum \limits _{p=1}^{n}\delta ^{\scriptscriptstyle p-1}\cdot u_{\scriptscriptstyle 0}(x_{\scriptscriptstyle p})\end{array}}}

Dies ist das exponentielle Diskontierungsmodell. Der Faktor r {\displaystyle r} stellt die Zeitpräferenzrate – im Fall von Finanzanlagen also den Zinssatz – dar und wird auch als Diskontrate bezeichnet. Der Wert δ {\displaystyle \delta } ist für alle Perioden konstant. Damit kann ein additives Präferenzfunktional formuliert werden, das zur exponentiellen Diskontierung führt.[15] Das ist die weitverbreitete Formulierung des Modells des diskontierten Nutzens und beschreibt den idealtypischen homo oeconomicus für intertemporale Entscheidungen. Dieser erfüllt sämtliche – für eine exponentielle Diskontierung notwendigen – Anforderungen.

Literatur

  • Gérard Debreu: Topological methods in cardinal utility theory. In: Arrow, K.J./Karlin, S./Suppes, P. (HRSg.): Mathematical methods in the social sciences, 1959: proceedings of the first Stanford symposium. Stanford: University Press, 1960. S. 16–26.
  • Harald Dyckhoff: Zeitpräferenz. In: Zeitschrift für betriebswirtschaftliche Forschung, 40 (11). 1988. S. 990–1008.
  • Peter Clingerman Fishburn (1979): Utility theory for decision making. New York: Wiley.
  • Peter Clingerman Fishburn und Ward Edwards (1997): Discount-neutral utility models for denumerable time streams. In: Theory and Decision, 43 (2), S. 139–166.
  • Peter Clingerman Fishburn und Ariel Rubinstein (1982): Time preference. In: International Economic Review, 23 (3): 677–694.
  • Shane Frederick, George Loewenstein und Ted O’Donoghue: Time discounting and time preference: A critical review. In: Journal of Economic Literature, 40 (2). 2002. S. 351–401.
  • Tjalling Charles Koopmans (1960): Stationary ordinal utility and impatience. In: Econometrica, 28 (2): 287–309.
  • Tjalling Charles Koopmans (1972): Representation of preference orderings over time. In: McGuire, C. B./Radner, R. (Hg.): Decision and organization - a volume in honor of Jacob Marschak. Amsterdam u. a.: North-Holland, S. 79–100.
  • Kelvin Lancaster: An axiomatic theory of consumer time preference. In: International Economic Review, 4 (2). 1963. S. 221–231.
  • David Müller (2022): Investitionscontrolling: Entscheidungsfindung bei Investitionen II: Entscheidungstheorie. 3. Aufl., Berlin u. a., Springer Gabler, ISBN 978-3-658-36597-4.
  • Drazen Prelec und George Loewenstein (1991): Decision making over time and under uncertainty: A common approach. In: Management Science, 37 (7): 770–786.

Einzelnachweise

  1. Koopmans (1960); Koopmans (1972).
  2. Vgl. Fishburn/Rubinstein (1982); Prelec/Loewenstein (1991); Frederick/Loewenstein/O’Donoghue (2002).
  3. Vgl. Lancaster (1963).
  4. Vgl. Dyckhoff (1988).
  5. Vgl. Müller (2022: 181–216).
  6. Vgl. Müller (2022:190–191).
  7. Vgl. Fishburn/Edwards (1997: 147); Müller (2022: 12–13).
  8. Vgl. Müller (2022: 13).
  9. Vgl. Fishburn/Edwards (1997: 147); Müller (2022: 195).
  10. Vgl. Debreu (1960).
  11. Vgl. Müller (2022: 197).
  12. Vgl. Müller (2022: 203).
  13. Vgl. Koopmans (1960: 293–294).
  14. Vgl. Fishburn (1979: 95–96).
  15. Vgl. Fishburn/Edwards (1997: 154); Müller (2022: 204).