Umkehrfunktion

Die Umkehrfunktion

In der Mathematik bezeichnet die Umkehrfunktion oder inverse Funktion einer bijektiven Funktion die Funktion, die jedem Element der Zielmenge sein eindeutig bestimmtes Urbildelement zuweist.

Eine Funktion a\in A ein eindeutig bestimmtes Element b \in B zu, das mit f(a) bezeichnet wird. Gilt für {\displaystyle a\in A,b\in B} die Beziehung {\displaystyle b=f(a)}, so sagt man auch, dass a ein Urbildelement von b unter f ist. Im Allgemeinen kann ein Element von B kein, ein oder mehrere Urbildelemenete unter f besitzen. Falls jedes Element von B genau ein Urbildelement unter f besitzt (man spricht dann von dem Urbildelement), nennt man f invertierbar. In diesem Fall kann man eine Funktion {\displaystyle f^{-1}\colon B \to A} definieren, die jedem Element von B ihr eindeutig definiertes Urbildelement unter f zuordnet. Diese Funktion wird dann als die Umkehrfunktion von f bezeichnet.

Man kann leicht nachweisen, dass eine Funktion genau dann invertierbar ist, wenn sie bijektiv (also gleichzeitig injektiv und surjektiv) ist. Tatsächlich besagt die Injektivität nichts anderes, als dass jedes Element von B höchstens ein Urbildelement unter f besitzt. Die Surjektivität besagt gerade, dass jedes Element von B mindestens ein Urbildelement unter f besitzt.

Der Begriff der Umkehrfunktion gehört formal zum mathematischen Teilgebiet der Mengenlehre, wird aber in vielen Teilgebieten der Mathematik verwendet.

Definition

Seien A und B nicht-leere Mengen. Neben der Definition aus der Einleitung gibt es weitere Möglichkeiten, die Begriffe der Invertierbarkeit einer Funktion f\colon A\to B und der Umkehrfunktion einer invertierbaren Funktion formal einzuführen:

Es stellt sich heraus, dass alle vorgestellten Invertierbarkeitsbegriffe äquivalent zum Begriff der Bijektivität sind. Auch führen alle Definitionen der Umkehrfunktion zum gleichen Ergebnis.

Notation

Wenn f \colon A \rightarrow B eine bijektive Funktion ist, dann bezeichnet {\displaystyle f^{-1}\colon B\rightarrow A} die Umkehrfunktion. Dabei ist die hochgestellte -1 nicht mit einer negativen Potenz bezüglich der Multiplikation zu verwechseln. Es handelt sich vielmehr um die Umkehrung bezüglich der Komposition von Funktionen. Die alternative Schreibweise \bar f (f quer), kann leicht mit der komplexen Konjugation verwechselt werden. Sie wird daher in der mathematischen Literatur nur selten verwendet.

Allerdings besteht auch bei der Notation f^{-1} eine Doppeldeutigkeit. Diese Notation wird nämlich auch für die Urbildfunktion verwendet, die für jede Funktion (also auch nicht bijektive) existiert. Die Urbildfunktion ist eine Funktion von der Potenzmenge {\mathcal  {P}}(B) in die Potenzmenge \mathcal{P}(A). Es ist üblich, in der Notation der Urbildfunktion bei einelementigen Mengen die Mengenklammern wegzulassen. Für b \in B wird also statt f^{{-1}}(\{b\}) auch einfach {\displaystyle f^{-1}(b)} geschrieben. Identifiziert man nun in dieser notationellen Weise die einelementige Menge mit dem einen enthaltenen Element, dann ist die Umkehrfunktion eine Spezialisierung der Urbildfunktion, und frontale Widersprüche können nicht auftreten. Denn für bijektive f ist {\displaystyle f^{-1}(b)} das eine und einzige Element der Urbildmenge f^{{-1}}(\{b\}).

Wegen der genannten Verwechslungsmöglichkeit findet sich gelegentlich in der Literatur für die Umkehrfunktion (das ist die (-1)-te Iteration) die Schreibweise

{\displaystyle f^{\langle -1\rangle }} so dass {\displaystyle \mathrm {id} }/TD> {\displaystyle =f\circ f^{\langle -1\rangle }} (mit hochgestellter spitzer Klammer),

für die Iteration

{\displaystyle f^{\langle 0\rangle }} {\displaystyle :=\mathrm {id} } und {\displaystyle f^{\langle {n+1}\rangle }} {\displaystyle :=f\circ f^{\langle n\rangle }},

für die Potenz

{\displaystyle f^{\;\!0}} {\displaystyle :=\mathrm {1} } und {\displaystyle f^{\;\!n+1}} {\displaystyle :=f\cdot f^{\;\!n}} (ohne hochgestellte Klammer)

und für die Ableitung

{\displaystyle f^{(0)}} {\displaystyle :=f} und {\displaystyle f^{(n+1)}} {\displaystyle :=(f^{(n)})'} (mit hochgestellter runder Klammer).

Dann ist beispielsweise

\sin ^{{\langle -1\rangle }}=\arcsin \,,
\sin^2+\cos^2=1

und

{\displaystyle \sin ^{(2)}=\sin ^{\prime \prime }=-\sin .}

Einfache Beispiele

{\displaystyle f^{-1}\colon \mathbb {R} \to \mathbb {R} ,\quad f^{-1}(x)=(x-2)/3}.

Eigenschaften

( f^{-1} )^{-1} = f.
{\displaystyle f(f^{-1}(b))=b} für alle b \in B,
{\displaystyle f^{-1}(f(a))=a} für alle a\in A.
Oder etwas eleganter:
f \circ f^{-1} = \operatorname{id}_B
f^{-1} \circ f = \operatorname{id}_A.
{\displaystyle f(g(b))=b} für alle b \in B

dann kann aus jeder der drei folgenden Eigenschaften bereits geschlossen werden, dass beide Funktionen bijektiv und ihre gegenseitigen Umkehrfunktionen sind:

{\displaystyle g(f(a))=a} für alle a\in A,
f ist injektiv
g ist surjektiv
(f^{-1})'(y)=\frac{1}{f'(f^{-1}(y))}.
Diese Aussage wird in der mehrdimensionalen Analysis zum Satz von der Umkehrabbildung verallgemeinert.

Umkehrfunktion für nicht bijektive Funktionen

In vielen Fällen besteht der Wunsch nach einer Umkehrfunktion für eine nicht bijektive Funktion. Hierzu kann man die folgenden Hilfsmittel heranziehen:

Beispiele

Die alternative Idee, den Definitionsbereich um das fehlende Urbildelement für die 1, nämlich die 0, zu erweitern, hat auf den ersten Blick denselben Nachteil. Fügt man, um dies zu beheben, die 0 ebenfalls zur Zielmenge hinzu, so besitzt diese wiederum kein Urbildelement. Man kann diesen Prozess aber gedanklich unendlich oft fortsetzen und gelangt dadurch zur Menge \mathbb {Z} der ganzen Zahlen. Auf dieser Menge ist die Nachfolger-Funktion bijektiv, und ihre Umkehrfunktion ist die Vorgänger-Funktion.

Berechnung

Die effektive Bestimmung der Umkehrfunktion ist oft schwierig. Asymmetrische Verschlüsselungsverfahren beruhen darauf, dass die Bestimmung der Umkehrfunktion einer Verschlüsselungsfunktion effektiv nur möglich ist, wenn man einen geheimen Schlüssel kennt. Dabei ist die Berechnungsvorschrift für die Verschlüsselungsfunktion selbst öffentlich bekannt.

Reelle Funktionen sind oft durch eine Berechnungsvorschrift definiert, die durch einen arithmentischen Term T (mit einer Variablen x) beschrieben werden kann. Bei der Suche nach der Umkehrfunktion versucht man nun die Funktionsgleichung {\displaystyle y=T(x)} durch Äquivalenzumformung in die Form {\displaystyle x=T'(y)} (für einen passenden Term T') zu bringen, also äquivalent nach x aufzulösen. Gelingt dies, so ist die durch die Berechnungsvorschrift T definierte Funktion als bijektiv erwiesen und T' ist eine Berechnungsvorschrift für die Umkehrfunktion. Man beachte, dass bei den Schritten der Äquivalenzumformung die Mengen, aus denen x und y gewählt werden sollen, genau zu beachten sind. Sie bilden dann Definitionsbereich und Zielmenge der betrachteten Funktion.

Beispiele:

Die Umkehrfunktion von f lautet daher f^{-1}(y)=\tfrac{y+1}{2}. Da es üblich ist, das Argument mit x zu bezeichnen, schreibt man auch: f^{-1}(x)=\tfrac{x+1}{2}.
(Die zweite Lösung der quadratischen Gleichung entfällt, da x als positiv vorausgesetzt ist.) Die Umkehrfunktion lautet also: f^{-1}(y) = y + \sqrt{y^2+1}
Bemerkung: Bei dieser Lösung wurde die Quadratwurzel verwendet. Die Quadratwurzelfunktion ist gerade definiert als die Umkehrfunktion der einfachen Quadratfunktion {\displaystyle x\mapsto x^{2}}. Diese einfache Funktion kann nämlich nicht unter Verwendung der Grundrechenarten 'umgekehrt' werden.
Dieses Problem wurde dadurch gelöst, dass der Vorrat an mathematischen Standardoperationen um ein weiteres Mitglied (nämlich die Quadratwurzel) erweitert wurde.
Die Leistung der oben durchgeführten Umformung besteht also darin, die Berechnung für die Umkehrfunktion der Funktion f auf die Berechnung der Umkehrfunktion der Quadratfunktion zurückgeführt zu haben.
Die Quadratwurzel kann, wie gesagt, nicht auf elementare Weise berechnet werden. Tatsächlich hat sie selbst für ganzzahlige Argumente oft irrationale Werte. Es gibt aber gut verstandene Näherungsverfahren für die Quadratwurzel.
Daher wird obige Umformung als ausreichend angesehen. Tatsächlich lässt sich ein besseres Ergebnis auch nicht erzielen.
Man beachte, dass auch die anderen oben angegebenen Umkehrfunktionen (Logarithmus, Arcus- und Area-Funktionen) nicht mit Hilfe der Grundrechenarten (und der Exponentialfunktion und den trigonometrischen Funktionen) berechnet werden können. Sie erweitern daher, genau wie die Quadratwurzel, die Menge der mathematischen Standardoperationen (siehe auch Elementare Funktion).

Umkehrfunktionen und Morphismen

In der höheren Mathematik werden oft Mengen betrachtet, die noch mit zusätzlicher mathematischer Struktur versehen sind. Ein einfaches Beispiel hierfür ist die Menge der natürlichen Zahlen, auf der es unter anderem die durch die Kleiner-Relation definierte Ordnungsstruktur gibt.

Betrachtet man nun Funktionen zwischen zwei Mengen, die den gleichen Typ von Struktur tragen (also etwa zwei geordnete Mengen), so interessiert man sich besonders für Funktionen zwischen diesen Mengen, die mit den entsprechenden Strukturen 'verträglich' sind. Diese Verträglichkeit muss dabei gesondert definiert werden. Die Definition ist aber in den meisten Fällen naheliegend.

Funktionen, die diese Verträglichkeit erfüllen, werden auch Morphismen genannt. Bei geordneten Mengen sind die Morphismen etwa die monotonen Funktionen.

Ist ein Morphismus bijektiv, so stellt sich die Frage, ob die Umkehrfunktion ebenfalls ein Morphismus ist.

In vielen Teilgebieten der Mathematik ist dies automatisch der Fall. So sind etwa die Umkehrfunktionen bijektiver Homomorphismen automatisch ebenfalls Homomorphismen.

In anderen Teilgebieten ist dies nicht der Fall. Bei den geordneten Mengen kommt es zum Beispiel darauf an, ob man sich auf Totalordnungen beschränkt (dann sind Umkehrfunktionen von monotonen Funktionen wieder monoton) oder ob man auch Halbordnungen zulässt (dann ist dies nicht immer der Fall).

Ein bijektiver Morphismus, dessen Umkehrfunktion ebenfalls ein Morphismus ist, wird auch Isomorphismus genannt.

Umkehrfunktionen von Linearen Abbildungen

Ein besonders wichtiges Beispiel für den Morphismusbegriff ist der Begriff der linearen Abbildung (dem Vektorraumhomomorphismus). Eine bijektive linearen Abbildung ist immer ein Isomorphismus. Oft stellt sich die Frage, wie deren Umkehrfunktion effektiv bestimmt werden kann.

Damit überhaupt ein solcher Isomorphismus existieren kann, müssen die beiden beteiligten Vektorräume dieselbe Dimension haben. Ist diese endlich, so lässt sich jede lineare Abbildung zwischen den Räumen durch eine quadratische Matrix (mit entsprechender Spaltenzahl) darstellen. Die lineare Abbildung ist dann genau dann bijektiv, wenn diese Matrix eine Inverse besitzt. Diese Inverse beschreibt dann die Umkehrfunktion.

Im mathematischen Teilgebiet der Funktionalanalysis betrachtet man vor allem unendlichdimensionale Vektorräume, die neben der Vektorraumstruktur noch eine zusätzliche topologische Struktur tragen. Als Morphismen lässt man hier nur solche linearen Abbildungen gelten, die auch mit den topologischen Strukturen verträglich, das heißt stetig, sind. Im Allgemeinen ist die Umkehrfunktion einer bijektiven stetigen linearen Abbildung zwischen zwei topologischen Vektorräumen nicht zwangsläufig stetig. Sind aber beide beteiligten Räume Banachräume, so folgt aus dem Satz über die offene Abbildung, dass dies der Fall sein muss.

Verallgemeinerungen

Für allgemeinere Anwendungen ist der oben eingeführte Begriff der Umkehrfunktion als Inverses einer Bijektion zu eng. Entsprechend existieren Verallgemeinerungen für solche Gegebenheiten, von denen zwei nachfolgend vorgestellt werden.

Linksinverse

Für eine Funktion f\colon A\rightarrow B heißt eine Funktion {\displaystyle g\colon B\rightarrow A} Linksinverse (oder Retraktion), wenn

{\displaystyle g\circ f=\mathrm {id} _{A}.\,\!}

Das heißt, die Funktion g erfüllt

{\displaystyle {\text{Wenn }}f(a)=b{\text{, dann }}g(b)=a.\,\!}

Das Verhalten von g auf dem Bild von f ist also festgelegt. Für Elemente aus B, die nicht Resultat von f sind, kann g dagegen beliebige Werte annehmen. Eine Funktion f hat Linksinverse genau dann, wenn sie injektiv (linkseindeutig) ist.

Eine injektive Funktion kann mehrere Linksinverse haben. Dies ist genau dann der Fall, wenn die Funktion nicht surjektiv ist und der Definitionsbereich mehr als ein Element besitzt.

Beispiele

Linksinverse treten oft als 'Inverse' von Einbettungen auf.

Sei zum Beispiel A die Menge der Vereine, die in der Saison 2018/19 mit einer Mannschaft in der ersten Fußball-Bundesliga der Männer vertreten sind. B sei die Menge der Kommunen in Deutschland. Die Funktion f ordne einem Verein die Kommune zu, in der sein Stadion steht. Da in der betrachteten Saison keine zwei Bundesliga-Mannschaften aus derselben Stadt kommen, ist diese Funktion injektiv. Da es auch Kommunen ohne Bundesliga-Stadion gibt, ist sie nicht surjektiv. Es gibt also mehrere Linksinverse zu f. Eine einfach zu bildende Linksinverse ist die Funktion, die jeder Kommune, die ein Bundesliga-Stadion besitzt, den zugehörigen Verein und allen anderen Kommunen den FC Bayern München zuordnet. Ein in der Praxis sinnvolleres Beispiel wäre die Funktion, die jeder Kommune den Bundesliga-Verein mit dem am nächsten gelegenen Stadion zuordnet. Allerdings wäre es auch deutlich aufwändiger diese Funktion zu ermitteln, zumal erst einmal geklärt werden müsste, welcher Abstandsbegriff der Definition zu Grunde liegt (Luftlinie, kürzeste Entfernung mit dem PKW, …).

Als numerisches Beispiel sei f die Einbettung von \mathbb {Z} in \mathbb {R} . Dann bietet sich jede Rundungsfunktion (auf 0 Stellen nach dem Komma), also zum Beispiel die Gaußklammer, als Linksinverse an. Aber auch die Funktion auf \mathbb {R} , die jeder ganzen Zahl sich selbst und allen anderen Zahlen die 0 zuordnet, ist eine Linksinverse.

Rechtsinverse

Eine Rechtsinverse (Koretraktion) von f\colon A\rightarrow B (oder, bei Faserbündeln, ein Schnitt von f) ist eine Funktion {\displaystyle h\colon B\rightarrow A}, so dass

{\displaystyle f\circ h=\mathrm {id} _{B}.\,\!}

Das heißt, die Funktion h erfüllt

{\displaystyle {\text{Wenn }}h(b)=a{\text{, dann }}f(a)=b.\,\!}

{\displaystyle h(b)} kann also jedes Urbildelement von b unter f sein.

Hat eine Funktion f eine Rechtsinverse, so muss sie surjektiv (rechtstotal) sein.

Umgekehrt scheint es offensichtlich, dass aus der Surjektivität von f die Existenz einer Rechtsinversen folgt. Zu jedem b \in B kann man ja ein oder sogar mehrere Urbildelemente unter f in A finden. Ist die Funktion allerdings 'hochgradig nicht-injektiv', so muss hierzu für eine unüberschaubare Menge von Elementen der Zielmenge eine Entscheidung getroffen werden, welches der Urbildelemente man denn jeweils wirklich nimmt. Eine solche simultane Entscheidung kann nicht immer konstruktiv getroffen werden. Das Auswahlaxiom (in geeigneter Formulierung) besagt gerade, dass eine Rechtsinverse trotzdem für alle surjektiven Funktionen existiert.

In vielen Fällen kann allerdings die Auflösung der Uneindeutigkeit durch eine globale Festlegung erfolgen. Dies ist etwa bei der Definition der Quadratwurzel der Fall, wo man die Uneindeutigkeit immer zu Gunsten der positiven Lösung auflöst. In solchen Fällen wird das Auswahlaxiom nicht benötigt.

Die Funktion h ist offenbar genau dann Rechtsinverse von f, wenn f Linksinverse von h ist. Hieraus folgt unmittelbar, dass Rechtsinverse immer injektiv und Linksinverse immer surjektiv sind.

Eine surjektive Funktion hat genau dann mehrere Rechtsinverse, wenn sie nicht injektiv ist.

Beispiele

Rechtsinverse treten oft als Funktionen auf, die Repräsentanten einer Menge bestimmen.

Sei beispielsweise f\colon \text{Art} \rightarrow \text{Gattung} eine Funktion, die jeder Art ihre Gattung zuweist. Als Rechtsinverse h wählt man dann eine Funktion, die für jede Gattung eine typische Art benennt. Politische Vertretung liefert viele Beispiele. Hier könnte f etwa die Staatsangehörigkeit eines Menschen sein, h das Staatsoberhaupt eines Staates.

Die Hilbert-Kurve bildet das Einheitsintervall stetig (daher die Bezeichnung Kurve) auf das Einheitsquadrat ab. In der praktischen Anwendung wird aber häufig der Hilbert-Index benötigt, nämlich eine Linearisierung zweidimensionaler Daten (eine Umkehrung der Hilbert-Kurve). Dazu nimmt man eine der Rechtsinversen der Hilbert-Kurve, von denen es mehrere gibt – denn die Hilbert-Kurve kann als stetige Abbildung zwischen zwei Räumen unterschiedlicher Dimension nach dem Satz von der Invarianz der Dimension nicht bijektiv sein.

Links- und Rechtsinverse von Morphismen

Tragen die Mengen A und B eine zusätzliche mathematische Struktur und ist f\colon A\rightarrow B eine injektive bzw. surjektive Funktion, die mit diesen Strukturen verträglich ist, so stellt sich die Frage, ob es möglich ist, die Links- bzw. Rechtsinverse so zu wählen, dass die ebenfalls mit den Strukturen verträglich ist. Für viele in der Mathematik untersuchte Strukturen ist dies nicht der Fall. Ist f allerdings eine injektive bzw. surjektive lineare Abbildung, so kann man die Links- bzw. Rechtsinverse ebenfalls als lineare Abbildung wählen.

Verschiedenes

Der Begriff der Umkehrfunktion ist in diesem Fall identisch mit dem Begriff des inversen Elements.
Diese ist dann die leere Funktion, die bijektiv und involutorisch ist.
Ist A, aber nicht B, leer, so gibt es wieder genau eine Funktion von A nach B, die ebenfalls leer ist. Diese Funktion ist injektiv aber nicht surjektiv. Sie besitzt weder Links- noch Rechtsinverse, da es überhaupt keine Funktionen von B nach A gibt.

Siehe auch

Trenner
Basierend auf einem Artikel in: Extern Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung: Jena, den: 29.05. 2023