Movatterモバイル変換


[0]ホーム

URL:


Zum Inhalt springen
WikipediaDie freie Enzyklopädie
Suche

Differentialrechnung

Dies ist ein als exzellent ausgezeichneter Artikel.
aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet vonAbleitung (Mathematik))
Graph einer Funktion (blau) und einerTangente an den Graphen (rot). DieSteigung der Tangente ist die Ableitung der Funktion an dem markierten Punkt.

DieDifferential- oderDifferenzialrechnung ist ein wesentlicher Bestandteil derAnalysis und damit ein Gebiet derMathematik. Zentrales Thema der Differentialrechnung ist die Berechnung lokaler Veränderungen vonFunktionen. Während einestetige Funktion ihren Eingabewerten kontinuierlich gewisse Ausgangswerte zuordnet, wird durch die Differentialrechnung ermittelt, wie stark sich die Ausgabewerte nach sehr kleinen Veränderungen der Eingabewerte ändern. Sie ist eng verwandt mit derIntegralrechnung, mit der sie gemeinsam unter der BezeichnungInfinitesimalrechnung zusammengefasst wird.

DieAbleitung einer Funktion dient der Darstellung lokaler Veränderungen einer Funktion und ist gleichzeitig Grundbegriff der Differentialrechnung. Anstatt von der Ableitung spricht man auch vomDifferentialquotienten, dessen geometrische Entsprechung dieTangentensteigung ist. Die Ableitung ist nach der Vorstellung vonLeibniz derProportionalitätsfaktor zwischeninfinitesimalen Änderungen des Eingabewertes und den daraus resultierenden, ebenfallsinfinitesimalen Änderungen des Funktionswertes. Eine Funktion wird alsdifferenzierbar bezeichnet, wenn ein solcher Proportionalitätsfaktor existiert.Äquivalent wird die Ableitung in einem Punkt als die Steigung derjenigenlinearen Funktion definiert, die unter allen linearen Funktionen die Änderung der Funktion am betrachteten Punkt lokal am bestenapproximiert. Entsprechend wird mit der Ableitung in dem Punkt eine lineare Näherung der Funktion gewonnen. DieLinearisierung einer möglicherweise komplizierten Funktion hat den Vorteil, dass eine einfacher behandelbare Funktion entsteht als die ursprüngliche Funktion.

In vielen Fällen ist die Differentialrechnung ein unverzichtbares Hilfsmittel zur Bildungmathematischer Modelle, die die Wirklichkeit möglichst genau abbilden sollen, sowie zu deren nachfolgender Analyse.

  • Das Verhalten von Bauelementen mit nicht-linearerKennlinie wird bei kleinen Signaländerungen in der Umgebung eines Bezugspunktes durch ihrKleinsignalverhalten beschrieben; dieses basiert auf dem Verlauf der Tangente an die Kennlinie im Bezugspunkt.
  • Die Ableitung nach der Zeit ist im untersuchten Sachverhalt diemomentane Änderungsrate. So ist beispielsweise die Ableitung der Orts- beziehungsweise Weg-Zeit-Funktion eines Teilchens nach der Zeit seineMomentangeschwindigkeit, und die Ableitung der Momentangeschwindigkeit nach der Zeit liefert die momentane Beschleunigung.
  • In den Wirtschaftswissenschaften spricht man auch häufig von Grenzraten anstelle der Ableitung, zum BeispielGrenzkosten oder Grenzproduktivität eines Produktionsfaktors.

In der Sprache derGeometrie ist die Ableitung eine verallgemeinerte Steigung. Der geometrische Begriff Steigung ist ursprünglich nur fürlineare Funktionen definiert, derenFunktionsgraph eine Gerade ist. Die Ableitung einer beliebigen Funktion an einer Stellex0{\displaystyle x_{0}} kann man als die Steigung derTangente im Punkt(x0,f(x0)){\displaystyle (x_{0},f(x_{0}))} desGraphen vonf{\displaystyle f} definieren.

In der Sprache derArithmetik schreibt manf(x){\displaystyle f'(x)} für die Ableitung einer Funktionf{\displaystyle f} an der Stellex{\displaystyle x}. Sie gibt an, um welchen Faktor vonΔx{\displaystyle \Delta x} sichf(x){\displaystyle f(x)} ungefähr ändert, wenn sichx{\displaystyle x} um einen „kleinen“ BetragΔx{\displaystyle \Delta x} ändert. Für die exakte Formulierung dieses Sachverhalts wird der BegriffGrenzwert oderLimes verwendet.

Einführung

[Bearbeiten |Quelltext bearbeiten]

Heranführung anhand eines Beispiels

[Bearbeiten |Quelltext bearbeiten]

Fährt ein Auto auf einer Straße, so kann anhand dieses Sachverhalts eine Tabelle erstellt werden, in der zu jedem Zeitpunkt die Strecke, die seit dem Beginn der Aufzeichnung zurückgelegt wurde, eingetragen wird. In der Praxis ist es zweckmäßig, eine solche Tabelle nicht zu engmaschig zu führen, d. h. zum Beispiel in einem Zeitraum von 1 Minute nur alle 3 Sekunden einen neuen Eintrag zu machen, was lediglich 20 Messungen erfordern würde. Jedoch kann eine solche Tabelle theoretisch beliebig engmaschig gestaltet werden, wenn jeder Zeitpunkt berücksichtigt werden soll. Dabei gehen die vormalsdiskreten, also mit einem Abstand behafteten, abzählbaren Daten in einKontinuum über. DieGegenwart wird dann als Zeitpunkt, d. h. als ein unendlich kurzer Zeitabschnitt, interpretiert. Gleichzeitig hat das Auto aber zu jedem Zeitpunkt eine theoretisch bekannte Strecke zurückgelegt, und wenn es nicht bis zum Stillstand abbremst oder gar zurück fährt, wird die Strecke kontinuierlich ansteigen, also zu keinem Zeitpunkt dieselbe sein wie zu einem anderen.

  • Exemplarische Darstellung einer Tabelle, alle 3 Sekunden wird eine neue Messung eingetragen. Unter solchen Voraussetzungen können lediglich durchschnittliche Geschwindigkeiten in den Zeiträumen 0 bis 3, 3 bis 6 usw. Sekunden berechnet werden. Da die zurückgelegte Strecke stets zunimmt, scheint der Wagen nur vorwärts zu fahren.

    Exemplarische Darstellung einer Tabelle, alle 3 Sekunden wird eine neue Messung eingetragen. Unter solchen Voraussetzungen können lediglich durchschnittliche Geschwindigkeiten in den Zeiträumen 0 bis 3, 3 bis 6 usw. Sekunden berechnet werden. Da die zurückgelegte Strecke stets zunimmt, scheint der Wagen nur vorwärts zu fahren.
  • Übergang zu einer beliebig engmaschigen Tabelle, die nach Eintragung aller Punkte die Gestalt einer Kurve annimmt. Jedem Zeitpunkt zwischen 0 und 60 Sekunden wird ein Punkt auf der Kurve zugeordnet. Regionen, innerhalb derer die Kurve steiler nach oben verläuft, entsprechen Zeitabschnitten, in denen eine größere Strecke pro Zeitspanne zurückgelegt wird. In Regionen mit nahezu gleich bleibender Strecke, zum Beispiel im Bereich 15–20 Sekunden, fährt das Auto langsam und die Kurve verläuft flach.

    Übergang zu einer beliebig engmaschigen Tabelle, die nach Eintragung aller Punkte die Gestalt einer Kurve annimmt.Jedem Zeitpunkt zwischen 0 und 60 Sekunden wird ein Punkt auf der Kurve zugeordnet. Regionen, innerhalb derer die Kurve steiler nach oben verläuft, entsprechen Zeitabschnitten, in denen eine größere Strecke pro Zeitspanne zurückgelegt wird. In Regionen mit nahezu gleich bleibender Strecke, zum Beispiel im Bereich 15–20 Sekunden, fährt das Auto langsam und die Kurve verläuft flach.

Die Motivation hinter dem Begriff derAbleitung einer Weg-Zeit-Kurve oder -Funktion ist, dass nun angegeben werden kann,wie schnell sich das Auto zu einem momentanen Zeitpunkt bewegt. Aus einem Weg-Zeit-Verlauf soll also der passende Geschwindigkeit-Zeit-Verlaufabgeleitet werden. Hintergrund ist, dass die Geschwindigkeit ein Maß dafür ist,wie stark sich die zurückgelegte Strecke im Laufe der Zeitändert. Bei einer hohen Geschwindigkeit ist ein starker Anstieg in der Kurve zu sehen, während eine niedrige Geschwindigkeit zu wenig Veränderung führt. Dajedem Messpunkt auch eine Strecke zugeordnet wurde, sollte eine solche Analyse grundsätzlich möglich sein, denn mit dem Wissen über die zurückgelegte StreckeΔs{\displaystyle \Delta s} innerhalb eines ZeitintervallsΔt{\displaystyle \Delta t} gilt für die Geschwindigkeit

v=ΔsΔt.{\displaystyle v={\frac {\Delta s}{\Delta t}}.}

Sind alsot0{\displaystyle t_{0}} undt1{\displaystyle t_{1}} zwei unterschiedliche Zeitpunkte, so lautet „die Geschwindigkeit“ des Autos im Zeitintervall zwischen diesen

v=s(t1)s(t0)t1t0.{\displaystyle v={\frac {s(t_{1})-s(t_{0})}{t_{1}-t_{0}}}.}

Die Differenzen in Zähler und Nenner müssen gebildet werden, da man sich nur für die innerhalb eines bestimmten Zeitintervallst1t0{\displaystyle t_{1}-t_{0}} zurückgelegte Streckes(t1)s(t0){\displaystyle s(t_{1})-s(t_{0})} interessiert. Dennoch liefert dieser Ansatz kein vollständiges Bild, da zunächst nur Geschwindigkeiten für Zeitintervalle mit auseinander liegendem Anfangs- und Endpunkt gemessen wurden. Einemomentane Geschwindigkeit, vergleichbar mit einemBlitzerfoto, hingegen bezöge sich auf einunendlich kurzes Zeitintervall. Dementsprechend ist der oben stehende Begriff „Geschwindigkeit“ durch „durchschnittliche Geschwindigkeit“ zu präzisieren. Auch wenn mit echten Zeitintervallen, also diskreten Daten, gearbeitet wird, vereinfacht sich das Modell insofern, als für ein Auto innerhalb der betrachteten Intervalle keine schlagartige Ortsänderung und keine schlagartige Geschwindigkeitsänderung möglich ist. (Auch eine Vollbremsung benötigt Zeit, und zwar länger als die Zeit, in der die Reifen quietschen.) Damit ist auch in der Zeichnung der stillschweigenddurchgehend eingetragene Kurvenzug ohne Sprung und ohne Knick gerechtfertigt.

Zum Zeitpunkt 25 Sekunden bewegt sich das Auto momentan mit ca. 7,6 Metern pro Sekunde, umgerechnet 27 km/h. Dieser Wert entspricht der Steigung der Tangente der Weg-Zeit-Kurve an der entsprechenden Stelle. Weitere detailliertere Erklärungen zu diesergeometrischen Interpretation werden weiter unten gegeben.

Soll hingegen zu einem „perfekt passenden“ Geschwindigkeit-Zeit-Verlauf übergegangen werden, so muss der Terminus „durchschnittliche Geschwindigkeit in einem Zeitintervall“ durch „Geschwindigkeit zu einem Zeitpunkt“ ersetzt werden. Dazu muss zunächst ein Zeitpunktt0{\displaystyle t_{0}} gewählt werden. Die Idee ist nun, „ausgedehnte Zeitintervalle“ in einemGrenzwertprozess gegen ein unendlich kurzes Zeitintervall laufen zu lassen und zu studieren, was mit den betroffenen durchschnittlichen Geschwindigkeiten passiert. Obwohl der Nennert1t0{\displaystyle t_{1}-t_{0}} dabei gegen 0 strebt, ist dies anschaulich kein Problem, da sich das Auto in kürzer werdenden Zeitabschnitten beistetigem Verlauf immer weniger weit bewegen kann, womit sich Zähler und Nenner gleichzeitig verkleinern, und im Grenzprozess ein unbestimmter Ausdruck „00{\displaystyle {\tfrac {0}{0}}}“ entsteht. Dieser kann unter Umständen als Grenzwert Sinn ergeben, beispielsweise drücken

5 MeterSekunde  und  5 MillimeterMillisekunde  und  5 NanometerNanosekunde  usw.{\displaystyle {\tfrac {5\ \mathrm {Meter} }{\mathrm {Sekunde} }}\ {\text{ und }}\ {\tfrac {5\ \mathrm {Millimeter} }{\mathrm {Millisekunde} }}\ {\text{ und }}\ {\tfrac {5\ \mathrm {Nanometer} }{\mathrm {Nanosekunde} }}\ {\text{ usw.}}}

exaktdieselben Geschwindigkeiten aus. Nun gibt es zwei Möglichkeiten beim Studium der Geschwindigkeiten. Entweder, sie lassen in dem betrachteten Grenzwertprozesskeine Tendenz erkennen, sich einem bestimmten endlichen Wert anzunähern. In diesem Fall kann der Bewegung des Autoskeine zum Zeitpunktt0{\displaystyle t_{0}} gültige Geschwindigkeit zugeordnet werden, d. h., der Ausdruck „00{\displaystyle {\tfrac {0}{0}}}“ hat hier keinen eindeutigen Sinn. Gibt es hingegen eine zunehmende Stabilisierung in Richtung auf einen festen Wert, soexistiert derGrenzwert

dsdt(t0):=limt1t0s(t1)s(t0)t1t0=limΔt0s(t0+Δt)s(t0)Δt{\displaystyle {\frac {\mathrm {d} s}{\mathrm {d} t}}(t_{0}):=\lim _{t_{1}\to t_{0}}{\frac {s(t_{1})-s(t_{0})}{t_{1}-t_{0}}}=\lim _{\Delta t\to 0}{\frac {s(t_{0}+\Delta t)-s(t_{0})}{\Delta t}}}

und drückt die exakt im Zeitpunktt0{\displaystyle t_{0}} bestehende Geschwindigkeit aus. Der unbestimmte Ausdruck „00{\displaystyle {\tfrac {0}{0}}}“ nimmt in diesem Fall einen eindeutigen Wert an. Die dabei entstehende Momentangeschwindigkeit wird auch als Ableitung vons{\displaystyle s} an der Stellet0{\displaystyle t_{0}} bezeichnet; für diese wird häufig das Symbols(t0){\displaystyle s'(t_{0})} benutzt. Mit dem Grenzwert wird die Momentangeschwindigkeit zu einem beliebigen Zeitpunkt definiert als

v=dsdt.{\displaystyle v={\frac {\mathrm {d} s}{\mathrm {d} t}}.}

Prinzip der Differentialrechnung

[Bearbeiten |Quelltext bearbeiten]
Schaubild der Zeit-Strecke-Funktions(t)=2t{\displaystyle s(t)=2t} (in Blau). Verstreicht eine Sekunde (in Rot), so nimmt die zurückgelegte Strecke um 2 Meter zu (in Orange). Daher bewegt sich das Auto mit „2 Meter pro Sekunde“. Die Geschwindigkeit entspricht derSteigung. DasSteigungsdreieck lässt sich beliebig verkleinern, ohne dass sich an der Proportion von Höhe und Grundseite etwas ändert.

Das Beispiel des letzten Abschnitts ist dann besonders einfach, wenn die Zunahme der zurückgelegten Strecke mit der Zeitgleichförmig, also linear verläuft. Dann liegt speziell eineProportionalität zwischen derVeränderung der Strecke und derVeränderung der Zeit vor. Dierelative Veränderung der Strecke, also ihre Zunahme im Verhältnis zur Zunahme der Zeit, ist bei dieser Bewegung immer gleichbleibend. Diemittlere Geschwindigkeit ist zu jedem Zeitpunkt auch diemomentane Geschwindigkeit. Beispielsweise legt das Auto zwischen 0 und 1 Sekunden eine gleich lange Strecke zurück wie zwischen 9 und 10 Sekunden und die zehnfache Strecke zwischen 0 und 10 Sekunden. Als Proportionalitätsfaktor über den ganzen Weg gilt die konstante Geschwindigkeitv{\displaystyle v}, wobei sie im nebenstehenden Bildv=2m/s{\displaystyle v=2\,\mathrm {m/s} } beträgt. Die zwischen beliebig weit auseinanderliegenden Zeitpunktent{\displaystyle t} undt+Δt{\displaystyle t+\Delta t} zurückgelegte Strecke beträgt

Δs=s(t+Δt)s(t)=v(t+Δt)vt=vΔt{\displaystyle \Delta s=s(t+\Delta t)-s(t)=v\cdot (t+\Delta t)-v\cdot t=v\cdot \Delta t}.

Allgemein bewegt sich das Auto in der ZeitspanneΔt{\displaystyle \Delta t} um die StreckeΔs=vΔt{\displaystyle \Delta s=v\,\Delta t} vorwärts. Speziell beiΔt=5s{\displaystyle \Delta t=5\,\mathrm {s} } ergibt sich ein WegstückΔs=vΔt=2ms5s=10m{\displaystyle \Delta s=v\,\Delta t=2\,\mathrm {{\tfrac {m}{s}}\cdot 5\,s=10\,m} }.

Falls der Startwert beit=0{\displaystyle t=0} nichts(0)=0{\displaystyle s(0)=0} sonderns(0)=c0{\displaystyle s(0)=c\neq 0} beträgt, ändert dies nichts, da sich in der Beziehungs=vt+c{\displaystyle s=v\,t+c} die Konstantec{\displaystyle c} durch dieDifferenzbildung ausΔs{\displaystyle \Delta s} stets heraussubtrahiert. Auch anschaulich ist dies bekannt: Die Startposition des Autos ist unerheblich für seine Geschwindigkeit.

Werden statt derVariablent{\displaystyle t} unds{\displaystyle s} allgemein die Variablenx{\displaystyle x} undy{\displaystyle y} betrachtet, so lässt sich also festhalten:

Schwieriger wird es, wenn eine Bewegungnicht gleichförmig verläuft. Dann ist das Diagramm der Zeit-Strecken-Funktion nicht geradlinig. Für derartige Verläufe muss der Ableitungsbegriff erweitert werden. Denn es gibt keinen Proportionalitätsfaktor, derüberall die lokale relative Veränderung ausdrückt. Als einzig mögliche Strategie ist die Gewinnung einerlinearen Näherung für die nicht-lineare Funktion gefunden worden, zumindest an einer interessierenden Stelle. (Im nächsten Bild ist das die Stellex=1{\displaystyle x=1}.) Damit wird das Problem auf eine wenigstens an dieser Stelle lineare Funktion zurückgeführt. Die Methode derLinearisierung ist die Grundlage für den eigentlichenKalkül der Differentialrechnung. Sie ist in derAnalysis von sehr großer Bedeutung, da sie dabei hilft, komplizierte Vorgänge lokal auf leichter verständliche Vorgänge, nämlich lineare Vorgänge, zu reduzieren.[1]

x{\displaystyle x}0,50,90,990,99911,0011,011,11,52
f=x2{\displaystyle f=x^{2}}0,250,810,98010,99800111,0020011,02011,212,254
g=2x1{\displaystyle g=2x-1}00,80,980,99811,0021,021,223
g(x)f(x){\displaystyle g(x)-f(x)}−0,25−0,01−0,0001−0,0000010−0,000001−0,0001−0,01−0,25−1
|g(x)f(x)x1|{\displaystyle {\Big |}{\tfrac {g(x)-f(x)}{x-1}}{\Big |}}50 %10 %1 %0,1 %0,1 %1 %10 %50 %100 %
Graphische Darstellung der Approximation vonf(x)=x2{\displaystyle f(x)=x^{2}} an der Stellex=1{\displaystyle x=1} durchg(x)=2x1{\displaystyle g(x)=2x-1}. Letztere ist die Gleichung derTangente vonf{\displaystyle f} an dieser Stelle.

Die Strategie soll exemplarisch an der nicht-linearen Funktionf(x)=x2{\displaystyle f(x)=x^{2}} erläutert werden.[2] Die Tabelle zeigt Werte für diese Funktion und für ihre Näherungsfunktion an der Stellex=1{\displaystyle x=1}, das istg(x)=2x1{\displaystyle g(x)=2x-1}. Darunter enthält die Tabelle die Abweichung der Näherung von der ursprünglichen Funktion. (Die Werte sind negativ, weil in diesem Fall die Gerade immerunter der Kurve liegt – außer im Berührpunkt.) In der letzten Zeile steht der Betrag derrelativen Abweichung, das ist die Abweichung bezogen auf die Entfernung der Stellex{\displaystyle x} vom Berührpunkt beix=1{\displaystyle x=1}. Diese kann am Berührpunkt nicht berechnet werden. Aber die Werte in der Umgebung zeigen, wie sich die relative Abweichung einem Grenzwert nähert, hier dem Wert null. Diese Null bedeutet: Selbst wenn sichx{\displaystyle x} ein wenig (infinitesimal) vom Berührpunkt entfernt, entsteht noch kein Unterschied zwischeng(x){\displaystyle g(x)} undf(x){\displaystyle f(x)}.

Die lineare Funktiong(x){\displaystyle g(x)} ahmt das Verhalten vonf(x){\displaystyle f(x)} nahe der Stellex=1{\displaystyle x=1} gut nach (besser als jede andere lineare Funktion). Die relative VeränderungΔgΔx{\displaystyle {\tfrac {\Delta g}{\Delta x}}} hat überall den Wertm=2{\displaystyle m=2}. Die nicht so einfach zu ermittelnde relative VeränderungΔfΔx{\displaystyle {\tfrac {\Delta f}{\Delta x}}} stimmt aber im Berührpunkt mit dem Wertm=2{\displaystyle m=2} überein.

Es lässt sich also festhalten:

  • Nicht-lineare Funktionen: Soll die relative Veränderung einer nicht-linearen Funktion in einem bestimmten Punkt ermittelt werden, so wird sie (wenn möglich) dort linear genähert. Die Steigung der linearen Näherungsfunktion ist die an dieser Stelle vorliegende Steigung der betrachteten nicht-linearen Funktion, und es gilt dieselbe Anschauung wie bei Ableitungen linearer Funktionen. Dabei ist nur zu beachten, dass sich die relative Veränderung einer nicht-linearen Funktion von Punkt zu Punkt ändert.
Während im Beispiel oben (Fahrzeugbewegung) für die durchschnittliche Geschwindigkeit die ZeitspanneΔt{\displaystyle \Delta t} angemessen willkürlich gewählt werden kann, ist die momentane Geschwindigkeit, wenn sie veränderlich ist, nur fürkleineΔt{\displaystyle \Delta t} angebbar. Wie kleinΔt{\displaystyle \Delta t} gewählt werden muss, hängt ab von der Anforderung an die Qualität der Näherung. In mathematischer Perfektion wird sie infinitesimal. Bei dieser wird für die relative Veränderung (wie schon oben angegeben) anstelle des DifferenzenquotientenΔyΔx{\displaystyle {\tfrac {\Delta y}{\Delta x}}} derDifferenzialquotientdydx{\displaystyle {\tfrac {\mathrm {d} y}{\mathrm {d} x}}} geschrieben (in vereinfachter Schreibweisey{\displaystyle y'} oderf{\displaystyle f'}).

Die Gewinnung der linearen Näherung einer nicht-linearen Funktion an einer bestimmten Stelle ist zentrale Aufgabe des Kalküls der Differentialrechnung. Bei einer mathematisch angebbaren Funktion (im Beispiel war dasf(x)=x2{\displaystyle f(x)=x^{2}}) sollte sich die Ableitungausrechnen lassen. Im Idealfall ist diese Berechnung sogar so allgemein, dass sie auf alle Punkte des Definitionsbereichs angewendet werden kann. Im Falle vonf(x)=x2{\displaystyle f(x)=x^{2}} besitzt jede Stellex{\displaystyle x} als beste lineare Näherung die Steigungm=2x{\displaystyle m=2x}. Mit der Zusatzinformation, dass die lineare Funktion mit der Kurve im Punkt(x0,f(x0)){\displaystyle (x_{0},f(x_{0}))} übereinstimmen muss, kann dann die vollständige Funktionsgleichung der linearen Näherungsfunktion aufgestellt werden.

Der Ansatz zur Bestimmung des Differentialquotienten liegt in der Berechnung des Grenzwerts (wie oben bei der momentanen Geschwindigkeit):

limΔx0f(x0+Δx)f(x0)Δx=f(x0){\displaystyle \lim _{\Delta x\to 0}{\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}=f'(x_{0})\quad } oder in anderer Schreibweiselimh0f(x+h)f(x)h=f(x).{\displaystyle \quad \lim _{h\to 0}{\frac {f(x+h)-f(x)}{h}}=f'(x).}

Bei einigen elementaren Funktionen wiePotenzfunktion,Exponentialfunktion,Logarithmusfunktion oderSinusfunktion ist jeweils der Grenzwertprozess durchgeführt worden. Dabei ergibt sich jeweils eineAbleitungsfunktion. Darauf aufbauend sindAbleitungsregeln für die elementaren und auch für weitere Funktionen wieSummen,Produkte oderVerkettungen elementarer Funktionen aufgestellt worden.

Damit werden die Grenzübergänge nicht in jeder Anwendung neu vollzogen, sondern für die Rechenpraxis werden Ableitungsregeln angewendet. Die „Kunst“ der Differentialrechnung besteht „nur“ darin, kompliziertere Funktionen zu strukturieren und auf die Strukturelemente die jeweils zutreffende Ableitungsregel anzuwenden. Ein Beispiel folgtweiter hinten.

Berechnung von Grenzwerten

[Bearbeiten |Quelltext bearbeiten]

Jeder Differenzialquotient an einer vorgesehenen Stelle erscheint als unbestimmter Ausdruck vom Typ „00{\displaystyle {\tfrac {0}{0}}}“. Zu seiner Berechnung wird vomDifferenzenquotient ausgegangen, und dessen Verhalten in der Umgebung der vorgesehenen Stelle wird untersucht, ob er die Tendenz hat, einen bestimmten Wert anzunehmen. Einige Grenzwerte, die für Ableitungsregeln benötigt werden, werden nachfolgend hergeleitet. Selbstverständlich dürfen dazu keine Regeln der Differenzialrechnung verwendet werden, da diese erst nach der Kenntnis der Grenzwerte aufgestellt werden können.

Ein einfacher Fall 1f(x)=x2{\displaystyle \quad f(x)=x^{2}}

Ausgangspunkt ist der Differenzenquotient für die vorgesehene Funktion.

ΔfΔx=f(x+h)f(x)(x+h)x=(x+h)2x2h{\displaystyle {\frac {\Delta f}{\Delta x}}={\frac {f(x+h)-f(x)}{(x+h)-x}}={\frac {(x+h)^{2}-x^{2}}{h}}}

Wird diebinomische Formel(x+h)2=x2+2xh+h2{\displaystyle (x+h)^{2}=x^{2}+2xh+h^{2}} eingesetzt, so kürzt sich ein Summand heraus.

ΔfΔx=x2+2xh+h2x2h=2xh+h2h{\displaystyle {\frac {\Delta f}{\Delta x}}={\frac {x^{2}+2xh+h^{2}-x^{2}}{h}}={\frac {2xh+h^{2}}{h}}}

Fürh=0{\displaystyle h=0} ist dieser Bruch unbestimmt. Aber fürh0{\displaystyle h\neq 0} (dann und nur dann!) können Zähler und Nenner durchh{\displaystyle h} dividiert werden.

ΔfΔx=2x+h{\displaystyle {\frac {\Delta f}{\Delta x}}=2x+h}

Für jedesh0{\displaystyle h\neq 0} ist dieser Ausdruck bestimmt, auch wenn man dem Werth=0{\displaystyle h=0} nahe kommt. Er strebt im Grenzübergang gegen

limh0ΔfΔx=2x{\displaystyle \lim _{h\to 0}{\frac {\Delta f}{\Delta x}}=2x}

Im Weiteren werden hier nur Grenzwerte berechnet, und ihre Einsetzung in Differenzenquotienten erfolgt weiter hinten im AbschnittAbleitungsberechnung.

Veranschaulichung zur Grenzwertableitung amEinheitskreis
Fall 2sinhh{\displaystyle \quad {\frac {\sin h}{h}}}

Fürh=0{\displaystyle h=0} ist dieser Bruch unbestimmt. Zur Berechnung beih>0{\displaystyle h>0} wird die Fläche einesKreissektors mit dem Bogenh{\displaystyle h} verglichen mit den Flächen eines innen liegenden und eines außen liegenden Dreiecks gemäß der Zeichnung. Im gezeigten Quadranten gilt offensichtlich[3]

12sinhcosh<πh2π<12tanh1{\displaystyle {\frac {1}{2}}\sin h\cdot \cos h<\pi \cdot {\frac {h}{2\pi }}<{\frac {1}{2}}\tan h\cdot 1}

Beisinh0{\displaystyle \sin h\neq 0} kann diese Ungleichung mit2sinh{\displaystyle {\frac {2}{\sin h}}} multipliziert werden.

cosh<hsinh<1cosh{\displaystyle \cos h<{\frac {h}{\sin h}}<{\frac {1}{\cos h}}}

Fürh0{\displaystyle h\to 0} streben sowohl der linke als auch der rechte Ausdruck gegen eins. Damit muss auch der dazwischen liegende Ausdruck gegen eins streben. Für seinen Kehrwert gilt das ebenfalls. Fürh>0{\displaystyle h>0} strebt er im Grenzübergang nach

limh0sinhh=1{\displaystyle \lim _{h\to 0}{\frac {\sin h}{h}}=1}
Zwischenüberlegung(1+1n)n{\displaystyle \quad \left(1+{\frac {1}{n}}\right)^{n}}

Der Logarithmus dieses Ausdrucks, das istnlog(1+1n){\displaystyle n\cdot \log(1+{\frac {1}{n}})}, strebt fürn{\displaystyle n\to \infty } gegen „0{\displaystyle \infty \cdot 0}“. Dieser Logarithmus ist dort unbestimmt und damit auch der Ausdruck selber. Es ist aber bewiesen, dass

limn(1+1n)n{\displaystyle \lim _{n\to \infty }\left(1+{\frac {1}{n}}\right)^{n}}

einen bestimmten endlichen Wert annimmt, der alsEulersche Zahle{\displaystyle \mathrm {e} } bezeichnet wird. Dieses wird unter dem verlinkten Stichwort behandelt und hier als bekannt vorausgesetzt.

Fall 3ah1h{\displaystyle \quad {\frac {a^{h}-1}{h}}}

Fürh=0{\displaystyle h=0} ist dieser Bruch unbestimmt. Aber füra>1{\displaystyle a>1} undh>0{\displaystyle h>0} ist dieSubstitution[4]

ah1=1z{\displaystyle a^{h}-1={\frac {1}{z}}},ah=1+1z{\displaystyle \quad a^{h}=1+{\frac {1}{z}}}

zulässig. Aufgelöst nachh{\displaystyle h} unter Verwendung desnatürlichen Logarithmus ergibt das

h=ln(1+1z)lna{\displaystyle h={\frac {\ln(1+{\frac {1}{z}})}{\ln a}}}
ah1h=lnazln(1+1z)=lnaln(1+1z)z{\displaystyle {\frac {a^{h}-1}{h}}={\frac {\ln a}{z\,\ln(1+{\frac {1}{z}})}}={\frac {\ln a}{\ln \left(1+{\frac {1}{z}}\right)^{z}}}}

Fürh0{\displaystyle h\to 0} strebenz{\displaystyle z\to \infty } und der Nenner gegenlne=1{\displaystyle \ln \mathrm {e} =1}. Für jedesh>0{\displaystyle h>0} ist dieser Ausdruck bestimmt, auch wenn man dem Werth=0{\displaystyle h=0} nahe kommt. Er strebt im Grenzübergang nach

limh0ah1h=lna{\displaystyle \lim _{h\to 0}{\frac {a^{h}-1}{h}}=\ln a}

Als Voraussetzung für diese Herleitung mussz{\displaystyle z} positiv sein. Für0<a<1{\displaystyle 0<a<1} ist dieses erfüllt mit negativemh{\displaystyle h}. Nähert man sich bei0<a<1{\displaystyle 0<a<1} dem Werth=0{\displaystyle h=0} von der Seiteh<0{\displaystyle h<0} her, so gilt derselbe Grenzübergang.

Fall 4log(1+h)h{\displaystyle \quad {\frac {\log(1+h)}{h}}}

Fürh=0{\displaystyle h=0} ist dieser Bruch unbestimmt. Aber fürh>0{\displaystyle h>0} ist die Substitutionh=1z{\displaystyle h={\frac {1}{z}}} zulässig.[5]

log(1+h)h=zlog(1+1z)=log(1+1z)z{\displaystyle {\frac {\log(1+h)}{h}}=z\,\log \left(1+{\frac {1}{z}}\right)=\log \left(1+{\frac {1}{z}}\right)^{z}}

Fürh0{\displaystyle h\to 0} strebtz{\displaystyle z\to \infty }. Für jedesh>0{\displaystyle h>0} ist dieser Ausdruck bestimmt, auch wenn man dem Werth=0{\displaystyle h=0} nahe kommt. Er strebt im Grenzübergang nach

limh0log(1+h)h=loge{\displaystyle \lim _{h\to 0}{\frac {\log(1+h)}{h}}=\log \mathrm {e} }

Einordnung der Anwendungsmöglichkeiten

[Bearbeiten |Quelltext bearbeiten]

Extremwertprobleme

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Extremwertproblem

Eine wichtige Anwendung der Differentialrechnung besteht darin, dass mit Hilfe der Ableitung lokale Extremwerte einer Kurve bestimmt werden können. Anstatt also anhand einer Wertetabelle mechanisch nach Hoch- oder Tiefpunkten suchen zu müssen, liefert der Kalkül in einigen Fällen eine direkte Antwort. Liegt ein Hoch- oder Tiefpunkt vor, so besitzt die Kurve an dieser Stelle keinen „echten“ Anstieg, weshalb die optimale Linearisierung eine Steigung von 0 besitzt. Für die genaue Klassifizierung eines Extremwertes sind jedoch weitere lokale Daten der Kurve notwendig, denn eine Steigung von 0 ist nicht hinreichend für die Existenz eines Extremwertes (geschweige denn eines Hoch- oder Tiefpunktes).

In der Praxis treten Extremwertprobleme typischerweise dann auf, wenn Prozesse, zum Beispiel in der Wirtschaft, optimiert werden sollen. Oft liegen an den Randwerten jeweils ungünstige Ergebnisse, in Richtung „Mitte“ kommt es aber zu einer stetigen Steigerung, die dann irgendwo maximal werden muss. Zum Beispiel die optimale Wahl eines Verkaufspreises: Bei einem zu geringen Preis ist die Nachfrage nach einem Produkt zwar sehr groß, aber die Produktion kann nicht finanziert werden. Ist er andererseits zu hoch, so wird es im Extremfall gar nicht mehr gekauft. Daher liegt ein Optimum irgendwo „in der Mitte“. Voraussetzung dabei ist, dass der Zusammenhang in Form einer (stetig) differenzierbaren Funktion wiedergegeben werden kann.

Die Untersuchung einer Funktion auf Extremstellen ist Teil einerKurvendiskussion. Die mathematischen Hintergründe sind im AbschnittAnwendung höherer Ableitungen bereitgestellt.

Mathematische Modellierung

[Bearbeiten |Quelltext bearbeiten]

In dermathematischen Modellierung sollen komplexe Probleme in mathematischer Sprache erfasst und analysiert werden. Je nach Fragestellung sind das Untersuchen vonKorrelationen oderKausalitäten oder auch das Geben vonPrognosen im Rahmen dieses Modells zielführend.

Besonders im Umfeld sog.Differentialgleichungen ist die Differentialrechnung zentrales Werkzeug bei der Modellierung. Diese Gleichungen treten zum Beispiel auf, wenn es eine kausale Beziehung zwischen demBestand einer Größe und derenzeitlicher Veränderung gibt. Ein alltägliches Beispiel könnte sein:

Je mehr Einwohner eine Stadt besitzt, desto mehr Leute wollen dort hinziehen.

Etwas konkreterkönnte dies zum Beispiel heißen, dass bei1000000{\displaystyle 1\,000\,000} jetzigen Einwohnern durchschnittlich1000000{\displaystyle 1\,000\,000} Personen in den kommenden 10 Jahren zuziehen werden, bei1000001{\displaystyle 1\,000\,001} Einwohnern durchschnittlich1000001{\displaystyle 1\,000\,001} Personen in den kommenden 10 Jahren usw. – um nicht alle Zahlen einzeln ausführen zu müssen: Lebenn{\displaystyle n} Personen in der Stadt, so wollen so viele Menschen hinzuziehen, dass nach 10 Jahren weiteren{\displaystyle n} hinzukommen würden. Besteht eine derartige Kausalität zwischen Bestand und zeitlicher Veränderung, so kann gefragt werden, ob aus diesen Daten eine Prognose für die Einwohnerzahl nach 10 Jahren abgeleitet werden kann, wenn die Stadt im Jahr 2020 zum Beispiel1000000{\displaystyle 1\,000\,000} Einwohner hatte. Es wäre dabei falsch zu glauben, dass dies2000000{\displaystyle 2\,000\,000} sein werden, da sich mit steigender Einwohnerzahl auch die Nachfrage nach Wohnraum wiederum zunehmend steigern wird. Der Knackpunkt zum Verständnis des Zusammenhangs ist demnach erneut dessenLokalität: Besitzt die Stadt1000000{\displaystyle 1\,000\,000} Einwohner, so wollenzu diesem Zeitpunkt1000000{\displaystyle 1\,000\,000} Menschen pro 10 Jahre hinzuziehen. Aber einen kurzen Augenblick später, wenn weitere Menschen hinzugezogensind, sieht die Lage wieder anders aus. Wird dieses Phänomen zeitlich beliebig engmaschig gedacht, ergibt sich ein „differentieller“ Zusammenhang. Allerdings eignet sich die kontinuierliche Herangehensweise in vielen Fällen auch bei diskreten Problemstellungen.[6]

Mit Hilfe der Differentialrechnung kann aus so einem kausalen Zusammenhang zwischen Bestand und Veränderung in vielen Fällen ein Modell hergeleitet werden, was den komplexen Zusammenhangauflöst, und zwar in dem Sinne, dass zum Schluss eine Bestandsfunktionexplizit angegeben werden kann. Setzt man in diese Funktion dann zum Beispiel den Wert 10 Jahre ein, so ergibt sich eine Prognose für die Stadtbewohneranzahl im Jahr 2030. Im Falle oberen Modells wird eine BestandsfunktionB{\displaystyle B} gesucht mitB(t)=B(t){\displaystyle B(t)=B'(t)},t{\displaystyle t} in 10 Jahren, undB(0)=1000000{\displaystyle B(0)=1\,000\,000}. Die Lösung ist dann

B(t)=1000000et{\displaystyle B(t)=1\,000\,000\,e^{t}}

mit dernatürlichen Exponentialfunktion (natürlich bedeutet, dass der Proportionalitätsfaktor zwischen Bestand und Veränderung einfach gleich 1 ist) und für das Jahr 2030 lautet die geschätzte PrognoseB(1)2,718{\displaystyle B(1)\approx 2{,}718} Mio. Einwohner. Die Proportionalität zwischen Bestand und Änderungsrate führt also zuexponentiellem Wachstum und ist klassisches Beispiel einesselbstverstärkenden Effektes. Analoge Modelle funktionieren beimPopulationswachstum (Je mehr Individuen, desto mehr Geburten) oder der Verbreitung einer ansteckenden Krankheit (Je mehr Erkrankte, desto mehr Ansteckungen). In vielen Fällen stoßen diese Modelle jedoch an eine Grenze, wenn sich der Prozess aufgrund natürlicher Beschränkungen (wie eine Obergrenze der Gesamtbevölkerung) nicht beliebig fortsetzen lässt. In diesen Fällen sind ähnliche Modelle, wie daslogistische Wachstum, geeigneter.[7]

Numerische Verfahren

[Bearbeiten |Quelltext bearbeiten]

Die Eigenschaft einer Funktion, differenzierbar zu sein, ist bei vielen Anwendungen von Vorteil, da dies der Funktion mehr Struktur verleiht. Ein Beispiel ist das Lösen von Gleichungen. Bei einigen mathematischen Anwendungen ist es notwendig, den Wert einer (oder mehrerer) Unbekanntenx{\displaystyle x} zu finden, die Nullstelle einer Funktionf{\displaystyle f} ist. Es ist dannf(x)=0{\displaystyle f(x)=0}. Je nach Beschaffenheit vonf{\displaystyle f} können Strategien entwickelt werden, eine Nullstelle zumindest näherungsweise anzugeben, was in der Praxis meist vollkommen ausreicht. Istf{\displaystyle f} in jedem Punkt differenzierbar mit Ableitungf{\displaystyle f'}, so kann in vielen Fällen dasNewton-Verfahren helfen. Bei diesem spielt die Differentialrechnung insofern eine direkte Rolle, als beim schrittweisen Vorgehen immer wieder eine Ableitung explizit berechnet werden muss.[8]

Ein weiterer Vorteil der Differentialrechnung ist, dass in vielen Fällen komplizierte Funktionen, wie Wurzeln oder auch Sinus und Kosinus, anhand einfacher Rechenregeln wie Addition und Multiplikation gut angenähert werden können. Ist die Funktion an einem benachbarten Wert leicht auszuwerten, ist dies von großem Nutzen. Wird zum Beispiel nach einem Näherungswert für die Zahl26{\displaystyle {\sqrt {26}}} gesucht, so liefert die Differentialrechnung fürf(x)=x{\displaystyle f(x)={\sqrt {x}}} die Linearisierung

f(25+h)f(25)+hf(25)=25+h225=5+h10,{\displaystyle f(25+h)\approx f(25)+hf'(25)={\sqrt {25}}+{\frac {h}{2{\sqrt {25}}}}=5+{\frac {h}{10}},}

denn es gilt nachweislichf(x)=12x{\displaystyle f'(x)={\tfrac {1}{2{\sqrt {x}}}}}. Sowohl Funktion als auch erste Ableitung konnten an der Stelle25{\displaystyle 25} gut berechnet werden, weil es sich dabei um eineQuadratzahl handelt. Einsetzen vonh=1{\displaystyle h=1} ergibt265+110=5,1{\displaystyle {\sqrt {26}}\approx 5+{\tfrac {1}{10}}=5{,}1}, was mit dem exakten Ergebnis26=5,09901{\displaystyle {\sqrt {26}}=5{,}09901\dots } bis auf einen Fehler kleiner als11000{\displaystyle {\tfrac {1}{1000}}} übereinstimmt.[9] Unter Einbezughöherer Ableitungen kann die Genauigkeit solcher Approximationen zusätzlich gesteigert werden, da dann nicht nur linear, sondernquadratisch, kubisch usw. angenähert wird, siehe auchTaylor-Reihe.

Reine Mathematik

[Bearbeiten |Quelltext bearbeiten]
Tangentialebene, platziert an einem Punkt einer Kugeloberfläche

Auch in derreinen Mathematik spielt die Differentialrechnung als ein Kern der Analysis eine bedeutende Rolle. Ein Beispiel ist dieDifferentialgeometrie, die sich mit Figuren beschäftigt, die eine differenzierbare Oberfläche (ohne Knicke usw.) haben. Zum Beispiel kann auf eineKugeloberfläche in jedem Punkt tangential eineEbene platziert werden. Anschaulich: Steht man an einem Erdpunkt, so hat man das Gefühl, die Erde sei flach, wenn man seinen Blick in derTangentialebene schweifen lässt. In Wahrheit ist die Erde jedoch nurlokal flach: Die angelegte Ebene dient der (durchLinearisierung) vereinfachten Darstellung der komplizierteren Krümmung.Global hat sie als Kugeloberfläche eine völlig andere Gestalt.

Die Methoden der Differentialgeometrie sind äußerst bedeutend für dietheoretische Physik. So können Phänomene wieKrümmung oderRaumzeit über Methoden der Differentialrechnung beschrieben werden. Auch die Frage, was der kürzeste Abstand zwischen zwei Punkten auf einer gekrümmten Fläche (zum Beispiel der Erdoberfläche) ist, kann mit diesen Techniken formuliert und oft auch beantwortet werden.

Auch bei der Erforschung von Zahlen als solchen, also im Rahmen derZahlentheorie, hat sich die Differentialrechnung in deranalytischen Zahlentheorie bewährt. Die grundlegende Idee der analytischen Zahlentheorie ist die Umwandlung von bestimmten Zahlen, über die man etwas lernen möchte,in Funktionen. Haben diese Funktionen „gute Eigenschaften“ wie etwa Differenzierbarkeit, so hofft man, über die damit einhergehenden Strukturen Rückschlüsse auf die ursprünglichen Zahlen ziehen zu können. Es hat sich dabei häufig bewährt, zur Perfektionierung der Analysis von den reellen zu den komplexen Zahlen überzugehen (siehe auchkomplexe Analysis), also die Funktionen über einem größeren Zahlenbereich zu studieren. Ein Beispiel ist die Analyse derFibonacci-Zahlen0,1,1,2,3,5,8,13,21,{\displaystyle 0,1,1,2,3,5,8,13,21,\dots }, deren Bildungsgesetz vorschreibt, dass eine neue Zahl stets aus der Summe der beiden vorangehenden entstehen soll. Ansatz der analytischen Zahlentheorie ist die Bildung dererzeugenden Funktion

F(x)=0+1x+1x2+2x3+3x4+5x5+8x6+13x7+,{\displaystyle F(x)=0+1x+1x^{2}+2x^{3}+3x^{4}+5x^{5}+8x^{6}+13x^{7}+\dotsb ,}

also eines „unendlich langen“Polynoms (einer sog.Potenzreihe), dessenKoeffizienten genau die Fibonacci-Zahlen sind. Für hinreichend kleine Zahlenx{\displaystyle x} ist dieser Ausdruck sinnvoll, weil die Potenzenxn{\displaystyle x^{n}} dann viel schneller gegen 0 gehen als die Fibonacci-Zahlen gegen Unendlich, womit sich langfristig alles bei einem endlichen Wert einpendelt. Es ist für diese Werte möglich, die FunktionF{\displaystyle F} explizit zu berechnen durch

F(x)=x1xx2.{\displaystyle F(x)={\frac {x}{1-x-x^{2}}}.}

Das Nennerpolynom1xx2{\displaystyle 1-x-x^{2}} „spiegelt“ dabei genau das Verhaltenfnfn1fn2=0{\displaystyle f_{n}-f_{n-1}-f_{n-2}=0} der Fibonacci-Zahlenfn{\displaystyle f_{n}} „wider“ – es ergibt sich in der TatF(x)xF(x)x2F(x)=x{\displaystyle F(x)-xF(x)-x^{2}F(x)=x} durch termweises Verrechnen. Mit Hilfe der Differentialrechnung lässt sich andererseits zeigen, dass die FunktionF{\displaystyle F} ausreicht, um die Fibonacci-Zahlen (ihre Koeffizienten) eindeutig zu charakterisieren. Da es sich aber um eine schlichterationale Funktion handelt, lässt sich dadurch die für jede Fibonacci-Zahlfn{\displaystyle f_{n}} gültigeexakte Formel

fn=Φn(1Φ)n5{\displaystyle f_{n}={\frac {\Phi ^{n}-\left(-{\frac {1}{\Phi }}\right)^{n}}{\sqrt {5}}}}

mit demgoldenen SchnittΦ=1+52{\displaystyle \Phi ={\tfrac {1+{\sqrt {5}}}{2}}} herleiten, wennf0=0,f1=1{\displaystyle f_{0}=0,f_{1}=1} undfn=fn1+fn2{\displaystyle f_{n}=f_{n-1}+f_{n-2}} gesetzt wird. Die exakte Formel vermag eine Fibonacci-Zahl zu berechnen, ohne die vorherigen zu kennen. Der Schluss wird über einen sog.Koeffizientenvergleich gezogen und nutzt aus, dass das Polynomx2+x1{\displaystyle x^{2}+x-1} als NullstellenΦ{\displaystyle -\Phi } und1Φ{\displaystyle {\tfrac {1}{\Phi }}} besitzt.[10]

Der höherdimensionale Fall

[Bearbeiten |Quelltext bearbeiten]

Die Differentialrechnung kann auf den Fall „höherdimensionaler Funktionen“ verallgemeinert werden. Damit ist gemeint, dass sowohl Eingabe- als auch Ausgabewerte der Funktion nicht bloß Teil des eindimensionalen reellenZahlenstrahls, sondern auch Punkte eines höherdimensionalen Raums sind. Ein Beispiel ist die Vorschrift

(xy)(x2+y2x22y){\displaystyle \left({x \atop y}\right)\mapsto \left({x^{2}+y^{2} \atop x^{2}-2y}\right)}

zwischen jeweils zweidimensionalen Räumen. Das Funktionsverständnis als Tabelle bleibt hier identisch, nur dass diese mit „vier Spalten“(x,y,x2+y2,x22y){\displaystyle (x,y,x^{2}+y^{2},x^{2}-2y)} „deutlich mehr“ Einträge besitzt. Auch mehrdimensionale Abbildungen können in manchen Fällen an einem Punkt linearisiert werden. Allerdings ist dabei nun angemessen zu beachten, dass es sowohl mehrere Eingabedimensionen als auch mehrere Ausgabedimensionen geben kann: Der korrekte Verallgemeinerungsweg liegt darin, dass die Linearisierung injeder Komponente der Ausgabejede Variable auflineare Weise berücksichtigt. Das zieht für obere Beispielfunktion eine Approximation der Form

f(x,y):=(x2+y2x22y)(m1(xx0)+m2(yy0)+c1m3(xx0)+m4(yy0)+c2){\displaystyle f(x,y):=\left({x^{2}+y^{2} \atop x^{2}-2y}\right)\approx \left({m_{1}(x-x_{0})+m_{2}(y-y_{0})+c_{1} \atop m_{3}(x-x_{0})+m_{4}(y-y_{0})+c_{2}}\right)}

nach sich. Diese ahmt dann die gesamte Funktion in der Nähe der Eingabe(x0,y0){\displaystyle (x_{0},y_{0})} sehr gut nach.[11] Injeder Komponente wird demnach für jede Variable eine „Steigung“ angegeben – diese wird dann das lokale Verhalten der Komponentenfunktion bei kleiner Änderung in dieser Variablen messen. Diese Steigung wird auch alspartielle Ableitung bezeichnet.[12] Die korrekten konstanten Abschnittec1,c2{\displaystyle c_{1},c_{2}} berechnen sich exemplarisch durchc1=x02+y02{\displaystyle c_{1}=x_{0}^{2}+y_{0}^{2}} bzw.c2=x022y0{\displaystyle c_{2}=x_{0}^{2}-2y_{0}}. Wie auch im eindimensionalen Fall hängen die Steigungen (hierm1,m2,m3,m4{\displaystyle m_{1},m_{2},m_{3},m_{4}}) stark von der Wahl des Punktes (hier(x0,y0){\displaystyle (x_{0},y_{0})}) ab, an dem abgeleitet wird. Die Ableitung ist demnach keine Zahl mehr, sondern ein Verband aus mehreren Zahlen – in diesem Beispiel sind es vier – und diese Zahlen sind im Regelfall bei allen Eingaben unterschiedlich. Es wird allgemein für die Ableitung auch

f(x0,y0)=(m1m2m3m4){\displaystyle f'(x_{0},y_{0})={\begin{pmatrix}m_{1}&m_{2}\\m_{3}&m_{4}\end{pmatrix}}}

geschrieben, womit alle „Steigungen“ in einer sog.Matrix versammelt sind. Man bezeichnet diesen Term auch alsJacobi-Matrix oderFunktionalmatrix.[13]

Beispiel: Wird oben(x0,y0)=(1,0){\displaystyle (x_{0},y_{0})=(1,0)} gesetzt, so kann man zeigen, dass folgende lineare Approximation bei sehr kleinen Änderungen vonx{\displaystyle x}undy{\displaystyle y} sehr gut ist:

f(x,y)=(x2+y2x22y)(2x12x2y1).{\displaystyle f(x,y)=\left({x^{2}+y^{2} \atop x^{2}-2y}\right)\approx \left({2x-1 \atop 2x-2y-1}\right).}

Zum Beispiel gilt

f(1,003;0,002)=(1,0060131,002009){\displaystyle f(1{,}003;0{,}002)=\left({1{,}006013 \atop 1{,}002009}\right)}

und

(21,003121,00320,0021)=(1,0061,002).{\displaystyle \left({2\cdot 1{,}003-1 \atop 2\cdot 1{,}003-2\cdot 0{,}002-1}\right)=\left({1{,}006 \atop 1{,}002}\right).}

Hat man im ganz allgemeinen Falln{\displaystyle n} Variablen undm{\displaystyle m} Ausgabekomponenten, so gibt es kombinatorisch gesehen insgesamtnm{\displaystyle n\cdot m} „Steigungen“, also partielle Ableitungen. Im klassischen Falln=m=1{\displaystyle n=m=1} gibt es wegen11=1{\displaystyle 1\cdot 1=1} eine Steigungf(x0){\displaystyle f'(x_{0})} und im oberen Beispieln=m=2{\displaystyle n=m=2} sind es22=4{\displaystyle 2\cdot 2=4} „Steigungen“.[14]

Geschichte

[Bearbeiten |Quelltext bearbeiten]
Gottfried Wilhelm Leibniz
Isaac Newton
Hauptartikel:Infinitesimalrechnung#Geschichte

Die Aufgabenstellung der Differentialrechnung bildete sich alsTangentenproblem ab dem 17. Jahrhundert heraus. Hierunter versteht man die Aufgabe, bei einer beliebigen Kurve in einem beliebigen Punkt die Tangente zu bestimmen.[15] Ein naheliegender Lösungsansatz bestand darin, die Tangente an eine Kurve durch ihreSekante über einem endlichen (endlich heißt hier: größer als null), aber beliebig kleinenIntervall zu approximieren. Dabei war die technische Schwierigkeit zu überwinden, mit einer solcheninfinitesimal kleinen Intervallbreite zu rechnen. Die ersten Anfänge der Differentialrechnung gehen aufPierre de Fermat zurück. Er entwickelte um 1628 eine Methode, Extremstellen algebraischer Terme zu bestimmen und Tangenten an Kegelschnitte und andere Kurven zu berechnen. Seine „Methode“ war rein algebraisch. Fermat betrachtete keine Grenzübergänge und schon gar keine Ableitungen. Gleichwohl lässt sich seine „Methode“ mit modernen Mitteln der Analysis interpretieren und rechtfertigen, und sie hat Mathematiker wie Newton und Leibniz nachweislich inspiriert. Einige Jahre später wählteRené Descartes einen anderen algebraischen Zugang, indem er an eine Kurve einen Kreis anlegte. Dieser schneidet die Kurve in zwei nahe beieinanderliegenden Punkten; es sei denn, er berührt die Kurve. Dieser Ansatz ermöglichte es ihm, für spezielle Kurven die Steigung der Tangente zu bestimmen.[16]

Ende des 17. Jahrhunderts gelang esIsaac Newton undGottfried Wilhelm Leibniz mit unterschiedlichen Ansätzen unabhängig voneinander, widerspruchsfrei funktionierende Kalküle zu entwickeln. Während Newton das Problem physikalisch über das Momentangeschwindigkeitsproblem anging,[17] löste es Leibniz geometrisch über das Tangentenproblem. Ihre Arbeiten erlaubten das Abstrahieren von rein geometrischer Vorstellung und werden deshalb als Beginn der Analysis betrachtet. Bekannt wurden sie vor allem durch das BuchAnalyse des Infiniment Petits pour l’Intelligence des Lignes Courbes[18] des AdligenGuillaume François Antoine, Marquis de L’Hospital, der beiJohann I Bernoulli Privatunterricht nahm und dessen Forschung zur Analysis so publizierte. Darin heißt es:

„Die Reichweite dieses Kalküls ist unermesslich: Er lässt sich sowohl auf mechanische als auch geometrische Kurven anwenden; Wurzelzeichen bereiten ihm keine Schwierigkeiten und sind oftmals sogar angenehm im Umgang; er lässt sich auf so viele Variablen erweitern, wie man sich nur wünschen kann; der Vergleich unendlich kleiner Größen aller Art gelingt mühelos. Und er erlaubt eine unendliche Zahl an überraschenden Entdeckungen über gekrümmte wie geradlinige Tangenten, FragenDe maximis & minimis, Wendepunkte und Spitzen von Kurven, Evoluten, Spiegelungs- und Brechungskaustiken, &c. wie wir in diesem Buch sehen werden.“[19]

Die heute bekannten Ableitungsregeln basieren vor allem auf den Werken vonLeonhard Euler, der den Funktionsbegriff prägte.

Newton und Leibniz arbeiteten mit beliebig kleinen positiven Zahlen.[20] Dies wurde bereits von Zeitgenossen als unlogisch kritisiert, beispielsweise vonGeorge Berkeley in der polemischen SchriftThe analyst; or, a discourse addressed to an infidel mathematician.[21] Erst in den 1960ern konnteAbraham Robinson diese Verwendung infinitesimaler Größen mit der Entwicklung derNichtstandardanalysis auf ein mathematisch-axiomatisch sicheres Fundament stellen. Trotz der herrschenden Unsicherheit wurde die Differentialrechnung aber konsequent weiterentwickelt, in erster Linie wegen ihrer zahlreichen Anwendungen in der Physik und in anderen Gebieten der Mathematik. Symptomatisch für die damalige Zeit war das von derPreußischen Akademie der Wissenschaften 1784 veröffentlichte Preisausschreiben:

„… Die höhere Geometrie benutzt häufig unendlich große und unendlich kleine Größen; jedoch haben die alten Gelehrten das Unendliche sorgfältig vermieden, und einige berühmte Analysten unserer Zeit bekennen, dass die Wörter unendliche Größe widerspruchsvoll sind. Die Akademie verlangt also, dass man erkläre, wie aus einer widersprechenden Annahme so viele richtige Sätze entstanden sind, und dass man einen sicheren und klaren Grundbegriff angebe, welcher das Unendliche ersetzen dürfte, ohne die Rechnung zu schwierig oder zu lang zu machen …“[22]

Erst zum Anfang des 19. Jahrhunderts gelang esAugustin-Louis Cauchy, der Differentialrechnung die heute übliche logische Strenge zu geben, indem er von den infinitesimalen Größen abging und die Ableitung alsGrenzwert vonSekantensteigungen (Differenzenquotienten) definierte.[23] Die heute benutzte Definition des Grenzwerts wurde schließlich vonKarl Weierstraß im Jahr 1861 formuliert.[24]

Definition

[Bearbeiten |Quelltext bearbeiten]

Sekanten- und Tangentensteigung

[Bearbeiten |Quelltext bearbeiten]

Ausgangspunkt für die Definition der Ableitung ist die Näherung der Tangentensteigung durch eine Sekantensteigung (manchmal auch Sehnensteigung genannt). Gesucht sei die Steigung einer Funktionf{\displaystyle f} in einem Punkt(x0,f(x0)){\displaystyle (x_{0},f(x_{0}))}. Man berechnet zunächst die Steigung derSekante anf{\displaystyle f} über einem endlichenIntervall[x0,x0+Δx]{\displaystyle [x_{0},x_{0}+\Delta x]} der LängeΔx{\displaystyle \Delta x}:

Sekantensteigung =f(x0+Δx)f(x0)(x0+Δx)x0=f(x0+Δx)f(x0)Δx{\displaystyle {\frac {f(x_{0}+\Delta x)-f(x_{0})}{(x_{0}+\Delta x)-x_{0}}}={\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}}.

Die Sekantensteigung ist also der Quotient zweier Differenzen; sie wird deshalb auchDifferenzenquotient genannt. Mit der KurznotationΔy{\displaystyle \Delta y} fürf(x0+Δx)f(x0){\displaystyle f(x_{0}+\Delta x)-f(x_{0})} kann man die Sekantensteigung abgekürzt alsΔyΔx{\displaystyle {\tfrac {\Delta y}{\Delta x}}} schreiben. Der AusdruckΔx{\displaystyle \Delta x} verdeutlicht also die beliebig klein werdendeDifferenz zwischen der Stelle, an der abgeleitet werden soll, und einem benachbarten Punkt. In der Literatur wird jedoch, wie auch im Folgenden, in vielen Fällen aus Gründen der Einfachheit das Symbolh{\displaystyle h} stattΔx{\displaystyle \Delta x} verwendet.

Differentialquotient einer Funktion

Um eine Tangentensteigung zu berechnen, muss man die beiden Punkte, durch die die Sekante gezogen wird, immer weiter aneinander rücken. Dabei gehen sowohlΔx{\displaystyle \Delta x} als auchΔy{\displaystyle \Delta y} gegen Null. Der QuotientΔyΔx{\displaystyle {\tfrac {\Delta y}{\Delta x}}} bleibt aber in vielen Fällen endlich. Auf diesemGrenzübergang beruht die folgende Definition.

Differenzierbarkeit

[Bearbeiten |Quelltext bearbeiten]
Definition der Ableitung über dieh-Methode: Zu den jeweiligenh-Werten sind die dazugehörigen Sekanten eingezeichnet. Fürh0{\displaystyle h\to 0} geht die Sekante in die Tangente und somit die Sekantensteigung (Differenzenquotient) in die Tangentensteigung (Ableitung) über.
Die Sekantensteigungen gehen fürxnx~{\displaystyle x_{n}\to {\tilde {x}}} in die Steigung der Tangente (und damit in die Ableitung) an der Stellex~{\displaystyle {\tilde {x}}} über. Es giltlimxnx~f(xn)f(x~)xnx~=f(x~){\displaystyle \lim _{x_{n}\to {\tilde {x}}}{\frac {f(x_{n})-f({\tilde {x}})}{x_{n}-{\tilde {x}}}}=f'({\tilde {x}})}.
Hauptartikel:Differenzierbarkeit

Eine Funktionf:UR{\displaystyle f\colon U\to \mathbb {R} }, die einoffenes IntervallU{\displaystyle U} in die reellen Zahlen abbildet, heißtdifferenzierbar an der Stellex0U{\displaystyle x_{0}\in U}, falls derGrenzwert

limxx0f(x)f(x0)xx0=limh0f(x0+h)f(x0)h{\displaystyle \lim _{x\to x_{0}}{\frac {f(x)-f(x_{0})}{x-x_{0}}}=\lim _{h\to 0}{\frac {f(x_{0}+h)-f(x_{0})}{h}}}   (mith=xx0{\displaystyle h=x-x_{0}})

existiert. Dieser Grenzwert heißtDifferentialquotient oderAbleitung vonf{\displaystyle f} nachx{\displaystyle x} an der Stellex0{\displaystyle x_{0}} und wird als

f(x0){\displaystyle f'(x_{0})}   oder   df(x)dx|x=x0{\displaystyle \left.{\frac {\mathrm {d} f(x)}{\mathrm {d} x}}\right|_{x=x_{0}}}   oder   dfdx(x0){\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}(x_{0})}   oder   ddxf(x0){\displaystyle {\frac {\mathrm {d} }{\mathrm {d} x}}f(x_{0})}

notiert.[25][26] Gesprochen werden diese Notationen als „f Strich von x null“, „d f von x nach d x an der Stelle x gleich x null“, „d f nach d x von x null“ respektive „d nach d x von f von x null“. Im später folgenden AbschnittNotationen werden noch weitere Varianten angeführt, um die Ableitung einer Funktion zu notieren.

Im Laufe der Zeit wurde folgende gleichwertige Definition gefunden, die sich im allgemeineren Kontext komplexer oder mehrdimensionaler Funktionen als leistungsfähiger erwiesen hat: Eine Funktion heißt an einer Stellex0{\displaystyle x_{0}} differenzierbar, falls eine KonstanteL{\displaystyle L} existiert, sodass

limh0f(x0+h)f(x0)Lhh=0.{\displaystyle \lim _{h\to 0}{\frac {f(x_{0}+h)-f(x_{0})-Lh}{h}}=0.}

Der Zuwachs der Funktionf{\displaystyle f}, wenn man sich vonx0{\displaystyle x_{0}} nur wenig entfernt, etwa um den Werth{\displaystyle h}, lässt sich also durchLh{\displaystyle Lh} sehr gut approximieren. Man nennt deshalb dielineare Funktiong:xf(x0)+L(xx0){\displaystyle g\colon x\mapsto f(x_{0})+L(x-x_{0})}, für die alsog(x0+h)=f(x0)+Lh{\displaystyle g(x_{0}+h)=f(x_{0})+Lh} für alleh{\displaystyle h} gilt, auch dieLinearisierung vonf{\displaystyle f} an der Stellex0{\displaystyle x_{0}}.[27]

Eine weitere Definition ist: Es gibt eine an der Stellex0{\displaystyle x_{0}}stetige Funktionr{\displaystyle r} mitr(x0)=0{\displaystyle r(x_{0})=0} und eine KonstanteL{\displaystyle L}, sodass für allex{\displaystyle x} gilt

f(x)=f(x0)+L(xx0)+r(x)(xx0){\displaystyle f(x)=f(x_{0})+L(x-x_{0})+r(x)(x-x_{0})}.

Die Bedingungenr(x0)=0{\displaystyle r(x_{0})=0} und dassr{\displaystyle r} an der Stellex0{\displaystyle x_{0}} stetig ist, bedeuten gerade, dass das „Restglied“r(x){\displaystyle r(x)} fürx{\displaystyle x} gegenx0{\displaystyle x_{0}} gegen0{\displaystyle 0} konvergiert.[27]

In beiden Fällen ist die KonstanteL{\displaystyle L} eindeutig bestimmt und es giltf(x0)=L{\displaystyle f'(x_{0})=L}. Der Vorteil dieser Formulierung ist, dass Beweise einfacher zu führen sind, da kein Quotient betrachtet werden muss. Diese Darstellung der besten linearen Approximation wurde schon vonKarl Weierstraß,Henri Cartan undJean Dieudonné konsequent angewandt und wird auchWeierstraßsche Zerlegungsformel genannt.

Bezeichnet man eine Funktion als differenzierbar, ohne sich auf eine bestimmte Stelle zu beziehen, dann bedeutet dies die Differenzierbarkeit an jeder Stelle des Definitionsbereiches, also die Existenz einer eindeutigen Tangente für jeden Punkt des Graphen.

Jede differenzierbare Funktion iststetig, die Umkehrung gilt jedoch nicht.[27] Noch Anfang des 19. Jahrhunderts war man überzeugt, dass eine stetige Funktion höchstens an wenigen Stellen nicht differenzierbar sein könne (wie die Betragsfunktion).Bernard Bolzano konstruierte dann als erster Mathematiker tatsächlich eine Funktion, die späterBolzanofunktion genannt wurde, die überall stetig, aber nirgends differenzierbar ist, was in der Fachwelt allerdings nicht bekannt wurde. Karl Weierstraß fand dann in den 1860er Jahren ebenfalls eine derartige Funktion (sieheWeierstraß-Funktion), was diesmal unter Mathematikern Wellen schlug. Ein bekanntes mehrdimensionales Beispiel für eine stetige, nicht differenzierbare Funktion ist die vonHelge von Koch 1904 vorgestellteKoch-Kurve.[28]

Ableitungsfunktion

[Bearbeiten |Quelltext bearbeiten]
Die Ableitung an verschiedenen Stellen einer differenzierbaren Funktion

Die Ableitung der Funktionf:UR{\displaystyle f\colon U\to \mathbb {R} } an der Stellex0{\displaystyle x_{0}}, bezeichnet mitf(x0){\displaystyle f'(x_{0})}, beschreibt lokal das Verhalten der Funktion in der Umgebung der betrachteten Stellex0{\displaystyle x_{0}}. In einigen Fällen ist es möglich, anjedem Punkt desFunktionsgraphen eine Linearisierung vorzunehmen. Dies erlaubt die Definition einerAbleitungsfunktion (oder kurzAbleitung)f:UR{\displaystyle f'\colon U\to \mathbb {R} }, die jedem Element des DefinitionsbereichsU{\displaystyle U} der Ausgangsfunktionf{\displaystyle f} die Steigung der dortigen Linearisierung zuordnet. Man sagt in diesem Falle, „f{\displaystyle f} ist inU{\displaystyle U} differenzierbar“.[29]

Beispielsweise hat die Quadratfunktionf:RR{\displaystyle f\colon \mathbb {R} \to \mathbb {R} } mitf(x)=x2{\displaystyle f(x)=x^{2}} an einer beliebigen Stellex0{\displaystyle x_{0}} die Ableitungf(x0)=2x0,{\displaystyle f'(x_{0})=2x_{0},} die Quadratfunktion ist also auf der Menge der reellen Zahlen differenzierbar. Die zugehörige Ableitungsfunktionf{\displaystyle f'} ist gegeben durchf:RR{\displaystyle f'\colon \mathbb {R} \to \mathbb {R} } mitf(x)=2x{\displaystyle f'(x)=2x}.

Die Ableitungsfunktion ist im Normalfall eine andere Funktion als die ursprünglich betrachtete. Einzige Ausnahme sind die Vielfachenxkex{\displaystyle x\mapsto k\cdot e^{x}} der natürlichenExponentialfunktion mit beliebigemkR{\displaystyle k\in \mathbb {R} } – unter denen, wie die Wahlk=ea{\displaystyle k=e^{-a}} zeigt, auch alle Funktionenxexa{\displaystyle x\mapsto e^{x-a}} mit beliebigemaR{\displaystyle a\in \mathbb {R} } enthalten sind (deren Graph aus dem der Exponentialfunktionxex{\displaystyle x\mapsto e^{x}} durch „seitliche“Verschiebung uma{\displaystyle a} entsteht und zu diesem daher kongruent ist).

Ist die Ableitung stetig, dann heißtf{\displaystyle f} stetig differenzierbar. In Anlehnung an die BezeichnungC(U){\displaystyle C(U)} für die Gesamtheit (denRaum) der stetigen Funktionen mit DefinitionsmengeU{\displaystyle U} wird der Raum der aufU{\displaystyle U} stetig differenzierbaren Funktionen mitC1(U){\displaystyle C^{1}(U)} abgekürzt.[30]

Notationen

[Bearbeiten |Quelltext bearbeiten]

Geschichtlich bedingt gibt es unterschiedliche Notationen, um die Ableitung einer Funktion darzustellen.

Lagrange-Notation

[Bearbeiten |Quelltext bearbeiten]

In diesem Artikel wurde bisher hauptsächlich die Notationf{\displaystyle f'} für die Ableitung vonf{\displaystyle f} verwendet. Diese Notation geht auf den MathematikerJoseph-Louis Lagrange zurück, der sie 1797 einführte.[31] Bei dieser Notation wird diezweite Ableitung vonf{\displaystyle f} mitf{\displaystyle f''} und dien{\displaystyle n}-te Ableitung mittelsf(n){\displaystyle f^{(n)}} bezeichnet.

Newton-Notation

[Bearbeiten |Quelltext bearbeiten]

Isaac Newton – neben Leibniz der Begründer der Differentialrechnung – notierte die erste Ableitung vonx{\displaystyle x} mitx˙{\displaystyle {\dot {x}}}, entsprechend notierte er diezweite Ableitung durchx¨{\displaystyle {\ddot {x}}}.[32] Heutzutage wird diese Schreibweise häufig in der Physik, insbesondere in derMechanik, für dieAbleitung nach der Zeit verwendet.[33]

Leibniz-Notation

[Bearbeiten |Quelltext bearbeiten]

Gottfried Wilhelm Leibniz führte für die erste Ableitung vonf{\displaystyle f} (nach der Variablenx{\displaystyle x}) die Notationdf(x)dx{\displaystyle {\tfrac {\mathrm {d} f(x)}{\mathrm {d} x}}} ein.[34] Gelesen wird dieser Ausdruck als „d f von x nach d x“. Für diezweite Ableitung notierte Leibnizd2f(x)dx2{\displaystyle {\tfrac {\mathrm {d} ^{2}f(x)}{\mathrm {d} x^{2}}}} und dien{\displaystyle n}-te Ableitung wird mittelsdnf(x)dxn{\displaystyle {\tfrac {\mathrm {d} ^{n}f(x)}{\mathrm {d} x^{n}}}} bezeichnet.[35] Bei der Schreibweise von Leibniz handelt es sich nicht um einen Bruch. Die Symboledf(x){\displaystyle \mathrm {d} f(x)} unddx{\displaystyle \mathrm {d} x} werden „Differentiale“ genannt, haben aber in der modernen Differentialrechnung (abgesehen von der Theorie derDifferentialformen) eine lediglich symbolische Bedeutung, im Differentialquotienten. In manchen Anwendungen (Kettenregel, Integration mancherDifferentialgleichungen,Integration durch Substitution) rechnet man mit ihnen aber so, als wären sie gewöhnliche Terme.

Euler-Notation

[Bearbeiten |Quelltext bearbeiten]

Die NotationDf{\displaystyle \mathrm {D} f} oderDxf(x){\displaystyle \mathrm {D} _{x}f(x)} für die erste Ableitung vonf{\displaystyle f} geht aufLeonhard Euler zurück. Dabei wird die Ableitung alsOperator – also als eine besondere Funktion, die selbst auf Funktionen arbeitet, aufgefasst. Diese Idee geht auf den MathematikerLouis François Antoine Arbogast zurück. Diezweite Ableitung wird in dieser Notation mittelsD2f{\displaystyle \mathrm {D} ^{2}f} oderDx2f(x){\displaystyle \mathrm {D} _{x}^{2}f(x)} und dien{\displaystyle n}-te Ableitung durchDnf{\displaystyle \mathrm {D} ^{n}f} oderDxnf(x){\displaystyle \mathrm {D} _{x}^{n}f(x)} dargestellt.[36]

Ableitungsberechnung

[Bearbeiten |Quelltext bearbeiten]

Das Berechnen der Ableitung einer Funktion wirdDifferentiation oderDifferenziation genannt; sprich, mandifferenziert diese Funktion.

Um die Ableitungelementarer Funktionen (z. B.xn{\displaystyle x^{n}},sin(x){\displaystyle \sin(x)}, …) zu berechnen, hält man sich eng an die oben angegebene Definition, berechnet explizit einen Differenzenquotienten und lässt dannh{\displaystyle h} gegen Null gehen. Dieses Verfahren ist jedoch meistens umständlich. Bei der Lehre der Differentialrechnung wird diese Art der Rechnung daher nur wenige Male vollzogen. Später greift man auf bereits bekannte Ableitungsfunktionen zurück oder schlägt Ableitungen nicht ganz so geläufiger Funktionen in einem Tabellenwerk nach (z. B. imBronstein-Semendjajew, siehe auchTabelle von Ableitungs- und Stammfunktionen) und berechnet die Ableitung zusammengesetzter Funktionen mit Hilfe derAbleitungsregeln.

Ableitungen elementarer Funktionen

[Bearbeiten |Quelltext bearbeiten]

Für die Berechnung der Ableitungsfunktion einer elementaren Funktion an einer vorgesehenen Stellex{\displaystyle x} wird der zugehörige Differenzenquotient gebildet, der in der Umgebungx+h{\displaystyle x+h} mith0{\displaystyle h\neq 0} gültig ist, und dann wird der Grenzübergangh0{\displaystyle h\to 0} vollzogen.

Natürliche Potenzen

[Bearbeiten |Quelltext bearbeiten]

Der Fallf(x)=x2{\displaystyle f(x)=x^{2}} ist bereits weiteroben behandelt worden. Der zugehörige Differenzenquotient ergibt sich zu

ΔfΔx=f(x+h)f(x)(x+h)x=x2+2xh+h2x2h.{\displaystyle {\frac {\Delta f}{\Delta x}}={\frac {f(x+h)-f(x)}{(x+h)-x}}={\frac {x^{2}+2xh+h^{2}-x^{2}}{h}}.}

Wennh0{\displaystyle h\neq 0} ist, lässt sichh{\displaystyle h} kürzen,

ΔfΔx=2x+h,{\displaystyle {\frac {\Delta f}{\Delta x}}=2x+h,}

und die Annäherungh0{\displaystyle h\to 0} führt auf

f(x)=limh0ΔfΔx=2x.{\displaystyle f'(x)=\lim _{h\to 0}{\frac {\Delta f}{\Delta x}}=2x.}

Allgemein für eine natürliche Zahln{\displaystyle n} mitf(x)=xn{\displaystyle f(x)=x^{n}} wird derbinomische Lehrsatz herangezogen:

(x+h)n=k=0n(nk)xnkhk=xn+nhxn1+h2gn(x,h).{\displaystyle (x+h)^{n}=\sum _{k=0}^{n}{\binom {n}{k}}x^{n-k}h^{k}=x^{n}+nhx^{n-1}+h^{2}g_{n}(x,h).}
ΔfΔx=(x+h)nxnh=xn+nhxn1+h2gn(x,h)xnh=nxn1+hgn(x,h).{\displaystyle {\frac {\Delta f}{\Delta x}}={\frac {(x+h)^{n}-x^{n}}{h}}={\frac {x^{n}+nhx^{n-1}+h^{2}g_{n}(x,h)-x^{n}}{h}}=nx^{n-1}+hg_{n}(x,h).}

Wenn(x+h)n{\displaystyle (x+h)^{n}} für alle endlichen Werte vonh{\displaystyle h} endlich ist, ist auchgn(x,h){\displaystyle g_{n}(x,h)} endlich. Der in der letzten Gleichung vorgn(x,h){\displaystyle g_{n}(x,h)} stehende Faktorh{\displaystyle h} führt aufhgn(x,h)h00{\displaystyle hg_{n}(x,h){\overset {h\to 0}{\longrightarrow }}0}. Damit entsteht

f(x)=limh0ΔfΔx=nxn1{\displaystyle f'(x)=\lim _{h\to 0}{\frac {\Delta f}{\Delta x}}=nx^{n-1}}

Zwei Ergänzungen:

  1. Ein konstanter Summandm{\displaystyle m} inf(x)=xn+m{\displaystyle \quad f(x)=x^{n}+m\quad } kürzt sich inf(x+h)f(x){\displaystyle f(x+h)-f(x)} heraus, noch bevor der Grenzübergang vollzogen wird.
  2. Ein konstanter Faktorm{\displaystyle m} inf(x)=mxn{\displaystyle \quad f(x)=m\,x^{n}\quad } kann inf(x+h)f(x){\displaystyle f(x+h)-f(x)} ausgeklammert und vor den Bruch gezogen werden.

Exponentialfunktion

[Bearbeiten |Quelltext bearbeiten]
Graph der Exponentialfunktiony=ex{\displaystyle y=\mathrm {e} ^{x}} (rot) mit der Tangente (der hellblau gestrichelten Linie) durch den Punkt (0,1)

Mit derExponentialfunktionf(x)=ax=expax{\displaystyle f(x)=a^{x}=\exp _{a}x} ergibt sich der Differenzenquotient

ΔfΔx=f(x+h)f(x)(x+h)x=ax+haxh{\displaystyle {\frac {\Delta f}{\Delta x}}={\frac {f(x+h)-f(x)}{(x+h)-x}}={\frac {a^{x+h}-a^{x}}{h}}}

Für jedesa>0{\displaystyle a>0} gilt

ax+h=axah.{\displaystyle a^{x+h}=a^{x}\cdot a^{h}.}

Damit kann im Zählerax{\displaystyle a^{x}} ausgeklammert werden.

ΔfΔx=axah1h.{\displaystyle {\frac {\Delta f}{\Delta x}}=a^{x}\,{\frac {a^{h}-1}{h}}.}

Mit demoben hergeleiteten Grenzübergang

limh0ah1h=lna{\displaystyle \lim _{h\to 0}{\frac {a^{h}-1}{h}}=\ln a}

entsteht

f(x)=limh0ΔfΔx=axlna.{\displaystyle f'(x)=\lim _{h\to 0}{\frac {\Delta f}{\Delta x}}=a^{x}\,\ln a.}

Darin istlna=logea{\displaystyle \ln a=\log _{\mathrm {e} }a} dernatürliche Logarithmus vona{\displaystyle a}. Speziell für dieEulersche Zahle{\displaystyle \mathrm {e} } istlne=1{\displaystyle \ln \mathrm {e} =1}. Damit entsteht die auszeichnende Zusatzeigenschaft

expex=expex.{\displaystyle \exp '_{\mathrm {e} }x=\exp _{\mathrm {e} }x.}

Logarithmus

[Bearbeiten |Quelltext bearbeiten]

Mit derLogarithmusfunktionf(x)=logax{\displaystyle f(x)=\log _{a}x} zur Basisa>0, a1{\displaystyle a>0,\ a\neq 1} ergibt sich der Differenzenquotient

Der Logarithmus vonx{\displaystyle x} (hier der natürliche Logarithmuslnx{\displaystyle \ln x}) existiert nur beix>0{\displaystyle x>0}
ΔfΔx=loga(x+h)logax(x+h)x=loga(x(1+hx))logaxh{\displaystyle {\frac {\Delta f}{\Delta x}}={\frac {\log _{a}(x+h)-\log _{a}x}{(x+h)-x}}={\frac {\log _{a}\left(x\cdot (1+{\frac {h}{x}})\right)-\log _{a}x}{h}}}

Für jedesa>0{\displaystyle a>0} gilt

loga(uv)=logau+logav.{\displaystyle \log _{a}(u\cdot v)=\log _{a}u+\log _{a}v.}
ΔfΔx=logax+loga(1+hx)logaxh=loga(1+hx)hxx.{\displaystyle {\frac {\Delta f}{\Delta x}}={\frac {\log _{a}x+\log _{a}(1+{\frac {h}{x}})-\log _{a}x}{h}}={\frac {\log _{a}(1+{\frac {h}{x}})}{{\frac {h}{x}}\;x}}.}

Mit demoben hergeleiteten Grenzübergang

limu0log(1+u)u=loge{\displaystyle \lim _{u\to 0}{\frac {\log(1+u)}{u}}=\log \mathrm {e} }

und mit derBasisumrechnunglogae=1logea{\displaystyle \log _{a}\mathrm {e} ={\frac {1}{\log _{\mathrm {e} }a}}} entsteht

f(x)=limh0ΔfΔx=1xlogae=1xlna{\displaystyle f'(x)=\lim _{h\to 0}{\frac {\Delta f}{\Delta x}}={\frac {1}{x}}\,\log _{a}\mathrm {e} ={\frac {1}{x\,\ln a}}}

Dieses existiert nur fürx>0{\displaystyle x>0}. Fürx<0{\displaystyle x<0} existiert die Funktiong(x)=loga(x){\displaystyle g(x)=\log _{a}(-x)}.[37] Mit der Substitutionz(x)=x>0{\displaystyle z(x)=-x>0} und derKettenregel ergibt ihre Ableitung

g(x)=dgdzdzdx=1zlna(1)=1xlna.{\displaystyle g'(x)={\frac {\mathrm {d} g}{\mathrm {d} z}}\,{\frac {\mathrm {d} z}{\mathrm {d} x}}={\frac {1}{z\,\ln a}}\cdot (-1)={\frac {1}{x\,\ln a}}.}

Beide Ableitungen können zusammengefasst werden fürx0{\displaystyle x\neq 0} zu

dloga|x|dx=1xlna.{\displaystyle {\frac {\mathrm {d} \log _{a}|x|}{\mathrm {d} x}}={\frac {1}{x\,\ln a}}.}

Speziell für den natürlichen Logarithmus gilt

ln|x|=1x.{\displaystyle \ln '|x|={\frac {1}{x}}.}

Sinus und Kosinus

[Bearbeiten |Quelltext bearbeiten]

Mit derSinusfunktionf(x)=sinx{\displaystyle f(x)=\sin x} ergibt sich der Differenzenquotient

ΔfΔx=sin(x+h)sinx(x+h)x.{\displaystyle {\frac {\Delta f}{\Delta x}}={\frac {\sin(x+h)-\sin x}{(x+h)-x}}.}

Mit demAdditionstheorem

sinusinv=2cosu+v2sinuv2{\displaystyle \sin u-\sin v=2\cos {\frac {u+v}{2}}\sin {\frac {u-v}{2}}}

gilt

ΔfΔx=2cos2x+h2sinh2h=cos2x+h2sinh2h2.{\displaystyle {\frac {\Delta f}{\Delta x}}=2{\frac {\cos {\frac {2x+h}{2}}\sin {\frac {h}{2}}}{h}}=\cos {\tfrac {2x+h}{2}}\cdot {\frac {\sin {\frac {h}{2}}}{\tfrac {h}{2}}}.}

Mit demoben hergeleiteten Grenzübergang

limu0sinuu=1{\displaystyle \lim _{u\to 0}{\frac {\sin u}{u}}=1}

und mitu=h2{\displaystyle u={\tfrac {h}{2}}} entsteht

f(x)=limh0ΔfΔx=cos2x21=cosx.{\displaystyle f'(x)=\lim _{h\to 0}{\frac {\Delta f}{\Delta x}}=\cos {\frac {2x}{2}}\cdot 1=\cos x.}

Für dieKosinusfunktion führt eine entsprechende Rechnung mit

cosucosv=2sinu+v2sinuv2{\displaystyle \cos u-\cos v=-2\sin {\frac {u+v}{2}}\sin {\frac {u-v}{2}}}

aufΔfΔx=cos(x+h)cosx(x+h)x=sin2x+h2sinh2h2.{\displaystyle \quad {\frac {\Delta f}{\Delta x}}={\frac {\cos(x+h)-\cos x}{(x+h)-x}}=-\sin {\tfrac {2x+h}{2}}\cdot {\frac {\sin {\frac {h}{2}}}{\tfrac {h}{2}}}.}

f(x)=limh0ΔfΔx=sinx.{\displaystyle f'(x)=\lim _{h\to 0}{\frac {\Delta f}{\Delta x}}=-\sin x.}

Weitere elementare Funktionen

[Bearbeiten |Quelltext bearbeiten]

Mit den vorstehenden Ableitungen können Ableitungsfunktionen für weitere Funktionen aufgestellt werden. Dazu werden zusätzlich die Ableitungsregeln für die Grundrechenarten, dieKettenregel und dieUmkehrregel benötigt.

Allgemeine Potenzen

[Bearbeiten |Quelltext bearbeiten]

Die Funktionf(x)=xn{\displaystyle f(x)=x^{n}} ist bisher nur fürn{\displaystyle n} als natürliche Zahl abgeleitet worden. Die Anwendbarkeit der zugehörigen Ableitungsregel lässt sich beix>0{\displaystyle x>0} auf reelle Exponenten erweitern. Mit der Substitution[38]

z(x)=nlnx{\displaystyle z(x)=n\,\ln x}

istf(x)=xn=ez.{\displaystyle \;f(x)=x^{n}=\mathrm {e} ^{z}.}

Wird dieses mit der Kettenregel differenziert, so entsteht das bekannte Ergebnis:

f(x)=dfdzdzdx=ezn1x=nfx=nxn1.{\displaystyle f'(x)={\frac {\mathrm {d} f}{\mathrm {d} z}}\,{\frac {\mathrm {d} z}{\mathrm {d} x}}=\mathrm {e} ^{z}\cdot n\;{\frac {1}{x}}=n\;{\frac {f}{x}}=n\,x^{n-1}.}

Eine Anwendung ist die Ableitung derWurzelfunktion.Fürf(x)=xm=x1m{\displaystyle f(x)={\sqrt[{m}]{x}}=x^{\frac {1}{m}}} gilt mitn=1m{\displaystyle n={\tfrac {1}{m}}}

f(x)=1mfx=1mxmx.{\displaystyle f'(x)={\frac {1}{m}}{\frac {f}{x}}={\frac {1}{m}}\;{\frac {\sqrt[{m}]{x}}{x}}.}

Der Fallm=2{\displaystyle m=2} betrifft dieQuadratwurzel:

Fürf(x)=x{\displaystyle f(x)={\sqrt {x}}\quad } giltf(x)=12x.{\displaystyle \quad f'(x)={\frac {1}{2{\sqrt {x}}}}.}

Tangens und Kotangens

[Bearbeiten |Quelltext bearbeiten]

Mit Hilfe derQuotientenregel und den Ableitungsfunktionen für Sinus und Kosinus können auch die Ableitungsfunktionen fürTangens und Kotangens aufgestellt werden. Es gilt

tanx=(sinxcosx)=sinxcosxcosxsinxcos2x=cos2x+sin2xcos2x=1cos2x=1+tan2x.{\displaystyle \tan 'x=\left({\frac {\sin x}{\cos x}}\right)'={\frac {\sin 'x\cos x-\cos 'x\sin x}{\cos ^{2}x}}={\frac {\cos ^{2}x+\sin ^{2}x}{\cos ^{2}x}}={\frac {1}{\cos ^{2}x}}=1+\tan ^{2}x.}

Dabei wurde die als „Trigonometrischer Pythagoras“ bezeichnete Formelsin2x+cos2x=1{\displaystyle \sin ^{2}x+\cos ^{2}x=1} verwendet. Ebenso wird gewonnen

cotx=sin2xcos2xsin2x=1sin2x=1cot2x.{\displaystyle \cot 'x={\frac {-\sin ^{2}x-\cos ^{2}x}{\sin ^{2}x}}={\frac {-1}{\sin ^{2}x}}=-1-\cot ^{2}x.}

Arkussinus und Arkuskosinus

[Bearbeiten |Quelltext bearbeiten]

Arkussinus und Arkuskosinus sind als Umkehrfunktionen vonSinus und Kosinus definiert. Die Ableitungen werden mittels der Umkehrregel berechnet. Setzt manx=siny{\displaystyle x=\sin y}, so folgt im Bereich|x|<1{\displaystyle |x|<1}

arcsinx=1siny=1cosy=11sin2y=11x2.{\displaystyle \arcsin 'x={\frac {1}{\sin 'y}}={\frac {1}{\cos y}}={\frac {1}{\sqrt {1-\sin ^{2}y}}}={\frac {1}{\sqrt {1-x^{2}}}}.}

Für den Arkuskosinus ergibt sich mitx=cosy{\displaystyle x=\cos y} ebenso

arccosx=1cosy=1siny=11cos2y=11x2.{\displaystyle \arccos 'x={\frac {1}{\cos 'y}}={\frac {1}{-\sin y}}=-{\frac {1}{\sqrt {1-\cos ^{2}y}}}=-{\frac {1}{\sqrt {1-x^{2}}}}.}

Arkustangens und Arkuskotangens

[Bearbeiten |Quelltext bearbeiten]

Arkustangens und Arkuskotangens sind als Umkehrfunktionen vonTangens und Kotangens definiert. Setzt manx=tany{\displaystyle x=\tan y}, so folgt mittels der Umkehrregel

arctanx=1tany=11+tan2y=11+x2.{\displaystyle \arctan 'x={\frac {1}{\tan 'y}}={\frac {1}{1+\tan ^{2}y}}={\frac {1}{1+x^{2}}}.}

Für den Arkuskotangens ergibt sich mitx=coty{\displaystyle x=\cot y} ebenso

arccotx=1coty=11cot2y=11+x2.{\displaystyle \operatorname {arccot} 'x={\frac {1}{\cot 'y}}={\frac {1}{-1-\cot ^{2}y}}=-{\frac {1}{1+x^{2}}}.}

Zusammengesetzte Funktion

[Bearbeiten |Quelltext bearbeiten]

Zusammengesetzte Funktionen lassen sich so weit strukturieren, bis sich zu jedem Strukturelement die jeweils zutreffende elementare Ableitungsregel finden lässt. Dazu gibt es dieSummenregel, dieProduktregel, dieQuotientenregel und dieKettenregel. Da diese in eigenen Artikeln erläutert werden, wird hier nur ein Beispiel vorgestellt.

f(x)=(1+sin2x)2{\displaystyle f(x)=(1+\sin 2x)^{2}}
f(x)=f(u)=u2{\displaystyle f(x)=f(u)=u^{2}\quad }mitu=1+sin2x{\displaystyle u=1+\sin 2x\quad }f(u){\displaystyle f(u)} ist ableitbar nachu{\displaystyle u} als Potenzf=2u{\displaystyle f'=2u}
u=u(v)=1+v{\displaystyle u=u(v)=1+v}mitv=sin2x{\displaystyle v=\sin 2x}u(v){\displaystyle u(v)} ist ableitbar nachv{\displaystyle v} als Summe mit einer Konstantenu=1{\displaystyle u'=1}
v=v(w)=sinw{\displaystyle v=v(w)=\sin w}mitw=2x{\displaystyle w=2x}v(w){\displaystyle v(w)} ist ableitbar nachw{\displaystyle w} als trigonometrische Funktionv=cosw{\displaystyle v'=\cos w}
w=w(x)=2x{\displaystyle w=w(x)=2x}w(x){\displaystyle w(x)} ist ableitbar nachx{\displaystyle x} als Potenz mit konstantem Faktor  w=2{\displaystyle w'=2}

Nach der Kettenregel ergibt sich

f(x)=4(1+sin2x)cos2x{\displaystyle f'(x)=4\,(1+\sin 2x)\,\cos 2x}

Zusammenfassung

[Bearbeiten |Quelltext bearbeiten]

Hier werden die Ableitungsregeln elementarer und zusammengesetzter Funktionen zusammengefasst. Eine ausführliche Liste findet sich unterTabelle von Ableitungs- und Stammfunktionen.

f(x){\displaystyle f(x)}f(x){\displaystyle f'(x)}Anmerkung
x{\displaystyle x}1{\displaystyle 1}Elementares
ax{\displaystyle ax}a{\displaystyle a}konstanter Faktor bleibt erhalten
x+a{\displaystyle x+a}1{\displaystyle 1}konstanter Summand verschwindet
xn{\displaystyle x^{n}}nxn1{\displaystyle n\,x^{n-1}}Potenzfunktion
ex{\displaystyle \mathrm {e} ^{x}}ex{\displaystyle \mathrm {e} ^{x}}Exponentialfunktion
ax{\displaystyle a^{x}}axlna(a>0){\displaystyle a^{x}\,\ln a\quad (a>0)}
ln|x|{\displaystyle \ln |x|}1x{\displaystyle {\frac {1}{x}}}Logarithmusfunktion
loga|x|{\displaystyle \log _{a}|x|}1x1lna{\displaystyle {\frac {1}{x}}\,{\frac {1}{\ln a}}}
sinx{\displaystyle \sin x}cosx{\displaystyle \cos x}Trigonometrische Funktionen
cosx{\displaystyle \cos x}sinx{\displaystyle -\sin x}
tanx{\displaystyle \tan x}1cos2x=1+tan2x{\displaystyle {\frac {1}{\cos ^{2}x}}=1+\tan ^{2}x}
cotx{\displaystyle \cot x}1sin2x=(1+cot2x){\displaystyle -{\frac {1}{\sin ^{2}x}}=-(1+\cot ^{2}x)}
arcsinx{\displaystyle \arcsin x}11x2(|x|<1){\displaystyle {\frac {1}{\sqrt {1-x^{2}}}}\quad (|x|<1)}
arccosx{\displaystyle \arccos x}11x2(|x|<1){\displaystyle {\frac {-1}{\sqrt {1-x^{2}}}}\quad (|x|<1)}
arctanx{\displaystyle \arctan x}1x2+1{\displaystyle {\frac {1}{x^{2}+1}}}
arccotx{\displaystyle \operatorname {arccot} x}1x2+1{\displaystyle {\frac {-1}{x^{2}+1}}}
sinhx{\displaystyle \sinh x}coshx{\displaystyle \cosh x}Hyperbelfunktionen
coshx{\displaystyle \cosh x}sinhx{\displaystyle \sinh x}
tanhx{\displaystyle \tanh x}1cosh2x=1tanh2x{\displaystyle {\frac {1}{\cosh ^{2}x}}=1-\tanh ^{2}x}
cothx{\displaystyle \coth x}1sinh2x=1coth2x{\displaystyle {\frac {-1}{\sinh ^{2}x}}=1-\coth ^{2}x}
arsinhx{\displaystyle \operatorname {arsinh} x}1x2+1{\displaystyle {\frac {1}{\sqrt {x^{2}+1}}}}
arcoshx{\displaystyle \operatorname {arcosh} x}1x21(x>1){\displaystyle {\frac {1}{\sqrt {x^{2}-1}}}\quad (x>1)}
artanhx{\displaystyle \operatorname {artanh} x}11x2(|x|<1){\displaystyle {\frac {1}{1-x^{2}}}\quad (|x|<1)}
arcothx{\displaystyle \operatorname {arcoth} x}11x2(|x|>1){\displaystyle {\frac {1}{1-x^{2}}}\quad (|x|>1)}
u(x)+v(x){\displaystyle u(x)+v(x)}u+v{\displaystyle u'+v'}Summenregel
u(x)v(x){\displaystyle u(x)\cdot v(x)}uv+vu{\displaystyle u'v+v'u}Produktregel
u(x):v(x){\displaystyle u(x):v(x)}uvvuv2{\displaystyle {\frac {u'v-v'u}{v^{2}}}}Quotientenregel
u[v(x)]{\displaystyle u[v(x)]}f(u)u(v)v(x){\displaystyle f'(u)\cdot u'(v)\cdot v'(x)}
oderdfdx=dfdududvdvdx{\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}={\frac {\mathrm {d} f}{\mathrm {d} u}}\,{\frac {\mathrm {d} u}{\mathrm {d} v}}\,{\frac {\mathrm {d} v}{\mathrm {d} x}}}
Kettenregel
mitf=f(u),u=u(v),v=v(x){\displaystyle f=f(u),u=u(v),v=v(x)}
f(x){\displaystyle f(x)}1(f1)(y){\displaystyle {\frac {1}{(f^{-1})'(y)}}}
oderdydx=1dxdy{\displaystyle {\frac {\mathrm {d} y}{\mathrm {d} x}}={\frac {1}{\frac {\mathrm {d} x}{\mathrm {d} y}}}}
Umkehrregel
mity=f(x){\displaystyle y=f(x)} oder nachx{\displaystyle x} aufgelöst
 x=f1(y){\displaystyle \quad \ x=f^{-1}(y)}

Höhere Ableitungen

[Bearbeiten |Quelltext bearbeiten]

Ist die Ableitungf{\displaystyle f'} einer Funktionf{\displaystyle f} wiederum differenzierbar, so lässt sich die zweite Ableitung vonf{\displaystyle f} als Ableitung der ersten definieren. Auf dieselbe Weise können dann auch dritte, vierte etc. Ableitungen definiert werden. Eine Funktion kann dementsprechend einmal differenzierbar, zweimal differenzierbar etc. sein.

Ist die erste Ableitung einesWeges nach der Zeit eineGeschwindigkeit, so kann die zweite Ableitung alsBeschleunigung und die dritte Ableitung alsRuck interpretiert werden.

Wenn Politiker sich über den „Rückgang des Anstiegs der Arbeitslosenzahl“ äußern, dann sprechen sie von der zweiten Ableitung (Änderung des Anstiegs), um die Aussage der ersten Ableitung (Anstieg der Arbeitslosenzahl) zu relativieren.

Höhere Ableitungen können auf verschiedene Weisen geschrieben werden:

f=f(2)=d2fdx2,f=f(3)=d3fdx3,{\displaystyle f''=f^{(2)}={\frac {\mathrm {d} ^{2}f}{\mathrm {d} x^{2}}},\quad f'''=f^{(3)}={\frac {\mathrm {d} ^{3}f}{\mathrm {d} x^{3}}},\quad \ldots }

oder im physikalischen Fall (bei einer Ableitung nach der Zeit)

x¨(t)=d2xdt2,x...(t)=d3xdt3.{\displaystyle {\ddot {x}}(t)={\frac {\mathrm {d} ^{2}x}{\mathrm {d} t^{2}}},\quad {\overset {...}{x}}(t)={\frac {\mathrm {d} ^{3}x}{\mathrm {d} t^{3}}}.}

Für die formale Bezeichnung beliebiger Ableitungenf(n){\displaystyle f^{(n)}} legt man außerdemf(1)=f{\displaystyle f^{(1)}=f'} undf(0)=f{\displaystyle f^{(0)}=f} fest.

Höhere Differentialoperatoren

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Differentiationsklasse

Istn{\displaystyle n} eine natürliche Zahl undUR{\displaystyle U\subset \mathbb {R} } offen, so wird der Raum der inU{\displaystyle U}n{\displaystyle n}-mal stetig differenzierbaren Funktionen mitCn(U){\displaystyle C^{n}(U)} bezeichnet. DerDifferentialoperatorddx{\displaystyle {\tfrac {\mathrm {d} }{\mathrm {d} x}}} induziert damit eine Kette vonlinearen Abbildungen

Cn(U)ddxCn1(U)ddxCn2(U)ddxddxC0(U),{\displaystyle C^{n}(U)\,\,\,\,{\overset {\tfrac {\mathrm {d} }{\mathrm {d} x}}{\longrightarrow }}\,\,\,\,C^{n-1}(U)\,\,\,\,{\overset {\tfrac {\mathrm {d} }{\mathrm {d} x}}{\longrightarrow }}\,\,\,\,C^{n-2}(U)\,\,\,\,{\overset {\tfrac {\mathrm {d} }{\mathrm {d} x}}{\longrightarrow }}\,\,\,\,\cdots \,\,\,\,{\overset {\tfrac {\mathrm {d} }{\mathrm {d} x}}{\longrightarrow }}\,\,\,\,C^{0}(U),}

und damit allgemein fürkn{\displaystyle k\leq n}:

Cn(U)dkdxkCnk(U).{\displaystyle C^{n}(U)\,\,\,\,{\overset {\tfrac {\mathrm {d} ^{k}}{\mathrm {d} x^{k}}}{\longrightarrow }}\,\,\,\,C^{n-k}(U).}

Dabei bezeichnetC0(U){\displaystyle C^{0}(U)} den Raum der inU{\displaystyle U}stetigen Funktionen. Exemplarisch: Wird einfCn(U){\displaystyle f\in C^{n}(U)} durch Anwenden vonddx{\displaystyle {\tfrac {\mathrm {d} }{\mathrm {d} x}}} einmal abgeleitet, kann das Ergebnisf{\displaystyle f'} im Allgemeinen nur noch(n1){\displaystyle (n-1)}-mal abgeleitet werden usw. Jeder RaumCk(U){\displaystyle C^{k}(U)} ist eineR{\displaystyle \mathbb {R} }-Algebra, da nach der Summen- bzw. der Produktregel Summen und auch Produkte vonk{\displaystyle k}-mal stetig differenzierbaren Funktionen wiederk{\displaystyle k}-mal stetig differenzierbar sind. Es gilt zudem die aufsteigende Kette von echtenInklusionen

Cn(U)Cn1(U)Cn2(U)C0(U),{\displaystyle \cdots \,\,\,\,C^{n}(U)\,\,\,\,\subsetneq \,\,\,\,C^{n-1}(U)\,\,\,\,\subsetneq \,\,\,\,C^{n-2}(U)\,\,\,\,\subsetneq \,\,\,\,\cdots \,\,\,\,\subsetneq \,\,\,\,C^{0}(U),}

denn offenbar ist jede mindestensn{\displaystyle n}-mal stetig differenzierbare Funktion auch(n1){\displaystyle (n-1)}-mal stetig differenzierbar usw., jedoch zeigen die Funktionen

fn(x)={xn+1sin(1x),xU{0},0,x=0,{\displaystyle f_{n}(x)={\begin{cases}x^{n+1}\sin \left({\frac {1}{x}}\right),&x\in U\setminus \{0\},\\0,&x=0,\end{cases}}}

exemplarisch Beispiele für Funktionen ausCn1(U)Cn(U){\displaystyle C^{n-1}(U)\setminus C^{n}(U)}, wenn – wasohne Beschränkung der Allgemeinheit möglich ist –0U{\displaystyle 0\in U} angenommen wird.[39]

Höhere Ableitungsregeln

[Bearbeiten |Quelltext bearbeiten]
Leibnizsche Regel

Die Ableitungn{\displaystyle n}-ter Ordnung für ein Produkt aus zwein{\displaystyle n}-mal differenzierbaren Funktionenf{\displaystyle f} undg{\displaystyle g} ergibt sich aus

(fg)(n)=k=0n(nk)f(k)g(nk){\displaystyle (fg)^{(n)}=\sum _{k=0}^{n}{n \choose k}f^{(k)}g^{(n-k)}}.

Die hier auftretenden Ausdrücke der Form(nk){\displaystyle {\tbinom {n}{k}}} sindBinomialkoeffizienten. Die Formel ist eine Verallgemeinerung der Produktregel.

Formel von Faà di Bruno

Diese Formel ermöglicht die geschlossene Darstellung dern{\displaystyle n}-ten Ableitung der Komposition zweiern{\displaystyle n}-mal differenzierbarer Funktionen. Sie verallgemeinert die Kettenregel auf höhere Ableitungen.

Taylorformeln mit Restglied

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Taylorformel

Istf{\displaystyle f} eine in einem IntervallI{\displaystyle I}(n+1){\displaystyle (n+1)}-mal stetig differenzierbare Funktion, dann gilt für allea{\displaystyle a} undx{\displaystyle x} ausI{\displaystyle I} die sogenannte Taylorformel:

f(x)=Tn(a;x)+Rn+1(a;x){\displaystyle f(x)=T_{n}(a;x)+R_{n+1}(a;x)}

mit demn{\displaystyle n}-tenTaylorpolynom an der Entwicklungsstellea{\displaystyle a}

Tn(a;x)=k=0nf(k)(a)k!(xa)k=f(a)+f(a)1!(xa)+f(a)2!(xa)2++f(n)(a)n!(xa)n{\displaystyle {\begin{aligned}T_{n}(a;x)&=\sum _{k=0}^{n}{\frac {f^{(k)}(a)}{k!}}(x-a)^{k}\\&=f(a)+{\frac {f'(a)}{1!}}(x-a)+{\frac {f''(a)}{2!}}(x-a)^{2}+\dotsb +{\frac {f^{(n)}(a)}{n!}}(x-a)^{n}\end{aligned}}}

und dem(n+1){\displaystyle (n+1)}-tenRestglied

Rn+1(a;x)=f(n+1)(ξ)(n+1)!(xa)n+1{\displaystyle R_{n+1}(a;x)={\frac {f^{(n+1)}(\xi )}{(n+1)!}}(x-a)^{n+1}}

mit einemξ=ξ(x)(min{a,x},max{a,x})I{\displaystyle \xi =\xi (x)\in (\min\{a,x\},\max\{a,x\})\subset I}.[40] Eine beliebig oft differenzierbare Funktion wirdglatte Funktion genannt. Da sie alle Ableitungen besitzt, kann die oben angegebene Taylorformel zurTaylorreihe vonf{\displaystyle f} mit Entwicklungspunkta{\displaystyle a} erweitert werden:

(Tf)(a;x):=f(a)+f(a)(xa)+f(a)2(xa)2++f(n)(a)n!(xa)n+=n=0f(n)(a)n!(xa)n.{\displaystyle {\begin{aligned}(Tf)(a;x)&:=f(a)+f'(a)(x-a)+{\frac {f''(a)}{2}}(x-a)^{2}+\dotsb +{\frac {f^{(n)}(a)}{n!}}(x-a)^{n}+\dotsb \\&=\sum _{n=0}^{\infty }{\frac {f^{(n)}(a)}{n!}}(x-a)^{n}.\end{aligned}}}

Es ist jedoch nicht jede glatte Funktion durch ihre Taylorreihe darstellbar, siehe unten.

Glatte Funktionen

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Glatte Funktion

Funktionen, die an jeder Stelle ihres Definitionsbereichsbeliebig oft differenzierbar sind, bezeichnet man auch alsglatte Funktionen. Die Menge aller in einer offenen MengeUR{\displaystyle U\subset \mathbb {R} } glatten Funktionenf:UR{\displaystyle f\colon U\to \mathbb {R} } wird meist mitC(U){\displaystyle C^{\infty }(U)} bezeichnet. Sie trägt die Struktur einerR{\displaystyle \mathbb {R} }-Algebra (skalare Vielfache, Summen und Produkte glatter Funktionen sind wieder glatt) und ist gegeben durch

C(U)=nNCn(U),{\displaystyle C^{\infty }(U)=\bigcap _{n\in \mathbb {N} }C^{n}(U),}

wobeiCn(U){\displaystyle C^{n}(U)} alle inU{\displaystyle U}n{\displaystyle n}-mal stetig differenzierbaren Funktionen bezeichnet.[30] Häufig findet man in mathematischen Betrachtungen den Begriffhinreichend glatt. Damit ist gemeint, dass die Funktion mindestens so oft differenzierbar ist, wie es nötig ist, um den aktuellen Gedankengang durchzuführen.

Analytische Funktionen

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Analytische Funktion

Der obere Begriff der Glattheit kann weiter verschärft werden. Eine Funktionf:UR{\displaystyle f\colon U\to \mathbb {R} } heißt reell analytisch, wenn sie sich in jedem Punkt lokal in eine Taylorreihe entwickeln lässt, also

f(x)=n=0f(n)(a)n!(xa)n{\displaystyle f(x)=\sum _{n=0}^{\infty }{\frac {f^{(n)}(a)}{n!}}(x-a)^{n}}

für alleaU{\displaystyle a\in U} und alle hinreichend kleinen Werte von|xa|{\displaystyle |x-a|}. Analytische Funktionen haben starke Eigenschaften und finden besondere Aufmerksamkeit in der komplexen Analysis. Dort werden dementsprechend keine reell, sondern komplex analytischen Funktionen studiert. Ihre Menge wird meist mitCω(U){\displaystyle C^{\omega }(U)} bezeichnet und es giltCω(U)C(U){\displaystyle C^{\omega }(U)\subsetneq C^{\infty }(U)}. Insbesondere ist jede analytische Funktion glatt, abernicht umgekehrt. Die Existenz aller Ableitungen ist alsonicht hinreichend dafür, dass die Taylorreihe die Funktiondarstellt, wie das folgende Gegenbeispiel

f(x)={0falls x=0e1/x2falls x0{\displaystyle f(x)={\begin{cases}0&{\text{falls }}x=0\\\mathrm {e} ^{-1/x^{2}}&{\text{falls }}x\neq 0\end{cases}}}

einer nicht analytischen glatten Funktion zeigt.[41] Alle reellen Ableitungen dieser Funktion verschwinden in 0, aber es handelt sich nicht um die Nullfunktion. Daher wird sie an der Stelle 0 nicht durch ihre Taylorreihe dargestellt.

Anwendungen

[Bearbeiten |Quelltext bearbeiten]
Kurvendiskussion
Kurvendiskussion

Eine wichtige Anwendung der Differentialrechnung in einer Variablen ist die Bestimmung vonExtremwerten, meist zurOptimierung von Prozessen, wie etwa im Kontext von Kosten, Material oder Energieaufwand.[42] Die Differentialrechnung stellt eine Methode bereit, Extremstellen zu finden, ohne dabei unter Aufwand numerisch suchen zu müssen. Man macht sich zu Nutze, dass an einer lokalen Extremstellex0{\displaystyle x_{0}} notwendigerweise die erste Ableitung der Funktionf{\displaystyle f} gleich 0 sein muss. Es muss alsof(x0)=0{\displaystyle f'(x_{0})=0} gelten, wennx0{\displaystyle x_{0}} eine lokale Extremstelle ist. Allerdings bedeutet andersherumf(x0)=0{\displaystyle f'(x_{0})=0} noch nicht, dass es sich beif(x0){\displaystyle f(x_{0})} um ein Maximum oder Minimum handelt. In diesem Fall werden mehr Informationen benötigt, um eine eindeutige Entscheidung treffen zu können, was meist durch Betrachten höherer Ableitungen beix0{\displaystyle x_{0}} möglich ist.

Eine Funktion kann einen Maximal- oder Minimalwert haben, ohne dass die Ableitung an dieser Stelle existiert, jedoch kann in diesem Falle die Differentialrechnung nicht verwendet werden. Im Folgenden werden daher nur zumindest lokal differenzierbare Funktionen betrachtet. Als Beispiel nehmen wir diePolynomfunktionf{\displaystyle f} mit dem Funktionsterm

f(x)=13x32x2+3x=x3(x3)2.{\displaystyle f(x)={\frac {1}{3}}x^{3}-2x^{2}+3x={\frac {x}{3}}(x-3)^{2}.}

Die Abbildung zeigt den Verlauf der Graphen vonf{\displaystyle f},f{\displaystyle f'} undf{\displaystyle f''}.

Horizontale Tangenten

[Bearbeiten |Quelltext bearbeiten]

Besitzt eine Funktionf:(a,b)R{\displaystyle f\colon (a,b)\to \mathbb {R} } mit(a,b)R{\displaystyle (a,b)\subset \mathbb {R} } an einer Stellex0(a,b){\displaystyle x_{0}\in (a,b)} ihren größten Wert, gilt also für allex{\displaystyle x} dieses Intervallsf(x0)f(x){\displaystyle f(x_{0})\geq f(x)}, und istf{\displaystyle f} an der Stellex0{\displaystyle x_{0}} differenzierbar, so kann die Ableitung dort nur gleich Null sein:f(x0)=0{\displaystyle f'(x_{0})=0}. Eine entsprechende Aussage gilt, fallsf{\displaystyle f} inx0{\displaystyle x_{0}} den kleinsten Wert annimmt.

Geometrische Deutung diesesSatzes von Fermat ist, dass der Graph der Funktion in lokalen Extrempunkten eine parallel zurx{\displaystyle x}-Achse verlaufende Tangente, auch waagerechte Tangente genannt, besitzt.

Es ist somit für differenzierbare Funktionen einenotwendige Bedingung für das Vorliegen einer Extremstelle, dass die Ableitung an der betreffenden Stelle den Wert 0 annimmt:

f(x0)=0{\displaystyle f^{\prime }(x_{0})=0}

Umgekehrt kann aber daraus, dass die Ableitung an einer Stelle den Wert Null hat, noch nicht auf eine Extremstelle geschlossen werden, es könnte auch beispielsweise einSattelpunkt vorliegen. Eine Liste verschiedener hinreichender Kriterien, deren Erfüllung sicher auf eine Extremstelle schließen lässt, findet sich im ArtikelExtremwert. Diese Kriterien benutzen meist die zweite oder noch höhere Ableitungen.

Bedingung im Beispiel

[Bearbeiten |Quelltext bearbeiten]

Im Beispiel ist

f(x)=x24x+3=(x1)(x3).{\displaystyle f'(x)=x^{2}-4\cdot x+3=(x-1)\cdot (x-3).}

Daraus folgt, dassf(x)=0{\displaystyle f^{\prime }(x)=0} genau fürx=1{\displaystyle x=1} undx=3{\displaystyle x=3} gilt. Die Funktionswerte an diesen Stellen sindf(1)=43{\displaystyle f(1)={\tfrac {4}{3}}} undf(3)=0{\displaystyle f(3)=0}, d. h., die Kurve hat in den Punkten(1,43){\displaystyle (1,{\tfrac {4}{3}})} und(3,0){\displaystyle (3,0)} waagerechte Tangenten, und nur in diesen.

Da die Folge

f(0)=0,f(1)=43,f(3)=0,f(4)=43{\displaystyle f(0)=0,\quad f(1)={\frac {4}{3}},\quad f(3)=0,\quad f(4)={\frac {4}{3}}}

abwechselnd aus kleinen und großen Werten besteht, muss in diesem Bereich ein Hoch- und ein Tiefpunkt liegen. Nach dem Satz von Fermat hat die Kurve in diesen Punkten eine waagerechte Tangente, es kommen also nur die oben ermittelten Punkte in Frage: Also ist(1,43){\displaystyle (1,{\tfrac {4}{3}})} ein Hochpunkt und(3,0){\displaystyle (3,0)} ein Tiefpunkt.

Kurvendiskussion

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Kurvendiskussion

Mit Hilfe der Ableitungen lassen sich noch weitere Eigenschaften der Funktion analysieren, wie die Existenz vonWende- undSattelpunkten, dieKonvexität oder die oben schon angesprocheneMonotonie. Die Durchführung dieser Untersuchungen ist Gegenstand der Kurvendiskussion.

Termumformungen

[Bearbeiten |Quelltext bearbeiten]

Neben der Bestimmung der Steigung von Funktionen ist die Differentialrechnung durch ihrenKalkül ein wesentliches Hilfsmittel bei derTermumformung. Hierbei löst man sich von jeglichem Zusammenhang mit der ursprünglichen Bedeutung der Ableitung als Anstieg. Hat man zweiTerme als gleich erkannt, lassen sich durch Differentiation daraus weitere (gesuchte) Identitäten gewinnen. Ein Beispiel mag dies verdeutlichen:

Aus der bekannten Partialsumme

k=0nxk=1+x+x2++xn=xn+11x1{\displaystyle \sum _{k=0}^{n}x^{k}=1+x+x^{2}+\dotsb +x^{n}={\frac {x^{n+1}-1}{x-1}}}

dergeometrischen Reihe soll die Summe

k=1nkxk1=1+2x+3x2++nxn1{\displaystyle \sum _{k=1}^{n}kx^{k-1}=1+2x+3x^{2}+\dotsb +nx^{n-1}}

berechnet werden. Dies gelingt durch Differentiation mit Hilfe derQuotientenregel:

k=1nkxk1=k=0nkxk1=ddxk=0nxk=ddxxn+11x1=(n+1)xn(x1)(xn+11)(x1)2=nxn+1(n+1)xn+1(x1)2{\displaystyle \sum _{k=1}^{n}kx^{k-1}=\sum _{k=0}^{n}kx^{k-1}={\frac {\mathrm {d} }{\mathrm {d} x}}\sum _{k=0}^{n}x^{k}={\frac {\mathrm {d} }{\mathrm {d} x}}{\frac {x^{n+1}-1}{x-1}}={\frac {(n+1)x^{n}(x-1)-(x^{n+1}-1)}{(x-1)^{2}}}={\frac {nx^{n+1}-(n+1)x^{n}+1}{(x-1)^{2}}}}

Alternativ ergibt sich die Identität auch durch Ausmultiplizieren und anschließendes dreifachesTeleskopieren, was aber nicht so einfach zu durchschauen ist.

Zentrale Aussagen der Differentialrechnung einer Variablen

[Bearbeiten |Quelltext bearbeiten]

Fundamentalsatz der Analysis

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Fundamentalsatz der Analysis

Die wesentliche Leistung Leibniz’ war die Erkenntnis, dassIntegration und Differentiation zusammenhängen. Diese formulierte er im Hauptsatz der Differential- und Integralrechnung, auchFundamentalsatz der Analysis genannt, der besagt:

IstIR{\displaystyle I\subset \mathbb {R} } ein Intervall,f:IR{\displaystyle f\colon I\to \mathbb {R} } eine stetige Funktion undaI{\displaystyle a\in I} eine beliebige Zahl ausI{\displaystyle I}, so ist die Funktion

F:IR,xaxf(t)dt{\displaystyle F\colon I\to \mathbb {R} ,\;x\mapsto \int _{a}^{x}f(t)\,\mathrm {d} t}

stetig differenzierbar, und ihre AbleitungF{\displaystyle F'} ist gleichf{\displaystyle f}.

Hiermit ist also eine Anleitung zum Integrieren gegeben: Gesucht ist eine FunktionF{\displaystyle F}, deren AbleitungF{\displaystyle F'} der Integrandf{\displaystyle f} ist. Dann gilt:[43]

abf(x)dx=F(b)F(a).{\displaystyle \int _{a}^{b}f(x)\,\mathrm {d} x=F(b)-F(a).}

Mittelwertsatz der Differentialrechnung

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Mittelwertsatz der Differentialrechnung

Ein weiterer zentraler Satz der Differentialrechnung ist derMittelwertsatz, der 1821 vonCauchy bewiesen wurde.[44]

Es seif:[a,b]R{\displaystyle f\colon [a,b]\to \mathbb {R} } eine Funktion, die auf dem abgeschlossenen Intervall[a,b]{\displaystyle [a,b]} (mita<b{\displaystyle a<b}) definiert und stetig ist. Außerdem sei die Funktionf{\displaystyle f} im offenen Intervall(a,b){\displaystyle (a,b)} differenzierbar. Unter diesen Voraussetzungen gibt es mindestens einx0(a,b){\displaystyle x_{0}\in (a,b)}, sodass

f(x0)=f(b)f(a)ba{\displaystyle f'(x_{0})={\frac {f(b)-f(a)}{b-a}}}

gilt – geometrisch-anschaulich: Zwischen zwei Schnittpunkten einerSekante gibt es auf der Kurve einen Punkt mit zur Sekante parallelerTangente.[45]

Monotonie und Differenzierbarkeit

[Bearbeiten |Quelltext bearbeiten]

Ista<b{\displaystyle a<b} undf:(a,b)R{\displaystyle f\colon (a,b)\to \mathbb {R} } eine differenzierbare Funktion mitf(x)0{\displaystyle f'(x)\not =0} für allea<x<b{\displaystyle a<x<b}, so gelten folgende Aussagen:[46]

Daraus lässt sich herleiten, dass eine stetig differenzierbare Funktionf:(a,b)f((a,b)){\displaystyle f\colon (a,b)\to f((a,b))}, deren Ableitung nirgends verschwindet, bereits einenDiffeomorphismus zwischen den Intervallen(a,b){\displaystyle (a,b)} undf((a,b)){\displaystyle f((a,b))} definiert. In mehreren Variablen ist die analoge Aussage falsch. So verschwindet die Ableitung derkomplexen Exponentialfunktionzexp(z){\displaystyle z\mapsto \mathrm {exp} (z)}, nämlich sie selbst, in keinem Punkt, aber es handelt sich um keine (global)injektive AbbildungCexp(C){\displaystyle \mathbb {C} \to \mathrm {exp} (\mathbb {C} )}. Man beachte, dass diese als höherdimensionale reelle FunktionR2exp(R2){\displaystyle \mathbb {R} ^{2}\to \mathrm {\exp } (\mathbb {R} ^{2})} aufgefasst werden kann, daC{\displaystyle \mathbb {C} } ein zweidimensionalerR{\displaystyle \mathbb {R} }-Vektorraum ist.

Allerdings liefert derSatz von Hadamard ein Kriterium, mit dem in manchen Fällen gezeigt werden kann, dass eine stetig differenzierbare FunktionF:RnRn{\displaystyle F\colon \mathbb {R} ^{n}\to \mathbb {R} ^{n}} einHomöomorphismus ist.

Die Regel von de L’Hospital

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Regel von de L’Hospital

Als eine Anwendung desMittelwertsatzes lässt sich eine Beziehung herleiten, die es in manchen Fällen erlaubt, unbestimmte Ausdrücke der Gestalt00{\displaystyle {\tfrac {0}{0}}} oder{\displaystyle {\tfrac {\infty }{\infty }}} zu berechnen.[47]

Seienf,g:(a,b)R{\displaystyle f,g\colon (a,b)\to \mathbb {R} } differenzierbar undg{\displaystyle g} habe keine Nullstelle. Ferner gelte entweder

limxaf(x)=limxag(x)=0{\displaystyle \lim _{x\to a}f(x)=\lim _{x\to a}g(x)=0}

oder

limxaf(x)=limxag(x)=±{\displaystyle \lim _{x\to a}f(x)=\lim _{x\to a}g(x)=\pm \infty }.

Dann gilt

limxaf(x)g(x)=limxaf(x)g(x),{\displaystyle \lim _{x\to a}{\frac {f(x)}{g(x)}}=\lim _{x\to a}{\frac {f'(x)}{g'(x)}},}

unter der Bedingung, dass der letzteGrenzwert inR{±}{\displaystyle \mathbb {R} \cup \{\pm \infty \}} existiert.

Differentialrechnung bei Funktionenfolgen und Integralen

[Bearbeiten |Quelltext bearbeiten]

In vielen analytischen Anwendungen hat man es nicht miteiner Funktionf{\displaystyle f}, sondern mit einer Folge(fn)nN{\displaystyle (f_{n})_{n\in \mathbb {N} }} zu tun. Dabei muss geklärt werden, inwieweit sich der Ableitungsoperator mit Prozessen wie Grenzwerten, Summen oder Integralen verträgt.

Grenzfunktionen

[Bearbeiten |Quelltext bearbeiten]

Bei einer konvergenten, differenzierbaren Funktionenfolge(fn)nN{\displaystyle (f_{n})_{n\in \mathbb {N} }} ist es im Allgemeinen nicht möglich, Rückschlüsse auf den Grenzwert der Folge(fn)nN{\displaystyle (f_{n}')_{n\in \mathbb {N} }} zu ziehen, selbst dann nicht, wenn(fn)nN{\displaystyle (f_{n})_{n\in \mathbb {N} }}gleichmäßig konvergiert. Die analoge Aussage in der Integralrechnung ist hingegen richtig: Bei gleichmäßiger Konvergenz können Limes und Integral vertauscht werden, zumindest dann, wenn die Grenzfunktion „gutartig“ ist.

Aus dieser Tatsache kann zumindest Folgendes geschlossen werden: Seifn:[a,b]R{\displaystyle f_{n}\colon [a,b]\to \mathbb {R} } eine Folge stetig differenzierbarer Funktionen, sodass die Folge der Ableitungenfn:[a,b]R{\displaystyle f_{n}'\colon [a,b]\to \mathbb {R} }gleichmäßig gegen eine Funktiong:[a,b]R{\displaystyle g\colon [a,b]\to \mathbb {R} } konvergiert. Es gelte außerdem, dass die Folgefn(x0){\displaystyle f_{n}(x_{0})} fürmindestens einen Punktx0[a,b]{\displaystyle x_{0}\in [a,b]} konvergiert. Dann konvergiertfn:[a,b]R{\displaystyle f_{n}\colon [a,b]\to \mathbb {R} } bereits gleichmäßig gegen eine differenzierbare Funktiong:[a,b]R{\displaystyle g\colon [a,b]\to \mathbb {R} } und es giltf=g{\displaystyle f'=g}.[48]

Vertauschen mit unendlichen Reihen

[Bearbeiten |Quelltext bearbeiten]

Seifn:[a,b]R{\displaystyle f_{n}\colon [a,b]\to \mathbb {R} } eine Folge stetig differenzierbarer Funktionen, sodass die Reihen=1||fn||{\displaystyle \textstyle \sum _{n=1}^{\infty }||f_{n}'||_{\infty }} konvergiert, wobei||fn||:=supx[a,b]|fn(x)|{\displaystyle ||f_{n}'||_{\infty }:=\sup _{x\in [a,b]}|f_{n}'(x)|} dieSupremumsnorm bezeichnet. Konvergiert außerdem die Reihen=1fn(x0){\displaystyle \textstyle \sum _{n=1}^{\infty }f_{n}(x_{0})} für einx0[a,b]{\displaystyle x_{0}\in [a,b]}, dann konvergiert die FunktionenreihegN:=n=1Nfn{\displaystyle \textstyle g_{N}:=\sum _{n=1}^{N}f_{n}} gleichmäßig gegen eine differenzierbare Funktion, und es gilt[49]

(n=1fn)(x)=n=1fn(x).{\displaystyle \left(\sum _{n=1}^{\infty }f_{n}\right)'(x)=\sum _{n=1}^{\infty }f_{n}'(x).}

Das Resultat geht aufKarl Weierstraß zurück.[50]

Vertauschen mit Integration

[Bearbeiten |Quelltext bearbeiten]

Es seif:[a,b]×[c,d]R{\displaystyle f\colon [a,b]\times [c,d]\to \mathbb {R} } eine stetige Funktion, sodass diepartielle Ableitung

(t,x)xf(t,x){\displaystyle (t,x)\mapsto {\frac {\partial }{\partial x}}f(t,x)}

existiert und stetig ist. Dann ist auch

g(x):=abf(t,x)dt{\displaystyle g(x):=\int _{a}^{b}f(t,x)\mathrm {d} t}

differenzierbar, und es gilt

g(x)=abxf(t,x)dt.{\displaystyle g'(x)=\int _{a}^{b}{\frac {\partial }{\partial x}}f(t,x)\mathrm {d} t.}

Diese Regel wird auch alsLeibnizsche Regel bezeichnet.[51]

Differentialrechnung über den komplexen Zahlen

[Bearbeiten |Quelltext bearbeiten]

Bisher wurde nur vonreellen Funktionen gesprochen. Alle behandelten Regeln lassen sich jedoch auf Funktionen mitkomplexen Eingaben und Werten übertragen. Dies hat den Hintergrund, dass die komplexen ZahlenC{\displaystyle \mathbb {C} } genau wie die reellen Zahlen einenKörper bilden, dort also Addition, Multiplikation und Division erklärt ist. Diese zusätzliche Struktur bildet den entscheidenden Unterschied zu einer Herangehensweise mehrdimensionaler reeller Ableitungen, wennC{\displaystyle \mathbb {C} } bloß als zweidimensionalerR{\displaystyle \mathbb {R} }-Vektorraum aufgefasst wird. Ferner lassen sich die euklidischen Abstandsbegriffe der reellen Zahlen (siehe auchEuklidischer Raum) auf natürliche Weise auf komplexe Zahlen übertragen. Dies erlaubt eine analoge Definition und Behandlung der für die Differentialrechnung wichtigen Begriffe wieFolge undGrenzwert.[52]

Ist alsoUC{\displaystyle U\subset \mathbb {C} } offen,f:UC{\displaystyle f\colon U\to \mathbb {C} } eine komplexwertige Funktion, so heißtf{\displaystyle f} an der StellezU{\displaystyle z\in U}komplex differenzierbar, wenn der Grenzwert

limh0f(z+h)f(z)h{\displaystyle \lim _{h\to 0}{\frac {f(z+h)-f(z)}{h}}}

existiert.[53] Dieser wird mitf(z){\displaystyle f'(z)} bezeichnet und(komplexe) Ableitung vonf{\displaystyle f} an der Stellez{\displaystyle z} genannt. Es ist demnach möglich, den Begriff der Linearisierung ins Komplexe weiterzutragen: Die Ableitungf(z){\displaystyle f'(z)} ist die „Steigung“ der linearen Funktion, dief{\displaystyle f} beiz{\displaystyle z} optimal approximiert. Allerdings ist darauf zu achten, dass der Werth{\displaystyle h} im Grenzwert nicht nur reelle, sondern auch komplexe Zahlen (nahe bei 0) annehmen kann. Dies hat zur Folge, dass der Terminus der komplexen Differenzierbarkeit wesentlich restriktiver ist als jener der reellen Differenzierbarkeit. Während im Reellen nur zwei Richtungen im Differenzenquotienten betrachtet werden mussten, sind es im Komplexen unendlich viele Richtungen, da diese keine Gerade, sondern eine Ebene aufspannen. So ist beispielsweise die Betragsfunktionz|z|{\displaystyle z\mapsto |z|} nirgends komplex differenzierbar. Eine komplexe Funktion ist genau dann komplex differenzierbar in einem Punkt, wenn sie dort dieCauchy-Riemannschen Differentialgleichungen erfüllt undtotal differenzierbar ist.[54]

Trotz (bzw. gerade wegen) des viel einschränkenderen Begriffs der komplexen Differenzierbarkeit übertragen sich alle üblichen Rechenregeln der reellen Differentialrechnung in die komplexe Differentialrechnung. Dazu gehören die Ableitungsregeln, also zum Beispiel Summen-, Produkt- und Kettenregel, wie auch die Umkehrregel für inverse Funktionen. Viele Funktionen, wie Potenzen, die Exponentialfunktion oder der Logarithmus, haben natürliche Fortsetzungen in die komplexen Zahlen und besitzen weiterhin ihre charakteristischen Eigenschaften. Von diesem Gesichtspunkt her ist die komplexe Differentialrechnung mit ihrem reellen Analogon identisch.

Wenn eine Funktionf{\displaystyle f} in ganzU{\displaystyle U} komplex differenzierbar ist, nennt man sie auch eineinU{\displaystyle U}holomorphe Funktion.[55] Holomorphe Funktionen haben bedeutende Eigenschaften. So ist zum Beispiel jede holomorphe Funktion bereits (in jedem Punkt) beliebig oft differenzierbar. Die daraus aufkommende Klassifizierungfrage holomorpher Funktionen ist Gegenstand derFunktionentheorie. Es stellt sich heraus, dass im komplex-eindimensionalen Fall der Begriff holomorph äquivalent zum Begriffanalytisch ist. Demnach ist jede holomorphe Funktion analytisch, und umgekehrt. Ist eine Funktion sogar in ganzC{\displaystyle \mathbb {C} } holomorph, so nennt man sieganz. Beispiele für ganze Funktionen sind die Potenzfunktionenzzn{\displaystyle z\mapsto z^{n}} mit natürlichen Zahlenn{\displaystyle n} sowiezez{\displaystyle z\mapsto e^{z}},zsin(z){\displaystyle z\mapsto \sin(z)} undzcos(z){\displaystyle z\mapsto \cos(z)}.

Differentialrechnung mehrdimensionaler Funktionen

[Bearbeiten |Quelltext bearbeiten]

Alle vorherigen Ausführungen legten eine Funktion ineiner Variablen (also mit einer reellen oder komplexen Zahl als Argument) zugrunde. Funktionen, dieVektoren auf Vektoren oder Vektoren auf Zahlen abbilden, können ebenfalls eine Ableitung haben. Allerdings ist eine Tangente an den Funktionsgraph in diesen Fällen nicht mehr eindeutig bestimmt, da es viele verschiedene Richtungen gibt. Hier ist also eine Erweiterung des bisherigen Ableitungsbegriffs notwendig.

Mehrdimensionale Differenzierbarkeit und die Jacobi-Matrix

[Bearbeiten |Quelltext bearbeiten]

Richtungsableitung

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Richtungsableitung

Es seiURn{\displaystyle U\subset \mathbb {R} ^{n}} offen,f:URm{\displaystyle f\colon U\to \mathbb {R} ^{m}} eine Funktion,x0U{\displaystyle x_{0}\in U} undvRn{0}{\displaystyle v\in \mathbb {R} ^{n}\setminus \{0\}} ein (Richtungs-)Vektor. Aufgrund der Offenheit vonU{\displaystyle U} gibt es einε>0{\displaystyle \varepsilon >0} mitx0+hvU{\displaystyle x_{0}+hv\in U} für alle|h|<ε{\displaystyle |h|<\varepsilon }, weshalb die Funktion(ε,ε)Rm{\displaystyle (-\varepsilon ,\varepsilon )\to \mathbb {R} ^{m}} mithf(x0+hv){\displaystyle h\mapsto f(x_{0}+hv)} wohldefiniert ist. Ist diese Funktion inh=0{\displaystyle h=0} differenzierbar, so heißt ihre AbleitungRichtungsableitung vonf{\displaystyle f} an der Stellex0{\displaystyle x_{0}}in der Richtungv{\displaystyle v} und wird meistens mitDvf(x0){\displaystyle D_{v}f(x_{0})} bezeichnet.[56] Es gilt:

Dvf(x0)=limh0f(x0+hv)f(x0)h.{\displaystyle D_{v}f(x_{0})=\lim _{h\to 0}{\frac {f(x_{0}+hv)-f(x_{0})}{h}}.}

Es besteht ein Zusammenhang zwischen der Richtungsableitung und der Jacobi-Matrix. Istf{\displaystyle f} differenzierbar, dann existiertDvf(x0){\displaystyle D_{v}f(x_{0})} und es gilt in einer Umgebung vonx0{\displaystyle x_{0}}:

f(x0+hv)=f(x0)+Jf(x0)(hv)+o(||hv||)=f(x0)+hJf(x0)v+o(|h|),{\displaystyle f(x_{0}+hv)=f(x_{0})+J_{f}(x_{0})(hv)+o(||hv||)=f(x_{0})+hJ_{f}(x_{0})v+o(|h|),}

wobei die Schreibweiseo{\displaystyle o} das entsprechendeLandau-Symbol bezeichnet.[57]

Es werde als Beispiel eine FunktionR3R{\displaystyle \mathbb {R} ^{3}\to \mathbb {R} } betrachtet, also einSkalarfeld. Diese könnte eineTemperaturfunktion sein: In Abhängigkeit vom Ort wird die Temperatur im Zimmer gemessen, um zu beurteilen, wie effektiv die Heizung ist. Wird dasThermometer in eine bestimmte Raumrichtung bewegt, ist eine Veränderung der Temperatur festzustellen. Dies entspricht genau der entsprechenden Richtungsableitung.

Partielle Ableitungen

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Partielle Ableitung

Die Richtungsableitungen in spezielle Richtungenej{\displaystyle e_{j}}, nämlich in die der Koordinatenachsen mit der Länge||ej||=||v||=1{\displaystyle ||e_{j}||=||v||=1}, nennt man diepartiellen Ableitungen.

Insgesamt lassen sich für eine Funktion inn{\displaystyle n} Variablenn{\displaystyle n} partielle Ableitungen errechnen:[58]

f(x1,,xn)xi=limhi0f(x1,,xi+hi,,xn)f(x1,,xi,,xn)hi;i{1,,n}{\displaystyle {\frac {\partial f(x_{1},\dots ,x_{n})}{\partial x_{i}}}=\lim _{h_{i}\to 0}{\frac {f(x_{1},\dots ,x_{i}+h_{i},\dots ,x_{n})-f(x_{1},\dots ,x_{i},\dots ,x_{n})}{h_{i}}};\quad i\in \{1,\dots ,n\}}

Die einzelnen partiellen Ableitungen einer Funktion lassen sich auch gebündelt alsGradient oderNablavektor anschreiben:[59]

grad(f)(x1,,xn)=f(x1,,xn)=(f(x1,,xn)x1,f(x1,,xn)x2,,f(x1,,xn)xn).{\displaystyle \mathrm {grad} (f)(x_{1},\dots ,x_{n})=\nabla f(x_{1},\dots ,x_{n})=\left({\frac {\partial f(x_{1},\dots ,x_{n})}{\partial x_{1}}},{\frac {\partial f(x_{1},\dots ,x_{n})}{\partial x_{2}}},\dots ,{\frac {\partial f(x_{1},\dots ,x_{n})}{\partial x_{n}}}\right).}

Meist wird der Gradient alsZeilenvektor (also „liegend“) geschrieben. In manchen Anwendungen, besonders in der Physik, ist jedoch auch die Schreibweise alsSpaltenvektor (also „stehend“) üblich. Partielle Ableitungen können selbst differenzierbar sein und ihre partiellen Ableitungen lassen sich dann in der sogenanntenHesse-Matrix anordnen.

Totale Differenzierbarkeit

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Totale Differenzierbarkeit

Eine Funktionf:URnRm{\displaystyle f\colon U\subset \mathbb {R} ^{n}\to \mathbb {R} ^{m}} mit(x1,,xn)(f1(x1,,xn),,fm(x1,,xn)){\displaystyle (x_{1},\dots ,x_{n})\mapsto (f_{1}(x_{1},\dots ,x_{n}),\dots ,f_{m}(x_{1},\dots ,x_{n}))}, wobeiU{\displaystyle U} eineoffene Menge ist, heißt in einem Punktx0U{\displaystyle x_{0}\in U}total differenzierbar (oder auch nurdifferenzierbar, manchmal auchFréchet-differenzierbar[56]), falls einelineare AbbildungL:RnRm{\displaystyle L\colon \mathbb {R} ^{n}\to \mathbb {R} ^{m}} existiert, sodass

limh0f(x0+h)f(x0)L(h)h=0{\displaystyle \lim _{h\to 0}{\frac {f(x_{0}+h)-f(x_{0})-L(h)}{\|h\|}}=0}

gilt.[60] Für den eindimensionalen Fall stimmt diese Definition mit der oben angegebenen überein. Die lineare AbbildungL{\displaystyle L} ist bei Existenz eindeutig bestimmt, ist also insbesondere unabhängig von der Wahläquivalenter Normen. Die Tangente wird daher durch die lokale Linearisierung der Funktion abstrahiert. Die Matrixdarstellung der ersten Ableitung vonf{\displaystyle f} nennt manJacobi-Matrix. Es handelt sich um eine(m×n){\displaystyle (m\times n)}-Matrix. Fürm=1{\displaystyle m=1} erhält man denweiter oben beschriebenen Gradienten.

Zwischen den partiellen Ableitungen und der totalen Ableitung besteht folgender Zusammenhang: Existiert in einem Punkt die totale Ableitung, so existieren dort auch alle partiellen Ableitungen. In diesem Fall stimmen die partiellen Ableitungen mit den Koeffizienten der Jacobi-Matrix überein:

L=Jf(x0)=(f1x1(x0)f1x2(x0)f1xn(x0)fmx1(x0)fmx2(x0)fmxn(x0)).{\displaystyle L=J_{f}(x_{0})={\begin{pmatrix}{\frac {\partial f_{1}}{\partial x_{1}}}(x_{0})&{\frac {\partial f_{1}}{\partial x_{2}}}(x_{0})&\ldots &{\frac {\partial f_{1}}{\partial x_{n}}}(x_{0})\\\vdots &\vdots &\ddots &\vdots \\{\frac {\partial f_{m}}{\partial x_{1}}}(x_{0})&{\frac {\partial f_{m}}{\partial x_{2}}}(x_{0})&\ldots &{\frac {\partial f_{m}}{\partial x_{n}}}(x_{0})\end{pmatrix}}.}

Umgekehrt folgt aus der Existenz der partiellen Ableitungen in einem Punktx0{\displaystyle x_{0}} nicht zwingend die totale Differenzierbarkeit, ja nicht einmal die Stetigkeit. Sind die partiellen Ableitungen jedoch zusätzlich in einer Umgebung vonx0{\displaystyle x_{0}}stetig, dann ist die Funktion inx0{\displaystyle x_{0}} auch total differenzierbar.[61]

Rechenregeln der mehrdimensionalen Differentialrechnung

[Bearbeiten |Quelltext bearbeiten]

Kettenregel

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Mehrdimensionale Kettenregel

Es seienURn{\displaystyle U\subset \mathbb {R} ^{n}} undVRm{\displaystyle V\subset \mathbb {R} ^{m}} offen sowief:URm{\displaystyle f\colon U\to \mathbb {R} ^{m}} undg:VR{\displaystyle g\colon V\to \mathbb {R} ^{\ell }} inx0U{\displaystyle x_{0}\in U} bzw.y0:=f(x0){\displaystyle y_{0}:=f(x_{0})} differenzierbar, wobeif(U)V{\displaystyle f(U)\subset V}. Dann isth:UR{\displaystyle h\colon U\to \mathbb {R} ^{\ell }} mith(x):=g(f(x)){\displaystyle h(x):=g(f(x))} inx0{\displaystyle x_{0}} differenzierbar mit Jacobi-Matrix

Jh(x0)=Jgf(x0)=Jg(f(x0))Jf(x0).{\displaystyle J_{h}(x_{0})=J_{g\circ f}(x_{0})=J_{g}(f(x_{0}))J_{f}(x_{0}).}

Mit anderen Worten, die Jacobi-Matrix der Kompositionh=gf{\displaystyle h=g\circ f} ist das Produkt der Jacobi-Matrizen vong{\displaystyle g} undf{\displaystyle f}.[62] Es ist zu beachten, dass die Reihenfolge der Faktoren im Gegensatz zum klassischen eindimensionalen Fall eine Rolle spielt.

Produktregel

[Bearbeiten |Quelltext bearbeiten]
Siehe auch:Mehrdimensionale Produktregel

Mit Hilfe der Kettenregel kann die Produktregel aufreellwertige Funktionen mit höherdimensionalem Definitionsbereich verallgemeinert werden.[63] IstURn{\displaystyle U\subset \mathbb {R} ^{n}} offen und sindf,g:UR{\displaystyle f,g\colon U\to \mathbb {R} } beide inx0U{\displaystyle x_{0}\in U} differenzierbar, so folgt

Jfg(x0)=f(x0)Jg(x0)+g(x0)Jf(x0){\displaystyle J_{fg}(x_{0})=f(x_{0})J_{g}(x_{0})+g(x_{0})J_{f}(x_{0})}

oder in der Gradientenschreibweise

(fg)(x0)=f(x0)g(x0)+g(x0)f(x0).{\displaystyle \nabla (fg)(x_{0})=f(x_{0})\nabla g(x_{0})+g(x_{0})\nabla f(x_{0}).}

Funktionenfolgen

[Bearbeiten |Quelltext bearbeiten]

SeiURn{\displaystyle U\subset \mathbb {R} ^{n}} offen. Es bezeichnefk{\displaystyle f_{k}} eine Folge stetig differenzierbarer Funktionenfk:URm{\displaystyle f_{k}\colon U\to \mathbb {R} ^{m}}, sodass es Funktionenf:URm{\displaystyle f\colon U\to \mathbb {R} ^{m}} undg:UL(Rn,Rm){\displaystyle g\colon U\to {\mathcal {L}}(\mathbb {R} ^{n},\mathbb {R} ^{m})} gibt (dabei istL(Rn,Rm){\displaystyle {\mathcal {L}}(\mathbb {R} ^{n},\mathbb {R} ^{m})} der Raum der linearen Abbildungen vonRn{\displaystyle \mathbb {R} ^{n}} nachRm{\displaystyle \mathbb {R} ^{m}}), sodass Folgendes gilt:

Dann istf{\displaystyle f} stetig differenzierbar aufU{\displaystyle U} und es giltJf(x)=g(x){\displaystyle J_{f}(x)=g(x)}.[64]

Implizite Differentiation

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Implizite Differentiation

Ist eine Funktionxy(x){\displaystyle x\mapsto y(x)} durch eine implizite GleichungF(x,y(x))=0{\displaystyle F(x,y(x))=0} gegeben, so folgt aus dermehrdimensionalen Kettenregel, die für Funktionen mehrerer Variablen gilt,

Fx+Fyy=0.{\displaystyle F_{x}+F_{y}y'=0.}

Für die Ableitung der Funktiony{\displaystyle y} ergibt sich daher

y=FxFy{\displaystyle y'=-{\frac {F_{x}}{F_{y}}}}

mitFx=Fx,Fy=Fy{\displaystyle F_{x}={\frac {\partial F}{\partial x}},F_{y}={\frac {\partial F}{\partial y}}} undFy0.{\displaystyle F_{y}\neq 0.}

Zentrale Sätze der Differentialrechnung mehrerer Veränderlicher

[Bearbeiten |Quelltext bearbeiten]

Satz von Schwarz

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Satz von Schwarz

Die Differentiationsreihenfolge ist bei der Berechnung partieller Ableitungen höherer Ordnung unerheblich, wenn alle partiellen Ableitungen bis zu dieser Ordnung (einschließlich) stetig sind. Dies bedeutet konkret: IstURn{\displaystyle U\subset \mathbb {R} ^{n}} offen und die Funktionf:UR{\displaystyle f\colon U\to \mathbb {R} } zweimal stetig differenzierbar (d. h., alle zweifachen partiellen Ableitungen existieren und sind stetig), so gilt für alle1j,kn{\displaystyle 1\leq j,k\leq n} undxU{\displaystyle x\in U}:

xjxkf(x1,,xn)=xkxjf(x1,,xn).{\displaystyle {\frac {\partial }{\partial x_{j}}}{\frac {\partial }{\partial x_{k}}}f(x_{1},\dots ,x_{n})={\frac {\partial }{\partial x_{k}}}{\frac {\partial }{\partial x_{j}}}f(x_{1},\dots ,x_{n}).}

Der Satz wird falsch, wenn die Stetigkeit der zweifachen partiellen Ableitungen weggelassen wird.[65]

Satz von der impliziten Funktion

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Satz von der impliziten Funktion

Der Satz von der impliziten Funktion besagt, dass Funktionsgleichungen auflösbar sind, falls dieJacobi-Matrix bezüglich bestimmter Variablen lokal invertierbar ist.[66]

Mittelwertsatz

[Bearbeiten |Quelltext bearbeiten]

Über den höherdimensionalen Mittelwertsatz gelingt es, eine Funktion entlang einer Verbindungsstrecke abzuschätzen, wenn die dortigen Ableitungen bekannt sind. SeienURn{\displaystyle U\subset \mathbb {R} ^{n}} offen undf:URm{\displaystyle f\colon U\to \mathbb {R} ^{m}} differenzierbar. Gegeben seien zudem zwei Punktex,yU{\displaystyle x,y\in U}, sodass die Verbindungsstrecke{x+t(yx)0t1}{\displaystyle \{x+t(y-x)\mid 0\leq t\leq 1\}} eine Teilmenge vonU{\displaystyle U} ist. Dann postuliert der Mittelwertsatz die Ungleichung:[67]

||f(y)f(x)||sup0t1||Jf(x+t(yx))||||yx||.{\displaystyle ||f(y)-f(x)||\leq \sup _{0\leq t\leq 1}||J_{f}(x+t(y-x))||\cdot ||y-x||.}

Eine präzisere Aussage ist indes für den Fallreellwertiger Funktionen in mehreren Veränderlichen möglich, siehe auchMittelwertsatz für reellwertige Funktionen mehrerer Variablen.

Höhere Ableitungen im Mehrdimensionalen

[Bearbeiten |Quelltext bearbeiten]

Auch im Fall höherdimensionaler Funktionen können höhere Ableitungen betrachtet werden. Die Konzepte haben jedoch einige starke Unterschiede zum klassischen Fall, die besonders im Falle mehrerer Veränderlicher in Erscheinung treten. Bereits die Jacobi-Matrix lässt erkennen, dass die Ableitung einer höherdimensionalen Funktion an einer Stelle nicht mehr die gleiche Gestalt wie der dortige Funktionswert haben muss. Wird nun die erste AbleitungxJf(x){\displaystyle x\mapsto J_{f}(x)} erneut abgeleitet, so ist die erneute „Jacobi-Matrix“ im Allgemeinen ein noch umfangreicheres Objekt. Für dessen Beschreibung ist das Konzept dermultilinearen Abbildungen bzw. desTensors erforderlich. Ist0f:=f{\displaystyle \partial ^{0}f:=f}, so ordnetf:UL(Rn,Rm){\displaystyle \partial f\colon U\to {\mathcal {L}}(\mathbb {R} ^{n},\mathbb {R} ^{m})} jedem Punkt eine(m×n){\displaystyle (m\times n)}-Matrix (lineare Abbildung vonRn{\displaystyle \mathbb {R} ^{n}} nachRm{\displaystyle \mathbb {R} ^{m}}) zu. Induktiv definiert man für die höheren Ableitungen

f(x0):=(1f)(x0)L(Rn,L1(Rn,Rm))=L(Rn,Rm),{\displaystyle \partial ^{\ell }f(x_{0}):=\partial (\partial ^{\ell -1}f)(x_{0})\in {\mathcal {L}}(\mathbb {R} ^{n},{\mathcal {L}}^{\ell -1}(\mathbb {R} ^{n},\mathbb {R} ^{m}))={\mathcal {L}}^{\ell }(\mathbb {R} ^{n},\mathbb {R} ^{m}),}

wobeiL(Rn,Rm){\displaystyle {\mathcal {L}}^{\ell }(\mathbb {R} ^{n},\mathbb {R} ^{m})} der Raum der{\displaystyle \ell }-multilinearen Abbildungen vonRn××Rnmal{\displaystyle \underbrace {\mathbb {R} ^{n}\times \cdots \times \mathbb {R} ^{n}} _{\ell -\mathrm {mal} }} nachRm{\displaystyle \mathbb {R} ^{m}} bezeichnet. Analog wie im eindimensionalen Fall definiert man die Räume der{\displaystyle \ell }-mal stetig differenzierbaren Funktionen aufURn{\displaystyle U\subset \mathbb {R} ^{n}} durchC(U,Rm){\displaystyle C^{\ell }(U,\mathbb {R} ^{m})}, und die glatten Funktion via[68]

C(U,Rm):==1C(U,Rm).{\displaystyle C^{\infty }(U,\mathbb {R} ^{m}):=\bigcap _{\ell =1}^{\infty }C^{\ell }(U,\mathbb {R} ^{m}).}

Auch die Konzepte der Taylor-Formeln und der Taylorreihe lassen sich auf den höherdimensionalen Fall verallgemeinern, siehe auchTaylor-Formel im Mehrdimensionalen bzw.mehrdimensionale Taylorreihe.

Anwendungen

[Bearbeiten |Quelltext bearbeiten]

Fehlerrechnung

[Bearbeiten |Quelltext bearbeiten]

Ein Anwendungsbeispiel der Differentialrechnung mehrerer Veränderlicher betrifft dieFehlerrechnung, zum Beispiel im Kontext derExperimentalphysik. Während man im einfachsten Falle die zu bestimmende Größe direkt messen kann, wird es meistens der Fall sein, dass sie sich durch einen funktionalen Zusammenhang aus einfacher zu messenden Größen ergibt. Typischerweise hat jede Messung eine gewisse Unsicherheit, die man durch Angabe desMessfehlers zu quantifizieren versucht.[69]

Bezeichnet zum BeispielV:R>03R{\displaystyle V\colon \mathbb {R} _{>0}^{3}\to \mathbb {R} } mit(l,b,h)lbh{\displaystyle (l,b,h)\mapsto lbh} das Volumen einesQuaders, so könnte das ErgebnisV{\displaystyle V} experimentell ermittelt werden, indem man Längel{\displaystyle l}, Breiteb{\displaystyle b} und Höheh{\displaystyle h} einzeln misst. Treten bei diesen die FehlerΔl{\displaystyle \Delta l},Δb{\displaystyle \Delta b} undΔh{\displaystyle \Delta h} auf, so gilt für den Fehler in der Volumenberechnung:

ΔV=bhΔl+hlΔb+lbΔh.{\displaystyle \Delta V=bh\Delta l+hl\Delta b+lb\Delta h.}

Allgemein gilt, dass wenn eine zu messende Größe funktional von einzeln gemessenen Größenx1,,xn{\displaystyle x_{1},\dots ,x_{n}} durchf:RnR{\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} } abhängt und bei deren Messungen jeweils die FehlerΔxk{\displaystyle \Delta x_{k}} entstehen, der Fehler der daraus errechneten Größe ungefähr bei

Δf=k=1n|fxk(m)|Δxk{\displaystyle \Delta f=\sum _{k=1}^{n}\left|{\frac {\partial f}{\partial x_{k}}}({\boldsymbol {m}})\right|\Delta x_{k}}

liegen wird. Dabei bezeichnet der Vektorm{\displaystyle {\boldsymbol {m}}} die exakten Terme der einzelnen Messungen.[69]

Lösungsnäherung von Gleichungssystemen

[Bearbeiten |Quelltext bearbeiten]

Viele höhere Gleichungssysteme lassen sich nicht algebraisch geschlossen lösen. In manchen Fällen kann man aber zumindest eine ungefähre Lösung ermitteln. Ist das System durchf(x)=0{\displaystyle f({\boldsymbol {x}})={\boldsymbol {0}}} gegeben, mit einer stetig differenzierbaren Funktionf:RmRm{\displaystyle f\colon \mathbb {R} ^{m}\to \mathbb {R} ^{m}}, so konvergiert die Iterationsvorschrift

xn+1:=xnJf(xn)1f(xn){\displaystyle {\boldsymbol {x}}_{n+1}:={\boldsymbol {x}}_{n}-J_{f}({\boldsymbol {x}}_{n})^{-1}f({\boldsymbol {x}}_{n})}

unter gewissen Voraussetzungen gegen eine Nullstelle. Dabei bezeichnetJf(xn)1{\displaystyle J_{f}({\boldsymbol {x}}_{n})^{-1}} dasInverse der Jacobi-Matrix zuf{\displaystyle f}. Der Prozess stellt eine Verallgemeinerung des klassischen eindimensionalenNewton-Verfahrens dar. Aufwendig ist allerdings die Berechnung dieser Inversen in jedem Schritt. Unter Verschlechterung der Konvergenzrate kann in manchen Fällen die ModifikationJf(x0)1{\displaystyle J_{f}({\boldsymbol {x}}_{0})^{-1}} stattJf(xn)1{\displaystyle J_{f}({\boldsymbol {x}}_{n})^{-1}} vorgenommen werden, womit nur eine Matrix invertiert werden muss.[70]

Extremwertaufgaben

[Bearbeiten |Quelltext bearbeiten]

Auch für die Kurvendiskussion von Funktionenf:RmR{\displaystyle f\colon \mathbb {R} ^{m}\to \mathbb {R} } ist die Auffindung von Minima bzw. Maxima, zusammengefasstExtrema, ein wesentliches Anliegen. Die mehrdimensionale Differentialrechnung liefert Möglichkeiten, diese zu bestimmen, sofern die betrachtete Funktion zweimal stetig differenzierbar ist. Analog zum Eindimensionalen besagt die notwendige Bedingung für die Existenz für Extrema, dass im besagten Punktx{\displaystyle {\boldsymbol {x}}} alle partiellen Ableitungen 0 sein müssen, also

fxj(x)=0{\displaystyle {\frac {\partial f}{\partial x_{j}}}({\boldsymbol {x}})=0}

für alle1jm{\displaystyle 1\leq j\leq m}. Dieses Kriterium ist nicht hinreichend, dient aber dazu, diesekritischen Punkte als mögliche Kandidaten für Extrema zu ermitteln. Unter Bestimmung der Hesse-Matrix, der zweiten Ableitung, kann anschließend in manchen Fällen entschieden werden, um welche Art Extremstelle es sich handelt.[71] Im Gegensatz zum Eindimensionalen ist die Formenvielfalt kritischer Punkte größer. Mittels einerHauptachsentransformation, also einer detaillierten Untersuchung der Eigenwerte, der durch eine mehrdimensionale Taylor-Entwicklung im betrachteten Punkt gegebenenquadratischen Form lassen sich die verschiedenen Fälle klassifizieren.[72]

Optimierung unter Nebenbedingungen

[Bearbeiten |Quelltext bearbeiten]

Häufig ist bei Optimierungsproblemen die Zielfunktionf:RmR{\displaystyle f\colon \mathbb {R} ^{m}\to \mathbb {R} } lediglich auf einerTeilmengeDRm{\displaystyle D\subset \mathbb {R} ^{m}} zu minimieren, wobeiD{\displaystyle D} durch sog.Nebenbedingungen bzw.Restriktionen bestimmt ist. Ein Verfahren, das zur Lösung solcher Probleme herangezogen werden kann, ist dieLagrangesche Multiplikatorregel.[73] Diese nutzt die mehrdimensionale Differentialrechnung und lässt sich sogar auf Ungleichungsnebenbedingungen ausweiten.[74]

Beispiel aus der Mikroökonomie

[Bearbeiten |Quelltext bearbeiten]
Neoklassische Produktionsfunktion
Neoklassische Produktionsfunktion

In derMikroökonomie werden beispielsweise verschiedene Arten vonProduktionsfunktionen analysiert, um daraus Erkenntnisse fürmakroökonomische Zusammenhänge zu gewinnen. Hier ist vor allem das typische Verhalten einer Produktionsfunktion von Interesse: Wie reagiert die abhängige VariableOutputy{\displaystyle y} (z. B. Output einer Volkswirtschaft), wenn dieInputfaktoren (hier:Arbeit undKapital) um eine infinitesimal kleine Einheit erhöht werden?

Ein Grundtyp einer Produktionsfunktion ist etwa dieneoklassische Produktionsfunktion. Sie zeichnet sich unter anderem dadurch aus, dass der Output bei jedem zusätzlichen Input steigt, dass aber die Zuwächse abnehmend sind. Es sei beispielsweise für eine Volkswirtschaft dieCobb-Douglas-Funktion

F(K,L)=TKαL1α{\displaystyle F(K,L)=T\cdot K^{\alpha }L^{1-\alpha }} mitα(0,1){\displaystyle \alpha \in (0,1)}

maßgebend. Zu jedem Zeitpunkt wird in der Volkswirtschaft unter dem Einsatz der Produktionsfaktoren ArbeitL{\displaystyle L} und KapitalK{\displaystyle K} mithilfe eines gegebenen TechnologielevelsT{\displaystyle T} Output produziert. Die erste Ableitung dieser Funktion nach den Produktionsfaktoren ergibt:

F(K,L)L=(1α)TKαLα{\displaystyle {\frac {\partial F(K,L)}{\partial L}}=(1-\alpha )\cdot T\cdot K^{\alpha }L^{-\alpha }}
F(K,L)K=αTK(1α)L1α{\displaystyle {\frac {\partial F(K,L)}{\partial K}}=\alpha \cdot T\cdot K^{-(1-\alpha )}L^{1-\alpha }}.

Da die partiellen Ableitungen aufgrund der Beschränkungα(0,1){\displaystyle \alpha \in (0,1)} nur positiv werden können, sieht man, dass der Output bei einer Erhöhung der jeweiligen Inputfaktoren steigt. Die partiellen Ableitungen 2. Ordnung ergeben:

2F(K,L)L2=α(1α)TKαL(1+α){\displaystyle {\frac {\partial ^{2}F(K,L)}{\partial L^{2}}}=-\alpha (1-\alpha )\cdot T\cdot K^{\alpha }L^{-(1+\alpha )}}
2F(K,L)K2=α(1α)TK(2α)L1α{\displaystyle {\frac {\partial ^{2}F(K,L)}{\partial K^{2}}}=-\alpha (1-\alpha )\cdot T\cdot K^{-(2-\alpha )}L^{1-\alpha }}.

Sie werden für alle Inputs negativ sein, also fallen die Zuwachsraten. Man könnte also sagen, dass bei steigendem Input der Output unterproportional steigt. Dierelative Änderung des Outputs im Verhältnis zu einer relativen Änderung des Inputs ist hier durch dieElastizitätηif(x)xixif(x){\displaystyle \eta _{i}\equiv {\tfrac {\partial f(x)}{\partial x_{i}}}{\tfrac {x_{i}}{f(x)}}} gegeben. Vorliegend bezeichnetηKF(K,L)KKF(K,L){\displaystyle \eta _{K}\equiv {\tfrac {\partial F(K,L)}{\partial K}}{\tfrac {K}{F(K,L)}}} die Produktionselastizität des Kapitals, die bei dieser Produktionsfunktion dem Exponentenα{\displaystyle \alpha } entspricht, der wiederum die Kapitaleinkommensquote repräsentiert. Folglich steigt der Output bei einer infinitesimal kleinen Erhöhung des Kapitals um die Kapitaleinkommensquote.

Weiterführende Theorien

[Bearbeiten |Quelltext bearbeiten]

Differentialgleichungen

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Differentialgleichung

Eine wichtige Anwendung der Differentialrechnung besteht in dermathematischen Modellierung physikalischer Vorgänge. Wachstum, Bewegung oder Kräfte haben alle mit Ableitungen zu tun, ihre formelhafte Beschreibung muss also Differentiale enthalten. Typischerweise führt dies auf Gleichungen, in denen Ableitungen einer unbekannten Funktion auftauchen, sogenannteDifferentialgleichungen.

Beispielsweise verknüpft dasnewtonsche Bewegungsgesetz

F(t)=ma(t)=mr¨(t)=md2r(t)dt2{\displaystyle {\vec {F}}(t)=m{\vec {a}}(t)=m{\ddot {\vec {r}}}(t)=m{\frac {\mathrm {d} ^{2}{\vec {r}}(t)}{\mathrm {d} t^{2}}}}

die Beschleunigunga{\displaystyle {\vec {a}}} eines Körpers mit seiner Massem{\displaystyle m} und der auf ihn einwirkenden KraftF{\displaystyle {\vec {F}}}. Das Grundproblem der Mechanik lautet deshalb, aus einer gegebenen Beschleunigung dieOrtsfunktion eines Körpers herzuleiten. Diese Aufgabe, eine Umkehrung der zweifachen Differentiation, hat die mathematische Gestalt einer Differentialgleichung zweiter Ordnung. Die mathematische Schwierigkeit dieses Problems rührt daher, dass Ort, Geschwindigkeit und BeschleunigungVektoren sind, die im Allgemeinen nicht in die gleiche Richtung zeigen, und dass die Kraft von der Zeitt{\displaystyle t} und vom Ortr{\displaystyle {\vec {r}}} abhängen kann.

Da viele Modelle mehrdimensional sind, sind bei der Formulierung häufig die weiter oben erklärten partiellen Ableitungen sehr wichtig, mit denen sichpartielle Differentialgleichungen formulieren lassen. Mathematisch kompakt werden diese mittelsDifferentialoperatoren beschrieben und analysiert.

Differentialgeometrie

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Differentialgeometrie

Zentrales Thema der Differentialgeometrie ist die Ausdehnung der klassischen Analysis auf höhere geometrische Objekte. Diese sehen lokal so aus wie zum Beispiel der euklidische RaumRn{\displaystyle \mathbb {R} ^{n}}, können aber global eine andere Gestalt haben. Der Begriff hinter diesem Phänomen ist dieMannigfaltigkeit. Mit Hilfe der Differentialgeometrie werden Fragestellungen über die Natur solcher Objekte studiert – zentrales Werkzeug ist weiterhin die Differentialrechnung. Gegenstand der Untersuchung sind oftmals die Abstände zwischen Punkten oder die Volumina von Figuren. Beispielsweise kann mit ihrer Hilfe der kürzestmögliche Weg zwischen zwei Punkten auf einer gekrümmten Fläche bestimmt und gemessen werden, die sogenannteGeodätische. Für die Messung von Volumina wird der Begriff derDifferentialform benötigt. Differentialformen erlauben unter anderem eine koordinatenunabhängigeIntegration.

Sowohl die theoretischen Ergebnisse als auch Methoden der Differentialgeometrie haben bedeutende Anwendungen in derPhysik. So beschriebAlbert Einstein seineRelativitätstheorie mit differentialgeometrischen Begriffen.

Verallgemeinerungen

[Bearbeiten |Quelltext bearbeiten]

In vielen Anwendungen ist es wünschenswert, Ableitungen auch für stetige oder sogar unstetige Funktionen bilden zu können. So kann beispielsweise eine sich am Strand brechende Welle durch eine partielle Differentialgleichung modelliert werden, die Funktion der Höhe der Welle ist aber noch nicht einmal stetig. Zu diesem Zweck verallgemeinerte man Mitte des 20. Jahrhunderts den Ableitungsbegriff auf den Raum derDistributionen und definierte dort eineschwache Ableitung. Eng verbunden damit ist der Begriff desSobolew-Raums.

Der Begriff der Ableitung als Linearisierung lässt sich analog auf Funktionenf{\displaystyle f} zwischen zweinormierbarentopologischen VektorräumenX{\displaystyle X} undY{\displaystyle Y} übertragen (s. HauptartikelFréchet-Ableitung,Gâteaux-Differential,Lorch-Ableitung):f{\displaystyle f} heißt inξ{\displaystyle \xi }Fréchet-differenzierbar, wenn ein stetigerlinearer OperatorLξL(X,Y){\displaystyle L_{\xi }\in {\mathcal {L}}(X,Y)} existiert, sodass

limh0f(ξ+h)f(ξ)Lξhh=0{\displaystyle \lim _{h\to 0}{\frac {\|f(\xi +h)-f(\xi )-L_{\xi }h\|}{\|h\|}}=0}.

Eine Übertragung des Begriffes der Ableitung auf andere Ringe alsR{\displaystyle \mathbb {R} } undC{\displaystyle \mathbb {C} } (und Algebren darüber) führt zurDerivation.

Siehe auch

[Bearbeiten |Quelltext bearbeiten]

Literatur

[Bearbeiten |Quelltext bearbeiten]

Differentialrechnung ist ein zentraler Unterrichtsgegenstand in derSekundarstufe II und wird somit in allen Mathematik-Lehrbüchern dieser Stufe behandelt.

Lehrbücher für Mathematik-Studierende

[Bearbeiten |Quelltext bearbeiten]

Lehrbücher für das Grundlagenfach Mathematik

[Bearbeiten |Quelltext bearbeiten]

Weblinks

[Bearbeiten |Quelltext bearbeiten]
Commons: Differentialrechnung – Sammlung von Bildern, Videos und Audiodateien
Wikibooks: Mathe für Nicht-Freaks: Ableitung und Differenzierbarkeit – Lern- und Lehrmaterialien
Wiktionary: Differentialrechnung – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

[Bearbeiten |Quelltext bearbeiten]
  1. Herbert Amann,Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 316.
  2. Serge Lang:A First Course in Calculus. Fifth Edition. Springer, S. 59–61.
  3. Fritz Wicke:Einführung in die Höhere Mathematik: unter besonderer Berücksichtigung der Bedürfnisse des Ingenieurs. Band 1. Springer, 1927, Seite 103.
  4. Carl Spitz:Erster Cursus der Differential- und Integralrechnung. C. F. Winter’sche Verlagshandlung, 1871, Seite 15
  5. Carl Spitz:Erster Cursus der Differential- und Integralrechnung. C. F. Winter’sche Verlagshandlung, 1871, Seite 16
  6. T. Arens et al.:Mathematik. Spektrum, S. 422.
  7. T. Arens et al.:Mathematik. Spektrum, S. 170.
  8. T. Arens et al.:Mathematik. Spektrum, S. 292.
  9. Serge Lang:A First Course in Calculus. Fifth Edition. Springer, S. 463–464.
  10. John Stillwell:Mathematics and Its History, Third Edition, Springer, S. 192–194.
  11. Serge Lang:Calculus of Several Variables, Third Edition, Springer, S. 439.
  12. Serge Lang:Calculus of Several Variables, Third Edition, Springer, S. 434.
  13. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 161.
  14. Serge Lang:Calculus of Several Variables, Third Edition, Springer, S. 435–436.
  15. Hans Wußing,Heinz-Wilhelm Alten, Heiko Wesemüller-Kock,Eberhard Zeidler:6000 Jahre Mathematik: Von den Anfängen bis Newton und Leibniz. Springer, 2008, S. 429.
  16. Thomas Sonar:3000 Jahre Analysis, Springer, S. 247–248.
  17. Thomas Sonar:3000 Jahre Analysis, Springer, S. 378.
  18. Marquis de L’Hospital:Analyse des Infiniment Petits pour l’Intelligence des Lignes Courbes. Preface, S. ix–x: « L’Étendue de ce calcul est immense: … »;archive.org.
  19. Ernst Hairer,Gerhard Wanner:Analysis in historischer Entwicklung. Springer, S. 87.
  20. John Stillwell:Mathematics and its history, Third Edition, Springer, S. 157.
  21. Thomas Sonar:3000 Jahre Analysis, Springer, S. 424–425.
  22. Hans Wußing, Heinz-Wilhelm Alten, Heiko Wesemüller-Kock, Eberhard Zeidler:6000 Jahre Mathematik: Von Euler bis zur Gegenwart. Springer, 2008, S. 233.
  23. Thomas Sonar:3000 Jahre Analysis, Springer, S. 506–514.
  24. Ernst Hairer, Gerhard Wanner:Analysis in historischer Entwicklung, Springer, S. 91.
  25. T. Arens et al.:Mathematik. Spektrum, S. 284.
  26. Bronstein et al.:Taschenbuch der Mathematik, Verlag Harri Deutsch, S. 394.
  27. abcHerbert Amann, Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 318.
  28. Jeremy Gray:The Real and the Complex: A History of Analysis in the 19th Century, Springer, S. 271–272.
  29. Herbert Amann, Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 323.
  30. abHerbert Amann, Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 324.
  31. Differentialrechnung. In: Guido Walz (Hrsg.):Lexikon der Mathematik. 1. Auflage. Spektrum Akademischer Verlag, Mannheim/Heidelberg 2000,ISBN 3-8274-0439-8. 
  32. Ernst Hairer, Gerhard Wanner:Analysis in historischer Entwicklung, Springer, S. 90.
  33. Harro Heuser:Lehrbuch der Analysis. Teubner, Wiesbaden 2003,ISBN 3-519-62233-5, S. 269.
  34. Thomas Sonar:3000 Jahre Analysis, Springer, S. 408.
  35. Lokenath Debnath:The Legacy of Leonhard Euler – A Tricentennial Tribute, Imperial College Press, S. 26.
  36. Ali Mason:Advanced Differential Equations. EDTECH, 1019,ISBN 1-83947-389-4,S. 67. 
  37. Karl Bosch:Mathematik für Wirtschaftswissenschaftler. 14. Auflage, Oldenbourg, 2003, S. 77
  38. Klaus Hefft:Mathematischer Vorkurs zum Studium der Physik. 2. Auflage. Springer, 2018, S. 97.
  39. Herbert Amann, Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 329.
  40. Herbert Amann, Joachim Escher:Analysis 1. 3. Auflage. S. 358.
  41. Herbert Amann, Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 330–331.
  42. T. Arens et al.:Mathematik. Spektrum, S. 304.
  43. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 32–33.
  44. Ernst Hairer, Gerhard Wanner:Analysis in historischer Entwicklung, Springer, S. 248.
  45. Herbert Amann, Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 335.
  46. Herbert Amann, Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 336.
  47. Herbert Amann, Joachim Escher:Analysis 1. 3. Auflage. Birkhäuser, S. 346.
  48. Terence Tao:Analysis II, Third Edition, Hindustan Book Agency, S. 64.
  49. Terence Tao:Analysis II, Third Edition, Hindustan Book Agency, S. 65.
  50. Jeremy Gray:The Real and the Complex: A History of Analysis in the 19th Century, Springer, S. 201.
  51. Eberhard Freitag, Rolf Busam:Funktionentheorie 1, 4. Auflage, Springer, S. 89.
  52. Eberhard Freitag, Rolf Busam:Funktionentheorie 1, 4. Auflage, Springer, S. 16 ff.
  53. Eberhard Freitag, Rolf Busam:Funktionentheorie 1, 4. Auflage, Springer, S. 35.
  54. Eberhard Freitag, Rolf Busam:Funktionentheorie 1, 4. Auflage, Springer, S. 42–43.
  55. Eberhard Freitag, Rolf Busam:Funktionentheorie 1, 4. Auflage, Springer, S. 45.
  56. abHerbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 157.
  57. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 158.
  58. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 159.
  59. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 165.
  60. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 154–157.
  61. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 158–163.
  62. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 173.
  63. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 175.
  64. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 177.
  65. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 192.
  66. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 230–232.
  67. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 176.
  68. Herbert Amann, Joachim Escher:Analysis 2. 2. Auflage. Birkhäuser, S. 188.
  69. abT. Arens et al.:Mathematik. Spektrum, S. 794.
  70. T. Arens et al.:Mathematik. Spektrum, S. 803.
  71. T. Arens et al.:Mathematik. Spektrum, S. 811.
  72. T. Arens et al.:Mathematik. Spektrum, S. 812.
  73. T. Arens et al.:Mathematik. Spektrum, S. 1193–1195.
  74. T. Arens et al.:Mathematik. Spektrum, S. 1196.
Dieser Artikel wurde am 18. April 2021 indieser Version in die Liste derexzellenten Artikel aufgenommen.
Normdaten (Sachbegriff):GND:4012252-9 (GND Explorer,lobid,OGND,AKS)
Abgerufen von „https://de.wikipedia.org/w/index.php?title=Differentialrechnung&oldid=254449709#Ableitungsfunktion
Kategorien:

[8]ページ先頭

©2009-2025 Movatter.jp