Suchbaum

aus Wikipedia, der freien Enzyklopädie

Zur Navigation springen Zur Suche springen

In derInformatik ist einSuchbaum eineabstrakte Datenstruktur, bei der dieMenge von Elementen, in der gesucht werden soll, in einerBaumstruktur dargestellt wird.Wie einassoziatives Datenfeld oder eineHashtabelle realisiert er eine endlicheFunktion (englisch:map), bei der aus einemSuchschlüssel (aus der endlichenDefinitionsmenge) ein Datenwert (aus derWertemenge) gewonnen wird. Bei fehlender Wertemenge realisiert der Baum eineIndikatorfunktion, entspricht also einer endlichen Menge (englisch:set).

Aus Effizienzgründen besitzt die Menge allermeist einetotale Quasiordnung, die auch eineTotalordnung sein kann. Dieser Ordnung entspricht im Baum eine Links-Rechts-Orientierung auf folgende Weise: »links« von einem Knoten gibt es keine größeren Elemente und »rechts« keine kleineren. Dadurch wird in Form des„binären Suchens“ ein Prinzip namens„Teile und herrsche“ möglich, welches Suchzeiten erlaubt, dielogarithmisch in der Anzahl der Suchschlüssel sind.

Es gibt Suchbäume sowohl in statischer (unveränderlicher) wie in dynamischer (durch Einfügen und Löschen von Elementen veränderbarer) Ausprägung, für welche sich dieBaumstruktur besonders gut eignet.

Operationen

[Bearbeiten |Quelltext bearbeiten]

Die charakteristischeOperation ist dasSuchen. Die meisten anderen Operationen, wieEinfügen,Löschen,Traversieren werden von der unterliegendenBaumstruktur geerbt.

Die Suchoperation gibt ein Element mit übereinstimmendem Schlüssel zurück oder, falls der Schlüssel nicht vorkommt, das NULL-Element oder ein im Sinne derTotalordnung nächstgelegenes anderes Element.

Der maximale Aufwand für das Suchen, d. h. die Maximalzahl der erforderlichen Vergleiche, ist bei vorliegenderTotalordnung proportional zurBaumhöhe $h {\displaystyle h}$ . Ein Baum wirdbalanciert genannt, wenn dafür Sorge getragen ist, dass $h {\displaystyle h}$ stets logarithmisch in der Anzahl $n {\displaystyle n}$ der Elemente ist. Ohne solche Vorkehrung kann der Suchbaumentarten bis zum ungünstigen Fall, dass der Suchaufwand proportional wird zu $n {\displaystyle n}$ .

Spezielle Suchbäume

[Bearbeiten |Quelltext bearbeiten]

Binärer Suchbaum

[Bearbeiten |Quelltext bearbeiten]

Einbinärer Suchbaum ist eine knotenbasierteDatenstruktur, in der jederKnoten einen Schlüssel und maximal zweiTeilbäume enthält, den linken und den rechten. Alle Schlüssel des linken Teilbaums sind kleiner als der Schlüssel des Knotens und die des rechten Teilbaums größer. Jeder Teilbaum ist ein binärer Suchbaum. Es sind viele Varianten entwickelt worden, die der Degeneration entgegenwirken sollen.

DieZeitkomplexität für die Suche in einembinären Suchbaum ist imWorst Case die Höhe desBaums, die für einen Baum mit $n {\displaystyle n}$ Elementen so klein wie ${\mathcal {O}}(\log \ n)$ sein kann.

KeineBinärbäume sind folgende Suchbäume:

B-Baum

[Bearbeiten |Quelltext bearbeiten]

B-Bäume sind Verallgemeinerungen vonbinären Suchbäumen, da sie an jedemKnoten eine variable Anzahl vonTeilbäumen haben können. Während untergeordnete Knoten einen vordefinierten Bereich haben, werden sie nicht unbedingt mit Daten gefüllt, was bedeutet, dass B-Bäume möglicherweise etwas Platz verschwenden können. Der Vorteil ist, dass B-Bäume nicht so häufig rebalanciert werden müssen wie andere selbst-balancierende Bäume.

Aufgrund des variablen Bereichs ihrer Knotenlänge sindB-Bäume für Systeme optimiert, die große Datenblöcke lesen. Sie werden auch häufig inDatenbanken verwendet.

DieZeitkomplexität für die Suche in einemB-Baum beträgt ${\mathcal {O}}(\log \ n)$ .

(a, b)-Baum

[Bearbeiten |Quelltext bearbeiten]

Ein(a, b)-Baum ist ein Suchbaum, in dem alleBlätter die gleiche Tiefe haben. JederKnoten hat mindestens einen und höchstens $b {\displaystyle b}$ Nachfolger, während die Wurzel mindestens 2 und höchstens $b {\displaystyle b}$ Nachfolger hat.

$a {\displaystyle a}$ und $b {\displaystyle b}$ können mit folgender Formel bestimmt werden:^[1]

2\leq a\leq {\frac {(b+1)}{2}}

DieZeitkomplexität für die Suche nach einem(a, b)-Baum beträgt ${\mathcal {O}}(\log \ n)$ .

Ternärer Suchbaum

[Bearbeiten |Quelltext bearbeiten]

Ein ternärer Suchbaum ist eineDatenstruktur in Gestalt einesPräfixbaums, in der die Folgeknoten^[2] entsprechend derOrdnungsrelation geordnet sind.

Jeder Knoten in einem ternären Suchbaum enthält 3Zeiger:

Der mittlere Zeiger zeigt auf den Knoten, mit dessenWert, dem aktuellen, sich die Zeichenkette fortsetzt.
Der linke Zeiger zeigt auf einen Knoten, dessenWert kleiner ist als der aktuelleWert.
Der rechte Zeiger zeigt auf einen Knoten, dessenWert größer ist als der aktuelleWert.

Zusätzlich zu den drei Zeigern hat jeder Knoten ein Feld zum Markieren des Endes einerZeichenkette und ggf. ein Feld für weitere Benutzerdaten.

Die untenstehende Grafik zeigt einen ternären Suchbaum, der die Zeichenketten „cute“, „cup“, „at“, „as“, „he“, „us“ und „v“ enthält. Dabei ist das Ende einer Zeichenkette durch Unterstreichung des letzten Zeichens markiert:

          c        / | \       a  u  h       |  |  | \t  te  u     /  / |     | \spesv

Beim Suchen in einem ternären Suchbaum wird der Suchschlüssel als eine Zeichenkette übergeben, für die getestet wird, ob einPfad sie enthält.

DieZeitkomplexität für die Suche in einem ausgeglichenen ternären Suchbaum beträgt ${\mathcal {O}}(\log \ n)$ .^[3]

Weitere auf Bäumen basierende Suchstrukturen

[Bearbeiten |Quelltext bearbeiten]

Obwohlkomplexitätstheoretische Angabenasymptotisch zu verstehen sind, lassen sie sich am ehesten in die Praxis übertragen, wenn die gesamte Datenstruktur in einem gleichförmigen Medium, z. B. demArbeitsspeicher (Hauptspeicher), untergebracht werden soll.

Spielen dagegen Zugriffe zu externenMedien eine Rolle, kommen weitergehende Überlegungen ins Spiel. Im Kontext der Suchbäume sei verwiesen auf die Artikel:

Speicherkomplexität

[Bearbeiten |Quelltext bearbeiten]

Der Speicherverbrauch eines Suchbaums ist – zusätzlich zu den Nutzdaten – im Allgemeinen linear in der Anzahl $n {\displaystyle n}$ der Elemente, also in ${\mathcal {O}}(n)$ .

Laufzeitkomplexität

[Bearbeiten |Quelltext bearbeiten]

Bei derLaufzeit unterscheidet manOperationen zum Suchen, Einfügen und Löschen. Bei den letzteren beiden ist in der Tabelle die Laufzeit für das Positionierennicht mit eingerechnet, da dies nicht nur über das Suchen, sondern z. B. auch über dasTraversieren geschehen kann. Abhängig von der Art des Suchbaums werdenasymptotische mittlere $<$ maximale (worst case) Laufzeiten gegenübergestellt, wobei die maximale weggelassen ist, wenn sie mit der mittleren übereinstimmt.

Laufzeitkomplexitäten
Suchbaum	Suchen (=Baumhöhe)	Traversieren zum Nachbarknoten	Einfügen	Löschen
AVL-Baum	${\mathcal {O}}(\log n)$	${\mathcal {O}}(1)\!<\!{\mathcal {O}}(\log n)$	${\mathcal {O}}(1)\!<\!{\mathcal {O}}(\log n)$	${\mathcal {O}}(1)\!<\!{\mathcal {O}}(\log n)$
Rot-Schwarz-Baum	${\mathcal {O}}(\log n)$	${\mathcal {O}}(1)\!<\!{\mathcal {O}}(\log n)$	${\mathcal {O}}(1)\!<\!{\mathcal {O}}(\log n)$	${\mathcal {O}}(1)\!<\!{\mathcal {O}}(\log n)$
2-3-4-Baum	${\mathcal {O}}(\log n)$		${\mathcal {O}}(\log n)$	${\mathcal {O}}(\log n)$
B-Baum	${\mathcal {O}}(\log n)$		${\mathcal {O}}(\log n)$	${\mathcal {O}}(\log n)$
Splay-Baum	${\mathcal {O}}(\log n)$ ¹ $\!<\!{\mathcal {O}}(n)$	${\mathcal {O}}(1)\!<\!{\mathcal {O}}(n)$	${\mathcal {O}}(\log n)$ ¹ $\!<\!{\mathcal {O}}(n)$	${\mathcal {O}}(\log n)$ ¹ $\!<\!{\mathcal {O}}(n)$
binärer Suchbaum	${\mathcal {O}}(\log n)$ ² $\!<\!{\mathcal {O}}(n)$	${\mathcal {O}}(1)\!<\!{\mathcal {O}}(n)$	${\mathcal {O}}(1)$	${\mathcal {O}}(\log n)$ ² $\!<\!{\mathcal {O}}(n)$
¹ Abhängig vom Zugriffsmuster der Anwendung können bei Splay-Bäumen auch unterlogarihmische mittlereLaufzeiten vorkommen. ² Unter den unbalanciertenbinären Suchbäumen gibt esBäume, bei denen ${\mathcal {O}}(\log n)$ nicht garantiert werden kann. Die Angabe ${\mathcal {O}}(\log n)$ gilt jedoch im Mittel über alle möglichen Baumformen hinweg.

Neben den vorgenanntenOperationen kommen weitere in Betracht:

Zugriff auf spezielle Elemente, wie z. B. das kleinste Element
Verschmelzen von Suchbäumen

Laufzeitmessungen einigerSuchalgorithmen anhand realistischer Beispiele sind zu finden beiBen Pfaff.

Siehe auch

[Bearbeiten |Quelltext bearbeiten]

Effizienz (Informatik)

Literatur

[Bearbeiten |Quelltext bearbeiten]

Alexander Reinefeld:Spielbaum-Suchverfahren. (=Subreihe Künstliche Intelligenz. Band 200). Springer, 1989,ISBN 3-540-50742-6.
A. Banzhaf, U. Boes, M. Kramer:Steuerung von Erkennungsprozessen durch Baumsuchverfahren. In: H. Burkhardt, K. H. Höhne, B. Neumann (Hrsg.):Mustererkennung. (=Informatik-Fachberichte. Band 219). Springer, Berlin/ Heidelberg 1989,ISBN 3-540-51748-0.