Datensatz

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springenZur Suche springen

EinDatensatz (anhören/?) ist (beispielsweise nach Mertens[1]) eine Gruppe von inhaltlich zusammenhängenden (zu einem Objekt gehörenden)[2]Datenfeldern, z. B. Artikelnummer und Artikelname. Datensätze entsprechen einer logischen Struktur, die bei derSoftwareentwicklung (z. B. im konzeptionellen Schema derDatenmodellierung) festgelegt wurde.[3]

In derDatenverarbeitung werden zu Datensätzen zusammengefasste Daten inDatenbanken oder inDateien gespeichert. Sie sind Gegenstand der Verarbeitung vonComputerprogrammen und werden von diesen erzeugt, gelesen, verändert und gelöscht (sieheCRUD). Bei derEingabe wird der Inhalt von Datensätzen oft in der Form einesFormulars dargestellt, bei derAusgabe oder Anzeige auch inListen­form, ggf. nur mit einem Teil der Datenfelder.

Auchnicht-elektronische Daten können zu Datensätzen zusammengefasst sein, zum Beispiel ist eineKarteikarte in einerKartei ein Datensatz.[4]

Neben der Bedeutung von „Datensatz“ im engeren Sinn – alsSammlung konkreter Daten (z. B. die Adressdaten von Kunde Müller) – wird der Ausdruck im Kontext der Softwareentwicklung auch alsTypbegriff bei derDeklaration von Daten verwendet; Beispiel: Datensatz ‚Adressdaten‘. Abhängig von den dabei angewendeten Methoden, Programmiersprachen etc. werden anstelle von ‚Datensatz‘ auchTermini wie Satz (englischRecord),Entitätstyp,Klasse,Tupel, Struktur,Verbund usw. benutzt. Deren logischer Aufbau wird im Rahmen des Konzeptionellen Schemas derDatenmodellierung festgelegt.[5]

Abgrenzung: Obwohl Daten eigentlich immer als Aneinanderreihung mehrererDatenelemente auftreten, nennt man nicht alle Erscheinungsformen von Daten ‚Datensatz‘, sondern nur Datengruppierungen, die zu einem bestimmten Objekt gehören und die innerhalb einesDatenbestands identische Strukturen aufweisen. Die Datenfelder ‚Name‘, ‚Adresse‘ und ‚Geburtsdatum‘ könnten also einen Datensatz zu einer Person bilden.Nicht als Datensätze in diesem Sinn gelten zum Beispiel:Fließtexte, Drucker- oder Video-Datenströme, Inhalte vonausführbaren Dateien, Fotodaten oder die Daten vonGrafiksoftware.

Inhaltsverzeichnis

Abweichende Bedeutung in der Statistik

[Bearbeiten |Quelltext bearbeiten]

Zusammenfassend bezeichnet der Datensatz in derInformatik – wie oben beschrieben – eine eindimensionale, strukturierte Folge vonAttributeneines Elements einer übergeordneten Menge (z. B. eine Karteikarte einer Kartei, eine Bestellung einer Datenbank für Bestellungen, eine Zeile einer Adressliste).

Dagegen bezeichnet der Datensatz in derStatistik dieGesamtheit von Daten in einem bestimmten Zusammenhang. Hier ist er also gleichbedeutend mitDatenbestand (ein Satz bzw. eine Sammlung von Daten, auch aus der Übersetzung vonData Set, früher bei IBM fürDatei verwendet[6]) – beispielsweisealle in einer statistischenErhebung ermittelten Daten oder die „Steuersünder-CD“.[7]

Varianten bei der Speicherung

[Bearbeiten |Quelltext bearbeiten]

Im Allgemeinen entspricht ein Datensatz, mit den Ausdrucksmitteln vonProgrammiersprachendeklariert, demDatentypVerbund bzw. Record, ggf. innerhalb einesassoziativen Arrays. Das mathematische Modell eines Datensatzes ist einTupel.

Bezüglich der Speicherung von Datensätzen lassen sich zahlreiche Unterscheidungen treffen. Zum Beispiel:

  • Speicherung in normalenDateien: Hier bieten sich Alternativen wie:
    • Benutzerdefinierte individuelle Datenformate und -strukturen,
    • CSV-Dateien mit Feldtrennzeichen wie Strichpunkt o. ä.,
    • XML-Format in der Form <Feldname = Feldinhalt> und mit weiteren strukturbezogenen, textlich formulierten Informationen,
    • RDF-Format für Internet-Informationen.
  • Speicherung in Datenbanken:
    • Inrelationalen Datenbanken werden Datensätze in Tabellenform gespeichert, wobei ein Datensatz i. d. R. einer Tabellenzeile entspricht.
    • Spaltenorientierte Datenbanken speichern nicht alle Datenfelder je Datensatz hintereinander, sondern für jedes Datenfeld die Inhalte aller Datensätze, eine Spalte (mit all ihren Zeilen) steht hier also für 'Datensatz'.[8]

Im Detail ist ‚Datensatz‘ jedoch kein technischer, sondern ein logischer Begriff, für den es zahlreiche technische Erscheinungs- und Implementierungsfomen gibt. Dabei können Datensätze nach den folgenden Merkmalen/Eigenschaften unterschieden werden:

  • Allgemeingültigkeit: Verbindlich festgelegte Strukturen und Formate (wie binäre Daten oder Text, Länge, sonstige Regeln), z. B. für bestimmteSoftwarelösungen (wie beimDTA-Verfahren) vs. individuell vomAnwender definierte Formate.
  • Satz-/Datenfeldlänge: Fixe und einheitliche Länge je Feld vs. variabel lange Felder (z. B. mit Feldtrennzeichen wie bei CSV oder mit Feldlängenangabe); führt entsprechend zu Datensätzen mit fixer oder variabler Länge.
  • VerwendeteZeichenkodierung: Nur Textzeichen z. B. imASCII-Code vs. andere Datentypen in einemBinärcode.
  • Feldattribute: Nur Nettodaten vs. weitere Informationen je Feld (wie fett, unterstreichen, Schrifttyp usw., meist nicht sichtbar).
  • Datensatzbegrenzung: Satzende-Kennzeichnung vs. feste Satzlänge.
  • Homogenität: Einheitliche vs. unterschiedliche Datenarten in derselben Datei, erkennbar z. B. durch ein Datenfeld ‚Satzart‘.

In Anwendungen zurTabellenkalkulation wird ein Datensatz meist durch eine Zeile, je nach Anordnung alternativ durch eine Spalte repräsentiert. Ein klassisches Beispiel für einen Datensatz ist eineLochkarte.

Für elektronische Daten gilt: Sie existieren in ihrem Speichermedium als Bit-/Bytefolgen beliebiger Länge. In dieser Datenmenge werden die einzelnen Datensätze und Datenfelder durch meist von derProgrammiersprache und/oder derSystemsoftware bereitgestellte Verfahren identifiziert und adressiert und zum Beispiel in Zeilen und Spalten dargestellt.

Logische/physische Datensätze: Auf elektronischenDatenträgern werden in der Regel mehrere Datensätze zu größeren Speichereinheiten zusammengefasst. Solche Einheiten werden je nach Computersystem unterschiedlich bezeichnet, zum Beispiel als ‚Page‘ (Seite, bei vielen Datenbanksystemen) oder als Block (bei konventioneller Speicherung).[9] In einem Computerprogramm sind der Verarbeitung des einzelnen Datensatzes Routinen vorgeschaltet (meist desBetriebssystems oder desDBMS), die das tatsächliche Lesen oder Schreiben auf dem Datenträger aus Optimierungsgründen block-/seitenweise durchführen und den jeweils einzelnen Datensatz innerhalb des Datenblocksiterativ positionieren und zur Verarbeitung imHauptspeicher bereitstellen.

Siehe auch

[Bearbeiten |Quelltext bearbeiten]

Einzelnachweise

[Bearbeiten |Quelltext bearbeiten]
  1. P. Mertens et al.:Grundzüge der Wirtschaftsinformatik. 5. Auflage. Springer Verlag, Berlin 1998, S. 59
  2. Datensatz. In: GablerWirtschaftslexikon
  3. Henry Herper: Informatisches Modellieren. (PDF) Uni Magdeburg, 2004, abgerufen am 11. März 2014. 
  4. Datensatz. Fremdwort.de
  5. Dr. Henry HerperInformatisches Modellieren[1]Seite 46 Datenmodellierung - Schichtenmodell (2004)
  6. TechtargetWhatIs.com/de[2]Datensatz
  7. Anzahl der Dokumenten- und Datensätze im Berliner Datenportal (PDF; 149 kB)
  8. Zeilen- und spaltenorientierte Datenbanken. Eliteinformatiker
  9. Sebastian Dworatschek:Grundlagen der Datenverarbeitung.books.google.de Kap. 1.2.1Logische und physische Sätze
Normdaten (Sachbegriff):GND:4011133-7(lobid,OGND,AKS)
Abgerufen von „https://de.wikipedia.org/w/index.php?title=Datensatz&oldid=252539619
Kategorien:
Versteckte Kategorie: