EineDatei (englischfile) ist in derInformationstechnologie die Zusammenfassung gleichartigerdigitaler Daten, die zumSpeichern aufDatenträgern oderSpeichermedien, zurWiedergabe, zumBearbeiten und zurDatenübertragung dient und durch einenDateinamen identifiziert wird.
Das Wort „Datei“ ist nicht erst durch die Informationstechnologie entstanden, sondern war auch bereits zuvor bekannt. DemDuden zufolge ist die Datei ein „nach zweckmäßigen Kriterien geordneter, zur Aufbewahrung geeigneter Bestand an sachlich zusammengehörenden Belegen oder anderen Dokumenten.“[1] Das Wort „Datei“ ist einNeologismus ausDaten undKartei,[2] weil eine Kartei vergleichbar ausKarteikarten mit einheitlicher Inhaltsstruktur besteht.[3] Der deutsche Begriff „Datei“ ist deutlich enger gefasst als die englische Übersetzung (englischfile), welche oft auch eine (Papier-)Akte, eine (Papier-)Kartei oder einenKarteikasten beschreibt. Gegebenenfalls ist eine Präzisierung aufenglischdata file oderenglischcomputer file notwendig.
In der Informationstechnologie ist die Datei eine Menge zusammengehörigerInformationen, die in einemComputer oder auf einem Datenträger unter einem Dateinamen so gespeichert sind, dass sie von einemBetriebssystem oder einem geeignetenComputerprogramm erschlossen werden können.[4] Es handelt sich um die Zusammenfassung gleichartigerDaten zum Zweck der gemeinsamen Handhabung. Die Datei wird oft inDatensätze unterteilt, um die Übersicht zu erhalten.[5]
Nach demVerwendungszweck kann unterschieden werden zwischen:[6]
Nach derAusführbarkeit wird unterschieden zwischen
Wegen des unterschiedlichen Inhalts und der technisch unterschiedlichenWiedergabe weisen diese Dateien verschiedeneDateiformate auf.
Moderne Dateisysteme unterstützen auch sogenannteSparse-Dateien: Nur mit Daten gefüllte Abschnitte einer (großen) Datei werden tatsächlich gespeichert; die dazwischen liegenden „freien Bereiche“ werden nicht gespeichert und als „mit Null-Bytes gefüllt“ angenommen/bewertet.
Manche Dateisysteme bieten ferner an, Dateien transparent zukomprimieren oder zuverschlüsseln („transparent“: Das lesende/bearbeitende Programm kann die Datei normal verwenden, als ob die Datei nicht komprimiert/verschlüsselt wäre – es „sieht durch diesen Vorgang ungestört hindurch“).
Möglichkeiten, das Dateiformat zu kennzeichnen, beinhalten
Eine solche Kennzeichnung ist teilweise obligatorisch, teilweise dient sie lediglich der Orientierung des Benutzers. Oft fehlen Kennzeichnungen jeder Art; für solche Situationen gibt es spezielle Programme, die den Typ einer Datei zu bestimmen versuchen. Im Unix-Umfeld ist dafür z. B. der Befehlfile sehr verbreitet.
Auch über denInternet Media Type bzw. kurz „MIME-Typ“ kann festgestellt werden, um welches Dateiformat es sich bei einer Datei handelt. Der MIME-Typ kann in erweiterten Dateiattributen oder alternativen Datenströmen gespeichert werden, lässt sich aber auch aus dem Dateiinhalt (Magische Zahl) ermitteln.
In der elektronischen Datenverarbeitung ist die Datei eine Menge vonDatensätzen mit identischem oder kompatiblenDatenformat, die innerhalb einesDatenspeichers fixiert und nach einem Ordnungsmerkmal geordnet sind.[7] Mit dem Begriff „Datei“ wird auch ausgedrückt, dass sich die Datenbestände auf einem maschinenlesbaren Datenträger befinden.[9]
- Dateiinhalt
DerInhalt jeder Datei ist zunächst eine eindimensionale Aneinanderreihung vonBits, die normalerweise inDatenblöcken zusammengefasst interpretiert werden. Erst der Anwender einer Datei bzw. einAnwendungsprogramm oder das Betriebssystem selbst interpretieren diese Bit- oder Bytefolge beispielsweise als einausführbares Programm, einBild einenText oder eineTonaufzeichnung. Eine Datei besitzt also einDateiformat.
- Dateiformate
Die vom Nutzer angelegten Dateien lassen sich im Hinblick auf die gespeicherten Inhalte wie folgt einteilen:[10]
Das Anwendungsprogramm identifiziert den jeweiligen Dateityp an der Dateiendung, die hinter dem Dateinamen von diesem durch einen Punkt getrennt ist. An der Dateiendung lässt sich für den Nutzer meist erkennen, welche digitalen Daten gespeichert sind und für welches Programm sie angelegt wurde. Dateiendungen.bat (Batch-Datei) oder.sys (Systemdatei) dienen dem Betrieb eines Computers und werden direkt vom Betriebssystem geladen und ausgeführt.
- Aufbau
Eine Datei setzt sich allgemein zusammen aus demDateikopf und dem eigentlichen Dateiinhalt. Im Dateikopf (englischheader) befinden sich gegebenenfallsMetadaten (insbesondere Steuerinformationen und Eigenschaften) über die enthaltenen Daten.
- Dateimanager
Dateien werden von einemDateimanager eines Betriebssystems verwaltet. Es handelt sich um ein Computerprogramm, mit dem Dateien undVerzeichnisse verwaltet werden können.[11] In grafischen Dateimanagern wieFinder,Windows-Explorer,Nautilus oderDolphin werden Dateien gewöhnlich als Liste oder Symbole auf einem Arbeitsblatt (Fenster, Ordner u. a.) dargestellt.
- Dateiverknüpfung
EineDateiverknüpfung ist eineVerknüpfung, die auf eine andere Datei oder ein Verzeichnis verweist.
- Speichern
DasSpeichern einer Datei geschieht mit Hilfe einesDatenspeichers, der ein bestimmtes Dateiformat unterstützt. Dazu wird dasMenü „Speichern“ ausgewählt, das für die Speicherung sorgt.[12] Moderne Betriebssysteme ordnen über das DateiformatAnwendungen zu, welche die Dateien interpretieren können. Die Speicherung kann auf einem Datenträger oder derFestplatte erfolgen.
- Wiedergabe
Die Wiedergabe kann entweder auf einemComputer oder durch spezifische, vom Dateiformat abhängigeWiedergabegeräte erfolgen.
- Datenübertragung
Für dieDatenübertragung über dasInternet zerlegt dasTransmission Control Protocol (TCP) eine zu versendende Datei in einzelne kleinereDatenpakete und versendet diese getrennt voneinander. Dabei kann ein Datenpaket verschiedeneKnotenpunkte im Internet (wieHostrechner,Server) durchlaufen, weil an jedem Knotenpunkt der optimale Weg für das Paket neu bestimmt wird.[13] Da unterwegs die ursprünglicheReihenfolge nicht eingehalten werden muss, hat das TCP auch die Aufgabe, die ursprüngliche Reihenfolge beim empfangendenEndgerät wiederherzustellen. DasInternet Protocol (IP) regelt die korrekteAdressierung der Datenpakete, damit die im Internet angeschlossenen Computer eindeutig identifiziert werden können.[13] Die Datenübertragung derdigitalen Daten beginnt mit dem Upload beimAbsender und endet mit dem Download beimEmpfänger.
- Datenkompression
Bei großenDatenmengen ist eineDatenkompression möglich, um den Speicherplatz zu minimieren.
- Dateikonverter
Dateikonverter dienen dazu, eine Datei in ein anderes Dateiformat umzuwandeln als dem Ursprungsformat.
Dateien werden in den meisten Betriebssystemen überDateisysteme verwaltet. Ein Dateisystem verwaltet das Speichermedium, indem in Listen vermerkt wird, welche Bereiche des Mediums durch welche Dateien belegt sind, welche Bereiche frei sind, sowie oftProtokolle zu geplanten und/oder abgeschlossenen Änderungen.
Obwohl eine Aufgabe des Dateisystems darin besteht, vom konkreten Speichermedium zu abstrahieren („alle gleich zu behandeln“), sind doch viele Dateisysteme an die üblichen technischen Eigenschaften der Speichermedien angepasst (z. B. Blockgröße 512 Byte fürFestplatten).
Für die meisten Dateisysteme ist 1 Byte die kleinste Verwaltungseinheit, d. h., die Länge des Dateiinhalt-Bitstroms muss auf ganze Bytes aufgehen (wobei im Allgemeinen auch 0 Byte = 0 Bit erlaubt sind).
Das Dateisystem verwaltet nebenVerzeichnissen mit Dateinamen und -speicherort fast immer noch weitereDateiattribute. Zu diesen gehören häufig derDateityp (Verzeichnis, normale Datei, spezielle Datei), die Dateigröße (Anzahl der Bytes in der Datei),Schreib- und Leserechte,Zeitstempel („Datum“, der Erzeugung, des letzten Zugriffs und der letzten Änderung) sowie gegebenenfalls noch andere Informationen. Eine Datei kann in vielen Dateisystemen durch ein Attribut alsversteckte Datei gekennzeichnet werden.
Die in Dateinamen verwendbaren Zeichen sind abhängig von Dateisystem, Betriebssystem und gegebenenfalls Sprachoptionen. Beispielsweise dürfen beiUnix-kompatiblen Dateisystemen in einem Dateinamen keinSchrägstrich/ und keinNullzeichen stehen. Bei anderen Betriebssystemen sind wiederum unterschiedliche Zeichen im Dateinamen nicht erlaubt. Oft ist das jedoch keine Einschränkung des „physischen“ Dateisystems, da bei Verwendung desselben Dateisystems auf einem anderen Betriebssystem diese Zeichen normal gespeichert werden können. Der Zugriff auf derartige Dateien ist dann wegen des unzulässigen Dateinamens auf dem jeweils anderen Betriebssystem üblicherweise nicht möglich, wodurch auch keine Möglichkeit besteht, die Datei umzubenennen oder zu löschen. Auch können die Zeichen unterschiedlich codiert sein, sodass das Betriebssystem auch verwendetenZeichensatz für die Dateinamen unterstützen muss, um diese richtig anzuzeigen.Unicode wird von vielenhistorischen Betriebssystemen und manchen damit verbundenen Dateisystemen nicht unterstützt. Ferner ist die Länge des Dateinamens z. B. bei Unix-artigen Systemen auf 255 Zeichen begrenzt. Derartige Begrenzungen finden sich sowohl in den Strukturen des Dateisystems als auch im Betriebssystem selbst, das diese verarbeitet. Zusätzlich dazu haben Betriebssysteme auch ein Limit für den gesamten Dateipfad inklusive Dateinamen – ist dieser unterschiedlich von einem Betriebssystem zum anderen, kann beim Datenaustausch der Zugriff auf Dateien in zu langen Pfaden scheitern.
Dateien ermöglichen einen einfachen Austausch der Daten mit anderen Programmen, Prozessen oder anderen Nutzern. Alternative Methoden zu Datenablage und -austausch sindDatenbanken und zunehmend auchcloudbasierte Speicher, die die Daten meist ebenfalls als Dateien verwalten.
Bei Anwendungsprogrammen werden oft Dateien automatisch beim Start eingelesen (z. B.Voreinstellungen,Konfiguration) und/oder der Nutzer wählt explizit eine zu „ladende“ Datei. Beispielsweise kann ein Text unter einem Namen (der „Dateiname“) in einem Datei-Verwaltungssystem („Dateisystem“) auf einem Datenträger abgelegt sein und durch einTextverarbeitungsprogramm nach dem Laden durch den Benutzer bearbeitet werden. Wenn der Benutzer den Befehl zur Speicherung auslöst, werden die Daten (hier der Text) in der Datei auf dem Speichermedium aktualisiert und die alte Version damit überschrieben. Mitunter bieten Programme weitere Möglichkeiten im Umgang mit Dateien:
- Das „Speichern als“ dient der Speicherung unter neuem Namen, auf anderem Datenträger oder in einem anderen Dateiformat;
- Datenverlust kann ggf. vermieden werden durch regelmäßige automatische Zwischenspeicherung;
- Warnung beim Beenden des Programms ohne vorheriges Speichern der Daten;
- regelmäßiges automatisches Speichern jeglicher Änderungen in der Cloud;
- gleichzeitiges Bearbeiten der Datei mit anderen Benutzern.
Mitunter können auch Metadaten in der Datei selbst einem Datenverlust vorbeugen.
Eine Datei besitzt eine innere Struktur sowie externe Attribute bzgl. ihrer Speicherung. Die innere Struktur – das Datenformat – wird meist allein von dem Programm kontrolliert, welches diese Datei speichert und bearbeitet. Die externen Attribute sind vor allem ein Name, der auch der Verwaltung der Ablage dient, sowie allgemeine Attribute für Dateien beliebigen Typs; diese werden meist von dem Dateisystem als Teil des Betriebssystems kontrolliert. Dateien machen Daten leicht kopierbar und transportabel. Hiermit wird ein Datenaustausch möglich, der unabhängig von den eigentlichen Programmen zur Bearbeitung der Daten ist.
- ↑Duden – Deutsches Universalwörterbuch. 9., vollständig überarbeitete und erweiterte Auflage. Cornelsen Verlag GmbH, 2019,ISBN 978-3-411-05509-8,S. 404 (eingeschränkte Vorschau in der Google-Buchsuche).
- ↑Dietmar Strauch, Margarete Rehm:Lexikon Buch – Bibliothek – Neue Medien. K. G. Saur Verlag, 2007,ISBN 978-3-598-11757-2,S. 124 (eingeschränkte Vorschau in der Google-Buchsuche).
- ↑Elke Lang, Andreas Bohne-Lang:Praxisbuch IT-Grundlagen für Bibliothekare. Walter de Gruyter GmbH, 2019,ISBN 978-3-11-052587-8, 2.2 Datenmodellierung im Entity-Relationship-Modell: Relationale Datenbanken,S. 107 (eingeschränkte Vorschau in der Google-Buchsuche): „So wie eine Kartei aus einer Menge von Karteikarten zusammengestellt ist und normalerweise in einem Karteikasten zusammengefasst aufbewahrt wird, sind auch die Daten in einer Datei strukturiert.“
- ↑Detlef Jürgen Brauner, Robert Raible-Besten, Martin M. Weigert:PC-Anwender-Lexikon. R. Oldenbourg Verlag, 1999,ISBN 3-486-24710-7,S. 100 f. (eingeschränkte Vorschau in der Google-Buchsuche):file, eine Reihe von zusammengehörigen Informationen, die in einem Computer bzw. auf einem Datenträger unter einer eigenen Bezeichnung (→Dateiname) so abgespeichert sind, daß sie von einem dafür geeigneten Programm (oder dem Betriebssystem) erschlossen werden können.
- ↑Vieweg Lexikon Technik; Maschinenbau, Elektrotechnick, Datentechnik; Nachschlagewerk für berufliche Aus-, Fort- und Weiterbildung. 1. Auflage. Freidr. Vieweg & Sohn Verlagsgesellschaft mbH, 1997,ISBN 3-528-04959-6,S. 80 (eingeschränkte Vorschau in der Google-Buchsuche): „Die Datei wird oft in Datensätze unterteilt, um die Übersicht zu erhalten.“
- ↑Lutz Heinrich, Armin Heinzl, Friedrich Roithmayr:Wirtschaftsinformatik-Lexikon. 7., vollständig überarbeitete und erweiterte Auflage. Oldenbourg Wissenschaftsverlag, 2004,ISBN 3-486-27540-2,S. 165 (eingeschränkte Vorschau in der Google-Buchsuche): „Nach dem Verwendungszweck der D. wird zwischen Stammdatei, Bewegungsdatei, Ausgabedatei (Berichtsdatei), Arbeitsdatei und Programmdatei unterschieden.“
- ↑abDietmar Strauch/Margarete Rehm,Lexikon Buch - Bibliothek - Neue Medien, 2007, S. 124
- ↑Computerlexikon.de,Stichwort: Temporäre Dateien
- ↑Ernst Tiemeyer:Bürotechnik und EDV für Rechtsanwalts- und Notargehilfen. Betriebswirtschaftlicher Verlag Dr. Th. Gabler GmbH, 1984,ISBN 3-409-19702-8, 2.3.3.1 Organisation der Datenspeicherung,S. 54 (eingeschränkte Vorschau in der Google-Buchsuche): „Der Begriff Datei wurde der Kartei nachempfunden und soll ausdrücken, daß sich die Datenbestände auf einem maschinenlesbaren Datenträger (einem externen Speichermedium) befinden und deshalb unmittelbar für eine automatisierte Verarbeitung zur Verfügung stehen.“
- ↑Detlef Jürgen Brauner, Robert Raible-Besten, Martin M. Weigert:Internet-Lexikon. R. Oldenbourg Verlag, 1997,ISBN 3-486-24170-2,S. 80 (eingeschränkte Vorschau in der Google-Buchsuche).
- ↑Christoph Prevezanos:Computer Lexikon 2011. Markt+Technik Verlag, 2010,ISBN 978-3-8272-4659-2,S. 213 (eingeschränkte Vorschau in der Google-Buchsuche): „Ein Dateimanager ist ein Programm, mit dem Dateien und Verzeichnisse verwaltet werden können. Er ist Bestandteil eines Betriebssystems (z. B.Windows Explorer). Dateimanager werden aber auch von Drittherstellern angeboten (z. B.Norton Commander).“
- ↑Martin Evening:Adobe Photoshop für Fotografen – Handbuch für professionelle Bildgestalter. Addison-Wesley, 2006,S. 30 (eingeschränkte Vorschau in der Google-Buchsuche): „Das Speichern einer Datei ist sehr einfach, allerdings sind einige Dinge zu beachten. Wenn Sie Datei/Speichern wählen, erstellen Sie immer ein sicheres Backup Ihres Bilds. Achten Sie dabei aber unbedingt darauf, dass Sie nicht das Original überschreiben.“
- ↑abSiegfried G. Häberle:Das neue Lexikon der Betriebswirtschaftslehre, Band A–E. Oldenbourg Wissenschaftsverlag GmbH, 2008,ISBN 978-3-486-58305-2,S. 1247 f. (eingeschränkte Vorschau in der Google-Buchsuche): „Das TCP zerlegt die zu versendende Datei in einzelne kleine Pakete und verschickt diese getrennt voneinander über das Internet. … Auf Grund der möglichen unterschiedlichen Wege der einzelnen Datenpakete erreichen sie den Zielrechner in der Regel nicht in der ursprünglichen Reihenfolge. Daher besteht eine weitere Aufgabe des TCP darin, die Datenpakete wieder in der ursprünglichen Reihenfolge zusammenzusetzen.“