DasCopy-On-Write-Verfahren (kurzCOW bzw.CoW genannt,englisch wörtlich für „Kopieren-beim-Schreiben“) ist in derDatenverarbeitung eine Optimierungsmethode zur Vermeidung unnötiger Kopien und Kopiervorgänge, beispielsweise zwischenProzessen unterunixartigen Systemen, insbesondere bei oder nach einemfork-Systemaufruf.
Die Grundidee des Verfahrens ist, dass identische Daten mehrerer – anfangs ebenfalls identischer – Dateien nur einmal vorhanden sein müssen. Erstellt man also ein Duplikat einer vorhandenen Datei, so muss der Inhalt des Duplikats nicht gespeichert werden. Es genügt, den neuen Dateinamen und den Ablageort im Dateisystem vorzumerken. Erst wenn eine der duplizierten Dateien verändert wird, also einen neuen Inhalt bekommt, müssen die veränderten Datenblöcke bzw. gegebenenfalls die gesamte Datei getrennt gespeichert werden.[1] Der Kopie wird zwar eine eigeneInode zugewiesen, die darin gespeicherten Zeigerstrukturen, welche auf die Datenblöcke zeigen, stimmen allerdings mit denen des Originals überein. Erst bei Veränderung einer der Datenblöcke wird für die Änderung ein neuer Datenblock verwendet und der entsprechende Zeiger neu gesetzt. Bei nicht geänderten Datenblöcken können weiterhin die originalen Blöcke referenziert bleiben.
Wenn derKernel eineSpeicherseite imAdressraum eines anderenProzesses verfügbar machen muss, ist es nicht nötig, die Daten tatsächlich zu kopieren oder ein weiteres Mal imHauptspeicher anzulegen, wenn die Daten lediglich ausgelesen, aber nicht beschrieben werden. Es genügt, wenn erst einmal die beiden Prozesse auf ein und dieselbe Speicherseite zugreifen. Erst wenn einer der beiden Prozesse die Daten zu ändern versucht, müssen diese tatsächlich (und dann auch nur teilweise) kopiert werden, da sich die Inhalte der Speicherseiten dann unterscheiden.
Dies wird auf modernenHauptprozessoren meist mit Hilfe vonPaging realisiert, wobei die beiden Prozesse auf die gleiche Speicherseite zugreifen. Sowohl im Adressraum des Besitzers des Originals als auch in dem des Besitzers der Kopie wird dieser gemeinsame Speicherbereich als „nur lesbar“ markiert. Findet ein Schreibzugriff statt, wird dasBetriebssystem informiert, so dass dieses vor dem tatsächlichen Schreibzugriff die betroffene Speicherseite durch eine tatsächliche Kopie ersetzen kann.
BeiDateisystemen bedeutetCopy-On-Write, dass geänderteBlöcke nicht überschrieben, sondern zunächst vollständig an einen freien Platz kopiert werden.[2] Danach werden Verweise auf den Block in denMetadaten aktualisiert.Copy-On-Write ermöglichttransaktionsbasierende Dateisysteme, die unter anderem ohne VerzögerungSpeicherabbilder (oderSchnappschüsse derselben) anlegen können. Alte Metadaten und Blöcke werden dabei nicht gelöscht, sondern dem jeweiligen Speicherabbild zugeordnet.
ZFS,Btrfs,APFS[3],NILFS,Bcachefs sowieXFS[4] sind bekannte Vertreter von Dateisystemen, die aufCopy-on-Write bauen.