Internet Archive är enwebbplats med ettarkiv som är tillgängligt överInternet. I webbplatsen ingårWayback Machine med arkiverade kopior av olika webbplatser från 1996 och framåt, samt arkiverade ljudband, datorprogram och filmer, som antingen inte har upphovsrätt eller har enCreative Commons-licens.
I Internet Archive samlas även digitaliserade böcker från ett flertal olika bibliotek samt från många specialsamlingar. I oktober 2008 hade Internet Archive 18 platser i fem länder där inskanning av böcker pågick. Sammantaget skannades cirka 1 000 böcker per dag. Arbetet finansieras av bibliotek ochstiftelser och tidigare även avMicrosoft.[2] Internet Archive samlar till skillnad från exempelvisGoogle Book Search (Google böcker) endast böcker som är ipublic domain eller från vilka de fått tillåtelse från författarna.[3]
Mellan 2006 och 2008 hade Microsoft ett samarbete med Internet Archive genom dess projektLive Search Books, inom vilket 300 000 böcker skannades in och donerades till samlingarna. Microsoft stödde även projektet ekonomiskt och med utrustning för inskanning. Den 23 maj 2008 avbröt dock Microsoft sitt stöd till projektet.[4]
Wayback Machine är ett sökbart digitaltarkiv överwebben som drivs av Internet Archive. Det är inte det enda i sin sort, men är det arkiv som harindexerat flest sidor sedan starten 1996; målet med tjänsten är att arkivera hela webben.[6] Den teknik som används för att söka och hämta webbsidor att arkivera är en så kalladspindel, vilken letar efter sidor att indexera och som även följerhyperlänkar vidare till nya sidor. Till exempel kan dettadatorprogram söka efter sidor viasökmotorer somGoogle. Allt kan inte sparas då det finns restriktioner av olika tekniska skäl.[7]