Брюстер Кейл заснувавInternet Archive у травні 1996 року, приблизно в той самий час, коли він заснував комерційну компанію Alexa Internet, що займається веб-скануванням[5][6]. Найдавніша відома заархівована сторінка на сайті була збережена 10 травня 1996 року о 14:42 за UTC (7:42 ранку PDT). До жовтня того ж року Інтернет-архів почав архівувати та зберігати великі обсягиВсесвітньої павутини.[7][8] Архівний контент став більш доступним для широкої публіки у 2001 році за допомогоюWayback Machine.
Наприкінці 1999 року Архів розширив свої колекції за межі веб-архіву, почавши зPrelinger Archives. Зараз Інтернет-архів містить тексти, аудіо, рухомі зображення та програмне забезпечення. У ньому розміщено низку інших проектів: NASA Images Archive, контрактна пошукова служба Archive-It, а також вікі-редагований бібліотечний каталог і книжковий інформаційний сайт Open Library. Незабаром після цього Архів почав працювати над наданням спеціалізованих послуг, пов'язаних з потребами доступу до інформації для людей з вадами зору; загальнодоступні книги стали доступні у захищеному форматі цифрової доступної інформаційної системи (DAISY)[9].
У серпні 2012 року Архів оголосив[10], що додавBitTorrent до своїх можливостей завантаження файлів для понад 1,3 мільйона існуючих і всіх нових завантажених файлів[11][12]. Цей метод є найшвидшим засобом завантаження медіа з Архіву, оскільки файли обслуговуються з двох дата-центрів Архіву, на додаток до інших торрент-клієнтів, які завантажили і продовжують обслуговувати файли. 6 листопада 2013 року штаб-квартира Інтернет-архіву в районі Річмонд у Сан-Франциско загорілася,[13] знищивши обладнання та пошкодивши кілька сусідніх квартир.[14] За даними архіву, він втратив бічну будівлю, в якій знаходився один з 30 його скануючих центрів; камери, освітлення та скануюче обладнання вартістю сотні тисяч доларів; і «можливо, 20 ящиків книг і фільмів, деякі незамінні, більшість вже оцифровані, а деякі можна було б замінити».[15] Неприбутковий архів звернувся за допомогою до благодійних пожертвувань, аби компенсувати збитки, які, за попередніми підрахунками, становлять 600 000 доларів[16].
Капітальний ремонт сайту розпочався у вигляді бета-версії у листопаді 2014 року, а старий макет було видалено у березні 2016 року[17][18].
У листопаді 2016 року Кайл оголосив, що Internet Archive будує Інтернет-архів Канади, копію архіву, який базуватиметься десь уКанаді. Ця заява набула широкого розголосу через припущення, що рішення про створення резервного архіву в іншій країні пов'язане з майбутнімпрезидентством Дональда Трампа , - цитують слова Кале[19][20]:
9 листопада в Америці ми прокинулися з новою адміністрацією, яка обіцяла радикальні зміни. Це стало чітким нагадуванням, що такі інституції, як наша, побудовані на довгострокову перспективу, повинні проектуватися з урахуванням змін. Для нас це означає збереження наших культурних матеріалів у безпеці, конфіденційності та постійному доступі. Це означає підготовку до Інтернету, який може зіткнутися з більшими обмеженнями. Це означає служити меценатам у світі, в якому урядовий нагляд нікуди не дінеться; більше того, схоже, що він посилюватиметься. Протягом всієї історії бібліотеки боролися проти жахливих порушень приватності, коли людей хапали просто за те, що вони читали. В Інтернет-архіві ми боремося за захист приватності наших читачів у цифровому світі.[19]
Починаючи з 2017 року,OCLC та Інтернет-архів співпрацюють, щоб зробити записи оцифрованих книг архіву доступними уWorldCat[21].
З 2018 року резиденція візуального мистецтва в Internet Archive, організована Аміром Сабером Есфахані та Ендрю МакКлінтоком, допомагає художникам працювати з більш ніж 48 петабайтами[22] оцифрованих матеріалів архіву. Протягом річної резиденції візуальні митці створюють низку робіт, кульмінацією яких стає виставка. Мета резиденції - поєднати цифрову історію з мистецтвом і створити щось, що майбутні покоління зможуть оцінити онлайн чи офлайн[23]. Серед попередніх резидентів - Тарават Талепасанд, Вітні Лінн і Дженні Оделл .
Internet Archive отримує більшість матеріалів з пожертв,[24] таких як сотні тисяч дисків на 78 об/хв з Бостонської публічної бібліотеки у 2017 році,[25] 250 000 книг з Університету Трента у 2018 році[26], а також всю колекцію бібліотеки Меріґровського коледжу у 2020 році після її закриття[27]. Потім усі матеріали оцифровуються і зберігаються в цифровому сховищі, тоді, як цифрова копія повертається власнику оригіналу, а копія Інтернет-архіву, якщо вона не є суспільним надбанням, надається по одному користувачеві по всьому світу відповідно до теорії контрольованого цифрового абонемента (CDL), що базується на доктрині першого продажу[28].
27 травня 2024 року, Інтернет-архів зазнав низки розподіленихDDoS-атак, які робили його сервіси недоступними з перервами, іноді на кілька годин поспіль, протягом кількох днів[29][30][31].
9 жовтня 2024 року сайт знову зазнав серйозних DDoS-атак, які спричинили значні перебої в роботі та зробили його сервіси тимчасово недоступними. Команда Інтернет-архіву, включно з архівістом Джейсоном Скоттом, підтвердила факт DDoS-атаки. У випливному вікні на сайті стверджувалося, що сталося «катастрофічне» порушення безпеки[32]. Повідомлялося, що постраждало близько 31 мільйона облікових записів користувачів[33][34].
28 вересня 2024 року стався витікбази данних з данними понад 31 мільйона користувачів. Стався витікбази данних під назвою «ia_users.sql» об'ємом 6,4 ГБ, яка включала в себехешовані типомbcryptпаролі таелектронні скриньки користувачів. Дослідник кібербезпеки Скотт Хельме підтвердив що хешований пароль у записі данних збігається з його хешованим паролем в його менеджері паролів. Він також підтвердив, що дата зміни пароля в записі збігається з датою коли він останнє змінював пароль у своєму менеджері паролів. При спробі відкрити сайт відображалосьJavaScript попередження:
"Have you ever felt like the Internet Archive runs on sticks and is constantly on the verge of suffering a catastrophic security breach? It just happened. See 31 million of you onHIBP!".
Засновник Інтернет Архіву Брюсер Кейл 10 жовтня 2024 рокуопублікував оновлення наX підтверджуючи витік данних, також він зазначив що сайт пошкоджили черезJavaScript бібліотеку. На данний момет сайт працює, але вWayback Machine недоступне збереження сторінки за допомогоюURL[35]
Wayback Machine — вебархів, що складається з копій сторінок вебсайтів, які беруться зAlexa Internet. Цей архів дозволяє користувачам бачити версіївебсторінок у тому вигляді, у якому вони були у різні проміжки часу.
Архів Wayback Machine стає доступним поступово. Проміжок часу з моменту копіювання та архівації вебсторінки до моменту, коли вона стає доступною у Wayback Machine, може становити до шести-дванадцяти місяців. Як альтернатива, користувачі, які хочуть заархівувати матеріал і негайно його процитувати, можуть скористатисяArchive-it[36]. Станом на2006 рік Wayback Machine містила майже двапетабайта даних, збільшуючись на 20терабайтів щомісяця.
Станом на 3 січня 2024 року Wayback Machine містила більше ніж 99 петабайтів даних[37].
Метою «Архіву Інтернету» стала боротьба звимиранням посилань — більшість вебсторінок, що створювалися, не були довговічними.
На додаток до мережевих архівів, сервіс підтримує широку колекцію цифрових мультимедійних ресурсів, які або єсуспільним надбанням, або розповсюджуються заCreative Commons License чи еквівалентною ліцензією, яка дозволяє вільне використання та розповсюдження.
Сервери вебдзеркала вебархіву в Олександрії
openlibrary.org (Open Library, вільна бібліотека) — сайт, що нараховує більше мільйона оцифрованих книжок, які перебувають усуспільному надбанніСША.
Некомерційний проєкт Internet Archive восени2009 року оголосив про запуск BookServer — універсальної і відкритої системи дистрибуції електронних книг.[38][39] BookServer повинен статиархітектурою, яка об'єднає різні формати й пристрої для читання електронних текстів. Система забезпечить каталогізацію всіх книг, наявних в магазинах, бібліотеках або увідкритому доступі.Пошукові системи зможутьпроіндексувати цей каталог, і читачам стане набагато простіше шукати необхідну інформацію.
BookServer забезпечитьсумісність придбаної книги, конвертуючи її в потрібнийформат. Електронний текст можна буде прочитати на будь-якому кінцевому пристрої, чи тонетбуці,смартфоні або спеціалізованій читалці на зразокKindle.
Проєкт не обмежується книгами, які можна буде вивантажити безкоштовно. Залежно від умов ліцензії, знайдену книгу можна буде купити або взяти воренду. В майбутньому в BookServer збираються інтегруватиплатіжну систему.
Ключовий компонент проєкту — стандартелектронного каталога книгOPDS[en] (Open Publication Distribution System), який побудований на базі розширюваної мови розміткиAtom. Основнимформатом для книг є відкритий і вільнийEPUB, представлений в 2007 році.
На момент оголошення в 20 центрах сканування Internet Archive, розташованих в 5 країнах світу, йшла робота зоцифрування книг, призначених длявідкритого доступу, і цей каталог налічував більше 1,6 мільйонів найменувань. Але приблизно половина з них — книги, відсканованіGoogle в рамках проєктуBook Search і завантажені згодом користувачами на сайт Internet Archive.
↑Archiving the Internet. Архів оригіналу за 11 жовтня 1997. Процитовано 10 жовтня 2024.{{cite web}}: Обслуговування CS1: bot: Сторінки з посиланнями на джерела, де статус оригінального URL невідомий (посилання)
↑Get Microsoft Internet Explore. Архів оригіналу за 10 травня 1996. Процитовано 10 жовтня 2024.{{cite web}}: Обслуговування CS1: bot: Сторінки з посиланнями на джерела, де статус оригінального URL невідомий (посилання)
↑In the Collections. Архів оригіналу за 6 червня 2000. Процитовано 10 жовтня 2024.{{cite web}}: Обслуговування CS1: bot: Сторінки з посиланнями на джерела, де статус оригінального URL невідомий (посилання)