Pour les articles homonymes, voirGallica (homonymie).
Logo de Gallica. | |
| Adresse | https://gallica.bnf.fr/ |
|---|---|
| Slogan | Source de culture et d'émotions |
| Commercial | non |
| Type de site | Bibliothèque numérique |
| Langue | Français,anglais,allemand,italien,russe |
| Siège social | Paris,Île-de-France |
| Propriétaire | Bibliothèque nationale de France |
| Lancement | 1997 |
| modifier | |
Gallica est labibliothèque numérique de laBibliothèque nationale de France et de ses partenaires. Enlibre accès depuis 1997, elle regroupe plusieurs millions dedocuments (des livres au formatEPUB, desjournaux, desrevues, des images, desenregistrements sonores, des cartes, desmanuscrits et desvidéos).
Gallica s'enrichit chaque semaine de milliers de nouveautés[1] et franchit ainsi le cap du millionième document en 2010, des six millions en 2020[2], des huit millions en[3], des neuf millions en octobre 2022, des dix millions en mars 2023[4] et des onze millions en janvier 2025[5].
En, Gallica proposait à la consultation en ligne plus de 10 millions de documents[6], dont862 918 livres, 5 804 805 fascicules de presse et revues, 1 789 461 images, 186 218 manuscrits, 196 490 cartes, 64 968 partitions, 52 004 enregistrements sonores, 519 876 objets et 5 585 vidéos[7]. Un certain nombre d'ouvrages a fait l'objet d'unereconnaissance optique de caractères et le texte peut être recherché sur Gallica.
L'ensemble des collections stockées sur Gallica et Gallicaintra-muros représentait un volume de 1 519 téraoctets au[8], ce qui équivaut à plus de 3 millions de documents[9].
À chaque document est associé unidentifiant numérique destiné à sa conservation à long terme, nomméArchival Resource Key (ARK).
Tous les documents disposent également d'unenotice propre, qui peut contenir :

Les premièresnumérisations datent de 1992, à la suite d'un projet de constitution d'une « collection d'images fixes numérisées » initié en 1990, du temps de l'Établissement Public de la Bibliothèque de France (EPBF)[11]. L'objectif est fixé à l'époque à 300 000 images fixes, avec l'idée de constituer des collections multimédias (incluant du son, des imprimés, des images fixes et animées). La Bibliothèque Nationale est alors démarchée pour participer au fonds, au même titre que des institutions privées ou encore desagences de photo.
À la suite de la fusion (décidée parFrançois Mitterrand) en 1994 de laBibliothèque Nationale et de l'EPBF, la nouvelleBibliothèque nationale de France (BnF) accordera une plus large place aux collections issues de ses fonds propres dans le processus de numérisation ; ils représenteront rapidement la moitié du fonds numérique. Le service spécifique chargé jusqu'à la fusion d'acheter les ouvrages à numériser doit désormais travailler avec les départements thématiques de la BnF pour choisir dans leurs fonds et le Département del’audiovisuel qui avait procédé principalement par acquisitions dans des collections extérieures est chargé de sélectionner des images fixes dans le fonds des départements spécialisés.
Leservice web de Gallica est ouvert le[12],[13]. Le projet a comme ambition de devenir la « bibliothèque virtuelle de l'honnête homme ». Elle propose alors un accès aux œuvres ainsi que des dossiers documentaires, notamment des textes et desimages duXIXe sièclefrancophone. Le serveur stocke à ce moment2 500 livres numérisés en mode image, ainsi que250 livres numérisés en mode texte (issus de la baseFrantext de l'Institut national de la langue française)[14]. Les livres sont classés par discipline, et accompagnés d'unechronologie duXIXe siècle, ainsi que de synthèses sur les grands courants en histoire,sciences politiques,droit,économie,littérature,philosophie,sciences et histoire des sciences. Enfin, un échantillon de la future iconothèque est disponible, avec un fonds duphotographeEugène Atget, une sélection de documents surPierre Loti, une collection d’images de l’École nationale des ponts et chaussées (sur les grands travaux de larévolution industrielle), et un choix de livres illustrés de la bibliothèque duMusée de l’Homme. À son lancement, Gallica est moins considéré comme une bibliothèque numérique que comme un « laboratoire dont l’objet est d’évaluer les conditions d’accès et de consultation à distance des documents numériques »[14].
Rapidement, le projet prend pourtant une ampleur très différente : au début de l'année 1998, Gallica annonce un objectif de 100 000 volumes et 300 000 images numérisées pour la fin 1999 (dont plus du tiers concernent leXIXe siècle). La moitié des 300 000 images doit provenir des départements spécialisés de la BnF, l'autre de collections d’établissements publics (musées et bibliothèques,Documentation française, École nationale des ponts et chaussées,Institut Pasteur,Observatoire de Paris par exemple) ou privés (agences de presse dontMagnum, l’Agence France-Presse,Sygma,Rapho). Mais dès la fin de l'année, la BnF revoit ses espérances à la baisse : selonLe Figaro, elle passe « d’une espérance universaliste, encyclopédique, à la nécessité de choix éditoriaux pointus », tandis que son président,Pierre-Jean Angremy, rapporte la décision ducomité éditorial de Gallica en déclarant :
« Nous avons décidé d’abandonner l’idée d’un vaste corpus encyclopédique de cent mille livres, auquel on pourrait sans cesse reprocher des trous. Nous nous orientons aujourd’hui vers des corpus thématiques, aussi complets que possibles, mais plus restreints. […] Nous cherchons à répondre, en priorité, aux demandes des chercheurs et des lecteurs[15]. »
Une deuxième version est mise en ligne en 2000. Leslivres etpériodiques sont choisis titre par titre, tandis que les autres médias font l'objet de numérisation par grands ensembles. Le mode image est alors dominant, le mode texte restant limité à des textes saisis pour certains, notamment dans le cadre d'Analyse et traitement informatique de la langue française.
S’y ajoute par la suite un grand programme de numérisations de lapresse quotidienne nationale française ainsi que de publications dessociétés savantes.
En 2005, en réponse à l'initiative deGoogle Livres,Jean-Noël Jeanneney publieQuand Google défie l'Europe[16], où il plaide pour une réaction européenne et notamment française. À la suite de cet appel, la Bibliothèque nationale de France s'engage dans la « numérisation de masse » avec une augmentation de la quantité des documents mis à disposition et le basculement progressif vers le mode texte parreconnaissance optique de caractères.
En est passé un nouveau marché avec Safig qui prévoit la numérisation de 300 000 ouvrages par an sur trois ans[17], en mode image et en mode texte. Le choix individuel des livres est abandonné au profit d'un système de « tranches de cotes ».
Gallica2, troisième version de Gallica, a été engagée en novembre 2007, l'ancienne version restant alors provisoirement disponible. S'appuyant sur lerobot d'indexationLucene, elle se veut la synthèse de Gallica et duprototypeEuropeana. Gallica2 cherche à développer lapersonnalisation de l'interface.
Toujours pour répondre à Google, est lancé un projet d'intégration dans Gallica d'œuvres sousdroits, en partenariat entre laBibliothèque nationale de France, laDirection du livre et de la lecture, leCentre national du livre et leSyndicat national de l'édition[18]. Lemoteur de recherche donne accès à la fois aux documents libres et aux documents sous droits, les diffuseurs restant libres de décider des conditions de consultation du texte intégral. Gallica donne également accès à des bibliothèques virtuelles partenaires via le protocoleOAI-PMH.
En, l'interface qui avait été provisoirement maintenue est retirée de la consultation, conduisant à la réunification de Gallica et de Gallica2 et les collections spécialisées commencent à être numérisées. La même année voit le lancement dublog de Gallica. L'interface change à nouveau le[19].
Par ailleurs, le rapport de la mission Tessier, remis le, prévoit des évolutions de Gallica, qui pourrait la détacher de la BnF et la transformer en une interface de consultation de divers documents numérisés[20].
Le,L'Avenir est le 1 500 000e document numérisé.
Le, est mis en place à laBibliothèque nationale de France un serviceGallica intra muros donnant accès aux documents sous droits d'auteur, uniquement depuis la bibliothèque de recherche.
Le, leministère de la Culture, le Commissariat aux investissements d’avenir et la BnF annoncent conjointement la signature de deux accords de numérisation et de diffusion pour les livres anciens et les fonds musicaux de la BnF[21] dans le cadre duProgramme d'investissements d'avenir, via la filialeBnF-Partenariats créée en 2012 :

L'accord de numérisation porte sur des œuvres du domaine public uniquement, et prévoit une exclusivité de commercialisation des œuvres pour les entreprises partenaires. Or les principaux acheteurs des licences d’accès à ces contenus seront des organismes publics de recherche ou desbibliothèques universitaires, acteurs qui seront obligés de payer pour des contenus numérisés qui font partie du patrimoine culturel commun. Plusieurs organisations dénoncent cet aspect de l'accord, notamment le collectifSavoirscom1, l’association COMMUNIA, l’Open Knowledge Foundation France, lesCreative Commons France, laQuadrature du Net,Framasoft, leParti Pirate,Wikimédia France, l'Association des bibliothécaires de France ou encore leFront de Gauche[22].
La BNF conserve des titres de presse de toutes époques, depuisLa Gazette deThéophraste Renaudot, jusqu’aux journaux gratuits publiés en France à partir duXXIe siècle[23], avec des opérations successives de microfilmage de 120 000 bobines à la date de 2007 mais des contraintes liées aux différents formats, à l'acidité du papier, ou encore aux altérations des copies microfilmées ont causé des complications et même une sous-exploitation de la presse comme outil et objet de recherche par les universitaires et historiens[23].
Un premier plan de numérisation pluriannuel pour 31 titres, représentant un volume total de près de 3,5 millions de pages, s’est étendu sur la période 2005-2010[23], afin chaque année de numériser entre 4 et 6 titres[23] en recourant à lareconnaissance optique de caractères (en anglais OCR pour Optical Caracter Recognition)[23].
Le coût total avoisine3,5 millions d’euros[23], assuré via la subvention versée par le ministère de la Culture et de la Communication[23] et incluant le coût du stockage informatique des données[23] et les prestations en sous-traitance[23].
Un article de 2007 laissait entendre que la presse n’a vraiment été parmi les préoccupations principales de la BNF qu'à partir du milieu desannées 2000, quand ce programme de numérisation, complété par la décision de « travailler » à la rédaction d’un « Guide des sources de la presse » a eu pour conséquence le retrait de microfilms à la consultation physique, y compris pour l'étude par la communauté scientifique. En 2007 cependant, onze ans après le lancement de Gallica, n'étaient encore disponibles à la consultation que quelques quotidiens et pour des périodes réduites[23] :
La Bibliothèque nationale de France a ensuite organisé l'exposition « La presse à la Une. De la Gazette à Internet », qui a fait l'objet d'un catalogue d'exposition sous la forme d'un « beau livre » publié en 2012, se demandant si les différents supports, numérique et papier, pourront cohabiter de manière complémentaire et qui recourt, parmi les possibilités offertes par le numérique à des QR codes invitant le lecteur à zoomer sur des entretiens vidéo, des « Unes » célèbres et emblématiques ou des albums thématiques complémentaires[24].
En 2020 est lancéGallicarte, qui permet la géolocalisation des documents, ainsi que l'application mobile gratuite disponible sur IOS et Android[1].
En 2021, Benjamin Azoulay et Benoît de Courson créent Gallicagram[25], logiciel qui représente graphiquement l’évolution de l’usage des mots au cours du temps en fouillant les corpus de presse et de livres numérisés par Gallica et par diverses autres bibliothèques nationales et locales, en cinq langues[26],[27],[28].

Il propose de l'iconographie sur des spectacles dethéâtre,danse,cirque etmarionnettes.
Depuis 2010, sont en ligne 50 000 photographies contemporaines de spectacle : des photographies de Joël Verhoustraeten[29] et deDaniel Cande[30]. J. Verhoustraeten et D. Cande restent titulaires des droits d'exploitation mais ont accepté une mise surinternet de leurs images.
Des cartes, des plans réalisés à main levée oulithographiés, les plus grandscartographesGerardus Mercator,Jodocus Hondius,Wilhem Blaeuw,Nicolas de Fer,Sanson d'Abbeville, etc.
Il propose des sources précieuses pour l'histoire des sciences.
Dans le cadre du pôle associéNumérisation concertée en mathématiques entre la Bibliothèque nationale de France et la Cellule MathDoc[31], le portail Gallica-Math a été constitué. Par une indexation fine des documents, il donne un accès aisé à une partie du fonds mathématique de Gallica[32] (Abel,Beltrami,Carnot,Cauchy,D'Alembert,Dirichlet,Euler,Fourier,Jacobi,Klein,Lagrange,Laguerre,Laplace,Möbius,Riemann),Journal de mathématiques pures et appliquées[33] créé par Liouville en 1836 et toujours vivant. En outre, la numérisation duRépertoire bibliographique des sciences mathématiques est complétée par une base de données[34] permettant des recherches fines, une navigation multiple dans le Répertoire et l'accès à nombre de documents originaux numérisés. Le catalogue LINUM[35] intègre les ouvrages de mathématiques de Gallica aux côtés d'autres bibliothèques étrangères (Cornell,Göttingen, Michigan). L'ensemble de ces documents est repris dans la mini-dml[36], exemple de serviceOAI d'une grande utilité pour les chercheurs mathématiciens.
Gallica présente également des sélections éditorialisées où les documents sont regroupés en ensembles thématiques, géographiques ou par type de documents et accompagnés de textes de présentation :
À partir de 2013, la BnF propose aux bibliothèques souhaitant diffuser leurs contenus sans disposer de leur propre outil, d'utiliser Gallica en « marque blanche »[58]. L'application est développée et hébergée par la BnF mais un habillage propre permet à la bibliothèque de s'approprier l'outil.
LaBibliothèque nationale et universitaire de Strasbourg est le premier établissement à signer un partenariat avec la BnF pour sa bibliothèque numériqueNumistral qui ouvre au public le 4 octobre 2013[59]. En janvier 2020 ce sont 8 bibliothèques numériques qui sont propulsées par Gallica marque blanche[60].
Sur les autres projets Wikimedia :
| Sites |
| ||||
|---|---|---|---|---|---|
| Départements | |||||
| Divers |
| ||||
| Publications | |||||
| Généralistes |
| ||||||
|---|---|---|---|---|---|---|---|
| Thématiques |
| ||||||