L’évolution de l’accès aux écrits scientifiques est accélérée grâce à la technologie du numérique, passant de la diffusion de revues imprimées institutionnelles dans les bibliothèques et les librairies, à la diffusion des articles en « open access » accessibles par tous et partout, sur Internet. Cet article vise à vous partager quelques repères historiques afin de mieux mesurer les enjeux actuels, à l’ère du numérique, et participer à la sensibilisation aux enjeux des humanités numériques et de l’humanisme numérique.
Accès à la presse scientifique avant le web
On peut faire remonter la naissance de la presse scientifique à 1665 en France, lorsque « Le Journal savant » voit le jour. Entre 1751 et 1772 est publié l’ « Encyclopédie ou Dictionnaire raisonné des sciences, des arts et des métiers », de Diderot et d’Alembert. Le principe de l’encyclopédie est de justifier des informations par des renvois à d’autres informations qui permettent d’approfondir. On a d’ailleurs là une structure adaptée à l’hypertexte, comme le rappelle Hervé Le Crosnier dans ses cours de culture numérique (cours filmés disponibles sur le site de canal-u.tv), l’encyclopédisme a permis, en s’appuyant sur les sciences, de faire évoluer les mentalités et de créer Les lumières.
Le milieu du XIXème siècle, marqué par l’arrivée de la presse rotative, constitue l’âge d’or de la presse, dont la presse scientifique, avec la création de nombreuses revues.
La période d’après guerre (1947-1957 environ)
Cette période voit apparaître le développement des sciences et techniques en documentation. Dans le contexte de guerre froide, la veille devient stratégique d’un point de vue économique et politique. Dans un monde en compétition, il convient d’être au fait des innovations scientifiques et industrielles des concurrents. Des procédés de traitement automatique du langage naturel (TALN) se développent pour faciliter la traduction des travaux.
En outre, d’après Hubert Fondin[1], professeur de SIC à l’université de Bordeaux3 et membre du Cémic (Centre d’étude des médias de l’information et de la communication), « le nombre d’articles publiés dans les revues de documentation passe de 300-400 en 1960 à 700-800 dès 1961 et exwactement 2157 en 1966 ».
Aussi, on observe la naissance de la scientométrie dans les années 60 aux Etats-Unis, et qui arrivera rapidement en France. Comme la bibliométrie, la scientométrie comptabilise les publications mais elle ne s’intéresse qu’aux publications scientifiques. La bibliométrie a pour objet de mesurer la visibilité ou l’impact des écrits après leur parution en tant que publications, grâce à l’étude des documents tels qu’ils sont indexés dans les bases de données bibliographiques. Dans son premier Index de citation (1963), Eugène Garfield développe l’idée d’utiliser les citations présentes dans les articles scientifiques, c’est-à-dire les renvois faits à d’autres articles, pour lier les articles entre eux. Pour l’anecdote, ISI, l’entreprise créée par Eugène Garfield appartient aujourd’hui à Thomson Reuters et est à la tête de Web of science, l’une bdes plus grosses bases de données bibliographique au monde ; avec Google Scholar (de Google/Alphabet) et Scopus (d’Elsevier)
Là encore, comme dans l’encyclopédisme, on retrouve une structure qui se rapproche ce que permet l’hypertexte actuel, à l’heure d’internet. C’est à la même période (1960) que Douglas Engelbart développera le premier véritable hypertexte en utilisant l’informatique. Le terme sera lui créé en 1965 par Ted Nelson, dans la cadre de son projet de bibliothèque XANADU de partage de données informatiques.
Le numérique
En 1971, Michael HART ouvre la voix à un nouveau type de partage de données, en mettant en ligne le premier livre numérique. Il développera ensuite le Gutenberg-e-programm pour rendre accessible gratuitement, sous forme numérique, les œuvres et travaux entrés dans le domaine public.
En 1995, le numérique permet la création de nouvelles formes d’accès au savoir encyclopédique. En France, l’encyclopédie Universalis qui sort en CDRoms compte plus de 200 000 liens.
En 1995, Ward Cunningham invente le WIKI : un outil collaboratif qui permet de rédiger/corriger un document à plusieurs tout en bénéficiant du suivi de versions, avec accès à l’historique. Cette technologie sert de base à Wikipédia
1998 : Larry Page et Sergueï Brin lance Google. Le moteur de recherche deviendra rapidement hégémonique grâce à l’efficacité de son algorithme pagerank, qui classe les site en prenant en compte le nombre de liens qui pointent vers ses derniers, ainsi que les liens vers lesquels ils renvoient, tout en tenant compte de l’autorité de ses liens et de la pertinence des mots clés. Dans les années 1990 à 2000, internet croit de façon vertigineuse
1997-2000, création Catalogue collectif de France (CCFr). Le CCFr constitue l’outil de recherches bibliographiques et documentaires le plus riche du domaine français. Il permet de localiser en France plus de 30 millions de documents imprimés et multimédia par l’interrogation simultané
La société numérique à l’heure du web 2.0
En 2001, c’est la publication des Licences créatives Commons.
Egalement en 2001, le CNRS (centre national pour la recherche scientifique) créé HAL (hyper articles en ligne), une archive ouverte qui permet aux chercheurs de déposer leurs travaux. Une archive est également déposée au format international OAI-PMH (Open Archives Initiatives – Protocol for Metadata Harvesting), protocole informatique créé la même année et permettant d’échanger des métadonnées. En effet, à l’heure du web, les métadonnées participent au classement et à l’archivage des documents en ligne. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion d’articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Près de 380 000 documents scientifiques (parmi plus d’1 million de références)
2001 : Création de Wikipédia par Jimmy Wales et Larry Sanger, l’encyclopédie collaborative sous licence CC-BY-SA
Il existe aussi désormais des portails mutualisés de revue en sciences, à accès libre. Créé en 2005 par le ministère de l’Éducation nationale, de l’Enseignement supérieur et de la Recherche, Persée est un portail web en libre accès de revues scientifiques françaises en sciences humaines et sociales. Persee.fr offre un accès libre et gratuit à des collections complètes de publications scientifiques (revues, livres, actes de colloques, publications en série, sources primaires, etc.) associé à une gamme d’outils de recherche et d’exploitation. Persée compte 574 498 documents (au 27/01/2016) grâce aux contributions de l’Université de Lyon, le CNRS, ENS de Lyon ainsi que le Ministère de l’éducation nationale, de l’enseignement supérieur e de la recherche.
Plusieurs éditeurs scientifiques ont créé une version en ligne, avec accès payant, comme Cairn.info. Cairn regroupe à son lancement (en 2005) quatre maisons d’édition (Belin, De Boeck, La Découverte et Erès) auxquelles se sont ajoutées la Bibliothèque nationale de France depuis 2006, et les Presses Universitaires de France (PUF) depuis 2014. De nombreux éditeurs plus petits s’y sont aussi agrégés.
L’ABES (agence bibliographie de l’enseignement supérieur) propose plusieurs catalogues :
– Le catalogue collectif SUDOC (système universitaire de documentation)
– Calames : catalogue en ligne des archives et des manuscrits de l’enseignement supérieur
– these.fr qui permet d’accéder aux thèses déjà soutenues, mais également en préparation (avec possibilité de ne sélectionner que celles en cours de finalisation, qui seront soutenues dans les 6 mois)
– périscope qui permet la comparaison de périodiques du Sudoc
– IdRef qui permet à des utilisateurs et à des applications clientes d’interroger, de consulter, de créer et d’enrichir des autorités.
=> voir les plus grosses bases de données bibliométriques
En 2016, Wikipédia fête ses 15 ans : fort de « 80 000 éditeurs, tous volontaires, et de ses 36 millions d’articles, le service est aujourd’hui incontournable, déployé en 280 langues. »[2]
Comme le rappelle Hervé Le Crosnier dans ses cours de culture numérique accessibles en ligne (conférences filméess et disponible sur le site de canal-u.tv), le suicide d’Aaron Swartz en 2011, représente un tournant dans le mouvement de l’accès libre. En 2011, cet activiste américain pour la liberté de l’Internet avait été inculpé pour avoir téléchargé et mis à disposition gratuitement un grand nombre d’articles depuis JSTOR (fondé en 1995, JSTOR est une société américaine à but non lucratif qui donne accès, sur abonnement à un système d’archivage en ligne de publication universitaire et scientifique, et une bibliothèque numérique). Il se suicide le 11 janvier 2013. En cas de condamnation, il encourait une peine d’emprisonnement pouvant atteindre 35 ans de prison et une amende pouvant atteindre 1 million de dollars[3]. Dans la foulée de ce tragique suicide, des centaines de centaines de professeurs et scientifiques du monde entier ont décidé de publier spontanément leurs travaux en Libre Accès.
Enjeux actuels : les biens communs de la connaissance (par Guillaume Atsé)
Jusqu’à janvier 2016, un chercheur pouvait déposer ainsi librement ses écrits, à partir du moment où il n’était pas lié par un contrat avec un éditeur. La Loi sur la République numérique de janvier 2016, l’y autorise désormais, même dans le cas d’un contrat avec un éditeur. Il s’agit d’une exception à l’exclusivité pour l’éditeur, mais uniquement si le chercheur est financé au moins à 50% pour des fonds publics.
Le projet de Loi souhaitait au départ inscrire le dépôt des écrits scientifiques des chercheurs financés par fonds publics, comme une obligation, dans l’optique de faciliter l’Accès aux écrits scientifiques publics par le plus grand nombre. Mais face à une levée de boucliers de certains éditeurs et chercheurs, l’Article 17 concernant le dépôt en ligne, a été amendé, et l’obligation est devenue une simple possibilité.
Mais cette possibilité est tout de même une avancée car elle autorise le dépôt gratuit d’un article scientifique simultanément à sa publication dans une revue ou un ouvrage scientifique payant. Chose qui n’était pas possible avant la Loi. C’était soit l’un soit l’autre.
En France il existe l’archive ouverte HAL (plateforme nationale d’archivage ouvert) où les chercheurs peuvent déposer leurs articles en libre consultation, avec des possibilités de rediffusion et de réutilisation variable en fonction de la licence que le chercheur décide d’attribuer à son article (le plus souvent désormais, une licence Créative Commons). Le dépôt d’un article scientifique réutilisable et accessible gratuitement est dit en « open access ». Cette évolution de l’Accès aux écrits scientifiques s’inscrit dans le mouvement « Open source » qui est une volonté d’internautes, de chercheurs, d’hommes politiques et d’entrepreneurs de favoriser le partage d’information, de connaissances, de logiciels, de façon libre sur Internet.
Dans cette optique, la science, la connaissance, deviennent des « biens communs » réutilisables gratuitement par tout un chacun, particulier, entreprise, ou Etat.
Un des enjeux du dépôt d’articles scientifiques en « open access » est à ce titre le coût des ressources scientifiques pour les bibliothèques, les universités. Les militants de « l’open access » avancent l’argument suivant : les bibliothèques universitaires consacrent une part grandissante de leur budget dans l’achat d’abonnements à des ressources en lignes (revues, articles,) notamment chez des éditeurs comme Elsevier ou Wiley. Or, ces coûts pourraient être évités si les bibliothèques cessent de s’abonner aux ressources payantes pour se tourner vers les archives ouvertes gratuites (et il en existe.)
Par ailleurs, comme l’indique le chercheur en SIC Olivier Ertzscheid dans une tribune publiée sur Rue89 en cotobre 2015, le développement de « l’open access » est favorable aux pays en développement, qui pourraient ainsi accéder à des savoirs scientifiques sans débourser des centaines de milliers de dollars auprès des grandes plateformes monopolistiques des écrits scientifiques en ligne.
Il y a aussi la question de la reconnaissance des chercheurs, qui peuvent se diriger vers les archives ouvertes anglo-saxonnes afin de diffuser plus largement leurs écrits, s’ils ont le sentiment que les archives ouvertes françaises ne sont pas suffisamment consultées ou diffusées.
Outre la publication d’articles récents en ligne, l’open access offre aux institutions la possibilité de numériser leurs fonds, et de les rendre accessible gratuitement en ligne. C’est le but du bibliothécaire de Harvard, Robert Darnton, à travers son projet le Gutenberg e-program, et c’est ce qu’a fait la New York Public Library en numérisant 180 000 archives au tout début de l’année 2016.
*Cet article est une republication d’un article co-écrit par Prisca Djengué et Guillaume Atgé2016 et publié sur le blog “QuoideNeufDoc”
—–
[1] FONDIN, Hubert. La science de l’information ou le poids de l’histoire [en ligne]. Article inédit. Mise en ligne 24 mars 2006. (disponible en ligne : http://lesenjeux.u-grenoble3.fr/2005/Fondin/fondin.pdf)
[2] http://lexpansion.lexpress.fr/high-tech/d-abord-conteste-jamais-egale-wikipedia-fete-ses-15-ans_1754029.html
[3] http://scinfolex.com/2015/11/01/trois-ans-apres-la-mort-daaron-swartz-ou-en-sommes-nous/