J’ai eu l’opportunité d’assister récemment à une présentation du logiciel de similitude (ou logiciel antiplagiat) Ephorus, mis en test récemment par l’université. L’outil et ses usages appellent quelques remarques, que je vous livre en vrac – sachant, comme d’habitude, que je ne suis pas spécialiste du sujet et que je n’en maîtrise pas les tenants et aboutissants techniques. Remarques, corrections et commentaires bienvenus… mais prenez soin de lire le billet de Jean-Noël Darde consacré à ces logiciels: il pose très clairement de nombreuses questions.
- Rappel sur le fonctionnement d’un logiciel de similitude: comme l’explique très bien Jean-Noël Darde, cet outil est “en mesure de comparer le texte qu’on lui soumet pour contrôle, d’une part à l’ensemble des textes en libre accès sur Internet et d’autre part à un stock de textes numérisés que les promoteurs du logiciel ont constitué — notamment avec des travaux, thèses et articles déjà contrôlés.”
- Première question: dans quoi vont “taper” les logiciels de similitude ? Tout d’abord, dans une partie du Web visible (et non pas dans “Internet”). Pour Ephorus comme pour d’autres logiciel, ce sont les algorithmes de Google qui vont être utilisés. Google, mais pas Google Scholar ou Google Books. De même, les ressources électroniques payantes ne sont pas analysées (Science Direct, Jstor, etc.). Gallica, Europeana non plus. Dommage…Il ne s’agit pas d’une spécificité d’Ephorus; visiblement, aucun outil sur le marché ne permet ce type d’analyse (on le comprend: imaginons plusieurs milliers de requêtes simultanées dans les bases au moment du dépôt des mémoires, entre juin et septembre… Outre l’accord technique des éditeurs, cela serait fatal à certains serveurs, déjà pas bien vaillants). Il me semble que cela limite la portée de l’outil aux étudiants les plus paresseux (ou les moins inventifs) et on peut penser (ou, tout du moins, espérer) qu’un étudiant de master ou de thèse sera un peu plus malin.
- A moins que… personnellement moi-même, si j’étais un grand groupe éditorial scientifique, ayant déjà une position monopolistique sur le marché, ayant déjà acquis un concurrent de Zotero, je jetterais un œil gourmand sur ces entreprises en pleine expansion. Je serais ainsi en mesure de proposer aux universités un spectre bien plus large de sources potentielles. Ou alors, on aurait dit que je me serais appelé Google et que j’aurais tué net le marché en proposant ma propre offre, gratuite pour les individuels (freemium) et payantes pour les institutions (premium). Vu la puissance de frappe de Google, vu que ces logiciels doivent sont dépendants d’un seul et unique moteur de recherche (le mien), je ne vois pas pourquoi je me priverais.
- Reste que les logiciels de similitude ne vont pas seulement chercher dans le web visible. Ils vont également interroger une base constituée des travaux déjà déposés par les étudiant.e.s. Deux choses à noter :
- la base (et le serveur ad hoc) sont, dans le cas d’Ephorus, localisés aux Pays-Bas.
- Un document déposé ne peut pas être effacé des serveurs d’Ephorus (source: tutoriel Ephorus réalisé par l’université d’Angers).
- Je suppose que les services juridiques des universités ont épluché comme il faut les clauses (que j’imagine) léonines des contrats et que, en cas de changement de prestataire, l’université reste propriétaire de la base.
- La question ultrasensible de la confidentialité et de l’innovation a également été prise en compte puisque l’on a la possibilité, dans Ephorus, de ne pas mettre un mémoire dans la base commune. Je ne sais trop quoi penser de cette limitation (ces travaux confidentiels n’auraient jamais été diffusés dans tous les cas ; je ne peux m’empêcher de penser qu’il y malgré tout une circulation officieuse de certains de ces travaux).
- J’écris sans doute une grosse bêtise, mais développer un outil en interne, est-ce si compliqué ? Comme me le souffle un estimé collègue,
@MxSz un solr pour docs locaux + abos docs elec + google pour le reste et drupal pour workflow et voilà tu l’as ton #antimachin
— Daniel Bourrion (@dbourrion) 25 Novembre 2013
Et une licence nationale ? Usine à gaz technocratique ?
- J’ai l’impression, pour conclure, qu’une partie des enseignants-chercheurs voit dans ce produit la réponse à un problème qui, apparemment (mais comment le prouver?), augmente d’année en année. J’aurais plutôt tendance à penser que la solution a toujours été et reste entre les mains (et dans les têtes) des enseignants eux-mêmes. Comme l’écrit encore Jean-Noël Darde, “le contrôle a priori et systématique revient non seulement à faire du soupçon la règle, mais à déléguer à ces logiciels ce qui est du ressort normal de la compétence des universitaires : compétence à diriger, lire, évaluer des travaux de recherche sur la base d’une connaissance des domaines dans lesquels tel universitaire accepte d’intervenir et d’être évaluateur.” En la matière, je pense que ce qu’il manque le plus à nos collègues, ce sont moins les compétences et l’envie que le temps.