Anti-plagiaires de tous les pays…

J’ai eu l’opportunité d’assister récemment à une présentation du logiciel de similitude (ou logiciel antiplagiat) Ephorus, mis en test récemment par l’université. L’outil et ses usages appellent quelques remarques, que je vous livre en vrac – sachant, comme d’habitude, que je ne suis pas spécialiste du sujet et que je n’en maîtrise pas les tenants et aboutissants techniques. Remarques, corrections et commentaires bienvenus… mais prenez soin de lire le billet de Jean-Noël Darde consacré à ces logiciels: il pose très clairement de nombreuses questions.

  1. Rappel sur le fonctionnement d’un logiciel de similitude: comme l’explique très bien Jean-Noël Darde, cet outil est “en mesure de comparer le texte qu’on lui soumet pour contrôle, d’une part à l’ensemble des textes en libre accès sur Internet et d’autre part à un stock de textes numérisés que les promoteurs du logiciel ont constitué —  notamment avec des travaux, thèses et articles déjà contrôlés.”
  2. Première question: dans quoi vont “taper” les logiciels de similitude ? Tout d’abord, dans une partie du Web visible (et non pas dans “Internet”). Pour Ephorus comme pour d’autres logiciel, ce sont les algorithmes de Google qui vont être utilisés. Google, mais pas Google Scholar ou Google Books. De même, les ressources électroniques payantes ne sont pas analysées (Science Direct, Jstor, etc.). Gallica, Europeana non plus. Dommage…Il ne s’agit pas d’une spécificité d’Ephorus; visiblement, aucun outil sur le marché ne permet ce type d’analyse (on le comprend: imaginons plusieurs milliers de requêtes simultanées dans les bases au moment du dépôt des mémoires, entre juin et septembre… Outre l’accord technique des éditeurs, cela serait fatal à certains serveurs, déjà pas bien vaillants). Il me semble que cela limite la portée de l’outil aux étudiants les plus paresseux (ou les moins inventifs) et on peut penser (ou, tout du moins, espérer) qu’un étudiant de master ou de thèse sera un peu plus malin.
  3. A moins que… personnellement moi-même, si j’étais un grand groupe éditorial scientifique, ayant déjà une position monopolistique sur le marché, ayant déjà acquis un concurrent de Zotero, je jetterais un œil gourmand sur ces entreprises en pleine expansion. Je serais ainsi en mesure de proposer aux universités un spectre bien plus large de sources potentielles. Ou alors, on aurait dit que je me serais appelé Google et que j’aurais tué net le marché en proposant ma propre offre, gratuite pour les individuels (freemium) et payantes pour les institutions (premium). Vu la puissance de frappe de Google, vu que ces logiciels doivent sont dépendants d’un seul et unique moteur de recherche (le mien), je ne vois pas pourquoi je me priverais.
  4. Reste que les logiciels de similitude ne vont pas seulement chercher dans le web visible. Ils vont également interroger une base constituée des travaux déjà déposés par les étudiant.e.s. Deux choses à noter :
    1.  la base (et le serveur ad hoc) sont, dans le cas d’Ephorus, localisés aux Pays-Bas.
    2. Un document déposé ne peut pas être effacé des serveurs d’Ephorus (source: tutoriel Ephorus réalisé par l’université d’Angers).
  5. Je suppose que les services juridiques des universités ont épluché comme il faut les clauses (que j’imagine) léonines des contrats et que, en cas de changement de prestataire, l’université reste propriétaire de la base.
  6. La question ultrasensible de la confidentialité et de l’innovation a également été prise en compte puisque l’on a la possibilité, dans Ephorus, de ne pas mettre un mémoire dans la base commune. Je ne sais trop quoi penser de cette limitation (ces travaux confidentiels n’auraient jamais été diffusés dans tous les cas ; je ne peux m’empêcher de penser qu’il y malgré tout une circulation officieuse de certains de ces travaux).
  7. J’écris sans doute une grosse bêtise, mais développer un outil en interne, est-ce si compliqué ? Comme me le souffle un estimé collègue,

    Et une licence nationale ? Usine à gaz technocratique ?

  8. J’ai l’impression, pour conclure, qu’une partie des enseignants-chercheurs voit dans ce produit la réponse à un problème qui, apparemment (mais comment le prouver?), augmente d’année en année. J’aurais plutôt tendance à penser que la solution a toujours été et reste entre les mains (et dans les têtes) des enseignants eux-mêmes. Comme l’écrit encore Jean-Noël Darde, “le contrôle a priori et systématique revient non seulement à faire du soupçon la règle, mais à déléguer à ces logiciels ce qui est du ressort normal de la compétence des universitaires : compétence à diriger, lire, évaluer des travaux de recherche sur la base d’une connaissance des domaines dans lesquels tel universitaire accepte d’intervenir et d’être évaluateur.” En la matière, je pense que ce qu’il manque le plus à nos collègues, ce sont moins les compétences et l’envie que le temps.

6 réflexions sur « Anti-plagiaires de tous les pays… »

  1. Hello.
    Une licence nationale pour répondre aux problèmes que tu pointes ne ferait que les exacerber en les développant à grande échelle : nous aurions tout acheté le même logiciel et les problèmes ne seraient pas réglés…
    Un développement local : au débotté, ça me semblait jouable comme je te le twittais hier soir. Après, il faudrait creuser un peu mais ça ne me semble pas totalement fou vu les fonctionnalités que tu décris ; en tous les cas, de manière certaine, dans le ‘cahier des charges’ “un solr pour docs locaux + abos docs elec + google pour le reste et drupal pour workflow”, monter un outil qui réponde à comparaison docs locaux + google + workflows, ça semble tout à fait jouable.

  2. ” le contrôle a priori et systématique revient non seulement à faire du soupçon la règle, mais à déléguer à ces logiciels ce qui est du ressort normal de la compétence des universitaires”

    exactement mon avis. Bizarre cette révolution de l’antiplagiat, comme si le plagiat n’avait pas de tout temps existé, bien avant le numérique.
    La meilleure défense/dissuasion ? À mon avis obliger la mise en ligne en open access (sauf cas de confidentialité légitime). Si l’étudiant est plagié, ce sera prouvé. Si l’étudiant est plagiaire, alors il est vraiment inconscient parce que son travail visible par tous le suivra toute sa vie.

    Autre chose qui me dérange dans ces démarches “logiciels antiplagiat” : ces idées saugrenues de “labellisation” des travaux validés par le logiciel (comme si les résultats d’un logiciel antiplagiat, négatif ou positif, voulaient dire quoi que ce soit – un résultat négatif ne signifie pas qu’il n’y a pas de plagiat dans le document, cf. la base de connaissances limitée ; un résultat positif signifie peut-être que l’étudiant a utilisé plein de sources comme on le lui demande). Comme s’il fallait féliciter les étudiants de ne pas avoir plagié, comme si cela était une quelconque preuve de la qualité du travail produit. Comme si encore ce n’était pas le présupposé de base, que la validation par un directeur et un jury signait la qualité et l’honnêteté d’un mémoire… La déduction logique, c’est la phrase citée en début de commentaire : les labels “vérifié anti-plagiat par la machine pourtant garantie non fiable à 100%”, c’est le soupçon a priori et généralisé.

  3. Dans certains établissements, le déploiement de ce type d’outils, en plus d’accuser, de fait, tous les étudiants rendant un mémoire est doublé de la signature d’une charte “anti-plagiat” (*) entre les établissements et les futurs diplômés. Les suspicions sont dans ces cas là, on ne peut plus officielles…
    L’open access et la validation par les “maîtres” (pour ne pas dire pairs dans certains domaines, même en Master), me paraissent être, en effet, les meilleures solutions contre le “”””problème”””” du plagiat…

  4. Assez d’accord avec Stéphanie : la solution, c’est l’open access (plus c’est visible, moins c’est plagié)… Et la pédagogie : quand on apprend à se servir de sa tête, et à citer correctement ses sources, on est moins tenté d’aller piquer des idées ailleurs. Je le vois bien en formation : si la plupart des étudiants voient bien que le copié collé, c’est du plagiat, ils sont beaucoup moins nombreux à se rendre compte que la paraphrase, sans source, ça en est aussi. Ce qui fausse le jeu, c’est qu’on croit que le logiciel anti plagiat va remplacer le boulot de l’enseignant…alors qu’il ne peut constituer qu’une aide pour retrouver certaines sources plus rapidement, quand il y a déjà soupçon.

    • Ephorus (la solution retenue par l’UA, actuellement en phase de test auprès d’un petit groupe d’enseignants et d’étudiants de différentes composantes) n’est pas mis en service tel quel. Des formations sont proposées à tous les interlocuteurs de l’université qui pourraient y avoir recours (enseignants, étudiants, personnels)

      Ces formations (que je dispense avec Nicolas Clere, responsable du comité de pilotage pour la mis en place d’une solution anti-plagiat) débutent par une double mise en garde :

      1 – “Solution anti-plagiat” est un abus de langage : il faudrait parler d’un logiciel de recherche et de sourçage de similitudes par comparaisons.

      2 – Les bases de données auxquelles a accès Ephorus sont limitées : Web ouvert (ce qui limite considérablement son champ d’action) et la base constituée par les documents précédemment soumis au sein de l’UA (pour l’instant, rien, ou presque)

      Ces deux points sont à eux seuls, une mise en garde pour les enseignants qui fantasmeraient (il y en a ?) sur un procédé magique de révélation des emprunts malhonnêtes.

      Mais : Le “plagiat” se répand avec constance à mesure que se répand l’usage des outils numériques. (le plagiat a effectivement toujours existé mais les questions de propriété intellectuelle ne sont pas aujourd’hui aussi claires qu’elles ont pu l’être avant la dématérialisation et les réseaux numériques – pas que dans le domaine de l’enseignement d’ailleurs)

      Donc : dans un premier temps, Il faut former les étudiants à la recherche documentaire, à la citation, à la construction d’une bibliographie, aux questions de propriété intellectuelle : c’est la mission première que s’est fixée L’université (Formations du scd ?)

      Ensuite, il faut montrer notre préoccupation à ce sujet, montrer notre implication à utiliser, nous aussi, les outils numériques comme une assistance à identifier (dans la limite des conditions décrites plus haut) les cas de similitudes, d’emprunts, de citations, qui pourraient poser problème.

      Pour terminer, Ephorus est en phase de test, toutes les réflexions constructives qui nourriront notre réflexion sont les bienvenues pour déterminer si nous adopterons cette solution. Ou pas…

      • Bonjour Laurent,

        Merci pour ce retour d’expérience.
        Dans mon esprit comme dans celui des collègues qui ont assisté à la présentation, il s’agit bien entendu d’un outil parmi d’autres, jouant ici sur la dissuasion.
        Après, il me semble qu’une partie des collègues voit dans cet outil un instrument permettant potentiellement de régler tous les problèmes… ce qui (nous en sommes d’accord) est loin d’être le cas.

        MxSz

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *