APRIL

S'abonner à flux APRIL
L'April a pour objectifs de promouvoir et défendre le logiciel libre et ses acteurs.
Mis à jour : il y a 16 min 43 sec

Apéro April le 10 août 2018 à partir de 19h00 dans les locaux de l'April (Paris)

mer, 08/08/2018 - 17:17
Début: 10 Août 2018 - 19:00Fin: 10 Août 2018 - 22:00 Un apéro April ?

Un apéro April consiste à se réunir physiquement afin de se rencontrer, de faire plus ample connaissance, d'échanger, de partager une verre et de quoi manger mais aussi de discuter sur l'actualité et les actions de l'April. Un apéro April est ouvert à toute personne qui souhaite venir, membre de l'April ou pas. N'hésitez pas à venir nous rencontrer.

L'apéro a lieu à Paris notamment parce que le local s'y trouve ainsi que les permanents et de nombreux actifs. Membre ou pas de l'April vous êtes les bienvenus. Contactez-nous pour organiser un Apéro April dans votre région.

Quand et quoi

Le prochain apéro francilien aura lieu le vendredi 10 août 2018 à partir de 19h00 dans les locaux de l'April au 44/46 rue de l'ouest, bâtiment 8, 75014 Paris (entrée possible par la place de la Catalogne, à gauche du biocop, au niveau des autolib), le téléphone du local est le 01 78 76 92 80 en cas de besoin.

En ouverture de l'apéro nous ferons un court point sur les dossiers/actions en cours.

Pour tous les détails et vous inscrire rendez-vous sur le pad.

Apéro April le 16 août 2018 à Montpellier

mer, 08/08/2018 - 11:49
Début: 16 Août 2018 - 18:30Fin: 16 Août 2018 - 19:30 Un apéro April ?

Un apéro April consiste à se réunir physiquement afin de se rencontrer, de faire plus ample connaissance, d'échanger, de partager une verre et de quoi manger mais aussi de discuter sur l'actualité et les actions de l'April. Un apéro April est ouvert à toute personne qui souhaite venir, membre de l'April ou pas. N'hésitez pas à venir nous rencontrer.

Quand et quoi

Le prochain apéro à Montpellier aura lieu jeudi 16 août 2018 de 18h30 à 19h30 à l'adresse suivante : Do Tank - 2, rue du Pavillon, 34000 Montpellier.

Pour tous les détails rendez-vous sur le site de Montpel’libre.

Les Aprilapéro Montpellier auront lieu le 3e jeudi de chaque mois.

Parcoursup : un enfer pavé de bonnes intentions - Judicaël Courant

ven, 08/03/2018 - 10:19


Titre : Parcoursup : un enfer pavé de bonnes intentions ?
Intervenant : Judicaël Courant
Lieu : Rencontres mondiales du logiciel libre 2018 - Strasbourg
Date : juillet 2018
Durée : 1 h 11 min
Visualiser la vidéo
Licence de la transcription : Verbatim
Illustration : copie d'écran de la vidéo
NB : transcription réalisée par nos soins.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas forcément celles de l'April.

Description

L'affectation des bacheliers dans l'enseignement supérieur en France était régi jusqu'en 2017 par un système appelé APB. Le gouvernement a choisi de remplacer celui-ci dès 2018 par un nouveau système, appelé Parcoursup.
Déléguer à une machine l'affectation des bacheliers dans le supérieur pose un certain nombre de questions :

  • Quelles règles souhaite-t-on pour l'accès au supérieur ?
  • Quels sont alors les objectifs assignés à la machine ?
  • Quel algorithme permet de les atteindre ?
  • Comment permettre à tous les citoyens de vérifier une exécution de l'algorithme ?

On verra rapidement quels faux et vrais problèmes posait APB et pose Parcoursup. J'expliquerai comment fonctionne l'algorithme qui les sous-tend (algorithme de Gale-Shapley) et j'expliquerai ce qu'il serait possible de faire pour améliorer Parcoursup.

Transcription

Bonjour. Tout le monde m’entend bien ? Impeccable. Je vais vous parler de Parcoursup. Qui je suis, d’abord, en quelques mots : je m’appelle Judicaël Courant ; j’ai une double formation mathématique et informatique ; je suis ancien maître de conférence en informatique et aujourd’hui j’enseigne en classe préparatoire.
Il est bien évident que ce que je vais vous présenter n’est pas le reflet d’une position officielle du ministère de l’Enseignement supérieur et de la Recherche, ni du ministère de l’Éducation nationale ; c’est ma vision des choses en tant que citoyen et en tant que citoyen qui a été confronté de près à Parcoursup et puis à ce qui s’appelait APB avant, Admission Post-Bac.

En quelques lignes, en quelques mots, qu’est-ce que c’est, à quoi ça fait référence Parcoursup ? Ça fait référence à un contexte qui est celui de l’affectation des élèves qui viennent d’avoir leur bac, les nouveaux bacheliers, dans l’enseignement supérieur et à la façon dont ça se fait en France.
Comment ça se fait en France ? Ça se fait via une procédure qui est centralisée, puisque tous les vœux des étudiants sont regroupés en un endroit, enfin des étudiants, des bacheliers qui ne sont pas encore étudiants ; c’est une procédure qui est automatisée : on exprime ses vœux par le Web et, dans cette procédure, les candidats, donc qui en général émettent leurs vœux avant leur bac, donc ce sont les futurs bacheliers, ils émettent leurs vœux, ils disent où ils veulent aller. Et puis les différentes formations sur lesquelles ils postulent, université, classe prépa, etc. classent les candidatures à partir de différents critères.

Il y a eu, vous l’avez sans doute noté dans l’actualité, il y a eu un gros changement entre 2017 et 2018. En 2017 il y avait un système qui s’appelait Admission Post-Bac, en abrégé APB, qui a été énormément décrié parce qu’il y avait un certain nombre d’étudiants qui n’avaient pas eu d’affectation, parce qu’il y avait des étudiants qui étaient affectés par tirage au sort – donc il y a un certain nombre de gens qui trouvaient que c’était une procédure un peu bizarre. Et puis, un autre point qui est petit peu plus technique, dont je parlerai par la suite, qui est une notion de bonus pour les premiers vœux. Les candidats qui demandaient une formation et pour lesquels c’était leur premier vœu étaient favorisés par rapport à ceux qui avaient mis cette formation-là en deuxième vœu mais qui n’avaient pas été pris sur leur premier vœu.

La ministre de l’Enseignement supérieur et de la Recherche, en juillet 2017 je crois, a décidé qui c’était fini Admission Post-Bac et qu’on remplaçait ça par un tout nouveau logiciel qui s’appelait Parcoursup. Si on regarde ce qu’il y a dans Parcoursup, il y a quelques bonnes intentions qui sont affichées : une intention c’est d’avoir plus de transparence, et puis il y a un critère qui est « on va essayer de favoriser les élèves qui sont boursiers en les remontant un petit peu dans les classements ».

Tout à l’heure Étienne Gonnu parlait des valeurs de la République française, enfin des valeurs des droits de l’homme ; dans la République française il y a liberté, égalité fraternité ; là on voudrait faire remonter un petit peu la valeur de fraternité, la mettre en avant. On verra qu’il faut peut-être se poser la question de liberté, égalité avant. Une des raisons qui me fait réagir sur Parcoursup, c’est que pour moi si fraternité c’est en troisième dans la devise de la France ce n’est pas parce que c’est le moins important, c’est parce que liberté et égalité sont des conditions nécessaires pour avoir la fraternité. Et on verra que Parcoursup, là-dessus, il y a des choses à redire.

Je n’ai pas précisé, n’hésitez pas à me poser des questions s’il y a des choses qui ne sont pas claires. On verra, j’espère que j’aurai assez de temps pour présenter tout ce que je veux présenter, mais s’il y a des choses qui ne sont pas claires, vraiment n’hésitez pas.

Une autre chose qui a fait beaucoup de bruit dans cette réforme Parcoursup, c’est la notion de sélection. Cette sélection elle existe. Pour moi c’est la conséquence d’une différence entre l’offre de formation et la demande de formation. À partir du moment où vous avez plus de bacheliers qui veulent faire des études supérieures que de places dans les études supérieures, il y aura nécessairement une sélection. On peut évidemment souhaiter que les choses évoluent, que le nombre de places augmente. Après, il y a des limites à ça : même s’il y a autant de places de formation au total que de bacheliers au total, tous les bacheliers ne peuvent pas aller faire, par exemple, leurs études à la Sorbonne. Donc il y aura de toutes façons une sélection.
Pour moi cette sélection, quelque part elle va rester nécessaire ; je ne vois pas comment elle ne va pas se produire. Et en plus, je trouve que c’est assez ridicule de dire qu’elle n’existait pas ou qu’elle n’existe toujours pas parce que, pour moi, elle existe déjà depuis 30 ans ; elle n'est juste pas assumée et donc ce que je préférerais c’est qu’on l’assume et qu’on se pose la question des critères sur lesquels on fait la sélection. Et les critères peuvent être divers et variés.
Le critère ça peut être premiers arrivés, premiers servis. Dans les années 80, quand vous aviez le bac et que vous vouliez une formation qui était assez demandée, il fallait courir aussitôt à l’université pour vous inscrire. Et si le secrétariat n’était pas ouvert, vous campiez devant le secrétariat en attendant l’ouverture. C’était le marronnier des journalistes tous les ans fin juin-début juillet, les files d’attente pour l’inscription devant, notamment, les filières STAPS [Sciences et techniques des activités physiques et sportives].
Après il y a d’autres critères qui existent : par l’argent. Ça c’est le cas des formations privées ; si elles ont trop de monde c’est simple, il suffit d’augmenter les frais d’inscription.
Autre critère qui a été utilisé c’est le hasard, j’en ai déjà parlé, le tirage au sort.
On peut imaginer qu’on trie aussi sur critères sociaux, ça se fait en partie dans Parcoursup ;
et puis on peut imaginer qu’on le fait aussi au « mérite » c’est-à-dire en fonction des notes ; ça ce sont des choses qui se font notamment pour les classes prépa ; j’ai mis « mérite » entre guillemets parce qu’on peut discuter de savoir si le fait d’avoir de très bonnes notes résulte uniquement d’un mérite du bachelier ou du fait qu’il est dans une catégorie socioprofessionnelle qui est plutôt favorisée.

Pour moi l’objectif, enfin les objectifs en fait de cet exposé, c’est qu’on puisse essayer ensemble de comprendre comment on peut faire cette sélection d’une façon qui soit raisonnable et comment se situent APB et Parcoursup. Est-ce que c’est raisonnable par rapport aux moyens dont on disposerait de faire une telle sélection ?
Et puis une fois qu’on a décidé un petit peu comment ça devrait être fait, est-ce qu’on peut faire confiance à un système informatisé qui fait ça ? Et à quelles conditions on peut faire confiance ?
Et essentiellement, j’espère qu’à la fin de cet exposé vous serez d’accord avec moi pour dire qu’on pourrait faire nettement mieux que Parcoursup et que ce n’est pas compliqué, finalement, de faire nettement mieux que Parcoursup.

Évidemment, il y a un truc qui est tout à fait évident, il y a un côté écran de fumée derrière la transformation d’APB en Parcoursup, c’est-à-dire qu’on dit : « Ah c’est la faute de l’informatique s’il y a des milliers d’étudiants qui n’ont pas eu de place dans le supérieur ». S’il n’y a pas assez de places dans le supérieur ce n’est pas la faute à l’informatique ! Vous pouvez avoir l’algorithme que vous voulez : quand il n’y a que deux places, s’il y a trois candidats, eh bien il y en aura un qui restera sur le côté ! D'accord ? Donc aucun algorithme ne peut résoudre le problème du manque de places dans l’enseignement supérieur. Après ça peut être un choix de dire « on veut plus de places » ou « on ne veut pas plus de places pour telle ou telle raison », mais il faut être clairs là-dessus.

On va commencer par un petit retour en arrière. Je vous propose qu’on revienne en 1985. Si on revient au milieu des années 80, on va faire cette petite expérience de pensée, vous pouviez vous inscrire dans plusieurs formations, il n’y avait pas de problème, il n’y avait pas de procédure informatisée et même pas de procédure centralisée. Comment ça se passait ? Essentiellement vous alliez à l’université sur place et après vous échangiez des courriers papier ou des coups de fil avec votre université. Vous alliez vous inscrire, on vous disait : « Désolé il n’y a plus de place, on vous met sur liste d’attente » et puis peut-être qu’une semaine après, deux semaines après, un mois après, vous receviez un courrier vous disant : « Ah, finalement on a une place, est-ce que ça vous intéresse ? » Alors là vous envoyiez, vous, une lettre pour dire « oui ça m’intéresse » et vous envoyiez une autre lettre à une autre université où vous étiez pris en disant « finalement je ne viendrai pas parce que j’ai eu autre chose ailleurs ».

Comment ça se passait ? On va prendre en exemple, on va faire une simulation. Pour simplifier les choses, on va prendre sept bacheliers ; je ne voulais pas les appeler A, B, C, D, E, F, G donc je les ai appelés Anaïs, Brice, Coline, David, Enola, Florent et Géraldine, et puis on imagine qu’ils veulent aller sur deux formations que j’ai appelées F1 et F2 et chaque formation a trois places. Donc si vous comptez bien, deux fois trois places ça fait six places, il y aura de toutes façons quelqu’un qui n’aura pas de place. Évidemment chaque candidat a ses propres préférences sur les formations et chaque formation a ses propres préférences sur les candidats, avec des critères qui peuvent être n’importe lesquels parmi ceux que j’ai cités avant.

On peut faire un tableau avec les différents candidats. Je vais supposer par exemple qu’Anaïs préfère aller d’abord dans la formation F2 puis s’il elle n’a pas F2 elle aimerait bien aller en F1. On fait ce tableau-là, je ne vais pas vous le lire en entier.
Et puis, de l’autre côté, les universités, elles, elles font un tableau de classement. Donc l’université F1, la formation F1 décide de classer Anaïs en premier, Brice en deuxième, Coline en troisième, David en quatrième, Florent en cinquième, Enola en sixième et Géraldine en septième. Alors que F2 décide de mettre David d’abord, puis Enola, puis Coline, puis Brice, puis Anaïs, puis Géraldine, puis Forent.

Comment les universités vont faire pour prendre du monde ? Elles n’ont que trois places chacune. Donc le principe est simple, elles vont mettre ce qu’on va appeler une barre d’admission ; ce concept de barre d’admission va être essentiel par la suite. On compte combien on a de places, on met une barre et puis on dit à ceux qui en-dessous de la barre « désolé on ne peut pas vous prendre, en tout cas pas pour l’instant » et ceux qui sont au-dessus de la barre « tant mieux pour vous, bienvenus, vous êtes pris. » OK ! Donc au départ on les fixe après les trois premières personnes dans chacune des deux formations puisqu’elles sont chacune trois places.

Si vous regardez bien vous vous apercevez que de toutes les personnes qui sont prises, en fait, il y en a une, Coline, qui était prise dans deux formations. D’accord ! Donc puisqu’elle est prise dans deux formations elle va se désister d’une des deux. Il se trouve que dans le tableau où j’avais donné les préférences, elle préférait aller dans la formation F2, donc elle va se désister de F1. Donc on a cette situation-là où j’ai barré Coline sur la formation F1, elle est dans la formation F2, j’ai mis en gras juste pour montrer qu’elle faisait ce choix-là, et puis, à partir de là, qu’est-ce qu’on constate ? On constate que dans la formation F1, il n’y a que deux étudiants alors qu’il y a trois places. Donc on va baisser la barre ; quand il reste des places dans une formation on baisse la barre. Donc ici je baisse la barre et là je peux admettre David. OK !
Et là David, vous voyez qu’il a le choix entre deux formations, il se trouve qu’il préférait F1 ; donc il va démissionner de F2. Il démissionne de F2 ; il n’y a plus que deux personnes dans la formation F2, donc on peut baisser la barre. Ici on arrive à une situation où il y a Anaïs, Brice, David dans la formation F1 ; Enola, Coline, Brice admis dans la formation F2. Brice a un choix à faire entre les deux, il se trouve qu’il préférait F2, donc il démissionne de F1, ce qui libère une place en F1, donc on baisse encore la barre. Et puis là, il y a trois personnes qui sont prises dans F1, il y a trois personnes qui sont prises dans F2 et, si je ne dis pas de bêtise, il n’y a personne qui est en commun entre F1 et F2. OK ! Donc les formations sont remplies, il n’y a plus de désistement possible ; quand il n’y a plus aucune démission, la liste des candidats est épuisée, on s’arrête. D’accord ? Et là ça y est, les universités ont fait le plein. Si vous regardez les candidats qui restent, eh bien dans les candidats qui sont en dessous de la barre pour F1, il y a Enola mais elle a eu une place dans F2 ; il y a Géraldine qui n’est pas prise dans F1, elle n’est pas prise non plus dans F2 ; il y a Anaïs qui n’est pas prise dans F2 mais qui était prise en F1 et Florent qui n’est pas pris dans F2, mais il était pris en F1. Donc en fait il y a Géraldine, simplement, qui n’est prise nulle part. OK !

Cette procédure a un gros défaut, c’est qu’elle est lente, parce qu’à chaque fois que l’université reçoit une démission elle va baisser sa barre et elle va informer un nouveau candidat que la barre a baissé et que maintenant il est pris. Et elle va attendre. Le candidat, s’il ne lui répond rien, eh bien elle va laisser la barre comme ça. Si le candidat lui dit « je démissionne parce que finalement je préfère ce que j’ai déjà », elle va de nouveau baisser la barre. Donc vous avez tout un jeu d’échanges qui a lieu, un jeu d’échanges de messages entre les universités qui disent aux candidats « finalement on peut vous prendre » et les candidats qui disent « finalement je ne suis pas intéressé ».
Si vous prenez par exemple Brice, il était premier sur la liste d’attente, sur une des listes d’attente, mais il a fallu qu’il y ait deux désistements avant qu’il soit pris. Parce que pour que la barre baisse, la barre qui était juste au-dessus de lui baisse, il a fallu qu’elle baisse d’abord de l’autre côté, que ça libère une première place dans l’autre formation, puis une deuxième place qui a permis à quelqu’un qui était devant Brice, dans la formation qui l’intéressait, de se désister. Donc même si vous êtes en tout début de liste d’attente, ça peut être très long avant que la barre baisse suffisamment pour que vous soyez pris.

Ce système, dans la réalité, ce qui se passe pour de nombreux candidats, c’est qu’ils attendaient tout l’été, dans les années 80, une réponse qui peut-être ne venait jamais parce que oui, ils étaient sur liste d’attente, mais il se trouve qu’il n’y a pas assez de désistements. Donc ils ne savent pas, ils sont dans l’incertitude tout l’été, ce qui est assez angoissant.

Un autre truc qui arrive aussi pour les étudiants les plus pauvres, c’est que quand vous ne savez pas si vous allez être à Dijon, à Strasbourg, à Toulouse, à Saint-Étienne l’année prochaine, vous dites qu’il faut chercher quand même un logement. À moins que vous n’ayez du monde de votre famille dans toutes ces villes-là, il faut chercher un logement. Vous savez très bien que si vous cherchez un logement à la fin de l’été ça va être beaucoup dur de le trouver à un prix raisonnable qu’au début de l’été. Donc si vous n’avez pas trop les moyens, vous allez avoir tendance à dire « aujourd’hui j’ai une proposition ; il y avait d’autres choses qui me plaisaient plus, mais je vais me fixer sur cette proposition parce que là, aujourd’hui, au 11 juillet, je peux trouver un logement, alors que si je cherche au 31 août, je n’aurai pas les moyens de me payer un logement ». Je n’ai pas de statistiques précises là-dessus, mais je suis convaincu qu’il y a un certain nombre d’étudiants qui sont obligés de se décider à un moment et qui finissent par se décider alors qu’ils auraient pu avoir quelque chose de mieux s’ils avaient continué à attendre.
Ça c’est une conséquence directe de la lenteur du processus.

Est-ce qu’on peut accélérer le processus ? Toute la question c’est est-ce qu’on peut accélérer le processus ? La réponse est en fait assez simple, il y a une solution toute bête pour accélérer le processus, c’est ce qu’on appelle la hiérarchisation des vœux par les candidats. C’est-à-dire que si chaque candidat annonce dès le départ quel est l’ordre de ses vœux au lieu juste de postuler sur trois universités, il dit « je postule sur ces trois universités, mais celle-là c’est ma préférée ; si je ne l’ai pas, je veux celle-là et si je n’ai aucune des deux, je préfère celle-ci ». D’accord ?
Il y a plusieurs intérêts au fait que les candidats hiérarchisent.
Il y a un premier intérêt, en tant que candidat ça ne vous intéresse peut-être pas, mais c’est quand même intéressant pour l’État, c’est que ça permet de faire des statistiques. Quand vous avez fait cinq vœux, on sait finalement que le vœu que vous avez classé cinquième, s’il n’y a pas trop de places dans la cinquième formation ce n’est peut-être pas grave parce que, finalement, elle n’est qu’en cinquième vœu ; ce qui serait peut-être important c’est plutôt d’augmenter le nombre de places sur la formation que vous avez classée en numéro 1. Donc en termes de possibilité de faire des statistiques pour l’État, sur l’écart entre l’offre de formation et la demande de formation, c’est un point qui me paraît très important.
La deuxième chose qui est importante, une fois que vous avez hiérarchisé vos vœux, c’est qu’on peut simuler le processus. C’est exactement ce qu’on a fait tout à l’heure avec la petite simulation que je vous ai faite tout à l’heure. Je vous ai dit à chaque fois que tel ou tel candidat démissionnait parce que je savais quel était l’ordre de ses vœux. S’il avait fallu que je les appelle à chaque fois pour savoir quel était l’ordre des vœux, on n’avait pas le temps de terminer la présentation !
Et il se trouve que c’est rapide en pratique. Si vous prenez un million de candidats, ce qui est à peu près l’ordre de grandeur pour Parcoursup, on est à plus de 800 000 candidats, plus de 800 000 bacheliers, que vous supposez que chaque candidat fait 100 vœux, ce qui est nettement plus que ce qui est autorisé dans Parcoursup et vous faites tourner ça sur l’ordinateur portable que j’ai là, qui est plutôt vieillissant, il a cinq ans, ça se fait en trois minutes ; c’est l’ordre de grandeur, trois à cinq minutes.
Donc en termes de calcul, c’est extrêmement facile si on veut le faire.
Puisque c’est très rapide, eh bien on peut faire ce calcul. Si les candidats expriment l’ordre de leurs vœux, s’ils hiérarchisent leurs vœux, on peut faire ce calcul et dès qu'on a tous les vœux et dès qu’on a tous les classements, on peut annoncer où on met les barres d’admission et chaque candidat sait qu’il est pris sur le vœu qu’il préfère parmi tous ceux où il est au-dessus de la barre d’admission.

Ça va à peu près pour tout le monde ? Oui ? N’hésitez pas si vous avez des questions, si ce n’est pas clair. Mon objectif c’est que tout le monde puisse comprendre ce mécanisme d’ici la fin de cette conférence. Donc c’est bon ? Je poursuis.

Si on regarde, puisqu’on parlait de retourner vers le futur, historiquement la problématique n’est pas nouvelle. Il y a un article qui date de 1962, qui a été écrit par des mathématiciens qui s’appelaient Gale et Shapley, un article qui s’appelle College Admission and The Stability of Marriage1 qui explique exactement ça. D’accord ?

C’est à peu près ce que fait APB, ce que faisait APB. C’est-à-dire qu’il demandait à chaque candidat quels étaient ses vœux et puis il demandait de classer les vœux. Et une fois que les vœux étaient classés et que les formations avaient fait le classement de leurs candidats, il moulinait et il donnait un résultat. Ils reprennent dans APB ce que je vous ai montré précédemment. C’est à peu près la même simulation, c’est une reprise de cet article de Gale et Shapley de 1962, qui est présentée un petit peu différemment dans l’article de 1962 mais c’était le même principe, sauf que APB ne vous disait pas quelle était la barre d’admission. Il regardait les barres d’admission et puis il disait « votre meilleur vœu dans lequel vous êtes au-dessus de la barre d’admission c’est celui-là, vous êtes pris sur celui-là ».

Donc les résultats étaient essentiellement en une fois.
Pour ceux qui connaissent APB, ce n’est pas tout à fait vrai ; il y avait trois phases d’APB, trois tours. Au premier tour vous aviez les résultats et puis il se trouve que le premier tour avait lieu avant le bac ; parmi les candidats il y en a qui ratent leur bac ; il y en a qui se disent « ah ben tiens, finalement je vais aller étudier à l’étranger » ou « tiens, je vais aller étudier dans telle formation » qui est une formation qui n’est pas dans APB, qui est une formation privée, qui n’a rien à voir avec APB, donc ils sortaient du système. Donc on faisait un deuxième puis un troisième tour pour gérer le fait qu’il y a des candidats qui démissionnaient alors qu’ils avaient des choses dans APB, parce qu’ils préféraient des choses qui étaient hors APB. Mais essentiellement, les résultats principaux, je n’ai pas revérifié les statistiques, essentiellement la plupart des gens savaient où ils allaient lors de la première phase d’APB. Donc il y avait deux tours supplémentaires pour gérer les départs du système.

Parcoursup. Qu’est-ce qu’a fait Parcoursup ?
Il y a eu une décision de la ministre, en juillet 2017, qui a dit « il ne faut pas hiérarchiser les vœux. Les candidats ne doivent pas dire quel est l’ordre de leurs vœux ». C’est une décision qui, personnellement, m’a paru absurde il y un an ; c’est ce qui m’a fait creuser cette question de l’affectation pour essayer de regarder ce qui se passe scientifiquement. Ça me paraît toujours absurde aujourd’hui. Ce qui me rassure c’est que ça paraît absurde aussi à tous les spécialistes de la question et, malheureusement, la ministre a répété que ça faisait partie du principe de Parcoursup. Moi je ne comprends pas en quoi le fait de ne pas hiérarchiser les vœux ça fait partie du principe. Elle a expliqué que ça donnait plus de liberté aux étudiants, enfin aux bacheliers. Moi je ne comprends pas comment le fait d’attendre tout l’été une réponse et de devoir se connecter tous les jours pour vérifier ça donne plus de liberté. J’ai l’impression ou bien que je suis un imbécile ou bien que la ministre nous prend pour des imbéciles !

Ça a une conséquence qui me paraît assez grave en termes de politique publique, c’est qu’il n’y a plus de statistiques. Quand un étudiant a fait dix vœux, s’il a reçu deux propositions sur deux vœux, on ne sait pas si c’était son neuvième et son dixième vœux et qu’en fait il n’est pas content parce que ce n’étaient pas ses vœux préférés, ou si c’était son premier et son deuxième vœux. Et on ne le saura pas puisqu’il n’a dit nulle part quels étaient ses vœux préférés. On pourra juste dire qu’il a eu son vœu préféré parmi les deux propositions qu’on lui a faites. Eh bien oui, normalement il a choisi celui qu’il préférait. Mais c’est à peu près la même chose que dire que 100 % des gagnants au loto ont tenté leur chance. C’est-à-dire que c’est prendre les gens pour des imbéciles !

Donc Parcoursup, le fait de ne pas avoir hiérarchisé les vœux, évidemment ça fait cette longue attente pour les bacheliers puisque ça a démarré le 22 mai et que tous les jours depuis le 22 mai, ceux qui n’ont pas encore eu tout ce qu’ils voulaient sont obligés d’aller continuer à regarder. Et ils le regardent en général tous les jours. Et pire que ça, c’est une angoisse quotidienne des résultats. C’est-à-dire que le problème ce n’est pas juste d’attendre. Si vous attendez vos résultats du bac vous savez que, quand vous avez passé le bac, vous savez qu’une semaine ou deux semaines après vous aurez les résultats. Mais vous n’allez pas regarder tous les jours pour savoir si vous avez vos résultats du bac !
J’ai des collègues dans le secondaire qui ont vu leurs élèves les premiers jours qui étaient toutes les heures en train de regarder sur leur téléphone portable, pour regarder s’ils avaient de nouvelles propositions. Apparemment ce n’était pas suffisamment clairement expliqué sur le site que ce n’est remis à jour qu’une fois par jour, enfin toutes les nuits. Mes collègues l’ont expliqué aux élèves ; ça a permis aux élèves de stresser un petit peu moins ; ça a permis aussi qu’ils écoutent un petit peu plus les cours. Mais vous imaginez que quand on est dans une situation de stress comme ça, quotidienne, ça ne facilite pas le travail intellectuel et donc c’est quelque chose qui est extrêmement difficile et pour les enseignants et pour les élèves toute la période entre le 22 mai et puis le bac.

Pour moi c’est un retour non pas vers le futur mais vers le passé, en 1985. Donc c’est assez dramatique qu’on en arrive là. C’est vraiment utiliser l’informatique pour revenir à un truc pré-informatique.

On peut se poser les questions : qu’est-ce qu’on pourrait faire comme système d’affectation dans lequel on puisse avoir un minimum confiance, sans parler directement d’APB ou de Parcoursup ?
Il y a un certain nombre de conditions, là j’en ai listées huit, il y en a peut-être d’autres. Je les ai listées, en fait, parce que j’ai remarqué que sur APB et sur Parcoursup, il pouvait y avoir des problèmes là-dessus. Je ne vais pas toutes vous les lire maintenant, simplement les deux premières.
C’est le fait qu’on ait un algorithme public et compréhensible et qu’on spécifie clairement ce qu’on veut.
Je vais commencer par la question de l’algorithme.
Pour APB l’algorithme était soi-disant publié. Le ministère, suite à des demandes de droit des lycéens notamment, a publié un algorithme ; il l’a publié sous la forme d’une page, je crois que c’était une page A4, avec un joli dessin. Tous les informaticiens ont trouvé que c’était grotesque. Ce n’était pas un algorithme ; c’était juste un truc qui expliquait vaguement les choses. En réalité l’algorithme est resté relativement secret mème si, à priori, il semble que ce soit l’algorithme que j’ai présenté précédemment.

Pour Parcoursup il y a quand même un progrès, un progrès indéniable, c’est qu’il a été publié de façon détaillée, il a été publié d’ailleurs sur Framagit2 comme le disait Pyg [Pierre-Yves Gosset] hier. Donc c’est un progrès.

Après, la question, ce n’est pas juste un algorithme. Un algorithme ça répond à une question ; ça répond à la question comment on fait quelque chose ? La première question à se poser ce n’est pas comment on fait, c’est qu’est-ce qu’on veut faire ? Et ça, c’est ce qu’on appelle une spécification. Un algorithme ça n’a pas de sens si ça ne répond pas à une question posée et, si possible, il faudrait que cette question, cette spécification, ce qu’on veut faire, ce soit dit clairement. Pour moi le problème c’est que si on regarde APB comme Parcoursup il n’y a pas eu de spécification qui a été publiée : c’est censé affecter les bacheliers dans l’enseignement supérieur, mais on ne sait pas comment ; c’est censé plus ou moins utiliser un classement, on ne sait pas bien comment.

Alors moi je proposerais bien une spécification qui est assez naturelle, qui est la suivante, qui est de dire : on va avoir ce mécanisme avec des barres d’admission, le classement avec des barres d’admission et ce qu’on veut c’est que les barres d’admission soient fixées en respectant la capacité des formations ; il ne s’agit pas de dire on admet tout le monde dans toutes les formations puisque qu’il n’y a pas assez de places pour tout le monde dans toutes les formations. Donc il faut respecter la capacité des formations et il faut mettre quand même les barres aussi bas que possible de façon à admettre le maximum de gens. Plus les barres sont basses, plus vous avez de choix, à priori, dans les vœux que vous avez proposés, plus vous aurez vos premiers vœux.

Et puis il y a une autre chose qui est importante, j’en parlerai un petit peu plus tard, c’est que ce serait bien que le système n’incite pas les étudiants, enfin les bacheliers, à mentir sur leurs préférences. Il y a des situations où vous pouvez avoir intérêt à mentir pour que ça marche mieux pour vous, mais c’est assez dramatique en termes de statistiques parce qu’on ne sait pas ; si les gens se mettent à mentir on ne sait pas ce qu’ils voulaient réellement.

Il se trouve qu’il y a un vrai problème derrière ici, c’est que les barres d’admission dans APB et dans Parcoursup ne sont pas aussi basses que possible et, en plus, le système peut inciter à mentir dans certains cas.

Je vais montrer ce que ça donne. On reprend l’exemple précédent.
L’exemple précédent on s’était arrêtés là, c’est-à-dire que la barre pour la formation F1 descendait après le cinquième candidat et la barre pour F2 descendait après le quatrième candidat. Et ça marchait bien puisque dans F1 il y avait deux démissions, dans F2 il y avait une démission, et donc il n’y avait que trois personnes qui allaient dans chaque formation.
En fait l’algorithme s’arrêtait là puisqu’il n’y avait plus de démissions. Pourtant on aurait pu faire mieux ! Si vous regardez Enola, vous remarquez qu’Enola n’est pas prise, elle est première sur liste d’attente sur F1 et elle est prise dans F2, mais en fait elle préférait F1. D’accord ? Et Anaïs est première sur liste d’attente dans F2, elle est prise sur F1, mais elle aurait préféré F2. Et l’algorithme, là, est bloqué. D’accord ! Et si on avait descendu un tout petit peu plus les barres, comme ça, eh bien Anaïs aurait eu le choix entre F1 et F2 et elle aurait démissionné de F1 ; et Enola aurait eu le choix entre F1 et F2, elle aurait démissionné de F2.
Donc finalement il y aurait eu trois personnes dans F1, trois personnes dans F2, ça marchait aussi, mais en plus Anaïs et Enola étaient plus contentes qu’avec la situation précédente.

En fait, l’algorithme qui est utilisé par APB et par Parcoursup ne met pas les barres d’admission de façon optimale ; il les met comme on le faisait dans les années 80 en baissant les barres petit à petit parce qu’on ne pouvait pas faire mieux, parce que c’était chaque université qui faisait ça dans son coin et que c’était la façon naturelle de faire.

On peut se poser la question : est-ce qu’il y a une façon systématique de mettre ces barres d’admission de façon optimale ? Est-ce que ça c’est optimal ou pas et est-ce qu’il y a une façon de le faire ?
La réponse est oui et la réponse non seulement c’est oui, mais elle est connue depuis 1962. C’est toujours l’article de Gale et Shapley de 1962 qui explique comment on peut faire ça. Il le présente un petit peu différemment qu’avec les barres d’admission, il utilise une métaphore qu’on appelle la métaphore des mariages stables, mais c’est vraiment les mêmes idées.

Donc il y a deux algorithmes. Il explique qu’il y a l’algorithme classique qu’on appelle COSM qui est celui d’APB et de Parcousup et puis il explique qu’il y a l’algorithme qui est optimal pour les étudiants qu’on appelle SOSM.
SOSM, c’est très simple. Comment ça marche ? On fait un truc qui est complètement contre-intuitif. Au lieu de mettre les barres de façon prudente au début et de les baisser, on les met le plus bas possible et puis on se dit « ah zut, on les a mises trop bas » et on les remonte tant qu’il y a besoin de les remonter.

Exemple : vous fixez les barres ici. Si vous fixez les barres là, qu’est-ce qui va se passer ? On calcule les démissions. Vous calculez les démissions, c’est toujours avec les mêmes préférences pour les étudiants, vous calculez les démissions, vous vous apercevez que dans F1, finalement, il n’y a plus que deux personnes, F1 n’est pas plein, ce n’est pas dramatique mais c’est dommage. Mais surtout, ce qui est très gênant, c’est que dans F2 il y a cinq personnes et donc ça, ça ne va pas. D’accord ? Il y a trop de monde. Puisqu’il y a trop de monde dans F2, qu’il y a deux personnes de trop dans F2, on va remonter la barre dans F2 de deux crans. Une fois qu’on a remonté la barre, on recalcule les démissions. Là qu’est-ce qu’on voit ? Dans F2 c’est bon, il y a trois personnes. Mais dans F1, cette fois-ci, il y a un petit moins de démissions et dans F1 vous avez quatre personnes au lieu de trois. Ce n’est pas grave ! Enfin ce n’est pas grave, ce serait gênant, donc on va remonter la barre d’admission de F1 et on recalcule les démissions.
Ici tout va bien : il y a trois personnes dans F1, trois personnes dans F2.

Cet algorithme est complètement général. Ce mécanisme-là marche très bien, on peut le simuler informatiquement, et ça vous garantit de mettre les barres le plus bas possible. C’est expliqué dans l’article de 1962 de Gale et Shapley.

Cet algorithme SOSM, ce n’est pas purement théorique. Aux USA il est utilisé depuis 1998 pour les internats de médecine. En Écosse il est apparemment utilisé, alors je ne sais pas depuis quelle date, pour l’affectation des jeunes médecins. En Espagne il est utilisé aussi pour l’affectation des bacheliers. En Hongrie, ce qui est intéressant c’est qu’ils avaient commencé par l’algorithme qui était le même que celui d’APB et de Parcoursup, COSM, et puis, en 2007, ils se sont aperçus, il y a quand même quelqu’un qui a dû dire « ah ! oui, mais ce n’est pas le bon algorithme », donc ils sont passés à SOSM. Et ça fait plus de dix ans, apparemment, personne n’a demandé à changer depuis.

Donc en résumé ce que fait Parcoursup n’est pas clairement spécifié ; on peut le spécifier.
Il y a un algorithme qui est l’algorithme optimal qui est bien connu depuis 56 ans, à peu près, mais c’est assez triste de voir qu’il n’est pas utilisé. D’accord ? Ça va sur ces points ?

Donc ça c’était sur les points d’algorithmique, la question de l’algorithme et la question de la spécification. Ce ne sont pas les seuls.

Une fois que vous avez un algorithme il faut le mettre en œuvre. Quand vous devez le mettre en œuvre, il y a des conditions à respecter pour le mettre en œuvre. On appelle ça des préconditions informatiquement. C’est quoi une précondition ? C’est une condition préalable à l’exécution d’un algorithme ou d’un programme.

Pour les algorithmes de Gale et Shapley, les deux algorithmes, il y a une précondition qui est importante c’est que l’ordre des vœux des candidats ne doit pas être un critère de classement. Quand les formations classent leurs candidats, elles ne doivent pas dire celui-là on va le placer mieux que l’autre parce qu’ils ont d’aussi bons dossiers, mais celui-là nous a classés en premier alors il est sans doute plus sympa avec nous. Ça c’est interdit si vous voulez que l’algorithme de Gale et Shapley marche correctement.

Dans APB, il y avait un truc qui existait qui était les bonus « premier vœu ». Sur certaines formations vous pouviez avoir un bonus sur certains vœux si c’était votre premier vœu. Qu’est-ce que ça veut dire ? Ça veut dire que, imaginons que vous voulez postuler, je ne sais plus quelles étaient exactement les formations concernées, mettons que ce soit une formation de médecine. Vous voulez postuler en médecine, si vous êtes moyen, vous avez un dossier moyen – alors c’est un peu plus compliqué que ça parce que ce n’était pas sur le dossier –, mais disons que vos chances étaient moyennes et, si vous êtes en premier vœu, vous allez avoir un bonus donc ça va augmenter fortement votre chance d’être pris.
Donc imaginons la situation suivante, vous avez deux formations qui vous intéressent : une première formation qui vous intéresse bien mais vous n’êtes vraiment pas sûr du tout d’être pris ; et puis la deuxième c’est médecine et puis là vous êtes un peu juste, un peu moyen, vous dites que ça risque d’être tangent. Qu’est-ce que vous avez intérêt à faire ? Eh bien si vous exprimez vos vœux de façon tout à fait honnête, vous risquez de ne pas être pris sur la première formation et puis quand vous allez arriver sur médecine vous allez vous faire passer devant par tous ceux qui avaient mis médecine en premier vœu. Donc vous avez peut-être intérêt à mentir ; à dire « je m’autocensure et je ne mets pas mon premier vœu sur l’autre formation, je mets comme premier vœu médecine parce que là j’ai un dossier moyen mais, avec en plus le premier vœu, je suis sûr d’être pris ». OK ! Vous voyez l’idée ? C’est-à-dire que vous aviez intérêt, dans certaines situations, non pas à répondre honnêtement mais à répondre de façon stratégique.

Donc ça veut dire que vous avez intérêt à ne pas donner vos vraies préférences contrairement à ce qu’était annoncé. C’était annoncé, dit et redit « exprimez vos préférences librement et honnêtement », eh bien ce n’était pas forcément une bonne idée !

Ça fausse les statistiques. Évidemment puisque les préférences ne sont pas les vraies préférences. Et qui est-ce que ça favorise ? Ça favorise les gens qui savent jouer stratégique. Et qui sont les gens qui savent jouer stratégique ? Eh bien ce sont les enfants de catégories socioprofessionnelles supérieures et les enfants de profs qui connaissent bien le système.

Je parlais tout à l’heure de liberté, égalité, fraternité, l’égalité en prend un coup !

Dans Parcoursup la solution est radicale. Je ne sais pas si c’est pour cela qu’il n’y a plus de hiérarchisation des vœux, mais la solution est radicale : il n’y a plus de hiérarchisation des vœux donc, de toutes façons, il n’y a plus de premier vœu, donc il n’y a plus de bonus premier vœu. Enfin ce n’était peut-être pas la peine de jeter le bébé avec l’eau du bain, ou l’APB avec l’eau du bain, je ne sais pas comment il faut dire.
Et puis évidemment, casser la hiérarchisation des vœux ça veut dire qu’il n’y a plus de statistiques ; ça veut dire qu’on ne pas utiliser l'algorithme SOSM, parce qu’on ne va pas s’amuser à dire aux étudiants « on place les barres en bas, on vous dit que vous êtes admis partout, c’est quoi votre premier vœu ? » Et puis on regarde et puis on dit : « Ah ben non, en fait il y en a trop qui sont sur telle formation, on vous dégage de votre premier vœu, c’est quoi le vœu suivant ? » Ça ferait quelque chose d’assez horrible. Donc ici, sur Parcoursup, on a toujours cette attente interminable.

L’algorithme c’est une chose ; la spécification c’est une chose. Mais après, une fois qu’on a spécifié, il faut implanter le programme ; il faut écrire le code et les informaticiens savent bien que le diable est dans les détails. Quand on écrit un programme, il suffit d’une toute petite erreur pour qu’il y ait un bug. Donc c’est important de savoir comment est réalisée l’implantation du programme, le code du programme.

Le code d’APB n’a pas été publié, sauf une toute petite partie qui est le tirage au sort sur lequel le ministère a publié 20 pages, ça fait à peu près 20 pages qui ont été envoyées par courrier papier ; ils l’ont fait de très mauvaise grâce et ils ont envoyé un courrier papier où le code est formaté de façon absolument horrible. Ça ne fait vraiment pas honneur à ceux qui ont programmé ça derrière, la façon dont c’est présenté.
Et puis ce code dépend d’Oracle, qui est un logiciel privateur, c’est une grosse base de données mais qui est une boîte noire, donc le code est une boîte noire.

Dans Parcoursup il y a eu un progrès indéniable, c’est que le cœur de l’algorithme est publié. Il a été publié le 21 mai 2018 sachant que les premiers résultats étaient le 22 mai. Et ce programme dépend aussi d’une base qui tourne sous Oracle.
Ce n’est vraiment que le cœur de l’algorithme qui a été publié, tout le reste n’a pas été publié et il peut y avoir des surprises dans le reste.

Moi ce que j’aimerais bien un jour c’est qu’il y ait une implantation qui soit publiée un peu avant l’utilisation comme ça on aurait le temps de regarder si elle est correcte ou pas avant l’utilisation.
Quelle soit publiée en intégralité parce que, encore une fois, le cœur de l’algorithme est publié. On peut se convaincre, sans doute – je n’ai pas eu le temps moi de le lire ; le cœur de l’algorithme, l’implantation correspondante est publiée ; on peut se convaincre que l’implantation correspond à peu près à l’algorithme, mais il y a plein d’autres choses autour, il y a plein de manipulations de données autour sur lesquelles il y a des possibilités d’erreurs.
Et puis j’aimerais bien qu’un jour ce soit publié uniquement sous forme de logiciels libres pour que n’importe qui puisse facilement essayer le programme lui-même pour voir si ça tourne bien.

Une fois qu’on fait tourner un gros processus comme ça, il y a aussi toute la phase d’exploitation du système. Donc il faut gérer rigoureusement le processus.
Ce que vous avez là ce sont quelques petits témoignages de problèmes que j’ai vus sur APB.
Par exemple, du côté des classes prépa on récupère un gros fichier de tableur avec la liste des candidats et leurs notes et puis différentes informations comme est-ce que l’étudiant est boursier ou pas ? Combien de parts de bourse il a ? À quelle distance il habite de la formation sur laquelle il postule ? Et puis il y a des informations du type est-ce qu’il a demandé l’internat ou pas ?

Donc comment ça marche ? Comment ça marchait ? Le 27 avril, en 2013, j’ai téléchargé ce fichier tableur et puis il y avait une colonne à remplir qui était comment on classe les étudiants : en face de chaque étudiant on met si on le classe un, deux, trois, etc. et puis on renvoie ça ; je renvoie ça le 24 mai ; on a fait ça avec des collègues pour trier les dossiers, on a pris à peu près un mois, et puis quand je renvoie ça, le site web me dit : « Ah là, dans telle colonne, tel endroit, vous avez un code qui n’existe pas ; votre code est inexistant ». J’ai regardé, je me suis dit « tiens c’est bizarre, est-ce que c’est moi qui l’ai rajouté ? » J’ai repris le fichier que j’avais téléchargé le 27 avril ; il était déjà là ce code. Donc j’ai fini par contacter le service d’APB par téléphone. Ils me disent : « C’est normal, ce code on l’a changé ; il n’existe plus. » Il existait le 27 avril mais le 24 mai il n’existe plus. Ils n’ont pas eu l’idée qu’ils pouvaient peut-être le changer plutôt en octobre et faire des essais en octobre, en septembre et que là ce n’était peut-être pas le moment pour toucher au bazar ; ça ne fait pas très sérieux.

En 2014, le 5 juin, non le 12 juin pardon, on avait déjà renvoyé tous nos classements et puis là on reçoit un petit mail d’APB disant : « Ah vous allez rire, on s’est trompés dans la colonne qui donne les parts de bourse, mais on est gentils on vous laisse cinq jours pour refaire tous vos classements ». Heureusement, il se trouve que nous on ne l’avait pas prise en compte cette colonne, on avait pris une autre colonne qui parlait aussi des critères sociaux pour l’accès à l’internat, mais sinon moi ça ne m’aurait pas fait rire du tout !

En 2015, il y a une colonne qui donne quelle est la distance du domicile de l’élève à la formation. Quand quelqu’un est à 500 kilomètres on va plutôt le favoriser pour l’internat par rapport à quelqu’un qui est à trois kilomètres. Et ce champ s’appelait « kilomères », c’était une faute d’orthographe ; en 2014 il s’appelait « kilomères » ; en 2013 je crois qu’il s’appelait « kilomères » aussi. Et puis en 2015, j’ai téléchargé le fichier un jour et puis quelques jours après, en fait ce n’était plus « kilomères », c’était « kilomètres » ; ils avaient jugé que c’était une correction tellement importante à faire, ils avaient quand même mis deux ans avant de se rendre compte qu’il y avait un petit bug là, mais ils l’ont fait tout de suite, ça ne pouvait pas attendre septembre ! Donc là encore ce n’est pas une gestion sérieuse du processus.

Après ça moi j’ai passé la main, j’ai laissé un autre collègue s’en occuper ; je lis encore les dossiers mais la partie technique de charger le fichier, de le renvoyer tout ça, ce n’est plus moi qui fais.

En 2016 j’ai un collègue qui m’a signalé que, par exemple, on a deux fichiers dans lesquels il n’y a pas les mêmes informations, deux fichiers de tableur, et il y avait deux colonnes qui s’appelaient presque pareil ; on avait l’impression que c’était les mêmes informations, mais elles n’avaient pas tout à fait le même nom ; en fait c’était les mêmes, mais elles n’avaient pas le même nom. Donc là encore ce n’est pas très rigoureux sur la façon de gérer les choses. Voilà !

Pour moi, la cause de tous ces problèmes, c’est que d’abord il y a une complexité qui est inutile. APB et Parcoursup ce sont des vraies usines à gaz. On pourrait faire des choses, me semble-t-il, plus simples.
Ensuite, c’est qu’il n’y a absence de réflexion vraiment sur ce processus. Les informaticiens qui gèrent ne serait-ce qu’un site web, ils vous expliqueront que normalement ils ont la version de développement et la version de production, quand on fait un truc un peu sérieux. Quand on fait son site web personnel, moi j’avoue que je n’ai pas ma version de développement et de prod. Mais quand on gère quelque chose qui doit gérer de l’ordre d’un million d’étudiants, il faudrait être un petit peu sérieux sur le processus.
Et une possibilité aussi c’est qu’il n’y a jamais eu de moyens sérieux alloués, je pense, à ça. APB, je crois que c’est moins d’une dizaine de personnes qui travaillent sur la partie informatique, me semble-t-il. Je n’ai plus les sources précises là-dessus.

On a parlé d’implantation, de gestion du processus et après il y a une autre question qu’on peut se poser, qui va plus loin, c’est que vous exécutez un programme sur un ordinateur. Je ne sais pas si vous avez entendu parler des problématiques d’ordinateurs de vote par exemple. Quand vous avez une machine à voter, vous votez et puis vous avez un résultat au bout. On peut toujours vous dire « le logiciel qui tourne sur la machine de vote c’est un logiciel libre, regardez, voilà son code », mais qu’est-ce qui vous prouve que le code qui est sur la machine c’est celui qu’on vous a donné ? À priori rien ! Donc vous ne pouvez pas être sûr que le code qui tourne est le bon. Vous ne pouvez pas non plus sûr être que le PC qui exécute le code n’a pas un problème. Que ce soit le fait qu’il est défectueux, que ce soit le fait qu’il est vérolé. Défectueux ça arrive : il y a eu un cas de machine de vote où on sait qu’il y a eu une erreur sur le comptage des votes ; il y a eu 4096 votes en trop enregistrés. Pourquoi 4096 ? Parce que ça correspond exactement à ce qui se passe quand on change un bit, de 1 à 0, et l’explication c’est qu’il y a eu une petite erreur physique, un rayon cosmique qui a dû arriver, qui a changé un bit ; ça se produit rarement mais ça peut se produire et ça a changé le résultat. Comment vous pouvez vérifier que là ça s’est bien passé ? On ne sait pas.

Et puis vous ne pouvez pas vérifier non plus que les résultats qui sont publiés sont bien sont qui ont été calculés. S’il y a quelqu’un qui récupère les résultats calculés et puis qui change pour remonter un copain, eh bien vous ne le saurez jamais ! D’accord ?

C’est une problématique qui est très difficile, qui n’a pas vraiment de solution en l’état actuel de la science, mais la science a quand même des réponses à ces questions-là. Les réponses de la science à cette question de l’expérimentation ça a été le critère de reproductibilité. Si vous voulez que quelque chose soit une expérience scientifique il faut montrer que vous êtes capable de reproduire l’expérience et que ça va donner le même résultat. Donc on pourrait exiger, par exemple, que les résultats soient reproduits par une commission de contrôle indépendante avec un matériel, un système d’exploitation différents, avec éventuellement une implantation différente.

Et puis on pourrait même espérer mieux, c’est que les données soient ouvertes ; c’est-à-dire que les données d’APB on les publie, éventuellement en anonymisant les données pour qu’on ne sache pas, on met un numéro d’anonymat à chaque candidat ; on publie les données et n’importe qui peut rejouer l’exécution du code d’APB ou de Parcoursup pour recalculer les données et vérifier que ça donne bien les mêmes choses. Et ça, il me semble que c’est indispensable pour qu’on puisse avoir confiance dans le résultat.

Il se trouve que la publication des données même anonymisées, il n’y en a pas eue à ma connaissance dans APB ; il n’y en a pas eu non plus dans Parcoursup. Ce serait pourtant quelque chose d’intéressant me semble-t-il.

Évidemment on peut se dire est-ce qu’il n’y a pas des problématiques de données personnelles, en publiant tout ça ? D’une part on pourrait essayer d’anonymiser un peu et, d’autre part, si vous regardez tous les concours officiels de l’État, les résultats sont publiés officiellement. Donc ce n’est pas quelque chose qui, en tout cas moi me paraît choquant à priori.

Un autre problème qui peut se poser ce sont tous les problèmes légaux et notamment le droit d’accès et de rectification qui étaient prévu dans la 78-17 du 6 janvier 1978, qu’on appelle la loi informatique et libertés familièrement, qui a été complétée par le RGPD [Règlement général sur la protection des données] ; j’avoue que je n’ai pas eu le temps de me plonger vraiment dans le RGPD, mais essentiellement ce que vous dit cette loi, c’est que quand vos informations sont traitées par un système informatique, vous avez le droit de vérifier si elles sont rentrées correctement et vous avez le droit de demander à ce qu’elles soient corrigées. Dans APB et dans Parcoursup ce n’est pas vraiment un droit qui existe. Je vous donne des exemples.
Il y a des situations où vous avez un élève de terminale qui candidate sur APB, en tout cas j’ai vu sur APB, et son lycée ne remonte pas toutes les notes : il oublie de mettre sa note de Sciences physiques, ou il oublie de mettre… J’ai vu des situations où il y avait une note de Sciences pour l’ingénieur qui était mise et il n’y avait pas le rang dans la classe. On savait qu’il y avait 35 élèves dans la classe, mais on ne savait pas si le candidat était premier, deuxième, troisième, alors que c’est une information qu’on avait pour tous les autres. Pourquoi ? Parce que c’était un oubli du lycée qui avait fait remonter.
Qu’est-ce qu’on fait nous, quand on a ce genre de dossier ? On n’a pas le droit de contacter les candidats. On n’a pas matériellement je pense, de toutes façons, le temps de faire remonter et de récupérer les informations, donc on dit « on va faire à la louche, il doit être à peu à peu là, donc son dossier il est plutôt bon, il est plutôt pas bon ». Et l’élève, s’il n’est pas pris à cause de ça, parce que l’information n’était pas là, il n’en saura jamais rien. Il pourra juste découvrir qu’il n’est pas pris sur une formation où il pensait être pris. Mais il n’aura même pas, à ma connaissance il n’avait même pas les données et je pense qu’il ne les a toujours pas dans Parcoursup, il n’a toujours pas précisément les données qui sont dans le système le concernant. Donc les candidats ne peuvent pas du tout vérifier.

Dans Parcoursup il y a une toute petite amélioration, c’est que si vous n’êtes pas pris à un endroit, on va vous donner votre rang ; on va vous dire « là vous êtes 300e en liste d’attente » et si vous avez un copain qui est moins bon que vous et que lui est 200e en liste d’attente vous dites « ah, il a dû y avoir un problème » et là vous pouvez essayer de faire un recours ; mais c’est relativement maigre comme information quand même. Et la rectification des erreurs n’est pas prévue dans l’algorithme. Donc la rectification des erreurs ça peut être ce genre de chose : vous appelez et vous aller dire « mais il y a eu une erreur ». Même si on vous fait remonter dans les classements, ce qui à mon avis va être compliqué, au mieux, ce qui va se passer, c’est qu’on va vous dire « on va vous mettre premier sur liste d’attente ; vous deviez être pris, eh bien vous ne serez pas pris, mais on vous met premier sur liste d’attente ; ça vous donne de bonnes chances d’être pris ». Ce n’est pas une rectification complète ! D’accord !

Dans les erreurs, il y a aussi des erreurs qui sont des erreurs humaines. Quand vous êtes obligé d’aller regarder tous les jours sur Parcoursup, il y a un certain nombre de bacheliers qui ne vont pas regarder sur un ordinateur, qui regardent sur leur téléphone portable. Et puis sur un téléphone portable, apparemment, s’ils ne cochent pas exactement au bon endroit, il y a eu un certain nombre de cas de gens qui se sont faits démissionner parce qu’ils n’ont pas dû faire la bonne manip, parce que l’interface n’était peut-être pas assez claire. Donc on voit des gens qui disparaissent et j’ai des collègues qui voient des gens disparaître et puis, tout d’un coup, revenir premier en liste d’attente. Donc c’est un moindre mal d’être premier en liste d’attente, mais c’est quand même un mal.

Et puis, si on voulait vraiment gérer les erreurs, ce serait très compliqué puisque l’évolution est quotidienne. Donc si vous avez quelqu’un qui met deux jours à se rendre compte qu’il y a une erreur, il faut revenir sur les deux jours en arrière ; matériellement c’est extrêmement difficile.
Parcoursup fait tout, enfin fait tout ! est conçu de telle façon que ça sera extrêmement difficile de rectifier les erreurs.

Voilà ! Donc ça c’était un des problèmes. Alors je précise, les erreurs c’est évidemment quelque chose qui est extrêmement fréquent en informatique et c’est pour ça, d’ailleurs, qu’il y a le RGPD, qu’il y a la loi informatique et libertés. Les erreurs de saisie c’est quelque chose d’extrêmement fréquent et qu’il faut prévoir quand on prévoit un programme, quand on écrit un programme.

Autre point qui a fait couler beaucoup d’encre et à juste titre, ce sont les classements locaux.
Je vous disais, en classe prépa on va classer les candidats qu’on a. Moi je suis dans une filière qui s’appelle la MPSI, il y a deux MPSI dans le lycée où je suis, c’est-à-dire qu’on a deux fois 48 places, donc 96 places chaque année et, pour ces 96 places, on a 3000 candidats. Donc on ne va pas regarder de façon détaillée les 3000 dossiers. Qu’est-ce qu’on fait ? On fait un tri informatique soit en utilisant une formule dans un tableur, mais en fait la liste est déjà tellement longue et avec tellement de paramètres que souvent le tableur a tendance à exploser ; soit avec un programme fait maison, avec des critères qui sont des critères maison, qui ne sont pas les mêmes dans tous les lycées. Qu’est-ce qu’on prend en compte ? On prend en compte la note, on prend en compte le rang parce que quelqu’un qui a 16 en maths en étant premier de sa classe, ce n’est peut-être pas pareil que quelqu’un qui a 16 en étant dixième de sa classe sur une classe de 15 personnes.

Ces classements locaux sont faits par les enseignants ; ça coûte cher en temps aux enseignants, mais, j’ai envie de dire, pas en argent à l’Éducation nationale. Parce que les enseignants sont bien gentils, ils font ça bénévolement parce qu’ils savent que sinon ce sera encore plus mal fait ; de toutes façons leur proviseur n’a pas le temps de le faire ; matériellement il n’aurait pas le temps de le faire et il ne saurait pas le faire.

On a des données qui sont relativement peu informatives : si vous prenez deux établissements, une même note dans deux établissements, ça n’a pas la même valeur ; et tous les enseignants sont convaincus. Je peux vous donner l’exemple avec deux établissements, les enseignants vont tous vous dire « il a une moins bonne note dans cet établissement parisien, mais je préfère celui-là que l’autre qui vient de Trifouillis-les-Oies, qui a une très bonne note, mais on ne sait pas trop ce que c’est que son lycée ». Donc ça, ça se fait au jugé. OK ! Traiter de la même façon les deux candidats en faisant abstraction du lycée d’où ils viennent ce ne serait pas vraiment équitable ; les traiter comme ça, au jugé, ce n’est pas forcément non plus très équitable.

Et puis enfin, il n’y a aucun contrôle des conflits d’intérêt. On peut classer ses propres enfants. Moi j’ai eu le cas de mes enfants qui ont postulé dans la MPSI où j’étais. Il se trouve qu’ils sont partis ailleurs, ça, ça me soulage. Et puis j’ai dit à mes collègues « regardez comment ils sont classés, vérifiez bien que je n’aie pas fait de bêtise » ; mais il n’y a aucun contrôle, ce qui n’est pas normal.

Il y a peut-être des recours en justice à venir puisque, je ne sais pas si vous avez vu dans l’actualité, il y a un sénateur, Pierre Ouzoulias, qui demande des informations sur ces classements locaux3 et qui compte bien aller en justice s’il n’a pas de réponse. Il va avoir du mal à avoir une réponse. Si vous demandez à tous les collègues de prépa de publier le logiciel qu’ils ont pour faire leurs traitements, si vous commencez à les étudier tous, je suis qu’il y a un certain nombre de recours en justice qui vont dire qu’il y a des choses qui ne vont pas parce qu’ils ont fait chacun ce qu’ils pouvaient, moi compris, mais on ne peut pas faire les choses parfaitement dans ces conditions. Donc ce qui risque de se passer après c’est que les gens vont dire, les collègues vont dire « écoutez très bien, ce qu’on a fait ça ne va pas, débrouillez-vous et puis vous ferez sans nous ! » Donc ça risque d’être pas mal le bazar. Enfin je ne vois pas bien comment ça va se passer.

Pour les classements locaux, moi j’ai une suggestion qui est toute bête ; il y a un examen national où les épreuves sont les mêmes pour toutes, où la notation est faite avec un barème qui est censé être le même pour tous ; c’est le baccalauréat ; donc on pourrait utiliser les notes du bac. Si on utilise les notes du bac, on peut très bien imaginer qu’on demande à chaque formation de publier des coefficients et puis chaque formation va classer les candidats par note pondérée des coefficients.
Si vous allez formation qui est surtout maths et bien vous pouvez imaginer que les coefficients importants ce sera maths, physique ; si c’est une formation qui est plutôt une formation littéraire, les coefficients ce sera le français, la philo. Donc voilà, on trie les candidats par leurs scores dans chaque formation.

L’intérêt c’est que les candidats sont traités de façon équitable. Bien sûr le bac n’est pas parfait mais c’est ce qu’il y a sans doute de moins mauvais pour juger de façon équitable des candidats.
L’analyse des dossiers il n’y en a plus, elle devient automatisée et ça, ça fait un coût à peu près zéro.
Le temps nécessaire au classement c’est à peu zéro. C’est-à-dire que dès que les résultats du bac sont publiés les classements sont faits.
Le classement des dossiers peut porter sur le travail de toute la terminale. Il se trouve qu’aujourd’hui il y a un certain nombre de collègues du secondaire qui disent une fois que les gens ont postulé sur APB, qu’ils ont envoyé leur dossier, il y en a un certain nombre qui se mettent en roue libre, parce qu’ils savent que, de toutes façons, le reste de l’année ne comptera pas pour être pris dans le supérieur. C’est un peu dommage d’avoir des élèves de lycée qui, à partir de mars, ne travaillent plus. Enfin c’est dommage pour eux essentiellement.
Les résultats sont publiquement vérifiables puisque vous avez les notes du bac, vous avez les coefficients, vous pouvez très bien recalculer votre score. Donc si on publie tous les scores et les classements, on sait comment vous êtes classé.
Je n’ai pas rajouté. Pour ce qui est des conflits d’intérêt, normalement pour le bac il y a des procédures qui font que vous n’avez pas à noter quelqu’un qui fait partie de votre famille ; et même si ça arrivait vous pouvez imaginer que vous pourrez peut-être noter quelqu’un de votre famille, mais juste dans une matière ; ça fera moins de dégâts que quelqu’un qui est capable de changer le classement complet. D’accord ?

Moi la proposition que je fais de procédure pour remplacer APB et Parcoursup ce serait la suivante. J’ai voulu faire une tentative, on peut en discuter après. Ce serait de dire en novembre comme aujourd’hui les différentes formations publient leurs capacités, elles publient les critères de sélection pour les candidats. Par exemple elles vont dire on met tel et tel coefficient sur telle et telle matière, et puis il faut avoir au moins tant pour être pris. Et après on classe par exemple par note, par moyenne globale. On peut rajouter éventuellement dans les critères des critères du type est-ce que le candidat est boursier ou pas, etc. On peut imaginer tout. Mais on peut avoir des critères précis, objectifs, publiés dès le départ.
En janvier on attribue un numéro d’anonymat à chaque candidat.
Entre février et mi-juin, les candidats, donc les élèves, expriment leurs vœux en les hiérarchisant. Ils ont jusqu’à mi-juin pour donner un ordre et mi-juin pour vérifier que c’est bien pris en compte correctement.
Et puis à mi-juin on publie les vœux de tout le monde, simplement au lieu de mettre le nom du candidat, on met juste son numéro d’anonymat à la place. Donc le candidat peut vérifier que ses vœux sont bien publiés correctement. Il peut éventuellement dire « attention, là vous n’avez pas pris mes vœux dans le bon ordre » et faire une réclamation. Donc ça laisse quelque temps pour faire des réclamations. On corrige s’il y a des réclamations.
Et puis le jour du bac, une fois qu’on a les notes du bac on publie les classements, on publie les barres d’admission et on dit « telle formation a telle barre d’admission ; il faut avoir telle note, calculée avec tel et tel coefficient pour être pris ». Ce seraient des barres d’admission provisoires au sens on peut imaginer qu’on se donne encore quelques jours pour traiter les réclamations ; il y a parfois des erreurs dans les notes du bac, parfois des erreurs simplement de report. Moi j’ai des cas : je connais quelqu’un qui a 13 sur une matière et puis, quand elle est allée voir sa copie, en fait ce n’était pas 13 c’était 18 ; ça avait été mal recopié.
Et donc mi-juillet on a fini de traiter les réclamations ; on publie les classements définitifs et les barres d’admission définitives.
Et puis éventuellement fin juillet ou en août on fait un nouveau tour pour attribuer les places qui n’ont pas été prises, pour gérer les questions des démissions mais ça ce sera uniquement marginal.

C’est une proposition qui serait tout à fait raisonnable, qui n’est pas très compliquée à mettre en place.

En conclusion, si on veut faire un petit bilan d’APB et Parcoursup.

Qu’est-ce qu’il y a de positif dans APB ? Il y avait un algorithme qui était assez efficace puisque, essentiellement il y avait une échéance importante pour les bacheliers et les deux autres après c’était beaucoup plus marginal.
En négatif c’était totalement opaque ; il y avait un problème de configuration puisqu’il y avait cette histoire de bonus premier vœu qui était une aberration.
Ce n’était pas équitable à cause de la question des classements locaux.
Ce n’était pas optimal puisqu’on avait choisi l’algorithme COSM au lieu du bon algorithme qui est SOSM.
Et enfin le processus n’était pas géré de façon vraiment rigoureuse.

Si on fait un bilan de Parcoursup, qu’est-ce qui change ? L’amélioration c’est qu’il y a un tout petit peu plus de transparence puisque l’algorithme et une partie de l’implémentation et les rangs sont publiés, les rangs des candidats.
Il y a un truc qui est dramatique c’est une régression grave c’est que c’est complètement inefficace puisqu'il y a une attente longue et qu’il y a un stress répété. Je ne suis pas juriste, mais il me semble que dans la notion de harcèlement moral, ce qui est important c’est la répétition. C’est-à-dire que vous pouvez très bien faire quelque chose qui embête un petit peu quelqu’un, juste un tout petit peu, c’est ridicule, c’est ridicule d’aller porter plainte pour ça, mais s’il vous le fait tous les jours pendant un mois, c’est du harcèlement moral. Et là, pour moi, c’est quelque chose qui s’apparente à du harcèlement moral ce stress répété.
Et puis bien sûr Parcoursup n’a pas vraiment réglé les problèmes d’opacité. Il n’a pas réglé la question de l’équité, il n’est pas toujours optimal et le processus n’est pas géré de façon raisonnable.

Il me semble, mais je peux me tromper, que la proposition que j’ai faite me paraît beaucoup plus transparente.
Elle est efficace puisqu’il y a essentiellement une échéance majeure pour les étudiants.
Elle est relativement plus équitable que les précédentes puisqu’on part des notes du bac.
Et puis enfin, elle est optimale au sens où elle utilise l’algorithme qui fixe les barres le mieux possible.

Évidemment, pour mettre en œuvre cette proposition, il faut réintroduire la hiérarchisation des vœux et donc ça, ça demande que la ministre se rende compte que la non-hiérarchisation des vœux c’est une grosse erreur. Et puis il faut un petit peu de travail de l’État pour la mettre en œuvre, mais ce n’est pas énorme. Voilà !

Il me semble, en tout cas, qu’il serait indigne de se satisfaire de la solution actuelle eu égard à ce qu’elle fait subir aux bacheliers.

Je ne sais pas si vous avez des questions, je ferai éventuellement quelques remarques en plus après si ça vous intéresse ; je crois qu’on arrive à la fin. Il y a une question, ici ou là. Il y a le micro.

Public : En fait le système que vous proposez avec la notation à partir des notes du bac, ça existe.

Judicaël Courant : Oui tout à fait.

Public : Ce n’est pas un système qui est mis en place depuis un certain temps. Après il y a peut-être la notion de se dire que si notre formation, en tant que lycéens, doit être déterminée à partir d’un seul jour, ça veut dire qu’il faut être très performant ce jour-là ; c’est peut-être mieux je ne sais pas, mais en tout cas il y a encore une part d’incertitude.

Judicaël Courant : Bien sûr on peut discuter de savoir s’il est préférable de le faire sur un examen en un seul jour ou sur du contrôle continu. Pour ma part je suis convaincu, mais on peut toujours en discuter, que le contrôle continu a plein de défauts ; il en a au moins deux qui sont importants. C’est que d’une part, l’enseignant, eh bien il a un conflit d’intérêt et donc on voit sur APB et Parcoursup, on voit des lycées, notamment des lycées privés, qui mettent des notes extraordinaires à des candidats qui ne sont pas du tout bons. En résumé, si vous payez, vous allez dans un lycée qui va vous mettre des très bonnes notes comme ça vous serez pris après.
Et l’autre inconvénient c’est qu’il me semble qu’un enseignant n’est pas là pour être celui qui va mettre une barrière à l’élève. Ce n’est pas le rôle de l’enseignant qui vous enseigne toute l’année de vous dire « ah ! toi je t’interdis d’aller dans telle formation parce que tu n’es pas assez bon ! » Son rôle c’est au contraire de soutenir au maximum ses élèves en disant « je vais vous aider au maximum, je ne sais pas si vous y arriverez, mais je vais vous aider au maximum et, de toutes façons, ce n’est pas moi qui à la fin trancherai ».
Après c’est vrai qu’on peut être malade le jour du bac, ça arrive, mais on peut très bien imaginer qu’on peut redoubler sa terminale dans ce genre de situation. Certes on perd un an, donc certes le système n’est pas parfait. J’avais discuté un jour avec un inspecteur général de mathématiques de l’Éducation nationale qui m’avait dit l’agrégation, qui est un concours où là encore ça se joue sur très peu de temps, il m’avait dit c’est un très mauvais système, mais on n’a rien trouvé de mieux. Donc pour moi, je ne prétends pas que le bac ce soit parfaitement satisfaisant, mais de ce que je vois, ça me paraît, le bac en tant qu’épreuve avec une épreuve où on est évalué par quelqu’un qui n’est pas son enseignant et évalué anonymement aussi, ça me paraît nettement mieux.
Dans l’évaluation du contrôle continu, il y a un autre problème qui se passe, c’est que ça arrive qu’un élève s’entende très mal avec son enseignant, c’est difficile après à son enseignant, quand il y a beaucoup d’émotionnel, c’est difficile à son enseignant de juger de façon complètement objective. C’est beaucoup plus facile quand on est face à une copie qui est anonyme.

Public : Est-ce que vous savez quelle équipe est derrière le développement de Parcoursup ou d’APB ? Si c’est plutôt une entreprise privée mandatée par l’État ou des développeurs internes à des services de l’État ?

Judicaël Courant : À ma connaissance. Donc APB ça a démarré, au départ il y avait un système tout à fait similaire, qui existe encore pour les étudiants qui sortent de prépa et qui ont passé les concours d’écoles d’ingénieurs. Ils ont des notes à la sortie des concours et puis, en fonction de ces notes, ils font des vœux et on les aiguille vers différentes écoles d’ingénieurs. C’est ce qu’on appelle le SCEI, le service commun des écoles d’ingénieurs, je crois, ou Service du concours écoles d’ingénieurs, je ne sais plus, qui fait ça. Et APB ça a démarré là avec une équipe qui a proposé ça en 2002, juste pour les prépas, avant de se généraliser derrière.
Ça a tellement été peu pensé que cette équipe-là, officiellement, alors il y avait un statut mais qui était un statut du type association pour les élèves de l’école d’ingénieurs, je ne sais plus ce que c’était exactement, mais un statut qui était complètement bizarroïde, qui a été remis à plat pour Parcoursup récemment. Mais ça veut dire que pendant des années il n’y avait même un statut un peu rigoureux des personnes qui travaillaient là-dessus. Je pense que les personnes qui travaillaient sur APB, ça devait être, je pense, moins d’une dizaine de personnes.

Pour ce qui est de Parcoursup, il y a eu deux chercheurs qui ont travaillé sur la question. Il y a deux chercheurs, il y a eu le directeur de cabinet ; le directeur de cabinet de Frédérique Vidal s’appelle Philippe Baptiste, c’est un informaticien, il a enseigné à l’École polytechnique la question des mariages stables, c’est-à-dire l’algorithme de Gale et Shapley dont j’ai parlé tout à l’heure, donc il connaît très bien la question. Et il a mandaté, enfin je pense que c’est lui qui a mandaté deux chercheurs pour travailler là-dessus, une qui est Claire Mathieu, qui est professeur au Collège de France actuellement et un autre chercheur qui est chercheur CNRS, je ne sais plus quel statut exactement il a, qui est Hugo Gimbert. Et c’est Hugo Gimbert, je pense, qui a écrit le code du cœur algorithmique de Parcoursup. Je ne sais pas si ça répond à votre question.

Juste une chose, ces deux chercheurs, à mon avis, ont fait ça en plus de leur boulot de recherche et d’enseignement. D’accord ! Donc ce n’est pas un truc qu’ils ont fait à plein temps. Et puis c’est un truc qu’ils ont fait quand, politiquement, il a commencé à avoir une petite idée de ce qu’il fallait faire ; donc ça s’est fait tout dans la précipitation manifestement.
Je ne sais pas si vous avez d’autres questions. Oui ?

Public : Votre proposition m’a l’air raisonnable. À qui, enfin quels sont vos interlocuteurs pour pouvoir, enfin quels sont les bons interlocuteurs à qui faire cette proposition justement ?

Judicaël Courant : C’est une bonne question. Il se trouve que j’ai un ancien camarade de promo qui est devenu député en 2017, le camarade de promo en question c’est Cédric Villani. Je lui ai écrit un petit mail en octobre-novembre en essayant de l’alerter sur le problème ; il m’a redirigé vers Philippe Baptiste avec qui j’ai pu échanger, à qui j’ai pu envoyer des informations, mais je n’ai pas eu l’impression que ça faisait bouger les choses. J’ai eu l’occasion de discuter aussi avec Claire Mathieu sur le sujet, qui est par ailleurs une de mes anciennes enseignantes puisque je l’ai eue en cours il y a quelques années quand j’étais en DEA donc l’équivalent du master 2.
J’ai l’impression que le problème est plus haut et que ce qui s’est passé c’est que la ministre a décidé, pour je ne sais pas quelle raison, qu’il ne fallait pas hiérarchiser les vœux, elle l’a redit je crois peut-être bien il y a quelques jours auprès des députés ; elle l’avait redit avant il y a une semaine ou quelques semaines lorsqu’il y a eu une commission qui a été mise en place pour essayer d’évaluer Parcoursup et de voir ce qu’il faudrait faire pour améliorer les choses, mais la ministre a dit « pas question de toucher à non-hiérarchisation des vœux ; ça fait partie du principe de Parcoursup. » Moi je ne comprends pas en quoi c’est un principe. Pour moi c’est ou bien de l’incompétence et de l’incompétence grave de la part de la ministre et en plus elle refuse de reconnaître son incompétence ; ou bien, plus grave, ce serait délibéré pour casser les statistiques. Ce sont les deux seules explications que je vois. Je n’arrive pas à trouver d’autre explication. Mais voilà !
Après, les autres interlocuteurs : j’ai échangé un mail ou deux avec le sénateur Pierre Ouzoulias, donc on va voir si on peut essayer de faire des choses là-dessus pour alerter un petit peu les parlementaires. Voilà ! Moi je ne vois pas comment faire évoluer les choses si ce n’est en lançant une alerte. [Oui, il faut qu’on s’arrête c’est ça ?]

Moi, ce que je souhaite, c’est que ces problèmes soient connus et qu’on puisse lancer le débat sur la place publique ; que les étudiants, les élèves puissent dire « nous on réclame la hiérarchisation des vœux parce qu’on sait que c’est bon ». On pourrait même faire des hiérarchisations partielles ou seulement par certaines personnes, juste par les volontaires, ça permettrait d’accélérer les choses. Voilà ! On peut lancer des choses comme ça. Moi j’espère qu’il y a des initiatives qui vont pouvoir être lancées comme ça.
Je crois qu’il faut qu’on s’arrête là. Merci beaucoup.

[Applaudissements]

L'April présente à la journée grand public d'EduCode à Bruxelles

mar, 07/31/2018 - 17:05
Début: 27 Août 2018 - 08:30Fin: 27 Août 2018 - 20:30

EduCode est un colloque international dédié à l’éducation, aux pratiques et à la recherche dans les domaines liés au numérique. Cet événement se déroulera du 27 au 29 août 2018 sur différents sites localisés à Bruxelles.
Pour plus d'information : https://educode.be

Journée grande public à Educode - 27 août 2018 à Bruxelles

La journée grand public d'EduCode aura lieu le 27 août au Bozar - Palais des beaux-arts de Bruxelles. Des expositions, tables-rondes et conférences sont prévues. Plusieurs acteurs associatifs participeront avec un stand pour présenter leurs activités.
Programme de la journée : https://educode.be/lundi-27-aout.

À cette occasion, l'April participera avec un stand pour porter haut les valeurs du Libre dans l'éducation et dans la recherche.

Revue de presse de l'April pour la semaine 30 de l'année 2018

lun, 07/30/2018 - 23:04

La revue de presse de l'April est régulièrement éditée par les membres de l'association. Elle couvre l'actualité de la presse en ligne, liée au logiciel libre. Il s'agit donc d'une sélection d'articles de presse et non de prises de position de l'association de promotion et de défense du logiciel libre.

En podcast.

Sommaire de la revue de presse de l'April pour la semaine 30

[ZDNet France] De Linux à Windows: une partie de l'Allemagne bascule

Par David Meyer, le jeudi 26 juillet 2018. Extrait:
> Après être passé en 2006 de Solaris à Linux, le land allemand de Basse-Saxe veut à présent migrer 13.000 postes de travail d'OpenSuse vers Windows, vraisemblablement Windows 10. Justification avancée: la standardisation des OS.
Lien vers l'article original: https://www.zdnet.fr/actualites/de-linux-a-windows-une-partie-de-l-allemagne-bascule-39871733.htm

Et aussi:
[Developpez.com] Après Munich, la Basse-Saxe, un État fédéré d'Allemagne, annonce l'abandon de Linux pour Windows

[Next INpact] Le gouvernement lance des «états généraux des nouvelles régulations numériques»

Par Xavier Berne, le jeudi 26 juillet 2018. Extrait:
> Le gouvernement vient d'annoncer le lancement d’une série de consultations destinées à mûrir la position de la France en matière de régulation du numérique (sous les angles économiques, sociétaux, etc.). Ces «états généraux» sont censés aboutir «début 2019».
Lien vers l'article original: https://www.nextinpact.com/news/106898-le-gouvernement-lance-etats-generaux-nouvelles-regulations-numeriques.htm

[Podcast Journal] Contre le monopole des GAFAM, le logiciel libre

Par la rédaction, le mardi 24 juillet 2018. Extrait:
> Google, Apple, Facebook, Amazon, Microsoft sont souvent épinglés pour leur utilisation de nos données personnelles ou encore sur les bénéfices énormes qu'ils font dans les pays sans y reverser d'impôts. Difficile pourtant de lutter contre leur omniprésence sur le web et dans le monde de l'informatique. L'utilisation de logiciels libres apparaît peu à peu comme leur meilleure alternative.
Lien vers l'article original: https://www.podcastjournal.net/Contre-le-monopole-des-GAFAM-le-logiciel-libre_a25566.html

[ZDNet France] LibreOffice sur le Microsoft Store: The Document Foundation dénonce

Par la rédaction, le mardi 24 juillet 2018. Extrait:
> La suite bureautique libre sur la plate-forme logicielle de Windows 10? Pendant quelques jours un tiers à utilisé ce stratagème pour faire payer les internautes. Sans que The Document Foundation n'approuve l'initiative.
Lien vers l'article original: https://www.zdnet.fr/actualites/libreoffice-sur-le-microsoft-store-the-document-foundation-denonce-39871641.htm

[Developpez.com] Explosion des prix de Google Maps: le département de Maine-et-Loire abandonne Google

Par Michael Guilloux, le lundi 23 juillet 2018. Extrait:
> Début mai, Google a annoncé une refonte complète de son offre cartographique à destination des professionnels. Ces changements, qui impliquent de renseigner obligatoirement un code de carte bleue, se traduisent par une explosion des prix pour les usages professionnels avec une réduction drastique du volume d’affichages gratuits autorisés.
Lien vers l'article original: https://www.developpez.com/actu/215961/Explosion-des-prix-de-Google-Maps-le-departement-de-Maine-et-Loire-abandonne-Google-pour-OpenStreetMaps-un-service-de-cartographie-open-source

Et aussi:
[cio-online.com] Le Maine-et-Loire trouve une alternative Open Source à Google Maps

[ZDNet France] PeerTube: l'hébergement libre de vidéos est sur les rails

Par Thierry Noisette, le lundi 23 juillet 2018. Extrait:
> Soutenu par Framasoft, PeerTube a réussi haut la main son appel à crowdfunding. Cet hébergement de vidéo décentralisé devrait se doter dans quelques mois de fonctionnalités améliorées.
Lien vers l'article original: https://www.zdnet.fr/blogs/l-esprit-libre/peertube-l-hebergement-libre-de-videos-est-sur-les-rails-39871579.htm

[Miroir Mag] Six clichés qui vous empêchent de vous mettre au logiciel libre

Par la rédaction, le lundi 23 juillet 2018. Extrait:
> Encore mal connus, les logiciels libres continuent de faire peur aux utilisateurs. Doutes sur la fiabilité, nécessité de compétences techniques, habitude des autres systèmes… Autant de freins à leur généralisation. Pourtant, ces logiciels que chacun est libre d’utiliser, modifier ou partager pourraient amener de nombreux bienfaits, s’ils étaient utilisés de manière globale.
Lien vers l'article original: https://www.miroir-mag.fr/technologie/six-cliches-qui-vous-empechent-de-vous-mettre-au-logiciel-libre

[zonebourse] Le DevOps – la prise de pouvoir de l’Open Source

Par Jan Gabriel, le lundi 23 juillet 2018. Extrait:
> S'il y a un débat public sur le fait qu'un outil puisse ou ne puisse pas être un «outil DevOps», nous pouvons néanmoins constater que les thèmes phares du DevOps - Agilité, Automatisation, Collaboration - se recoupent fort bien avec ceux du mouvement Open Source.
Lien vers l'article original: https://www.zonebourse.com/ITS-GROUP-5096/actualite/ITS-Le-DevOps-ndash-la-prise-de-pouvoir-de-l-rsquo-Open-Source--26978275/

[Libération] Contre Google, cherchez encore

Par Christophe Alix, le dimanche 22 juillet 2018. Extrait:
> Au regard de la surface financière acquise par Google, l’amende que vient de lui infliger l’Union européenne, pour record qu’elle soit, a tout d’une goutte d’eau dans un océan de dollars. Que représentent en effet 4,3 milliards d’euros au regard d’une capitalisation boursière qui dépasse les 700 milliards d’euros et d’une trésorerie qui avoisine les 100 milliards ?
Lien vers l'article original: http://www.liberation.fr/france/2018/07/22/contre-google-cherchez-encore_1668138

Et aussi:
[Developpez.com] La France devrait recevoir 650 millions d'euros dans le partage de l'amende record infligée à Google

Note

Les articles de presse utilisent souvent le terme « Open Source » au lieu de Logiciel Libre. Le terme Logiciel Libre étant plus précis et renforçant l'importance des libertés, il est utilisé par l'April dans sa communication et ses actions. Cependant, dans la revue de presse nous avons choisi de ne pas modifier les termes employés par l'auteur de l'article original. Même chose concernant l'emploi du terme « Linux » qui est généralement utilisé dans les articles pour parler du système d'exploitation libre GNU/Linux.

RGPD : quels changements pour les internautes - RCF

jeu, 07/26/2018 - 15:16


Titre : RGPD : quels changements pour les internautes ?
Intervenants : Gérald Sadde - Jean-Baptiste Cocagne
Lieu : RCF - Invité du 18/19
Date : mai 2018
Durée : 15 min
Présentation de l'émission ; Écouter le podcast
Licence de la transcription : Verbatim
Illustration : Flag of Europe blue - Wikimedia Commons. Licence Creative Commons CC0 1.0 Universal Public Domain Dedication.
NB : transcription réalisée par nos soins.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas forcément celles de l'April.

Description

Le règlement général de protection des données est entré en vigueur pour les citoyens européens le 25 mai 2018. Pour quels changements ?

Transcription

Voix off : RCF – 18/19 – L’invité

Jean-Baptiste Cocagne : Depuis une semaine, vous devez recevoir sans cesse dans vos boîtes mails ou sur les applications de votre smartphone des mails qui vous demandent d’accepter les nouvelles conditions d’utilisation des services que vous utilisez. Pourquoi recevez-vous tout ça ? Parce que la législation européenne a changé : c’est le RGPD, le règlement général de protection des données, et la nouveauté c’est que vous êtes, en tant que particulier, censé être mieux informé sur ce que l’on collecte sur vous, sur l’utilisation faite de vos données par des entreprises. On va parler de tout ça ce soir en détail avec un avocat. Maître Gérald Sadde, bonsoir.

Maître Gérald Sadde : Bonsoir.

Jean-Baptiste Cocagne : Merci d’être avec nous en direct ce soir. Vous êtes cofondateur de Legal Pilot, une start-up d’édition de logiciels juridiques et également cofondateur du cabinet lyonnais Shift avocats, un cabinet spécialisé dans le droit informatique et l’économie numérique ; c’est pour ça qu’on vous a fait signe ce soir. Tout simplement déjà, est-ce que ce RGPD correspond à un changement majeur ? Est-ce qu’on est à l’aube d’une révolution pour notre utilisation quotidienne du Web ?

Maître Gérald Sadde : Oui, on va y trouver du bon ; je pense que tous les internautes vont y trouver du bon. Après, ça n’est que la continuité d’un texte extrêmement ancien finalement, puisque la France était pionnière en la matière en 1978. On est les premiers je crois, au niveau mondial, à avoir une loi qui protégeait, déjà, les personnes.

Jean-Baptiste Cocagne : La loi informatique et libertés1.

Maître Gérald Sadde : La loi, la fameuse loi informatique, fichiers et libertés, elle s’appelait à l’époque comme cela et donc, ensuite, on a une belle directive en 1996, mais finalement le RGPD n’est que la continuité, alors amplifiée : c’est un texte qui correspond aux enjeux de l’Internet d’aujourd’hui, c’est un texte que est ambitieux dans son application territoriale et puis, aussi, dans le niveau des sanctions qu’il entend appliquer y compris aux géants de la tech américaine.

Jean-Baptiste Cocagne : On va voir tout cela en détails effectivement. Vous parlez de territoire, ce texte s’applique à l’échelle de toute l’Europe : c’est pour les 28 pays membres de l’Union européenne. Mais qu’est-ce que ça veut dire ? Quand on reçoit « ses conditions d’utilisation ont changé, veuillez donner votre consentement », qu’est-ce que veulent nous dire ces entreprises ?

Maître Gérald Sadde : En fait, le texte est même d’application encore plus large parce qu’il concerne toutes les sociétés qui collectent des données de citoyens européens, donc y compris, justement, les fameux GAFA, les Google, Amazon, Facebook, etc., qu’ils soient en Asie ou ailleurs. Et puis, les textes que vous recevez actuellement, les e-mails, ce sont des e-mails quelque part pour se rassurer. Ce sont des e-mails qui sont là pour réassurer leurs bases de données qui, du fait, on peut en déduire qu’elles ont été collectées dans de mauvaises conditions parce que si ça n’était pas le cas ils n’auraient pas besoin aujourd’hui d’envoyer ces mails, puisque tout ce qui a été fait correctement avant continue de valoir juridiquement. Donc ça veut dire qu’ils essayent de rattraper quelque chose et que, parfois, il va certainement y avoir un petit peu de casse parce que j’espère que les gens, aussi, vont se rendre compte du risque qu’ils ont pris avant avec leurs données.

Jean-Baptiste Cocagne : Donc tous ces mails c’est aussi une forme, pour les entreprises, de se protéger juridiquement de possibles retours, de dire « voilà ; on l’a fait, on vous a informé ».

Maître Gérald Sadde : Oui, ils essaient de prendre date un petit peu. Ils ont essayé de prendre date, vous avez dû tous crouler sous les mails le 25 ou avant le 25 minuit, parce qu’effectivement, il y a une sorte d’ombre qui planait au-dessus de tout ça ; il y a eu beaucoup d’épouvantails qui ont été agités et donc les GAFA, les entreprises hors Europe notamment, qui ont été très sensibilisées à cela par nos confrères aussi américains, souvent, eh bien elles ont eu vraiment le défi d’arriver à se mettre en conformité avant la date dite. Alors c’est une conformité de surface parce que le mail n’est que la petite partie émergée de l’iceberg. En fait la conformité, dans leur cas, est très compliquée à obtenir puisqu’elle est technique, elle relève de la sécurité, elle relève de l’organisation interne. Donc le mail c’est un tout petit bout de la conformité, mais il ne faut pas que ce soit l’arbre qui cache la forêt ; au contraire, il y a beaucoup de travail à faire après ce mail.

Jean-Baptiste Cocagne : C’est ce qu’on va voir dans la deuxième partie de l’interview, vous restez avec nous. Maître Sadde, on se retrouve juste après le journal régional.

Voix off : 18/19 – L’invité.

Jean-Baptiste Cocagne : Nous somme toujours en compagnie de maître Gérald Sadde, cofondateur du cabinet lyonnais Shift avocats, spécialité dans le droit informatique et l’économie numérique. Avec vous ce soir on parle de ce RGPD, ce règlement général de protection des données.

On le disait tout à l’heure on a reçu beaucoup de mails. J’imagine que certains auditeurs, comme moi, je le confesse, n’ont peut-être pas vraiment lu dans le détail ces messages. Est-ce que c’est grave docteur ?

Maître Gérald Sadde : Ça serait dommage ! Ça serait dommage parce que si vous observez un petit peu ce qu’on vous demande, vous allez découvrir, en fait, l’envers du décor, c’est-à-dire tout ce qu’on ne vous a pas dit initialement, la contrepartie de l’utilisation des services du Web. Je ne sais plus qui a dit : « Il y a toujours quelqu’un qui paye à un moment ou à un autre. »

Jean-Baptiste Cocagne : Et si c’est gratuit c’est que vous êtes le produit !

Maître Gérald Sadde : Exactement, vous m’enlevez les mots de la bouche. Donc il y a un prix ; le prix ce sont vos données. Donc le carburant de tout ça, le prix, ce sont les données, donc c’est un petit peu une partie de vous-même vos données personnelles ; c’est pour ça que ça a de la valeur d’ailleurs, c’est parce que c’est attaché à une personne physique ; on essaye de comprendre qui elle est pour mieux lui vendre, finalement, des produits. Donc quand vous recevez ces mails-là et que vous allez vraiment, que ce soit d’ailleurs dans les applications ou dans les mails classiques — dans les applications, en ce moment, ils n’arrêtent pas aussi de remettre à jour leur « police vie privée », la privacy policy — donc il faut regarder toutes les petites cases qu’on vous demande de cocher parce que vous allez découvrir qu’il y a un luxe de détails sur à quoi ça sert, qu’est-ce que vous avez accepté, et on va vous demander, en fait, des consentements.

C’est plus ou moins bien fait, c’est plus ou moins, d’ailleurs, fait dans les canons de ce qu’il faut faire selon les termes du RGPD, mais il faut regarder, il faut prendre le temps de lire, ça va vous permettre de reconfigurer, en fait de reprendre le contrôle d’applications dont vous avez complètement oublié tout ce qu’elles faisaient sur vous et pour cause, souvent elles ne vous l’ont pas dit !

Jean-Baptiste Cocagne : Voilà pour l’information, on va dire, mais quel est l’esprit de ce nouveau texte ? Quel est l’esprit de ce règlement général ? En quoi il protège mieux, ou pas, les citoyens européens ?

Maître Gérald Sadde : Il offre plus de droits. Il oblige les entreprises qui produisent ces services de la société de l’information à une vraie introspection, donc elles sont obligées de s‘auto-responsabiliser pour essayer de documenter beaucoup mieux ce qu’elles font sur les données. En fait, ça les force à créer une sorte de comptabilité des données personnelles : au lieu que ce ne soit que du chiffre maintenant c’est carrément qu’est-ce que je fais avec ces données ? Combien de temps je les garde ? Pourquoi je les garde ? Quel est le fondement légal de tout cela ? Donc ça va permettre, en cas de contrôle, de montrer une sorte de fiche d’identité de ce que fait la personne morale, donc la société, avec toutes vos données. Évidemment, le but c’est de chercher l’erreur ; c’est de chercher ce qui n’a pas été déclaré, donc c’est beaucoup plus protecteur, en tout cas en théorie.

Jean-Baptiste Cocagne : Et puis il y a de nouveaux services aussi qui sont rendus possibles, notamment la portabilité de ces données avec ce RGPD, c’est-à-dire qu'aujourd’hui je suis abonné à Spotify dans l’univers musical, je peux me transférer chez Deezer et garder l’intégralité de ma playlist par exemple ?

Maître Gérald Sadde : Oui parce que la donnée, en fait, c’est un bien qui n’est pas comme les autres ; c’est un bien dont la société qui les gère doit prendre soin. Finalement, la société est en permanence dépositaire de vos données ; elle ne les possède pas vraiment : c’est vous qui lui autorisez, pour les besoins d’un contrat, pour les besoins de l’utilisation du service, à en faire un usage. Donc quand vous partez de ce service-là, toute cette valeur qui a été accumulée, ce n’est pas seulement une valeur pour la société, c’est une valeur pour l’utilisateur, donc il n’y a pas de raison qu’il ne puisse pas partir avec.

Jean-Baptiste Cocagne : Concernant l’autonomie, le fait d’être informé, de prendre conscience aussi de toutes ces données et de leur utilisation, est-ce que c’est dans une idée de responsabiliser chaque utilisateur, notamment après le Facebook gate et Cambridge Analytica ? Est-ce que ça participe aussi à ce mouvement global de prendre conscience que ces données ne sont pas dans l’air, elles sont aussi, tout simplement, au service des entreprises ?

Maître Gérald Sadde : Je ne dirais pas forcément responsabiliser l’utilisateur. On essaie de l’informer tout en le prenant par la main. Et on est plutôt dans l’hyper-protection, parce qu’on considère qu’on est quand même dans des machineries extrêmement complexes, qui sont très compliquées à décortiquer pour le commun des mortels, que ce soit d’ailleurs les personnes qui sont peu férues de technologie ou les personnes qui sont peu férues de droit ; il faut avoir un peu des deux, voire beaucoup des deux, pour comprendre 100 % de ce que l’on vous propose. Ce que l’on demande aujourd’hui, ce que la loi demande, c’est effectivement plus de transparence pour que, au moins ceux qui le souhaitent, puissent s’emparer, reprendre la maîtrise de ces outils-là et donc avoir des outils, souvent d’ailleurs de plus en plus informatisés, qui leur permettent d’enlever ce qu’ils ont donné. Vous avez donné un consentement, vous devez pouvoir l’enlever. Vous avez donné beaucoup de données, vous devez pouvoir vous faire oublier. Le but c’est ça, c’est de vous redonner la maîtrise sur votre « soi digital ».

Jean-Baptiste Cocagne : Mais est-ce que ça pousse la logique jusqu’à pouvoir choisir les données que l’on donne à la carte ? Ou finalement c’est quand même un service global suivant les règles du jeu définies par l’entreprise ?

Maître Gérald Sadde : Il y a des choses très techniques derrière tout ça, mais oui, il y une granularité on dirait, j’aime bien ce terme.

Jean-Baptiste Cocagne : Granularité.

Maître Gérald Sadde : Une belle granularité à observer. C’est-à-dire que théoriquement nous, quand on fait le conseil aux entreprises, on leur explique justement que chaque type de données, chaque type de besoins fait l’objet finalement d’une raison différente. C’est-à-dire que la personne qui vous donne ses données, elle ne le fait pas forcément de la même façon pour tous les usages que vous allez faire de cette donnée.

Jean-Baptiste Cocagne : Est-ce que vous auriez un exemple ?

Maître Gérald Sadde : L’exemple un peu concret qui a déjà été jugé c’est avec par exemple Facebook ou peut-être plus simplement avec Netflix, ça sera peut-être plus simple. Vous avez besoin de Netflix, vous voulez être utilisateur de Netflix donc le système de VOD.

Jean-Baptiste Cocagne : De vidéos.

Maître Gérald Sadde : De vidéos à la demande. Vous savez qu’ils ont évidemment besoin de votre identité pour pouvoir fonctionner ; ils ont besoin de conserver ce que vous avez acheté pour vous facturer ; ça vous le savez donc vous allez signer un contrat avec eux et vous allez accepter, parce qu’ils en ont besoin, simplement, de dire « OK, je vais vous confier certaines de mes données ». Et vous voyez à peu près ce qu’ils vont en faire et on va en plus vous l’expliquer. Mais ce que vous ne savez pas c’est que derrière ils essaient de vous profiler. Donc ils vont essayer de déduire de vos habitudes de consommation, aussi en posant des cookies sur votre ordinateur, pour savoir où est-ce que vous avez été avant, où est-ce que vous avez été après être passé sur Netflix ; ils vont essayer de comprendre qui vous êtes pour vous proposer un contenu qui est, tout simplement peut-être, plus adapté. Ça part peut-être d’un bon sentiment mais le problème c’est que là on est sur une donnée qui est beaucoup plus opaque, qui n’est pas collectée directement auprès de la personne et c’est ça qui va être intéressant à qualifier ; c’est là où on va avoir besoin d’un travail juridique et parfois de consentement. Il va vraiment falloir passer par le consentement, ce qui n’est pas forcément le cas pour le contrat initial.

Jean-Baptiste Cocagne : D’ailleurs, en parlant de consentement, il y a aussi un âge de consentement numérique, c’est ce qu’apporte le RGPD. En France il a été fixé à 15 ans, mais chaque pays État membre de l’Union peut le fixer sur un autre âge. Vous disiez, Maître Sadde, que ça ouvre la porte à plus de recours en justice, potentiellement, parce que ce RGPD, eh bien si on lit, on peut trouver la faille et, du coup, ça ouvre la porte à plus de recours ?

Maître Gérald Sadde : Oui, ça ouvre la porte déjà à la volonté de faire exercer valablement ses droits. Ce qui veut dire qu’aujourd’hui on a énormément de sociétés, quand vous envoyez un mail, quand vous demandez d’avoir accès à vos données, de les rectifier, vous n’avez pas de réponse, voire pire, vous continuez de recevoir des mails, vous continuez de recevoir des sollicitations alors que vous avez demandé d’agir dans le sens inverse. Donc là, déjà, vous allez avoir la capacité de saisir la CNIL et au bout de quelques plaintes, la CNIL va se déplacer.

Jean-Baptiste Cocagne : La Commission nationale informatique et libertés.

Maître Gérald Sadde : En plus, vous allez avoir le droit de faire ce qu’on appelle des actions de groupe. Donc vous allez pouvoir vous saisir à plusieurs, avec des associations de consommateurs notamment, d’un problème, d’un prestataire, d’une société éditrice d’un service qui vous pose problème parce qu’on a constaté que vu la quantité de personnes qui s’en plaignaient c’est qu’elle bafoue les droits, donc on va essayer, à ce moment-là, de faire bouger les choses avec un avocat qui va aller servir de fer de lance contre cette société.

Jean-Baptiste Cocagne : Quand on dépeint le paysage informatique, on va dire avec ce RGPD, on a le petit citoyen face aux mastodontes numériques — on pense tout de suite à Google, Amazon, etc.—, mais ce RGPD concerne toutes les entreprises, on l’a dit, notamment je pense à des petites PME en France qui, par exemple, éditent une newsletter ou collectent des données pour leurs services. Là c’est un gros big-bang pour elles, c’est-à-dire qu’il y a tout une machinerie à mettre en place pour se conformer à la loi désormais ?

Maître Gérald Sadde : La CNIL ne cesse de dire qu’il faut adapter la mise en conformité aux moyens de la société. Donc c’est un big-bang si, effectivement, c’est une petite société dont l’activité tourne principalement autour de la donnée et que, pour autant, elle n’a jamais rien fait, ce qui serait anormal. C’est-à-dire que ça fait peut-être 40 ans, qu’elle est dans l’illégalité. Donc ça veut dire qu’il y avait un problème à la base !

Jean-Baptiste Cocagne : Là c’est un gros rappel, gros message de rappel.

Maître Gérald Sadde : Voilà ! C’est un gros message de rappel ; mais ça veut dire que, effectivement, il y a des sociétés qui peuvent être parfois d’une taille très modeste et qui vont se retrouver avec quelque chose qui les dépasse un petit peu parce qu’on a mis en lumière un aspect de leur activité, qui est parfois un aspect essentiel, parce que c’est tout simplement qu’elles sont sur un secteur hyper-réglementé avec, par exemple, de la donnée sensible, de la donnée de santé, de la donnée religieuse – je suis sur RCF, ça en fait partie. Je sais que même les congrégations se posent aujourd’hui la question de comment se mettre en conformité, c’est un vrai, alors pas un souci, mais c’est une vraie question qu’il faut se poser ; il y a certaines exceptions qui sont prévues par la loi, mais il faut encore savoir si on rentre bien dedans.

Jean-Baptiste Cocagne : Et ça pourrait faire l’objet d’un beau reportage dans les jours prochains. Merci Gérald Sadde, maître Gérald Sadde d’avoir été notre invité de soir.

Maître Gérald Sadde : Merci.

Jean-Baptiste Cocagne : Je rappelle que vous êtes cofondateur de Legal Pilot, une start-up d’édition de logiciels juridiques, également cofondateur du cabinet lyonnais Shift avocats, spécialisé dans le droit informatique. Merci.

Les communs, la recherche et le libre accès - Pablo Rauzy - PSES2018

mer, 07/25/2018 - 16:19


Titre : Les communs, la recherche et le libre accès
Intervenant : Pablo Rauzy
Lieu : Choisy-le-Roi - Pas Sage En Seine 2018
Date : juillet 2018
Durée : 1 h 05 min 42
Visualiser la vidéo
Licence de la transcription : Verbatim
Illustration : trois diapositives issues du diaporama support de la présentation
NB : transcription réalisée par nos soins. Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas forcément celles de l'April.

Description

Saviez-vous que les résultats de la recherche publique sont privatisés puis revendu aux labos publics ? En réponse à cette situation aberrante, le mouvement pour le Libre Accès prend doucement mais sûrement de l’ampleur dans la communauté scientifique. Mais il existe bien des modèles de libre accès… Lequel choisir ?

Les Communs nous fournissent un cadre de réflexion intéressant allant jusqu’à remettre en cause la légitimité de la propriété (intellectuelle) lucrative, à l’origine de cette situation.

Transcription

Bonjour à tous et à toutes. Je me présente ; je suis Pablo. Il y en a qui m’ont déjà vu il y a deux jours, donc c’est « re moi ». Je suis toujours maître de conférences à Paris 8 et, cette fois-ci, je ne viens pas du tout vous parler de ma recherche, je viens vous parler d’un truc sur lequel je milite, qui est en rapport avec la recherche mais pas avec ma recherche.

Je viens vous parler de libre accès à la recherche et je vais vous expliquer un petit peu ce que c’est, quel est le but, comment on peut le faire et pourquoi il y a cette problématique qui se pose. Mais je vais commencer, pour la suite, à vous parler de communs.

Les communs qu’est-ce que c’est ? Un commun c’est un faisceau de trois choses :

  • c’est une ressource partagée ; cette ressource peut être matérielle ou immatérielle. Je reviendrai après là-dessus ;
  • c’est un mode d’accès, les règles de partage de cette ressource
  • et c’est une gouvernance de la ressource. Le rôle de la gouvernance, et c’est important qu’elle existe sinon on n’appelle pas ça un commun, c’est d’assurer la pérennité de la ressource et son existence dans le temps.

Un exemple de commun, matériel cette fois-ci, ça va être un verger dans un village. Là, la ressource ce sont des pommes. OK ! Le mode d’accès ça pourrait être les gens vont se servir quand ils veulent des pommes, mais il y a des règles de partage c’est-à-dire qu’on ne peut pas venir et prendre toutes les pommes, on doit se limiter à, je ne sais pas, une pomme par jour par personne par exemple, histoire que tout le monde puisse en profiter et qu’il n’y ait pas des gens qui se disent OK, ça ne sert à rien, il y a juste telle personne du village qui récupère tout, qui fait de la compote et qui la vend au marché ; ça ne sert à rien… Je refuse de payer des charges communales, par exemple, pour arroser le verger ou pour payer le salaire de quelqu’un qui s’en occuperait.
Les règles de partage ça pourrait être aussi quelque chose de différent. Ça pourrait être aussi que, par exemple, tout le monde s’en occupe un petit peu. Quelque chose qui va vraiment marcher en commun, qui va être autogéré, etc.

Il y a plein de types de communs différents, mais ce sont ces trois choses-là qui font que c’est un commun.

La gouvernance ça pourrait être une association ; ça existe par exemple avec des potagers urbains ou des jardins partagés, des choses comme ça ; ou ça pourrait être le conseil municipal du village qui décide et puis, à ce moment-là, pour la gestion du commun, les grosses décisions se prendraient pendant les élections par exemple, pourquoi pas. En tout cas, le but de la gouvernance c’est d’empêcher l’épuisement du commun ; par exemple qu’il n’y ait pas quelqu’un pendant l’hiver qui vienne et qui coupe les pommiers pour se chauffer chez lui.

Ça c’est un exemple de commun matériel.

Un exemple de commun immatériel, en fait il y a en un que vous connaissez tous, Wikipédia. Là la ressource c’est quoi ? C’est du savoir encyclopédique. On y accède par copie. C’est immatériel donc on peut récupérer des données et c’est comme si on prenait une pomme mais qu’elle était encore dans l’arbre. C’est ça qui est assez cool avec les choses immatérielles. Le principe d’accès à Wikipédia c’est qu’on y accède en copiant la page, c’est-à-dire que quand vous accédez avec votre navigateur en fait votre navigateur télécharge une copie des données et les affiche par Internet.
Les règles, eh bien il y a une licence Creative Commons sur Wikipédia qui dit que vous pouvez faire plus ou moins ce que vous voulez avec le texte du moment que vous citez que ça vient de Wikipédia, en gros, et que vous le partagez sous cette même licence.
Et la gouvernance, eh bien là elle a des formes multiples ; c’est ce que je vous disais tout à l’heure, que la gouvernance peut être complexe. Sur Wikipédia, d’une part on a la Fondation Wikimedia ; vous avez déjà dû voir passer des appels au don avec la tête de Jimbo [Jimbo Wales] qui prend un tiers de l’écran en haut de Wikipédia. La fondation Wikimedia assure la pérennité des serveurs et de la bande passante derrière. C’est pour ça qu’ils font des appels au don régulièrement. Mais ce n’est pas la seule gestion, ce n’est pas la seule gouvernance qu’il y a sur Wikipédia. Chaque encyclopédie — les encyclopédies dans Wikipédia ce sont les langues — a son monde de fonctionnement propre. Il y a des petites langues où il va y avoir un ou deux admins qui vont avoir un peu des super pouvoirs et puis il y a des langues où ce sont des grosses encyclopédies où il y a des modérateurs, des opérateurs, différents types d’utilisateurs qui vont permettre de régler les conflits, par exemple, ou qui vont surveiller. Il y a des langues, aussi, ou certains portails, par exemple tel domaine scientifique, eh bien il y a quelques personnes qui s’y connaissent assez bien et qui surveillent régulièrement les mises à jour de ces pages-là pour vérifier qu’il n’y a pas une bêtise qui a été mise. Ensuite, de manière beaucoup plus décentralisée, chaque page Wikipédia a une page de discussion qui permet de prendre des décisions collectivement sur ce qui doit aller ou non dans cette page, pour que ça reste de qualité. Donc là, c’est une gouvernance encore plus décentralisée sur des petits morceaux du commun.

Il y a un truc avec les communs que des gens, je vais vous expliquer pourquoi, ont appelé la « tragédie des communs » c’est que s’il y a un tricheur, il est gagnant. Si on reprend l’exemple du verger, je vous avais dit si quelqu’un vient et récupère toutes les pommes et après fait de la compote et la vend au marché, par exemple, ou vient couper le bois, eh bien le commun est asséché et il y a quelqu’un qui a gagné beaucoup. Ça veut dire que si on applique une stratégie très individualiste, ce qui va se passer c’est que le commun va mourir. Ce n’est pas un truc qui est pérenne, c’est une espèce d’équilibre comme ça.

Les gens qui ont fait ça, qui ont appelé ça « tragédie des communs », ce sont des économistes plutôt libéraux, donc qui ont une espèce de modélisation de l’économie où chaque acteur agit comme une espèce de robot qui maximise son intérêt personnel au détriment de tout le reste. Évidemment, ce sont des modèles qui ne tiennent absolument pas la route dans le monde réel, qui nous amènent dans le mur régulièrement. Donc ce n’est pas du tout une tragédie. Il y a plein de communs qui continuent très bien de fonctionner parce que, en vérité, les gens ne pensent pas qu’à leur gueule. Du coup quand il y a un commun et qu’ils aiment ce truc-là, en fait ils font en sorte que ça continue d’exister et ils préfèrent avoir des pommes pendant des années et des années plutôt que gagner plein de sous d’un coup maintenant tout de suite. Et ça, ce sont des choses que leurs modèles économiques ne prennent pas en compte c’est pour ça qu’ils ont appelé ça « tragédie des communs » comme si c’était un truc inévitable. En fait, ce n’est pas du tout inévitable, il y a plein de communs qui perdurent pendant des années et des années, par exemple Wikipédia.

Un truc qu’on peut se dire c’est : est-ce que cette « tragédie des communs » peut arriver sur les communs immatériels où il n’y a pas quelqu’un qui peut venir et tout prendre ? Parce qu’à chaque fois qu’il prend tout, en fait juste il utilise de la bande passante. Sur Wikipédia, par exemple, les articles restent là même si je les prends plein de fois. En fait oui ça peut. Je vais vous donner un exemple et puis j’en prendrai d’autres peut-être après, je pense qu’il y a le temps.

Je vais vous montrer dans un univers alternatif où on a un autre Wikip€dia – vous voyez j’ai appelé ça Wikip€dia avec un € euro – où ça marche à peu près pareil, c’est-à-dire que tout le monde peut rédiger des articles et, de temps en temps, on doit tous un peu en corriger : quand on lit quelque chose et qu’on voit des erreurs eh bien on doit un peu participer aussi à corriger ; ça fait partie du contrat qu’on a. Mais pour lire un article il faut payer. Donc là on doit payer 30 euros, par exemple, pour lire un article sachant qu’avant on n’a que le titre et peut-être le premier paragraphe qu’il y a avant le sommaire, donc une espèce de résumé de l’article. Et basé sur ça, déjà on doit payer si on veut le voir.

Le problème c’est qu’évidemment, quand on lit un article Wikip€dia il y a toujours des liens vers plein d’autres articles qui sont utiles pour comprendre le contenu de l’article qu’on est en train de lire. Du coup, il faut lire plein d’articles. Ce ne sont pas des gens qui veulent vous arnaquer trop non plus, donc il y a la possibilité de prendre des abonnements et vous gagnez plein de sous en prenant des abonnements vu que vous payez beaucoup moins que si vous payez 30 euros par article. Par exemple des abonnements personnels au niveau des institutions où vous avez, pour 5 000 euros par un an, accès en illimité à Wikip€dia. Donc si vous faites la division, vous pouvez regarder plein d’articles par jour et ça vous revient beaucoup moins cher.

C’est quelque chose qui vous semble complètement absurde mais, en vérité, c’est possible de mettre en place un système comme ça dans notre société actuelle. D’une part, c’est mis en place dans la recherche, je vous le montrerai tout à l’heure, et d’autre part, faire une encyclopédie qui fonctionnerait sur ce modèle, c’est autorisé. Pourquoi c’est autorisé ? Parce qu’on a un truc qui s’appelle la propriété intellectuelle qui existe et qu’on n’a pas encore aboli la propriété lucrative, donc y compris pas la propriété intellectuelle lucrative. Ça, ça veut dire quoi ? Ça veut dire qu’on peut s’approprier quelque chose qui a été créé en commun et en faire quelque chose qui va être profitable. Pourquoi ça devient profitable ? Parce qu’on crée artificiellement de la rareté. En fait, on a un commun immatériel, on a une ressource immatérielle où c’est comme si on avait un pommier où, quand on prend une pomme, elle est encore dans l’arbre pour que quelqu’un puisse la prendre et là, artificiellement, par des jeux de licence, de droits de propriété privée lucrative, on va dire que non, finalement, on va artificiellement détruire la pomme quand quelqu’un la prend pour qu’il y en ait un nombre limité et qu’on puisse faire du commerce avec.

Ça vous semble complètement stupide et vous dites pourquoi quelqu’un voudrait faire ça ? Parce qu’il y a des gens qui pensent effectivement comme ces économistes libéraux. Et, en fait, c’est comme ça que ça se passe dans la recherche.

Comme je suppose que vous n’êtes pas tous et toutes complètement familiers-familières avec comment fonctionne la recherche, je vais vous expliquer très rapidement comment ça se passe.

C’est très schématique et des gens qui sont dans un domaine précis ne vont pas forcément y retrouver exactement ça, mais j’essaye de faire quelque chose qui marche pour un peu tout le monde, donc autant les sciences humaines que les sciences qu’on dit dures, souvent, mais je préfère dire inhumaines et asociales puisque les autres sont des sciences humaines et sociales ; c’est ce que je fais, des sciences inhumaines et asociales, je fais de l’informatique.

Donc comment ça marche la recherche ?

  • D’abord on cherche une question. C’est déjà une première étape, c’est que la question n’est pas toujours là dès le début. C’est-à-dire qu’il y a des problèmes qui sont là, mais il faut déjà bien formuler la question et c’est une bonne partie du boulot.
  • Une fois qu’on a une question, on a compris quelle était la bonne prochaine petite étape à faire dans notre domaine, sur lequel on fait de la recherche, eh bien on cherche une réponse. Ça peut être plein de choses différentes : ça peut être écrire du logiciel, faire des expériences, faire des stats, rédiger, traduire quelque chose, enfin bon ! Ça peut être plein de choses différentes.
  • Et puis, à un moment donné, on a des résultats. Alors ces résultats ce n’est pas forcement ceux qu’on attendait, mais il y a un moment donné où on a quelque chose qu’on a envie de communiquer avec la communauté parce qu’on pense que ça fait un peu avancer le schmilblick.
  • Donc ce qu’on fait, la communication scientifique aujourd’hui, elle est principalement par le biais de journaux ou de conférences. Je vais parler juste de journaux ou de revues dans le reste de la présentation, mais sachez que ça peut aussi être des workshops, des conférences, enfin ça peut être plein de choses différentes, mais la communication, la forme de communication est plus ou moins tout le temps la même : on rédige un article ; il y a des normes de rédaction d’article selon les journaux, les conférences, etc.
  • Et puis, une fois qu’on a rédigé l’article qui présente les résultats, eh bien on soumet cet article donc à une revue.
  • Cette revue ce n’est pas un truc qui n’existe pas, comme ça, qui est dans les terres, c’est un ensemble d’autres personnes, d’autres chercheurs et chercheuses qui se sont mis ensemble, qui ont formé un comité éditorial, qui vont réceptionner votre article, qui vont le relire ou le faire relire à des experts de votre domaine, qu’on appelle vos pairs, et qui vont juger de la qualité de l’article au sens de est-ce que c’est effectivement nouveau ? Est-ce que ce n’est pas quelque chose que la personne ou les personnes qui ont rédigé l’article ont raté, qui existait déjà par ailleurs ? Est-ce que c’est rigoureux ? Est-ce qu’il n’y a pas d’erreurs manifestes dedans, etc. ? Et est-ce que, aussi, ça correspond bien au sujet de la revue ou de la conférence ? À ce moment-là on va accepter l’article si on n’a pas atteint la limite et que les autres ne sont pas meilleurs que lui. Meilleur dans un sens absolument pas objectif, évidemment, parce que c’est très difficile de juger de choses qui n’ont rien à voir les unes avec les autres et que c’est souvent ça.
  • À ce moment-là, une fois que l’évaluation par les pairs est faite ; cette évaluation par les pairs elle peut faire des allers-retours aussi avec les auteurs. Il peut y avoir des « on va vous accepter, mais il faut d’abord faire ces corrections-là » ou « on voudrait cette expérience en plus pour confirmer ce résultat », etc., avant d’être acceptée et ensuite on a la « publication » de l’article. Publication je l’ai mis entre guillemets parce que vous allez voir que ce n’est pas si simple que ça.
    Le truc c’est qu’en fait, souvent, la publication de l’article ça consiste à dire il y a une grosse maison d’édition qui possède la revue et elle va dire « OK je diffuse ton article et je le mets dans ma revue mais, en échange, tu me cèdes tes droits d’auteur ». OK ? Donc on a les chercheurs qui ont fait le travail, ils cèdent leurs droits d’auteur à la revue et la revue, du coup, va pouvoir distribuer c’est-à-dire vendre cet article-là. C’est là où on va se retrouver avec une page web où il y aura le titre et l’abstract, donc le résumé de l’article, et il faudra, pour accéder à un PDF de, je ne sais pas, six ou dix pages, payer 30 euros, 40 euros, 60 euros. Voilà ! Donc ça c’est ce qui se passe. C’est pour ça que j’appelle ça « publication » parce que publication, normalement, ça veut dire rendre public mais là, on voit que c’est un peu plus compliqué que rendre public ; ce n’est pas tout à fait public !

En fait on est dans une situation où on a un coût qui est public et des bénéfices qui sont privés. Parce qu’on est exactement dans la situation dont je vous parlais tout à l’heure où on a une appropriation privée d’un travail commun, collectif et public, c’est-à-dire-dire que la recherche c’est financé sur argent public, en France très majoritairement mais même aux États-Unis où les universités sont pour beaucoup privées, en fait elles sont vachement financées par les États, pas l’État fédéral mais les États.

La situation c’est quoi ? Donc on a de l’argent public qui finance la recherche, les résultats qui sont privatisés et ensuite ils ont rachetés par de l’argent public. Parce qu’évidemment, pour faire de la recherche, on a besoin d’avoir les papiers des autres chercheurs. Du coup, on a des labos publics qui financent de la recherche ; des maisons d’édition qui privatisent ces résultats et qui les revendent aux labos publics. D’accord ? Et c’est comme ça que ça se passe pour de vrai.

Pour vous donner un ordre d’idée de à quel point c’est choquant…

Un autre truc que j’ai oublié de vous dire c’est qu’il y a de la recherche dans le privé, ça existe mais, en fait, si on regarde par exemple les mécanismes, genre en France, qu’on a pour financer ce genre de choses-là, il y a le crédit impôt recherche, je ne sais pas si vous en avez déjà entendu parler.
En gros, déjà, le crédit impôt recherche c’est majoritairement accaparé par des grosses boîtes du CAC 40 qui ne font pas du tout de la recherche avec, qui ont juste des bons avocats qui leur permettent de récupérer ça. Et, quand c’est dans des PME, il faut savoir que c’est conditionné souvent, alors pas que, mais c’est souvent le bon critère pour l’avoir, c’est que quelqu’un soit docteur dans l’entreprise, donc quelqu’un qui a fait une thèse, qui a passé son doctorat et, en fait, le crédit impôt recherche va quasiment rembourser le salaire de cette personne-là à l’entreprise. Ça veut dire que même quand c’est de la recherche qui vient de l’industrie, en fait c’est très majoritairement financé par de l’argent public. C’était juste pour préciser ça.

Quelques chiffres que j’ai pu récupérer au fur et à mesure de ma carrière académique.

À l’ENS [École nationale supérieure], par exemple en 2011, j’avais réussi à récupérer les chiffres ; depuis les chiffres sont un peu plus compliqués à récupérer parce qu’il y a un consortium national qui achète pour tout le monde et donc c’est plus compliqué à récupérer. Il y a un autre truc aussi, c’est qu’évidemment les contrats avec les maisons d’édition sont secrets. Donc il y a des clauses dans ces contrats qui interdisent aux bibliothécaires de révéler les montants. Mais bon ! J’avais réussi à me procurer quelques documents en étant dans des conseils d'administration ou des choses comme. Pour l’année 2011, les dépenses documentaires de l’ENS c’est environ 1 million d’euros. L’ENS c’est tout petit en termes de taille et, en plus, ils ont plein de labos qui sont ce qu’on appelle des UMR, des unités mixtes de recherche, où ils profitent, en fait, des abonnements aussi pris par les autres universités, par exemple Jussieu, etc., donc Paris 6. Paris 6, par exemple un million d’euros c’est juste pour Elsevier, donc le plus gros éditeur. Ils ont d’autres abonnements à côté.
Le CNRS, en 2013, c’était plus de 30 millions d’euros, c’était 36, mais les autres années c’est environ 30 ; la première année où je l’ai vu c’était 36 ; donc c’est environ 30 millions d’euros par an de dépenses documentaires au CNRS. D’accord ?

Je ne sais pas si vous imaginez le nombre de bourses de thèse qu’on pourrait financer avec cet argent-là, chaque année, le nombre d’infrastructures qu’on pourrait payer, le nombre de choses qu’on pourrait faire avec cet argent-là et qui, en fait, est juste de l’argent public qui est donné à du privé pour un service rendu qui est très minime — je vais vous parler un peu plus de ça après — et puis d’autres exemples pour vous montrer comment ça évolue dans le temps.

À Télécom ParisTech, là où j’ai fait ma thèse, entre 2009 et 2014, comme c’était trop cher, la bibliothèque universitaire ne pouvait plus payer tous les abonnements, eh bien ils ont divisé plus que par deux la quantité d’abonnements papier qu’ils ont récupérés. Et en échange, pour que les gens puissent continuer d'avoir accès aux choses, ils se sont abonnés électroniquement donc en accès par Internet, mais ils n’ont pas tout repris ; ils ont fait plus un tiers, à peu près, d’abonnements électroniques ; c’était trop cher de tout reprendre en version électronique.

Pendant ce temps-là — donc on a moins d’abonnements — eh bien sur cette période-là le coût de l’abonnement Reed Elsevier a monté de 21 %, celui de Springer de 32 et l’IEEE [Institute of Electrical and Electronics Engineers] carrément de 61 %, l’abonnement. Comment ils justifient ça ? Officieusement c’est « nos actionnaires en veulent plus et il faut maintenir leurs profits » et officiellement c’est « eh bien oui, mais vous avez publié plus de papiers au niveau mondial, on a plus de choses dans notre offre donc il faut payer plus cher ». Ce n’est jamais rentabiliser assez des choses qu’ils n’ont pas produites eux.

En face de ça, il y a la ruine des bibliothèques universitaires d’un côté et, en écho à ça, évidemment, eh bien vous voyez, par exemple Reed Elsevier, des chiffres d’affaires en milliards de dollars au niveau mondial. Ça c’est le chiffre d’affaires, donc c’est tout l’argent qui rentre ; ça ce sont les bénéfices. Évidemment quand on vend des choses qu’on ne produit pas, eh bien les bénéfices sont assez colossaux !
Et vous avez des magazines, il y avait un magazine américain qui s’appelle The Economist ou un truc comme ça, qui n'est pas un truc de gauchistes, vous avez compris, qui disait, en gros, que les meilleurs placements c’est dans les éditeurs scientifiques qu’on peut les faire parce qu’ils ont des taux — et on ne peut avoir ces taux-là que dans genre les business illégaux type drogue, etc. — de retour sur rentabilité parce qu’ils décident combien leurs clients doivent payer ; ils n’ont pas à acheter la matière première, c’est le client qui la fournit et, ensuite le client est obligé de payer ça parce qu’il ne peut pas s’en passer.
Et on a un truc où c’est de l’argent public, mais il n’y a pas de marché public puisque, avec la propriété intellectuelle, les articles ne sont que chez un éditeur. Donc si on veut accéder à cet article on est obligé de prendre l’abonnement de cet éditeur. Et si on veut accéder à un article d’un autre éditeur, il faut aussi prendre l’abonnement de l’autre éditeur. On ne peut pas dire on va prendre le moins cher. Donc il n’y a pas d’appels d’offres, etc., comme ça peut se faire pour certains autres trucs.

Le rôle des maisons d’édition c’est quoi ? Historiquement il y avait :

  • la mise en page des articles. Mais ça c’est de moins en moins vrai aujourd’hui avec des outils comme LaTeX ou même LibreOffice ou la suite Office de Microsoft, etc., il y a des choses qui sont assez puissantes pour que les éditeurs nous fournissent juste un modèle de fichier, un template, et on n’a plus qu’à remplir et tout se passe bien ;
  • distribuer le plus largement possible les articles : ça c’était un vrai travail comme la mise en page des articles, surtout à l’époque où il n’y avait pas Internet. Ça veut dire que votre article il fallait l’imprimer et l’amener dans toutes les BU du monde, dans toutes les bibliothèques universitaires du monde ; ça, ça avait un vrai coût. D’accord ! Et c’est comme ça que l’inertie de cette espèce de schmilblick s’est mise en route. C’était pour ce service-là ;
  • gagner de l’argent. Ce sont des entreprises privées, c’est toujours ça ;
  • et puis faire connaître les chercheurs ; puisque ce sont eux qui diffusent leurs résultats, il y a ce rôle-là. On va voir que c’est assez problématique.

La mise en page des articles, je vous ai dit aujourd’hui les chercheurs font ce travail eux-mêmes.

Distribuer le plus largement possible : aujourd’hui avec Internet c’est assez trivial. Héberger un PDF ça ne coûte pas beaucoup d’argent. OK !

Gagner de l’argent, bon eh bien ça, vous avez vu, ça se passe assez bien c’est bon, on ne va pas trop en parler.

Et puis faire connaître les chercheurs, alors là il y a un petit souci dont je voudrais aussi vous parler. Pour ça, en fait, il faudrait un petit peu, peut-être, faire un petit détour historique, mais je ne sais pas si j’ai le temps.

En gros, on va dire que dans la recherche comme ailleurs, on a une espèce de tendance à faire rentrer du néolibéralisme dedans, c’est-à-dire du management par les chiffres. Donc on va avoir des petites chefs qui doivent pouvoir mesurer est-ce que ce chercheur ou cette équipe est efficace ou pas ? Déjà qu’évaluer de la recherche c’est très compliqué ; ce n’est pas pour rien que la revue par les pairs est un processus long, etc. Donc ces gens-là veulent des indicateurs. Tout à l’heure [lors de l'exposé précédent, NdT] on parlait du quantified-self, eh bien c’est un peu le même délire, cette espèce de « vouloir avoir des chiffres sur tout » alors que ce n’est pas toujours possible. Donc typiquement ils ont inventé, enfin ils ont réutilisé des trucs de bibliométrie.

À la base, la bibliométrie ça a été inventé justement parce que ça commençait à coûter trop cher les abonnements, ce sont les bibliothécaires qui ont dit : « On va essayer de mesurer quelles sont les revues auxquelles il faut qu’on s’abonne parce que, effectivement, nos chercheurs les lisent. » Comment ils ont fait ça ? Ils se sont dit genre bon ! Il y a des revues qu’ils lisent beaucoup, on voit que c’est beaucoup accédé, ils nous les demandent beaucoup, mais finalement peut-être que ça ne leur sert à rien ; à chaque fois ils sont déçus. Donc ils ont dit, les bibliothécaires, on va essayer de trouver une autre mesure et en fait, finalement, ils ont pris le nombre de fois où un papier est cité dans d’autres articles. Ça veut dire que ce papier a effectivement été utilisé, est utile, peut-être en négatif mais au moins, il est utile pour un autre article. En fait, il y avait une mesure comme ça qui existait toute faite et, du coup, les néo-managers se sont dit « on peut réutiliser ça ; c’est super ! »
Maintenant ils évaluent les gens et donc, dès qu’il y a une bureaucratie comme ça qui se met en place, on a un système qui est complètement dénaturé et maintenant, ce qu’il faut, c’est avoir beaucoup de publications, pas des publications de qualité, il faut avoir beaucoup de publications. C’est ça qui va compter plus qu’autre chose.

Du coup les équipes, les labos, les chercheurs et les chercheuses, sont jugés sur, grosso modo, quelque chose qui correspond à leur nombre de publications, ce qui encourage à saucissonner les articles, c’est-à-dire prendre un résultat et dire on va couper : ce sous-résultat on va le publier là, ce sous-résultat on va le publier là, etc., ce qui, évidemment, n’est pas du tout scientifiquement valable mais, en plus, donne plein de dérives. J’en parlerai un petit peu après des dérives.

Évidemment cette bibliométrie, du coup, ça fait aussi qu’on regarde où est-ce qu’on a publié parce qu’il y a des revues qui sont plus prestigieuses que d’autres : elles sont plus anciennes, il y a plus de résultats, elles ont été beaucoup citées, du coup elles sont beaucoup achetées, du coup beaucoup lues. D’accord ! Du coup, c’est plus la classe d’avoir publié là-dedans qu'ailleurs. Le problème c’est que, comme ce sont les maisons d’édition qui détiennent les revues et pas les chercheurs, eh bien on se retrouve dans une situation où ça arrange les maisons d’édition d’avoir cette bibliométrie et de détenir des revues qui sont très « classe » et où les gens veulent publier puisque, du coup, ça va être plus acheté.

Ce qui se passe, c’est que ce sont les maisons d’édition qui font en sorte qu’on pousse à fond la bibliométrie donc l’évaluation des chercheurs, l’évaluation quantitative des chercheurs. Par exemple on a des outils qui sont vendus par les maisons d’édition, donc SciVal, Scopus, Web of Sciences et des choses comme ça, qui sont en fait des outils de marketing pour elles mais qui servent aux agences de moyens, aux agences de notation, etc., à évaluer les chercheurs et qui sont en fait, au final, détournés pour être des outils qui ne sont utiles qu'au marketing des maisons d’édition.

En fait, ce qui se passe quand on fait ça — c’est peut-être un peu tiré par les cheveux — mais, en quelque sorte, un chercheur ou une chercheuse ça produit du savoir. Donc le moyen de production de ce savoir principal c’est la diffusion du savoir ; le savoir, sinon, il est complètement inutile s’il n’est pas diffusé. Finalement, ce à quoi on a assisté historiquement c’est à une espèce de « prolétarisation » – je le mets vraiment entre guillemets parce qu’on est quand même dans des conditions qui ne sont pas celles d’ouvriers en usine quand on fait de la recherche, mais une espèce de prolétarisation de la recherche – puisqu’on est dépossédés de nos moyens de production. C’est-à-dire que les moyens de production qui sont les revues, qui, à la base étaient gérés par des chercheurs dans des sociétés savantes ou des choses comme ça, se sont fait racheter systématiquement par des grosses maisons d’édition qui les possèdent et font de la marchandisation avec. Et finalement, on occupe presque des emplois fictifs en fait. C’est-à-dire qu’on est rémunérés par une université, enfin on est rémunérés même par l’État, mais on fait gagner de l’argent à des sociétés privées. C’est exactement ça les emplois fictifs. Les emplois fictifs ce n’est pas que les gens ne travaillent pas. Les emplois fictifs c’est que, à la mairie de Paris, il y a des gens qui bossent pour le RPR et qui sont payés par des emplois de la mairie. C’est ça les emplois fictifs.

Donc là on est un peu dans cette situation-là. Et en plus, on a une espèce d’aliénation qui va avec, où les gens cherchent de plus en plus à publier et leur but ce n’est pas de trouver un nouveau résultat c’est d’avoir une nouvelle publication. Donc c’est une aliénation au sens où on n’a plus le sens de ce qu’on fait, on a juste des petites étapes comme ça.

Je vous ai parlé de beaucoup de choses, mais j’avais commencé à vous parler de combien ça coûte à la société tout ça, de combien d’argent public on dépense plusieurs fois pour le même travail. Mais finalement, ce coût en euros, surtout pour nous, on est dans un pays riche, c’est un symptôme plus qu’un vrai problème. Le vrai problème, fondamental, c’est l’accès citoyen à cette recherche. Quand moi je développe un nouvel algorithme ou je ne sais pas quoi, les gens s’en foutent, quoique ! il y a peut-être quelques start-ups que ça pourrait intéresser, mais surtout, en médecine, en biologie, il y a des choses qu’il pourrait être très utile d’avoir sur les maladies rares, des choses comme ça, où c’est important que les citoyens puissent y accéder, et aujourd’hui ce n’est pas du tout possible parce qu’un papier ça s’appuie sur plein d’autres et quand on a quelqu’un dans la famille qui est déjà atteint d’une maladie qui coûte très cher on ne peut pas, en plus, se payer le luxe de prendre les abonnements à toutes les revues qui vont être utiles pour ça.

Évidemment pour l’égalité entre les étudiants, les chercheurs et dans les universités du monde entier. Ça c’est déjà vrai en France. Moi je suis à Paris 8, à Saint-Denis dans le 9-3, je suis dans un département d’informatique, eh bien on n’est abonné à aucune revue d’informatique. Il n’y a pas les sous. Voilà ! Ce n’est pas grave parce qu’on a genre Sci-Hub, etc., donc de toutes façons on arrive à y accéder ; Sci-Hub c’est un système de piratage de publications donc c’est bon, ça marche quoi ! Mais on n’est pas abonné et les étudiants n'ont pas officiellement accès à toute cette connaissance. Alors que dans d’autres universités plus riches, par exemple à Sorbonne Université, eh bien il y a ces abonnements. Là je vous parle de juste en région parisienne, mais imaginez ce que c’est entre la France et les pays émergents. Ça veut dire que dans les pays émergents on a peut-être des gens qui essayent de faire de la recherche et on passe à côté de découvertes phénoménales parce qu’ils n’ont pas le matériel de base. Donc ça c’est très problématique ; il y a plein d’opportunités manquées. Après, si vous êtes dans cette ambiance-là, ce n’est pas trop mon cas, mais on peut penser à toutes les start-ups qui pourraient utiliser ces choses-là pour faire du business et qui ne peuvent pas du coup.

En réaction à ça, ce dont je viens vous parler, le libre accès.

Le libre accès c’est quoi ? C’est la mise à disposition des publications et des données de la recherche en accès libre, gratuit et illimité sur Internet, sans restriction de paiement, d’abonnement pris auprès d’éditeurs ou de sociétés savantes.

C’est une définition sur laquelle à peu près tout le monde est d’accord ; le problème c’est que c’est une définition très large. Ça veut dire qu’il y a plein de façons de faire du libre accès qui vont correspondre à ça. Je vais vous présenter trois voies, les trois voies principales qui existent aujourd’hui.

Il y a ce qu’on appelle la voie verte ou l’auto-archivage. Là c’est qu’en fait, on continue d’utiliser le circuit de publication normal mais les chercheurs, les auteurs des articles et les autrices des articles, vont aussi déposer dans des dépôts soit institutionnels, soit nationaux, soit de leur université, soit disciplinaires, vont mettre leur travail en accès libre. Par exemple, vous avez un nouvel article qui est accepté vous allez aussi le mettre sur, je ne sais pas, une archive d’articles de votre discipline à laquelle les gens peuvent accéder et là, ça va être disponible en libre accès, en plus de là.
Évidemment les éditeurs ne sont pas très contents de ce genre de chose donc ils mettent des périodes d’embargo. Par exemple, ça a été pendant longtemps 48 mois chez Elsevier avant qu’on ait le droit de mettre l’article en ligne gratuitement ; avec des exceptions genre si c’est sur votre page web et que comme ça les gens n’arrivent pas à le trouver, c’est bon.
En France, on a la chance depuis la loi République numérique que, maintenant, le délai d’embargo est maximisé par la loi à six mois pour les sciences inhumaines et asociales et 12 mois pour les autres disciplines. Donc ça c’est assez cool !
Par contre, c’est assez flou dans le texte de la loi sur ce qui est concerné par ça. Ça concerne les périodiques publiés au moins une fois par an. Typiquement les monographies, donc les livres, ce n’est pas inclus alors qu’il y a plein de livres qui sont écrits par des chercheurs — surtout en sciences humaines et sociales ils publient beaucoup comme ça — et puis nous, en informatique, on publie beaucoup dans des conférences. Alors les conférences ce sont effectivement des publications qui sont tous les ans, mais c’est chaque conférence. Par exemple c’est truc machin 2017, truc machin 2018, truc machin 2019, ce n’est pas un périodique qui est publié tous les ans ; ce n’est pas le journal of truc machin et du coup, ce n’est peut-être pas couvert. Il faudrait essayer de l’utiliser, d’attendre qu’il y ait un éditeur qui porte plainte et de faire une jurisprudence pour voir comment le juge interprète la loi. Mais bon ! En pratique les gens, je pense ceux qui le font, qui font comme si ça marchait et qui le faisaient déjà avant quand ils n’avaient pas le droit, il n’y a pas trop de problèmes. Ça arrive que les éditeurs poursuivent des institutions ou des individus, mais c’est assez rare parce que ça leur ferait quand même une assez mauvaise presse.
Donc ça c’est la voie verte, c’est l’auto-archivage.

Sur ça il faut faire attention, il y a des start-ups, Academia.edu et ResearchGate, dont certains d’entre vous ont peut-être entendu parler, ce ne sont pas des dépôts pérennes. Ce sont des gens qui cherchent un business modèle, qui peuvent se faire racheter à tout moment, ce n’est pas du dépôt voie verte ; c’est du réseau social, c’est, je ne sais pas, c’est comme si vous mettiez des posts sur Facebook sauf que c’est un truc soi-disant dédié à la recherche.
Il y a déjà SSRN, donc Social Science Research Network, qui s’est fait racheter ; Mendeley aussi et l’éditeur qui l’a racheté, du jour au lendemain, a supprimé tous les articles qui étaient de chez lui, pas les autres par exemple. Donc ce n’est pas du tout un truc pérenne, ça ne compte pas comme du libre accès pour moi.

Ensuite on a ce qu’on a appelé la voie dorée où là, l’idée, c’était de dire on publie dans le journal et directement c’est en libre accès sur le site de l’éditeur. Ça c’était bien donc on a appelé ça doré parce que c’est stylé. Le problème c’est que les éditeurs ont dit « oui, d’accord, mais alors ce sont les auteurs qui payent ». Et du coup, il y a beaucoup de gens qui confondent open access et « je paye pour publier ». Ils ont réussi ce coup-là parce qu’évidemment, vous pensez bien qu’avec tous leurs millions d’euros il faut bien qu’ils fassent quelque chose et ils font notamment beaucoup de lobbying. Vous avez par exemple dans le financement de la recherche qui, malheureusement, se fait de plus en plus par projet et plus sur financement pérenne dans les labos — ça veut dire qu’on perd beaucoup de temps à faire des projets et la plupart du temps ça échoue, enfin bref ! — mais dans les financements par projet de la recherche, par exemple au niveau européen qui distribue des énormes bourses de plusieurs millions d’euros parfois de recherche, eh bien maintenant, grâce au lobbying des maisons d’édition, il y a une partie de cet argent qui est fléché pour payer les charges liées à la publication, pour que ce soit en libre accès, parce que tout le monde est d’accord qu’il faut faire du libre accès ; tout le monde est d'accord qu’il faut que les articles soient en libre accès. C’est juste que les maisons d’édition vont expliquer « mais nous ça nous coûte beaucoup d’argent. Comment on va faire pour faire gagner à nos actionnaires ? » , ils ne disent pas ça comme ça, « comment on va tenir le taux de profit de nos actionnaires ? » Maintenant ça veut dire qu’il faut que les auteurs payent.

Ça, ça a été un peu dévoyé. Finalement ça coûte trop cher, en fait, cette méthode-là. On pourrait dire dans un pays comme la France on a assez d’argent ; on va le faire, ce n’est pas grave, allez, on paye comme ça. En fait, le CNRS produit tellement de papiers que s’il devait payer ! Parce que c’est cher, c'est genre 3000 euros, 5000 euros pour publier un papier. Un papier qui coûtait 30 euros avant, individuellement, et qui va peut-être être lu dix fois dans sa vie, et encore ça c’est un papier qui a du succès ! C’est très cher et ça ne serait pas vivable pour des institutions qui publient beaucoup.

Donc, en réponse à ça, il y a une certaine mouvance, dont je fais partie, qui propose ce qu’on appelle la voie diamant, il y a des gens qui parlent aussi de voie « platinium » ou de fair open access où l’idée c’est de faire de la recherche un commun, les communs dont je vous parlais tout à l’heure. Là les auteurs ne payent plus, les lecteurs ne payent plus, et on essaye de gérer ça en commun avec des ressources publiques. OK ? Quand je dis publiques, ça peut-être des ressources communes, pas forcément publiques au sens de « étatiques ».

C’est quand même beaucoup plus précis ce qu’on veut faire. Ce n’est plus sur le libre accès, c’est « on veut faire de la recherche un commun ».

Qu’est-ce que ça veut dire « faire de la recherche un commun » ? Ça veut dire qu’on se dirige vers une abolition de la propriété lucrative de la connaissance, en tout cas de cette connaissance-là et, en même temps, du coup ce n’est pas juste ça, c’est aussi qu’on va faire en sorte que les chercheurs et les chercheuses se réapproprient leurs moyens de production, c’est-à-dire les outils de diffusion de la connaissance ; c’est ça leur cœur de métier.

On va voir comment ça marche, tout simplement en faisant un exercice. Je vous ai dit un commun ce sont trois choses : c’est une ressource, un mode d’accès, des règles de partage et une gouvernance.

La ressource c’est quoi ? Ce sont les résultats de la recherche, donc des articles, des données, des logiciels. Ça peut être des données brutes, ça peut être des données traitées, ça peut être des images, des traductions ; ça peut être plein de choses.

Le mode d’accès. Eh bien ce n’est pas parfait mais c’est ce qu’on fait de mieux, accès via Internet ; c’est ce qu’on a de plus universel, ce n’est pas complètement universel mais c’est comme ça qu’on s’en rapproche le plus, sachant qu’il y a plein de problèmes de barrière de langue, etc., parce que, par exemple, on publie en anglais ; ce n’est pas parfait, je ne dis pas que c’est parfait. Mais si on utilise des licences libres les gens auront le droit de traduire, ce qu’ils n’ont pas le droit de faire actuellement. On utilise des logiciels et des licences libres, évidemment, parce que ça ne sert à rien de sortir d’une cage pour rentrer dans une autre.

Et la gouvernance c’est quoi ? Le principe ça va être que les auteurs et les autrices conservent leurs droits d’auteur ou leur copyright dans la législation. Pourquoi on fait ça ? Parce qu’en fait le but, quand moi je publie un article, l’article peut être vendu genre un million de fois, je ne touche pas un centime de plus. Mon salaire est fixe, il est payé par l’État sur une grille de fonctionnaires : je suis échelon 3, maître de conférences classe normale, je touche 2000 euros par mois, un peu plus, c’est comme ça. Je peux produire autant d’articles que je veux ou ne rien publier, je suis payé pareil. OK ! Donc ça veut dire que moi, mon intérêt quand je produis un article, c’est juste qu’il soit lu. Si j’écris un article et que je me fatigue à le faire publier, à le mettre en forme, à faire la recherche qui va permettre d’y aboutir, etc., c’est que je pense que c’est important, et mon intérêt en tant que chercheur c’est que mon article soit lu, c’est qu’il soit disponible le plus possible. Ça veut dire qu’en gros, mes intérêts personnels sur cet article sont alignés avec ceux de la communauté. Donc ça veut dire qu’en gros, la gouvernance d’un commun pour la recherche, ce qu’elle dirait c’est que les auteurs conservent leurs droits d’auteur, leur copyright. Ils ne les cèdent plus parce que ce sont eux qui vont dire « c’est moi qui décide pour cet article et il est disponible ». Forcément ! Ils n’ont aucun intérêt à le rendre privé.

Les comités éditoriaux détiennent les revues. Ça c’est aussi quelque chose d’important. Actuellement les revues sont détenues par la maison d’édition. Prenons un exemple : le journal de Pas Sage En Seine qui est détenu par Elsevier, eh bien en fait les organisateurs de Pas Sage En Seine, du coup eux ils bossent, ils bossent, ils bossent, ils acceptent les conférences, ils prennent les articles, ils font en sorte que ça soit un tout cohérent ; ils organisent la conf, etc. et à la fin c’est l’éditeur Elsevier qui va récolter tout l’argent que vous vous avez payé pour venir à Pas Sage En Seine – là heureusement c’est gratuit, ce n’est pas le cas, mais on imagine dans ce modèle-là. Et un jour, les organisateurs de Pas Sage En Seine ne sont pas contents, ils disent « finalement nous on veut faire du libre accès, on veut déjà rendre les conférences gratuites et puis on veut faire en sorte que tout continue de fonctionner ». Et là l’éditeur leur dit : « Oui, mais c’est moi qui détiens la revue, donc tu n’as pas le droit d’utiliser le nom Pas Sage En Seine. » Et du coup, ils sont obligés de partir et de faire, je ne sais pas, un « pas sage en bord de l’eau » pour faire un autre truc. Ça veut dire aussi qu’ils perdent leur évaluation qui existait. Je vous avais parlé des évaluations bibliométriques, ça concerne les chercheurs, les équipes, mais aussi les revues, les conférences, les journaux. Ça veut dire que les gens ne vont pas vouloir publier dans le nouveau truc. Les gens pourraient se dire « mais si, c’est bon, moi je suis bien installé, je suis un vieux chercheur, je peux utiliser tout mon crédit, etc., je n’ai plus besoin de faire avancer ma carrière, je n’ai plus besoin de réussir à obtenir un poste, parce que sinon je vais aller de contrat précaire en contrat précaire, etc., donc je peux moi publier dans la nouvelle revue pour la faire monter petit à petit et dans trois-quatre ans eh bien elle aura pris la place de l’ancienne. »

Le problème c’est que les vieux chercheurs ne publient jamais tout seuls, en fait, ils publient toujours avec leurs padawans, leurs thésards ou leurs thésardes. Du coup, ça voudrait dire qu’ils sacrifient une génération ou deux de thésards pour arriver à faire en sorte que la nouvelle revue marche bien. Ça c’est très problématique et du coup, on a une espèce de problème de poule et d’œuf où le fait que le moyen de diffusion soit détenu non pas par ses utilisateurs, que ce ne soit pas une propriété d’usage mais une propriété lucrative externe, eh bien ça nous empêche complètement de faire une transition vers du libre accès. Il y a des gens qui le font, qui montent des nouveaux trucs et ça démarre doucement ; ce sont des échecs dans certains cas, des succès dans d’autres, mais c’est un énorme frein, en tout cas, le fait que les revues soient possédées par des entités économiques externes qui ne sont pas les comités éditoriaux. Et les comités éditoriaux n’existent même pas officiellement. La plupart du temps, c’est une association de fait mais ce n’est pas une association légale. Ce sont juste les gens qui disent « oui, oui, je fais partie de telle revue » ; mais la revue n’est possédée par rien et ils n’ont pas de contrat, ils ne sont pas payés pour ça, etc. Ça fait partie de leur travail de chercheur ou de chercheuse d’animer leur communauté, etc.

Donc il faut que les comités éditoriaux se dotent d’une existence légale et détiennent la revue. Ce n’est pas complètement un truc utopiste ce dont je vous parle, c’est une idée qui est réaliste et qui a un coût nul, quasiment. D’accord ? Pourquoi ça a un coût nul ? Parce que les infrastructures existent déjà pour faire ce genre de choses. Les dépôts institutionnels et disciplinaires comme Hal, ArXiv, ePrint de l’IACR, enfin je ne vais pas tous vous les citer, Zenodo, etc., il y en a plein des dépôts. Ils existent déjà, les infrastructures sont là, on peut organiser des journaux dessus, on peut poser des articles, ils sont déjà accessibles, c’est déjà payé par de l’argent public ; c’est déjà là, ce n’est pas un truc qu’il faut monter et qu’il faut payer en plus, le temps qu’on arrête de payer les abonnements, c’est un truc qui est déjà là.

Les plateformes libres de revue par les pairs, par exemple HotCRP ça permet d’organiser des conférences, OJS, Open Journal Systems, c’est un truc qui permet de faire un journal et c’est une espèce de CMS, donc de WordPress ou de Joomla, je ne sais pas comment vous voulez appeler ça, mais dédié aux journaux scientifiques, avec des modules qui permettent de gérer la revue par les pairs, l’anonymisation, enfin tout un tas de choses qui sont utiles pour gérer un journal.

Au niveau du cadre légal, ce qui se passe en recherche c’est, de fait, ce qu’on utilise comme licence ; ça serait une licence Creative Commons- Attribution, c’est-à-dire que vous pouvez utiliser les résultats d’un article, vous pouvez construire dessus, vous pouvez en citer des passages, mais vous citez les auteurs ; c’est la règle du jeu. Bon ! C’est legit, voilà ! Du coup la licence existe déjà. Donc on pourrait utiliser celle-là.

Les associations à but non lucratif ça existe dans quasiment tous les pays. Les comités éditoriaux pourraient se doter, par exemple en France l'association loi 1901 ou 1900, je ne sais plus combien, là où il y a le concordat dans l’Est. Ça existe déjà, on peut déjà le faire. C’est très simple de rédiger des statuts d’une association qui disent « on est un journal scientifique ».

Et puis, comme je vous disais, il y a déjà des gens qui commencent à le faire. Il y a ce qu’on appelle les épi-revues. Le principe des épi-revues c’est de dire « la soumission de l’article c’est le dépôt de l’article dans une archive institutionnelle » donc un truc pérenne, etc. ; Hal, par exemple, est adossée au CNRS.

Et ensuite, on fait de la revue par les pairs. Et une fois que cette revue est faite, l’article a été modifié forcément un petit peu, il y a eu des suggestions d’amélioration qui ont été faites, eh bien on met à jour l’article sur les dépôts. Parce qu’en plus, contrairement aux versions qui sont chez les éditeurs privés, dans ces dépôts-là les articles peuvent avoir plusieurs versions. Donc on peut voir ; par exemple on peut dire « la version qui a été acceptée, qui a été relue par les pairs et acceptée par la revue c’est celle-là ». Mais après, on peut voir les versions qui ont été corrigées ; si par exemple il y a avait une typo, s’il y avait une preuve ou un truc où on avait dit « bon aller, ça c’est simple, c’est bon » et finalement on s’est rendu compte que c’était compliqué et qu’il faut rajouter une annexe pour montrer que ça marche effectivement, eh bien on peut l’avoir immédiatement. Alors que dans le système classique on va publier un erratum dans le journal d’après, voire deux ans après, vous imaginez le truc !
Et puis, on peut même imaginer dépasser les modèles actuels avec, par exemple, de l’évaluation ouverte où plutôt que de faire de l’évaluation où on anonymise les auteurs ou les reviewers ou les deux, on peut imaginer faire de l’évaluation complètement publique et où l’article n’est pas, finalement, accessible tout seul, on a ses reviews avec. Donc on peut dire « voilà, vous êtes en train de lire la version acceptée de l’article ; les reviews donc les évaluations qui ont fait que l’article a été accepté, elles disent ça » et souvent ça peut donner beaucoup d’informations. Par exemple on peut dire « eh bien ça, ça a été d’abord fait par telle personne et vous avez cité celui-là mais c’est mieux là », donc on peut avoir beaucoup d’informations dans les évaluations. C’est intéressant de les avoir avec. On pourrait imaginer expérimenter vu qu’on n’est plus contraints par les formats choisis par les éditeurs privés.

Pour l’instant on pourrait faire ça et du coup, si on allait vers ça, on pourrait dire on arrête de payer les abonnements. Pour l’instant c’est compliqué parce qu’il y a encore plein de choses qui sont chez les éditeurs, mais, en vérité, on pourrait déjà arrêter de payer les abonnements et il y a des universités qui le font. Il y a quelques universités, en France, qui ont arrêté de payer Springer qui est un gros éditeur, notamment en informatique. En Allemagne, il y a eu tout un front contre Springer et contre Elsevier aussi. Et en fait, ce dont on se rend compte c’est que quand on dit aux chercheurs « vous n’allez plus avoir accès à Springer », ils sont là « ah non ! » et tout, et après on leur dit « juste par la bibliothèque quoi ! — Ah ! » En fait, ils n’utilisent pas du tout ça, ils utilisent Sci-Hub ; c’est plus simple que d’aller se loguer ou d’utiliser le VPN de la bibliothèque ou le proxy HTTP, etc., qui est avec l’abonnement parce que les plateformes pirates sont beaucoup plus simples d’utilisation et marchent très bien. Légalement c’est évidemment interdit, mais moralement c’est quelque chose qui n’est absolument pas condamnable puisqu’on est en train juste de reprendre des choses qui ont été produites par notre communauté et qui n’avaient aucune raison, dans un premier lieu, d’être privatisées. Donc on pourrait faire ça.

Et pour finir, c’est mon dernier slide, je voudrais dire que c’est quand même un combat qui est politique. Ce n’est pas qu'un combat technique même si je vous ai dit que c’est bon, les plateformes sont là, etc., genre techniquement tout est bon on peut le faire. C’est un peu plus compliqué que ça parce qu’il y a la bibliométrie, je vous en ai déjà parlé assez longuement, c’est un frein à la publication en libre accès et ça, arrêter la bibliométrie et passer à autre chose, c’est un combat qui est éminemment politique. C’est comment on finance la recherche par exemple.

Si on continue d’aller vers ce système néo-libéral où on finance tout par projet et on met tout le monde en concurrence les uns avec les autres pour avoir les sous du projet, eh bien on ne peut pas se passer de bibliométrie parce qu’il faut bien évaluer les gens et quand il y a 12 000 projets à évaluer, eh bien si on ne peut pas demander à un tableur de les classer – et un tableur ne va pas lire les articles des gens évidemment – eh bien on ne peut pas faire ça.

Alors que si on avait un financement pérenne de la recherche, d’une part on pourrait voir à plus long terme, d’autre part on ne perdrait pas, en moyenne, un mois par personne par an à bosser à monter des projets plutôt que faire de la recherche sur laquelle le projet est censé bosser. Il y a plein de choses comme ça ! Il n’y aurait pas des labos où il n’y a pas de bourses de thèse et des labos où il y en a trop, ils n’arrivent pas à dépenser l’argent et du coup, à la fin, ils achètent des machines qu’ils ne vont pas utiliser parce que sinon ils n’auront plus leurs crédits l’année d’après !

Le financement par projet. C’est un truc qui est très politique qui est de comment on finance la recherche et qui permettrait de mettre un frein un petit peu à cette nécessité de la bibliométrie qui est quelque chose de très néfaste.

Les dépôts centralisés. Je vous ai parlé des dépôts institutionnels comme Hal, etc. Le problème c’est que Hal, par exemple, c’est quelque chose de national. C’est très utile d’avoir un dépôt disciplinaire ou national comme ça parce que, si tous les articles sont là-dessus, c’est facile de les trouver. Donc ça c’est bien. Donc pour la discoverability, j’ai traduit par « découvrabilité », je ne sais pas s’il y a un meilleur mot.

Et puis pour la pérennité aussi peut-être ; quand on est adossé au CNRS et puis aux gens de l’IN2P3 [Institut national de physique nucléaire et de physique des particules] qui sont dans les trucs de physique des particules, qui savent bien faire des backups, ça c’est bien mais, le problème, c’est que ça facilite aussi la mise en œuvre de la bibliométrie d’avoir tout au même endroit. Donc il y a une espèce de décentralisation qui serait nécessaire ; techniquement la décentralisation pourrait résoudre le problème mais techniquement ça pose problème d’être décentralisé pour la « découvrabilité ». Donc c’est à nouveau un combat politique. Il faut dire « on arrête la bibliométrie ».

Donc il n’y a pas vraiment de solution technique. On a un paradoxe et la solution n’est pas technique ; elle est politique.

Si vous avez des questions ou des précisions que vous voulez ou des choses à ajouter.

Public : Une petite remarque. Au tout début tu as cité le crédit impôt recherche. Il faut savoir qu’il y a aussi plein de boîtes privées qui grugent clairement le système, qui ne font absolument pas de R&D, qui demandent à leurs employés de déclarer des heures de entre guillemets « R&D » pour choper du crédit d’impôt là-dessus qui n’en est pas.

Pablo : Oui. Il me semble l’avoir dit, avoir précisé que le crédit impôt recherche, notamment dans les grosses boîtes, est complètement détourné, mais comme le crédit impôt compétitivité emploi et tout ; ce sont juste des cadeaux qu’on fait aux entreprises pour avoir des plus gros dividendes pour les actionnaires et pas du tout quelque chose qui est utile à quoi que ce soit d’autre.

Public : Excusez-moi, je voudrais vous parler du facteur humain dans tout ça, parce que moi je suis en plein dedans en fait.

Pablo : Oui. D’accord.

Public : Premier point : par exemple vous êtes maître de conférences, moi je n’en ai pas un seul, mais pas un seul qui m’a pris la tête pendant cinq ans pour mes références bibliographiques, qui ne doivent être que dans des articles publiés machin. Moi je suis en sciences humaines ; il faut savoir que les livres, eh bien ils nous font une fleur quand ils nous acceptent ; s'il y a un truc qui sort d’un bouquin dans une recherche de tant, c’est que ! Et si on essaye de trouver d’autres solutions, on se fait allumer. C’est très scolaire ce que je dis.

Pablo : Je n’ai pas du tout compris. D’autres solutions à quoi ?

Public : En fait, on ne peut sortir : tout ce qu’on fait en recherche doit être justifié et chaque justification doit venir de ce type d’articles, etc., qui sont eux-mêmes ; ça c’est le premier point.
Ensuite ça fait cinq ans qu’on me rabâche que, de toutes façons, si je veux par exemple faire de la recherche et être enseignant chercheur, parce qu’en gros il n’y a que ça pour faire de la recherche, blablaba, ou alors être mécène, mais c’est encore un autre problème, en fait le seul moyen c’est devoir publier beaucoup. Parce que pour pouvoir avoir le double, la double thèse, etc., si je n’ai pas le nombre d’articles nécessaires, ce n’est pas possible. Ça c’est tous nos enseignants, des gens comme vous qui ont le même poste, qui nous rabâchent ceci en moyenne, peut-être, 50 ou 100 fois par semestre. Donc je pense que c’est du bourrage de crâne. C’est dit à chaque devoir, c’est tout le temps dit !

Pablo : C’est quoi le domaine exactement ?

Public : Je suis en sciences humaines ; je suis en psychologie.

Pablo : En psychologie. D’accord !

Public : Et c’est d’autant plus grave parce que, selon les spécialités, ils se tapent dessus en disant la vraie psychologie ce sont des cognitivistes, les autres ce sont des cliniciens, blablabla ; on s’en fiche en fait, ça devait être un tout, mais ce n’est pas comme ça que ça marche. Donc le facteur humain.
Autre point en facteur humain, vous savez très bien qu’on préfère souvent… L’utopie c’est de dire « on fait le bien de tous », comme l’histoire des arbres au départ. La vraie vie et toutes les sciences humaines qui étudient ça vous diront « on préfère, nous, avoir moins du moment que l’autre, on est sûrs qu’il ait beaucoup moins. » Et c’est toujours ce mécanisme-là. Il y a la logique mathématique qui est de dire normalement on fait pour le mieux de tous et on se protège et tout ; mais dans la logique humaine et dans toutes les recherches qui ont été faites ce n’est pas le cas.

Alors vous allez travailler comment sur l’humain pour que ça ne se passe pas comme ça à l’université, qu’on ne se tape pas sur les doigts, qu’on n’invalide pas tout le travail qui est fait de tous les étudiants qui, de toutes façons, sont hyper-formatés par rapport à ça et puis changer : que l’humain n’ait pas envie, toujours, de descendre ce qu’on appelle l’exo-groupe, le groupe d’à côté ; c’est moi d’abord et, comme on dit, « moi je suis plus humain que toi et l’autre après ». Et ça c’est terriblement définitivement humain. C’est super ce que vous dites, mais c’est très utopiste.

Pablo : Justement, je ne pense pas que ce soit complètement utopiste. J’ai déjà dit quelques réponses à ça il me semble. Le besoin de taper sur le groupe d’à côté est fait parce qu’on est mis en compétition. Si on arrête ça, déjà il y a beaucoup moins ce besoin. J’ai des exemples très précis : dans les communautés type crypto ou physique, en fait ça se fait déjà ce dont je suis en train de vous parler. Par exemple moi j’ai fait ma thèse en cryptologie. En cryptologie, on a l’Association internationale de recherche en cryptologie, l’IACR, qui a un serveur de ePrint où les gens mettent leur papier même avant qu’il soit publié et c’est accessible à tout le monde et les gens peuvent y accéder, voire on a déjà des retours avant même l’évaluation par les pairs ; on a des retours avant que ce soit publié ; on est parfois invité dans des conférences ou plutôt des séminaires à présenter des travaux comme ça. C’est une communauté si vous voulez, la crypto, où les gens sont habitués à ce que, de toutes façons, tout soit cassé et qu’on démolisse leur travail. Du coup, ils n’ont pas du tout ce souci de mettre du travail en mode open source si vous voulez, release early, release often, même si c’est cassé. Et du coup ça existe déjà, donc c’est possible de faire ça. En physique des particules, ce sont eux qui ont commencé à monter ArXiv ; en 91 ils avaient déjà un serveur d’articles comme ça, c’était juste un serveur FTP à l’époque, qui leur permettait d’accéder à tout. Et vous avez, en sciences humaines par exemple, toute la plateforme Revues.org ; je ne dis pas que tout est parfait avec le Cléo, etc., je ne suis pas du tout en train de dire que OpenEdition ce sont des gentils, mais c’est quand même un outil assez génial où il y a beaucoup d’articles qui sont disponibles en libre accès et ça ne pose de problème à personne.

Public : Moi je vous encourage à aller voir les travaux de Tajfel et Turner qui vous diront que non, ce système-là ! Pendant très longtemps jusqu’aux années 70, on pensait que c’était la concurrence entre les gens ; quand on a enlevé la concurrence eh bien en fait, ce n’est pas ça. C’est un mécanisme cognitif. Oui c’est quand on prend la réalité humaine en face. En plus, pour que ça fonctionne, il faut que toutes les sciences humaines, sciences technologiques, etc., tout le monde s’y mette pour que ça fonctionne.

Pablo : Ça fonctionne déjà indépendamment dans certains domaines, vraiment !

Public : C'est indépendamment. Et de toutes façons en plus il faut prendre un certain recul. Je suis désolée, pourtant je ne devrais pas, en psychologie, être blasée, mais j’apprends tous les jours le mécanisme humain et ce qu’il est dans son ensemble. Donc je dis allez voir les travaux Tajfel et Turner et je pense que vous comprendrez ce que je veux dire. Je ne veux pas m’étaler, c’est un peu chiant pour les gens, mais allez voir.

Pablo : OK ! Je ne serai quand même pas du tout aussi défaitiste.

Public : Tu parlais d’utopie tout à l’heure. Moi je voulais savoir comment toutes ces idées-là sont analysées et comprises par bottom ?

Pablo : Par ?

Public : Par up, pardon ! Par le ministère de l’Éducation, par tes directeurs de fac – Paris 8 je connais bien j’y ai été aussi, ce n’est peut-être celle qui a le plus d’œillères –, mais le pré-carré de l’Éducation nationale me semble tellement fermé que comment peuvent-ils encourager ce genre de choses ? C’est point d’interrogation.

Pablo : Oui. D’une part, la première réponse, c’est qu’ils ne sont pas vraiment impliqués là-dedans à part que ça leur coûte de l’argent donc ils sont plutôt en faveur du libre accès en général. Par exemple il y a des commissions ; en ce moment, le gouvernement est en train de monter un truc qu’ils appellent le CoSo [Comité pour la science ouverte], c’est le collectif, je ne sais plus ; en gros faire une espèce de bibliothèque numérique ouverte donc ils ont fait appel à des chercheurs qui sont soit spécialistes de ce sujet-là, du libre accès, etc., soit des gens qui sont militants, pour bosser un petit peu là-dessus. Ce sont des problématiques qui montent jusqu’à assez haut.

Après, comme je disais, c’est éminemment politique et il y a des courants politiques, notamment la « macronie » au pouvoir actuellement en France, qui pensent que le business c’est plus important que l’accès à la connaissance, par exemple. Et qui donc ne vont jamais dire que c’est un problème que Elsevier ramasse autant d’argent et, je ne sais pas, ils vont trouver toutes les excuses du monde pour dire qu’ils fournissent un service, qu’ils font du marketing, que machin, je n’en sais rien. Donc après, c’est une question politique. Et il y a des programmes ; si vous regardez dans la dernière présidentielle, par exemple dans le programme de la France insoumise, l’Avenir en commun, il y avait ces questions-là ; dans le programme de Besancenot, le NPA, il y avait ça ; dans le programme de Hamon ça y était en partie aussi. Donc il y a tout un tas d’organisations politiques qui se sont saisies de cette question-là.

Public : Inaudible.[Question concernant le lien entre science ouverte et libre accès, note de l'orateur]

Pablo : Ça fait partie de l’open science ; le libre accès c’est un des aspects de l’open science. Après, dans l’open science, il y a plein d’autres choses. Il y a des gens qui veulent que la recherche se fasse de manière plus ouverte, c’est-à-dire qu’on ne publie pas que au moment où on a un article mais que les cahiers de recherche soient mis au jour au fur et à mesure, etc. Typiquement vous avez la plateforme Hypothèses, ce sont des espèces de blogs de recherche qui existent. Et puis il y a certains domaines où ça ne se fait pas du tout ; on ne doit citer que des articles qui ont été publiés, évalués par les pairs ; mais il y a d’autres domaines, aussi, où ça va tellement vite que des fois c’est publié sur un blog et il y a des articles qui citent des blogs-posts.

Public : Inaudible. [Questions sur les fab labs, note de l'orateur]

Pablo : Ça, après, c’est de la science citoyenne, c’est encore autre chose parce qu’il y a moins ces problématiques de publication qui entrent en jeu, mais oui c’est lié, c’est tout à fait lié tout ça. Oui. [Sinon pose la question, je la répète.]

Public : Ça marche. Déjà merci pour la conférence.

Pablo : De rien.

Public : Je suis moi-même doctorant en informatique et, juste pour illustrer un peu ce que tu disais, je pense qu’il y a peut-être un tiers des articles que j’ai lus pendant les trois ans de ma thèse qui viennent de Sci-Hub, sans ça je n’aurais pas pu les lire, en fait, ou ça m’aurait coûté 20 dollars par article ou je ne sais pas.

Pablo : 20 dollars ça va ; tu n’es pas dans un domaine cher !

Public : C’est ça ! C’est quand même un budget, finalement, sur la masse. Ma question, en fait, étant doctorant, l’école doctorale me dit : « Pour valider ton diplôme, un des critères c’est tu dois avoir fait x publications dans des conférences ou des journaux de tel rang », enfin il y a des critères qui varient un peu mais c’est le même principe. Et par rapport à ce que tu disais est-ce que, finalement, il y aurait des solutions pour sortir de ce truc-là parce que, l’effet que ça a, c’est que je suis obligé de faire ce genre de publications dans entre guillemets « l’ancien système », de donner les droits de mes publications que j’ai écrites avec mes petites mains à des entreprises lucratives qui vont les voler ensuite, tout ça pour que je puisse avoir ma thèse. Du coup mon directeur de thèse et mes encadrants sont obligés, en fait, de suivre le mouvement et donc, eux, c’est leur job au jour le jour. Finalement comment est-ce qu’on pourrait éviter ce cercle vicieux ?

Pablo : J’en ai parlé pendant l’exposé ; je ne sais pas si tu étais là.

Public : Je suis arrivé à la moitié peut-être.

Pablo : OK. Je ne sais plus quand j’en ai parlé, mais j’ai parlé exactement de ce problème-là, de poule et d’œuf, comme ça, pour faire une transition vers le libre accès. Effectivement c’est un problème et je n’ai pas de solution technique à donner comme ça. La solution est politique et elle doit venir à la fois de la base parce que tout ce mécanisme-là, dans la recherche : je veux dire le directeur de l’ED [école doctorale] et le conseil de l’ED qui décident de ça, ce sont des enseignants chercheurs et des chercheurs. D’accord ? Eux sont responsables, en partie, de ça. Après il y a des règles qui viennent de plus haut au niveau national, de l’ANR [Agence nationale de la recherche], de choses comme ça qui, en fait, les imposent de manière assez pernicieuse par exemple en disant genre « si l’ED qui est rattachée à votre labo n’a pas ces règles-là donc elle n’a pas souvent des publications dans des revues de rang A, etc. — sachant qu’une revue de rang A déjà c’est assez subjectif et ce sont souvent des classements qui sont faits pour arranger telle personne, enfin bon c’est assez compliqué —, eh bien vous avez moins de chance d’avoir les sous pour le projet. »

Donc à nouveau c’est vraiment l’idéologie de la mise en concurrence de tout le monde contre tout le monde et le financement par projet de la recherche qui impose vachement ce genre de mécanisme-là. Donc c’est une décision très politique qui doit venir un peu du haut, malheureusement, aussi, qui doit être prise et qui pourrait permettre de sortir de ce genre de chose-là. Mais c’est clair que toi, individuellement, tu ne peux pas faire quelque chose. Toi tu es obligé, pour l’instant, de jouer le jeu pour avoir une chance d’avoir un poste plus tard et ensuite essayer de changer les choses de l’intérieur. C’est triste mais je n’ai vraiment pas d’autre conseil à te donner. Je ne vais jamais te dire « sois militant, ne publie que dans des trucs en libre accès qui ne sont pas connus, etc. », parce que ça serait te sacrifier, en fait. Et ce n’est du tout une bonne idée. Oui ?

Public : Je voudrais poser une question sur le côté international de la recherche, si on ne se concentre que sur la France on passe à côté de plein de projets.

Pablo : Tout ! Même de la plupart des choses qui sont faites en France, puisqu’on collabore tout le temps.

Public : Ce genre de projet, est-ce qu’il existe à un niveau international ?

Pablo : Oui. Je vais répéter, pour peut-être le stream ou je n’en sais rien. La question c’est sur le côté international de ce genre de projet puisque la recherche est internationale.
Donc oui, tout à fait. Déjà les plateformes ArXiv, Zenodo, il y en a certaines qui existent au niveau européen, d’autres qui sont disciplinaires et donc complètement internationales.
L’exemple dont je vous parlais en crypto, tout à l’heure, donc l’IACR, l’Association internationale de recherche en cryptologie, comme son nom l’indique c’est international et c’est une association qui va beaucoup dans le sens du libre accès et qui essaye de faire en sorte que ce soit l’association qui détienne les grosses conférences de crtypto, les revues, etc., les plus importantes où les gens peuvent, pendant l’AG de l’association, décider de ce qu’on fait. Donc ça c’est un premier point « d’autogestion » entre guillemets de la recherche au niveau international, donc par discipline. Et après il y a des mouvements politiques sur ce sujet-là ; par exemple il y a des boycotts de Elsevier qui existent, qui sont complètement internationaux et qui sont signés par des chercheurs très connus, anglais, américains japonais, français, allemands, etc., brésiliens. Donc ces questions-là ne s’arrêtent pas du tout aux frontières de la France. Ce sont vraiment des questions qui sont totalement internationales et il y a des gens qui se battent partout dans le monde avec exactement les mêmes choses.

Public : Question subsidiaire : qu’est-ce qui empêcherait de créer une nouvelle revue en la faisant loi de 1901 ?

Pablo : Alors rien du tout ! Il n’y a rien du tout qui l’en empêche et les gens le font. Ça commence à exister, il y en a. Mais comme tu dis, ça met du temps à monter et ça c’est un problème parce que, à cause de ces trucs d’évaluation, par exemple le camarade là-bas ne peut pas publier dans cette revue-là parce que sinon il sacrifie sa thèse. Et puis, du coup, ses encadrants non plus parce qu’ils publient avec lui, etc. Donc il y a ce problème-là, mais, par contre, il ne faut pas être complètement défaitiste : les revues, il y en a qui sont montées, des épi-revues il y en a qui existent ou d’autres types : il y a Timothy Gowers, qui est un médaillé Fields, qui fait de l’analyse discrète ou je ne sais plus quoi, je ne sais plus exactement ce qu’il fait en maths, mais il monte des revues alternatives complètement sur le modèle dont je vous parlais et ça marche parce que lui a son poids de médaillé Fields et il dit « maintenant c’est là » et du coup, les gens publient là-dedans.

Donc la transition arrive ; le truc c’est que, comme je vous disais, il y a plein de façons de faire et il faut surveiller vers où on va, parce que si on laisse le lobbying des éditeurs gagner, on va juste aller vers un libre accès où, finalement, on paye pour publier. Et ça c’est très problématique non seulement parce que ça coûte trop cher mais en plus, c’est hyper-problématique scientifiquement de dire « ce résultat va être publié oui ou non en fonction de est-ce que le labo peut payer ». Ce n’est pas du tout comme ça que c’est censé fonctionner. Et ça, les éditeurs ils s’en foutent parce que scientifiquement ! Ils n’en ont rien à faire de la science. Je parle des gros éditeurs. Il y a plein de petits éditeurs, je tiens à être précis là-dessus, il y a plein de petits éditeurs, notamment en sciences humaines et sociales, qui bossent encore, parce que, par exemple, ce sont des domaines où on publie dans la langue de la littérature qu’on étudie, donc nécessairement c’est plus petit, ce n’est pas complètement aussi international que les gros trucs internationaux comme Elsevier et tout ça ; ils sont beaucoup plus proches des chercheurs, etc., donc il y a encore une qualité qui est recherchée, une vraie collaboration, etc.

Il y a d’autres éditeurs qui délocalisent le travail à des gens qui ne lisent pas forcément bien l’anglais, mais on leur demande juste de mettre les titres en rouge, etc., vous imaginez le travail ! Ça donne des résultats catastrophiques.

Public : C’était important pour moi d’avoir accès à des bibliothèques pour travailler et, du coup, je me suis dit à la fin, vu que j’ai ressorti mon algorithme, plutôt que simplement avoir un pseudo-code pour mon master, enfin dans ma thèse, je vais aussi publier. Donc j’ai commencé à faire des recherches pour voir pourquoi les chercheurs ne publiaient pas plus leur code. Il y a différentes raisons : parce que le code était moche, il a dû être fait rapidement pour faire l’article ; il n’est pas forcément portable ou « releasable » par n’importe qui ; il nécessiterait trop d’instructions, de documentation, etc. Je me suis dit bon ! je vais changer ça. Finalement le code est toujours chez moi, je ne l’ai toujours pas publié. Voilà ! Maintenant je vais peut-être me booster et essayer de le faire, finalement. Du coup, j’ai vu que dans un de vos projets il y avait partager pas seulement les articles en tant que ressources mais aussi du code. Sauf que ça demande une grosse discipline le fait de faire du code propre, mais aussi de se pousser à le publier. Est-ce que vous avez… ?

Pablo : Il y a plusieurs initiatives qui ont été prises là-dessus. Maintenant il y a des conférences qui, par exemple, récompensent ce qu’ils appellent les artifacts. C’est de releaser avec le papier aussi, les sets de données, les codes et tout ça, en précisant bien que ce n’est pas forcément super bien documenté et tout ça ; juste on écrit « pour obtenir le résultat vous relancez ce code R dégueulasse sur tel jeu de données » et puis voilà ! Il y a des gens qui se sentent visés là c’est ça ? Non ? Désolé ! Sinon il y a des gens qui « releasent » du code avec leurs articles, ça existe, complètement ; genre moi, généralement je l’ai fait. Donc j’ai fourni des outils qui généraient des résultats lisibles par des humains, etc. Ce n’est pas toujours évident et le problème c’est que [ouais, je finis ça], le problème c’est que ça t’engage un petit peu. Des fois c’est cool parce que du coup les gens utilisent les outils et quand ça marche c’est bien parce qu’ils te contactent et ils disent : « On a fait ça avec ton outil, est-ce que tu veux regarder avec nous ? » et puis tu as une collaboration avec des gens, tu collabores, etc. Ça m’est arrivé, c’est trop cool ! Mais si tu te retrouves à devoir faire du support technique alors que tu n’as déjà pas le temps de faire de la recherche parce que tu es noyé sous l’enseignement, l’administratif, etc., c’est compliqué. Donc les gens refusent aussi de le sortir pour ça.
Après, il y a d’autres cas où c’est juste que c’est du code qui a fonctionné une fois et que, pour le publier, il faudrait remonter dans l’historique du terminal pour voir où est-ce qu’on a écrit la bonne ligne de bash qui a sorti les résultats. Et bon ! Là ce sont des problèmes de méthode et voilà !
Mais il existe des plateformes, par exemple, qui lient à un article publié sur ArXiv, donc c’est un dépôt pérenne, un dépôt GitHub par exemple, et qui permettent d’avoir les deux en même temps systématiquement. Je n’entends pas du tout ce que tu dis.

Organisateur : Il faut arrêter là.

Pablo : OK. Donc on doit couper. On peut en discuter après. Merci beaucoup.

[Applaudissements]

Pages