L'informatique source de nouveaux savoirs - Décryptualité du 30 novembre 2020
Titre : Décryptualité du 30 novembre 2020 - L'informatique source de nouveaux savoirs
Intervenants : Manu - Luc
Lieu : April - Studio d'enregistrement
Date : 30 novembre 2020
Durée : 14 min 45
Écouter ou enregistrer le podcast
Revue de presse pour la semaine 48 de l'année 2020
Licence de la transcription : Verbatim
Illustration : Typhoon Mawar 2005 computer simulation - Licence Creative Commons Attribution-Share Alike 3.0 Unported
NB : transcription réalisée par nos soins, fidèle aux propos des intervenant·e·s mais rendant le discours fluide.
Les positions exprimées sont celles des personnes qui interviennent et ne rejoignent pas nécessairement celles de l'April, qui ne sera en aucun cas tenue responsable de leurs propos.
Description
Grâce à la modélisation et la capacité à exploiter des gros volumes de données, l'informatique nous offre une nouvelle façon d'acquérir des savoirs.
Transcription
Luc : Semaine 48. Salut Manu.
Manu : Salut Luc.
Luc : Au sommaire cette semaine de la revue de presse.
Le Monde Informatique, « Le CNRS soutient le patrimoine de codes sources Software Heritage », un article de Maryse Gros.
Manu : C’est le pendant de ce que font d’autres personnes dans d’autres contextes où il y a de la sauvegarde de codes sources pour l’histoire, l’humanité, le futur. Là c’est le CNRS qui le met en avant. C’est un projet qui s’appelle Software Heritage. C’est plutôt sympa.
Luc : ZDNet France, « Logiciels libres et communs dans l'éducation : présenter des alternatives aux GAFAM », un article de Thierry Noisette.
Manu : Il y a des États généraux du numérique libre et des communs pédagogiques qui ont démarré le 28 novembre. Il faudrait des alternatives aux GAFAM, c’est-à-dire que les gamins, les mioches, soient éduqués avec autre chose que du Microsoft, de l’Apple et du Google.
Luc : Clubic.com, « Gimp, l'alternative libre à Photoshop, fête ses 25 ans », un article de Guillaume Belfiore.
Manu : Gimp, allez, c’est quoi Gimp ?
Luc : C’est le GNU Image Manipulation Program.
Manu : Alors là, je suis sur les fesses ! Je ne pensais pas que tu connaissais l’acronyme, mais ça veut aussi dire ?
Luc : Ça veut dire « boiteux » dans un certain argot qui n’est pas très répandu en anglais, parce que ça leur a valu des trolls pas possibles, mais la vraie origine du nom c’est le film Pulp Fiction, ceux qui l’ont vu s’en souviennent, il y a une scène assez traumatisante où il y a un type en costume de latex qui est sorti d’une sorte de malle et en anglais ils l’appellent the gimp. Comme le nom correspond à peu près à la sortie du film, on est à peu près certains que le créateur, qui n’est plus dans le projet, avait ça en tête et que ça l’a fait rigoler.
Manu : Super logiciel malgré tout. Allez-y, jetez un œil, Gimp c’est pour faire du dessin, c’est super. Ne faites pas attention à ce que dit Luc !
Luc : Ce n’est pas tant pour faire du dessin que pour retravailler les images, les photos, etc., enfin les photos ou les dessins. Il y a plein de possibilités et énormément de choses à faire avec ce logiciel.
LeMagIT, « Les prochains satellites d’Airbus entièrement exploités par l’Open source », un article de Yann Serra.
Manu : Pas un petit projet, quelque chose de conséquent. C’est essentiellement des logiciels libres, mais pour faire de l’informatique en nuage ou plus distribuée, des serveurs, des trucs assez conséquents. C’est plutôt sympa. Ça me fait plaisir de savoir que même à Toulouse, ça y est, ils vont sortir un peu des logiciels privateurs.
Luc : Le Libre est utilisé partout, au moins comme des briques logicielles et là-bas ils avancent, ils vont plus loin dans ce domaine-là.
ChannelNews, « Microsoft va continuer à héberger le Health Data Hub pendant près de deux ans », un article de Dirk Basyn.
Manu : Je ne suis pas très étonné. Je ne sais pas pour toi ?
Luc : Oui, on s’en doutait. Vu que le Conseil d’État avait dit, de toute façon, que tout allait bien. Ça a fait râler pas mal de monde dont la CNIL. Je suppose qu’ils ont fait ce choix-là parce qu’ils n’avaient pas des masses d’options et c’est un très gros morceau.
Manu : Et puis c’est en place. Une fois que tu es en place, tu es dans la place, tu es installé ! On ne s’en sort pas.
Luc : C’est le drame du « ça marche, on l’a tout de suite, on n’a pas besoin de s’embêter. »
Manu : Ce n’est pas grave parce que ce sont juste les données de santé de tous les Français qui sont hébergées par Microsoft. On ne s’inquiète pas !
Luc : Tout va très bien ! On peut espérer que d’ici deux ans il y ait des solutions qui soient mises en place. Si on est encore là, on verra s’ils tiennent parole.
Le Monde.fr, « Le gouvernement doit rendre disponibles, en ligne, l'ensemble des « cahiers citoyens » en open source » , un article de la rédaction.
Manu : C’est un gros truc, les « cahiers citoyens ». J’avais oublié un peu le terme et le concept. Tu te rappelles ?
Luc : Non !
Manu : C’était tout ce qui était en lien avec les Gilets jaunes où ils avaient distribué et demandé à faire remonter des cahiers sur lesquels on posait des doléances, un peu comme il y a 200 ans.
Luc : Sauf que le résultat, c’est quoi ? C’est à peu près le même, non ?
Manu : C’est un résultat un peu compliqué. En tout cas, ce qui est demandé c’est que les contenus soient numérisés et distribués parce qu’il y a plein de gens qui vont travailler dessus et avoir une idée de ce que veut une portion de la population française, ce n’est pas rien !
Luc : En tout cas, il y a des gens qui ont pris la peine de remplir ces cahiers.
Manu : Voilà !
Luc : EurActiv, « Gaia-X: A Trojan Horse for Big Tech in Europe », un article de Stefane Fermigier et Sven Franck.
Manu : Je l’ai presque mis juste pour t’entendre le prononcer.
Luc : J’ai progressé en anglais parce que maintenant je travaille beaucoup en anglais.
Manu : Ça l’air d’être un gros truc que je ne connais pas bien. J’ai vu passer pas mal d’articles, pour l’instant ils ne sont pas passés dans la revue de presse. Gaia-X est une sorte d’initiative européenne pour faire de l’informatique en nuage mais européenne et effectivement Stefane et Sven ne sont pas enchantés par ce truc-là. Ils voient poindre des problèmes qui vont permettre aux grosses entreprises, aux multinationales, d’accaparer des marchés, un peu comme c’était déjà arrivé il y a quelques années quand ils avaient bouffé des entreprises qui fonctionnaient déjà assez bien, genre Gandi, et ils avaient monté des entreprises à côté avec des millions qui venaient de l’État français.
Luc : Pour le cloud souverain.
Manu : Voilà. Ça leur avait permis de débaucher les ingénieurs qui étaient déjà en place dans d’autres entreprises, qui faisaient déjà des projets intéressants et de faire, eh bien, pas grand-chose !
Luc : Oui, parce que les deux boîtes qui faisaient ça ont coulé.
Cette semaine on parle de quoi ?
Manu : Il faut voir, il y a plein de choses, mais tu avais quand même une idée.
Luc : Un peu. Un sujet de culture générale sur l’idée que l’informatique permet de générer du savoir. Traditionnellement, quand on s’attaque à un problème, on peut avoir une démarche empirique, on met les doigts dedans, on regarde, on voit ce qui se passe et on essaye de trouver une solution, et des approches théoriques où on va faire des calculs, utiliser les mathématiques et, avec des équations, avec une mise en forme de notre problème sous forme mathématique pour résoudre le problème avec ce raisonnement-là.
Un de mes collègues avait bossé sur des chantiers, notamment sur la construction de ponts. Ils avaient des portants gigantesques, en béton, qu’il fallait pousser avec des vérins. Il m’avait expliqué qu’il était jeune ingénieur et ils étaient toute une batterie avec leur calculette pour calculer combien de force il fallait mettre dans les vérins et il y avait Jésus. Jésus était un ouvrier portugais qui avait beaucoup d’expérience et lui avait la manœuvre dans le nez. Le chef de chantier disait : « Monsieur Jésus, qu’est-ce qu’on fait maintenant ? — On va mettre tant là et tant là. » Les autres calculaient à toute vitesse et disaient : « C’est bon !, ça nous va » et c’est comme ça que le pont se construisait.
Mais il y a des sujets qui sont inaccessibles, par aucune de ces méthodes-là.
Manu : Tu penses à quel genre de sujet ? J’en lance un, la météo par exemple.
Luc : Oui. Ça fait longtemps qu’on s’intéresse à la météo. On a commencé à mesurer la pression atmosphérique, les températures, etc., probablement au 19e je pense, de façon assez systématique, peut-être 18e.
Manu : Ils n’avaient peut-être même pas de thermomètres avant, mais ils faisaient des mesures, c’est juste que c’était avec le doigt.
Luc : Pour en déduire un certain nombre de choses. On a quand même appris à connaître un peu la météo. En tout cas prédire le temps, « la météo se trompe tout le temps », etc., c’était quand même très compliqué avec ces éléments-là.
Manu : On a de l‘informatique en masse. On a des mesures très précises et des modèles maintenant.
Luc : Oui. Ce qu'on fait avec l'informatique dans la météo, mais dans bien d’autres domaines, c’est qu’on va faire une sorte de simulation de la réalité, qu’on va essayer de faire de plus en plus fine possible, et ensuite on va faire tourner les calculs et on va essayer de reproduire pour anticiper ce que ça peut donner. C’est une démarche très différente, c’est-à-dire qu’on n’est pas capable de comprendre quelle est l’équation qu’il y a derrière, ce qui se passe – d’ailleurs il n’y en a pas probablement pas, il y a des systèmes qu’on appelle chaotiques qui sont impossibles à prédire, ça va être totalement aléatoire –, mais si on en a beaucoup qui sont en interaction les uns avec les autres, avec de la puissance de calcul et en faisant de la simulation, on arrive à obtenir des résultats qu’on n’arrive pas à atteindre autrement.
Manu : J’ai cru comprendre que les plus gros serveurs du monde étaient utilisés pour la météo, notamment, et puis qu’il y en avait d’autres qui étaient utilisés pour les explosions atomiques et la simulation des explosions atomiques.
Luc : Il y a aussi le réchauffement climatique qui nécessite beaucoup de puissance de calcul. On se souvient que Jacques Chirac était celui qui avait arrêté les essais nucléaires en vrai. On en avait quand même fait quelques-uns.
Manu : Oui, histoire de bien marquer l’anniversaire d'Hiroshima, c’était vraiment bien vu !
Luc : On a dit « c’est le dernier dont on a besoin pour caler notre modèle », donc de se doter d’outils informatiques qui permettent de reproduire, en tout cas de simuler ces choses-là, pour se faire de belles bombes nucléaires qui permettent de détruire le monde.
Manu : Oui, mais ils le faisaient mathématiquement, ça me rassure beaucoup !
Luc : Il y a pas mal d’exemples comme ça. Il y a longtemps, j’avais travaillé avec une boîte qui faisait ce qu’on appelle des systèmes multi-agents1. Ce sont notamment des simulations de comportement de foule, pas nécessairement mais dans leur cas c’était pas mal ça, et une de leurs grandes réalisations c’était d’avoir travaillé sur les flux de piétons pour le Stade de France à Saint-Denis. Avant la construction du stade, la question de la sécurité, quand on évacue le stade, s’était posée et les gens, l’architecte et les spécialistes, avaient dit « on estime que paf, paf, paf !, avec les escaliers ça se vide en tant de temps ». Eux avaient fait une simulation et avaient découvert que ça prenait quatre heures. Si ça se trouve c’est faux, on ne sait pas parce que ça ne reste qu’une simulation, ce n’est que de l’informatique, mais ils avaient fait un certain nombre de recommandations. Ceux qui sont déjà allés au Stade de France, quand on sort du stade on peut sortir tout autour du stade. Pour faire le tour ça prend du temps et il y a tout un parcours qui va jusqu’au RER, qui est finalement assez long mais très ouvert, on ne se rend pas compte que c’est long. Il y a eu tous ces calculs pour se débrouiller pour que les gens ne soient jamais, rarement, agglomérés, stoppés dans des grosses foules qui sont difficiles à gérer, pour réguler le trafic progressivement.
Manu : Je te ferai remarquer qu'il y a en d’autres qui ont réussi à faire ce genre-là de choses, ça s’appelle les Romains avec le Colisée. Ils arrivaient, d’après ce qu’on en sait, à évacuer les gens assez vite ; il y avait plein d’ouvertures partout, c’était brillant. Leurs modélistes c’était une autre catégorie !
Luc : Oui, peut-être ! On n’a pas vu comment ça marchait à l’époque ! Il y a plein d’exemples, les couloirs d’accès dans les métros, des choses comme ça, quand les gens sortent des escalators on va dire « on va mettre une petite barrière là pour éviter que les gens fassent un demi-tour pour prendre le deuxième escalator direct, pour favoriser le fait que les gens se croisent mieux, etc. »
Manu : J’ai vu que grâce à ça ils avaient même déterminé qu’il fallait éviter les portes faciles d’accès parce que, sinon, les gens vont s’agglutiner dessus, vont se bloquer et qu’il fallait mieux les mettre devant une porte. Ça explique certaines architectures : un poteau, par exemple un peu large, va bloquer le flux de personnes et éviter un entassement, tout simplement. Pareil, il y a des calculs pour l’évacuation des avions où ils vont essayer de modéliser les choses. C’est très compliqué, franchement, vraiment à chaque fois c’est un peu au doigt mouillé quand même.
Luc : Oui, pour avoir bossé avec ces gens-là il y a de ça. On avait travaillé notamment sur un autre projet, j’étais un petit peu dubitatif sur certaines choses qu’ils faisaient parce qu’en fait il y a des tas de gens qui font de la recherche dans ces domaines-là. Ils consultaient, lisaient tout ce qui écrit là-dessus en disant « telle équation rend bien tel comportement ». J’étais allé sur le terrain pour compter des trucs sur ce qu’on voulait modéliser et je leur avais fait « il se passe telle et telle chose », ce sont des questions sur la circulation sur les routes. C’était quand même assez compliqué parce que je devais prendre en compte la façon dont les gens étaient garés, s’il y avait des gens mal garés et quel était l’effet sur la circulation, notamment la circulation des bus. Il y a des trucs où, des fois, il ne faut pas grand-chose pour foutre la merde, parce que c’est mal placé ; à d’autres moments il n’y a pas de problème. Il y a des tas de phénomènes assez complexes. Le gars avec qui j’ai discuté a dit : « Ouais, c’est bon, là je vais faire ça. Là on met ça et ça va ! ». Ce n’est pas la garantie que ça marche puisque l’ordinateur ne tourne qu’avec ce qu’on lui met dedans.
Manu : Quelque part on obtient des choses, ce sont des comportements ou des phénomènes émergents qui vont apparaître sans qu’on les ait forcément prévus ou qu’on va découvrir en cours de route. C’est vrai que ça reste perturbant.
Luc : Oui, Et après, quand on est dans un domaine qu’on ne connaît pas, c’est difficile. Par exemple, une des utilisations de l’informatique et de la modélisation, c’est pour la conception des machines. Typiquement avant on devait construire des prototypes, les tester, voir ce qui se passait, etc. Aujourd’hui la conception passe beaucoup par l’informatique et, en général, on arrive à quelque chose de très proche du produit final, directement au premier modèle parce qu’il y a énormément de choses qui ont déjà été calées par l’informatique.
En revanche, il y a quelques années, Boeing avait sorti un avion entièrement en matériaux composites. Ils avaient enlevé l’aluminium et ils ont découvert toute une série de nouveaux problèmes qu’ils n’avaient pas du tout anticipés parce qu’il y a plein de choses qui se réglaient dans les avions en aluminium, qu’on n’avait jamais conçues parce que le problème ne s’était jamais posé, notamment la façon de disperser l’électricité, de disperser la chaleur, des problèmes de condensation et des choses comme ça. Les matériaux composites sont très isolants et soudain il y a plein de trucs qui n’ont pas du tout été anticipés parce que personne n’avait jamais envisagé ça.
Manu : Là, pour le coup, on n’y coupe pas, il faut passer par le test, l’expérience et puis les erreurs parce qu’on ne peut pas réfléchir à tout à l’avance, on ne peut pas tout modéliser à l’avance.
Je note un truc : tu n’as pas parlé d’un concept que pourtant on met régulièrement en avant dans le monde de l’informatique, l’IA [Intelligence artificielle]. Elle est où là-dedans ?
Luc : C’est une bonne question. L’IA est sans doute un outil parmi d’autres pour ces choses-là puisqu’on fait de la modélisation depuis longtemps, ce n’est pas une nouveauté. L’IA va exploiter un grand nombre de données. Là on est encore en train d’exploiter des choses qui sont déjà connues pour essayer d’en ressortir soit de l’auto apprentissage ou ressortir des connaissances qu’on n‘a pas vues nous-mêmes dans ces informations-là. Le point fort de l’informatique c’est sa capacité à traiter bêtement un très grand nombre d’informations, ce qui fait qu’on arrive effectivement à obtenir des résultats qu’on n’arrive pas à obtenir à la main.
Manu : Honnêtement, j’ai quand même souvent l’impression que c’est de la statistique très avancée et qu’on ne comprend pas parce que, effectivement, il y a beaucoup d’IA qui sont basées sur un réseau de neurones et le réseau de neurones, une fois qu’il a appris, on ne sait pas trop pourquoi il arrive à certains raisonnements, pourquoi il donne certains résultats. On ne maîtrise pas. À une autre époque, on avait des systèmes experts qui, eux, étaient très compliqués à mettre en place, ils n’avaient pas cet auto-apprentissage, c’était les années 70 et 80, par contre on mettait des règles dedans, on mettait des ensembles de statistiques en entrée qui donnaient les résultats des calculs en sortie et on pouvait dire par quoi c’était passé. C’est juste que, comme il fallait les programmer de manière très explicite, c’était très long, fastidieux et incomplet.
Luc : Ce qu’il faut bien garder en tête c’est que tout ça, tous ces modèles restent imparfaits. Il y a des problèmes qui sont toujours insolubles, c’est-à-dire qu’on peut faire mieux. J’ai travaillé pendant longtemps sur un outil d’optimisation de tournée et il sortait régulièrement des trucs pas optimisés, ce n’était pas le mieux qu’on puisse faire. Par contre, comme il y avait beaucoup de paramètres, aucun cerveau humain n’était capable de gérer autant de paramètres. Donc on faisait quelque chose qui n’était pas parfait mais qui était mieux que ce qu’un humain pouvait sortir.
Manu : Donc une tournée de bus, il y avait tout un chemin, il y avait des points de passage obligés et ça, la machine ne pouvait pas donner un truc optimal.
Luc : Non, il y avait plein de paramètres différents, je ne peux pas rentrer dans les détails, mais effectivement on le savait et c’était des choses qu’on disait à nos clients « ce ne sera jamais parfait parce que personne ne sait le faire ».
Manu : Je sais qu’en informatique on parle des problèmes NP-complets2 où il y a une sorte d’algorithme qui devient de plus en plus compliqué, c’est-à-dire que plus on rajoute de nœuds par exemple sur un chemin, plus on rajoute de routes potentielles sur un trajet, eh bien ça devient de plus en plus compliqué de calculer toutes les possibilités. Finalement, pour certains systèmes, il faut tout calculer pour savoir quel est l’optimal.
Luc : Oui. En tout cas l’idée c’était d’expliquer que l’informatique, au travers de différents outils, a donné accès à une sorte de nouvelle de façon de générer du savoir et permet d’accéder à des connaissances qu’on n’avait pas par le passé.
Manu : Ce n’était pas mal. On va réfléchir à tout ça et on revient vous voir la semaine prochaine.
Luc : Bonne semaine à tous. Salut.