La Chaire est faite de chair et de sang ! Nous commençons à être nombreux à travailler pour la Chaire. Et vous êtes nombreux à travailler avec nous. Nous prenons le temps de présenter les personnes qui font la Chaire, qui font fonctionner les projets, lui donnent de la visibilité.
Aujourd’hui, Corentin.
Corentin, tu es arrivé en mars 2021. Un financement de NeXT nous a permis de démarrer un projet très ambitieux de récupération de Ressources Éducatives Libres francophones pour pouvoir les traiter avec les outils d’intelligence artificielle du projet X5-GON. Mais avant d’entrer dans le projet, dis-nous un peu d’où tu viens et ce que tu as fait avant.
Après des études d’ingénieur en sciences informatiques à Sophia Antipolis, j’ai partagé mon début de carrière professionnelle entre les secteurs académique et industriel à travers lesquels j’ai acquis une expérience avec les technologies du Web Sémantique, qui visent à associer aux données le sens qu’elles font pour les humains et à l’étendre à l’égard des machines, avec des formats et protocoles d’échange normalisés. La modélisation des données pour les transformer en information, connaissance et sagesse selon la hiérarchie DIKW (Data, Information, Knowledge, Wisdom) s’applique particulièrement à celles qui constituent le socle des ressources éducatives, et constitue un préalable à leur traitement par les chaînes d’intelligence artificielle : j’ai donc naturellement fait le lien entre ces travaux et ceux menés dans le cadre de la chaire RELIA.
Pyramide DIKW
Pendant ton parcours tu as aussi beaucoup travaillé à distance. D’une certaine façon, tu avais pris de l’avance par rapport aux nouvelles façons de travailler que nous semblons inventer aujourd’hui.
Le domaine de l’ingénierie des connaissances pour l’informatique est hautement spécialisé et par conséquent son vivier de ressources humaines est restreint, ce qui encourage les quelques employeurs à favoriser le travail à distance des consultants au service de clients internationaux, principalement dans le secteur de la gouvernance des données. J’ai donc toujours opéré en télétravail au cours de ces dernières années, bien avant son avènement avec les mesures d’isolation dues à la pandémie de coronavirus. Par ailleurs, l’échange de données par les programmes informatiques à l’échelle du Web global est toujours plus aisé lorsqu’il est conduit dans des canaux standardisés, c’est pourquoi je privilégie l’implémentation et l’utilisation de protocoles tels que définis par des organisations comme le World Wide Web Consortium (W3C) ou l’Open Archives Initiative (OAI) pour conduire les données tout au long de leurs voyages à travers le Web.
Si nous en venons à Florilège, ton premier chantier a consisté à regarder les données des Universités Numériques Thématiques. Tu peux nous dire ce que sont ces UNTs ?
Les Universités Numériques Thématiques sont un ensemble de 6 organisations dont chacune regroupe plusieurs établissements de l’enseignement supérieur, pour mutualiser l’accès à leurs ressources pédagogiques au format numérique selon 6 thématiques.
Chacune de ces 6 organisations dispose donc d’un portail d’accès agrégeant les ressources des établissement qui y contribuent :
- UNIT pour les sciences de l’ingénieur et technologie ;
- AUNEGE pour l’économie et la gestion ;
- UOH pour les sciences humaines et sociales, langues et cultures ;
- UVED pour l’environnement et le développement durable ;
- UNESS pour les sciences de la santé et du sport ;
- IUT en ligne pour la technologie.
Et celles-ci sont donc en quelque sorte le réservoir des RELs de l’Université Française ?
Exactement. Si ces portails ne font que référencer les ressources hébergées par les établissements, ils permettent de les exposer à travers des interfaces Web communes pour les humains, mais aussi à travers des APIs pour les machines qui respectent un protocole normalisé : OAI Protocol for Metadata Harvesting (OAI-PMH). Ce protocole permet de récolter des métadonnées précises qui caractérisent chaque ressource, aux rangs desquelles figurent notamment la licence d’accès spécifique à chacune. Ce format d’échange de métadonnées structurées est donc essentiel pour effectuer un moissonnage sélectif des ressources avant de transmettre celles-ci aux chaînes de traitement par intelligence artificielle qui requièrent leur analyse en profondeur.
Et donc, l’ambition du projet sur lequel tu travailles actuellement, Florilège, c’est quoi ?
Le projet Florilège vise à créer le canal de communication pour connecter ces deux hémisphères : d’un côté les entrepôts de ressources éducatives libres qui les stockent, et de l’autre les outils d’analyse par apprentissage qui doivent en explorer le contenu et donc s’assurer de la compatibilité de leurs licences.
Merci Corentin. Et bonne continuation !
Sauf indication contraire, l’ensemble des contenus de ce site chaireunescorel.ls2n.fr est mis à disposition selon les termes de la Licence Creative Commons Attribution 4.0 International.
Répondre à cet article
Suivre les commentaires : |