Session 1
Dans la conscience collective, largement reprise par les discours dominants, les chercheurs en SHS sont cantonnés au rôle d’utilisateur d’outils relevant des humanités numériques ou de l’IA pour la collecte, le traitement, l’analyse, la mise en forme, la diffusion et la valorisation des résultats de la recherche. Pourtant, nombre de ces outils – y compris les plus récents comme les modèles de langage (LLM) utilisées par les IA – sont profondément inspirés voire co-modélisés à partir de travaux menés en LLASHS. Cette communication entend réaffirmer la place des chercheurs SHS non seulement comme utilisateurs mais bien comme co-concepteurs d’artefacts numériques, à partir de démarches théoriques, empiriques et sémiotiques ancrées à la fois dans leur discipline et dans des réflexions interdisciplinaires.
La datavisualisation s’impose comme une technologie de l’intelligence permettant de transformer des données brutes en représentations visuelles structurées et compréhensibles (Verlaet, 2023 ; Szoniecky, 2024). Elle s'inscrit dans un processus d’abstraction propre à la démarche scientifique (Leleu-Merviel, 1997), en rendant accessibles des connaissances complexes par des modèles graphiques. La sémiologie graphique (Bertin, 1967) peut être définie comme l’ensemble des règles permettant l’utilisation d’un système graphique composé de signes, lequel assure la lecture instantanée de l’image et sollicite les facultés de la vision pour identifier des motifs structuraux complexes dans le cadre d’un raisonnement logique. L’objectif de la visualisation de l’information est donc de produire des représentations visuelles, graphiques à partir d’éléments divers comme des données, des processus, des relations, des concepts, des textes, etc. L’un des intérêts de l’info-visualisation est qu’elle profite des caractéristiques du système de traitement cognitif humain et contribue à la fois à poser et à résoudre des problèmes. Toutefois, l’une des difficultés inhérentes à l’info-visualisation est de concevoir les métaphores visuelles permettant de représenter l’information et ainsi de fournir aux lecteurs une compréhension qualitative du contenu de l'information.
En nous appuyant sur deux métaphores issues de projets interdisciplinaires – le « diamant langagier » (Auger, 2023) pour l’appropriation des langues, et la « cartographie du métro » (Gonzalez et al., 2015, 2019) pour la visualisation des parcours de formation et des compétences – nous montrerons comment l’usage de métaphores permet de structurer des dispositifs de médiation qui articulent données, concepts et pratiques. Ces modélisations, construites dans une logique de design info-communicationnel et pédagogique, relèvent d’un processus où les SHS deviennent productrices de formes, de cadres et d’usages – en somme, de paradigmes opératoires – et non plus seulement de simples consommatrices de solutions numériques préconçues.
Session 2
Notre intervention se fera à deux voix. Elle proposera un retour d’expérience sur la création et l’animation de deux carnets de recherche : le carnet Studio21 du laboratoire RIRRA21 (créé en 2021) et le carnet Transculturalia du laboratoire IRIEC en cours d’élaboration. Après avoir présenté le projet qui a présidé à leur création, leur architecture et leurs contenus, nous voudrions expliquer comment ces carnets Hypothèses s’inscrivent dans l’écosystème des deux laboratoires en prolongeant et en valorisant leurs activités scientifiques, en dialogue étroit avec d'autres supports académiques comme les revues ou les séminaires. Il faudra aussi en présenter les enjeux : espaces moins codifiés que les revues, permettant de valoriser les travaux en cours sous la forme de billets, de capsules vidéo, de renforcer la visibilité des laboratoires, leur identité, de mettre en évidence le dynamisme de leurs doctorants. Il sera intéressant aussi d’exposer les difficultés rencontrées dans l’élaboration de ces carnets : comment mobiliser les chercheurs sur le long terme, maintenir une certaine régularité dans les publications et une exigence de qualité ? Quel équilibre trouver entre diversité et cohérence ? Quelle ligne éditoriale? Quelles compétences techniques ? Quelle valorisation dans les évaluations académiques ?
Dans le cadre de l'École d'été Ethicum, je me propose de retracer la genèse, les développements et les résultats atteints par le projet d'édition numérique de la polémique gongorine, dirigé par Mercedes Blanco depuis 2013, né au sein du Labex OBVIL et dont je suis partie prenante. J'aborderai aussi des risques et des difficultés auxquels sont soumis les outils et les projets numériques tant du point de vue de l'organisation du travail que de la pérennité des publications.
Session 3
La question de la moralité des intelligences artificielles (IA) fait l'objet d'un intérêt croissant au sein de la société contemporaine (Bonnefon et al., 2024). Aujourd’hui, les IA ne sont plus simplement perçues comme des outils technologiques sophistiqués destinés à faciliter la vie humaine, mais comme des entités susceptibles d'analyser et de résoudre des situations morales complexes (Ladak et al., 2023). Avec l'intensification des interactions entre humains et IA, la psychologie morale appliquée aux IA a connu une expansion significative. Ainsi, de nombreuses recherches se sont penchées sur la relation entre moralité et IA. Par exemple, des travaux ont exploré la responsabilité morale attribuée aux systèmes intelligents (Franklin et al., 2022; Bonnefon et al., 2016), la manière dont les erreurs morales commises par les IA sont perçues par les humains (Ishowo-Oloko et al., 2019), ainsi que les réactions humaines face aux décisions morales prises par ces systèmes (Awad et al., 2018). Néanmoins, bien que de nombreuses études aient exploré divers aspects de la moralité des IA, il reste encore de vastes zones d'ombre à explorer. L’une d'elles concerne la représentation que les individus se font de la morale des IA. Autrement dit : quelle morale attribuons-nous spontanément aux IA ? Identifier la nature de cette représentation est essentiel, car elle détermine nos attentes envers les IA et influence potentiellement nos interactions, nos comportements, notre confiance envers ces systèmes et, par conséquent, l’acceptabilité sociale des décisions qu’elles produisent. L’objectif de cette présentation est donc d’examiner empiriquement les représentations que les individus se construisent de la moralité des IA, afin de mieux saisir comment ces constructions influencent leurs attentes et les usages de ces technologies.
Une expérimentation est en cours consistant à soumettre à des personnes concernées par le contenu un article rédigé par une IA générative suite à des prompts rédigés par des chercheurs. On abordera l’article, des prompts, le retour des personnes, la version finale de l’article et on s’interrogera sur ce que cela peut dire sur l’enquête qualitative.
- Une intelligence artificielle pour mieux évaluer la santé des sols
Session 4
La transcription est une activité essentielle, mais chronophage, pour la constitution et l’analyse de corpus oraux. La transcription, qui constitue une première étape dans la catégorisation des données, à travers notamment les choix d’encodage orthographique ou phonétique, engage le chercheur, en le forçant à effectuer des choix précoces, souvent contraints par le cadre théorique choisi. Ces choix conditionnent les analyses subséquentes. C’est ce que Mondada (2007) appelle le biais interprétatif. Ces choix sont particulièrement cruciaux lors de l’analyse des discours d’apprenants, qui s’écartent souvent de la norme des locuteurs natifs. A travers l’exemple de l’utilisation par de nombreux apprenants anglophones du français de la terminaison verbale polysémique [e], je montre dans Leclercq (2020) que les choix de transcription peuvent conditionner l’interprétation qui est faite des données. Dans l’exemple (1), produit par une apprenante anglophone du français de niveau intermédiaire, le son [e] référe-t-il à l’infinitif, l’imparfait, le participe passé, ou même à une forme erronée de présent ? Quelle est l’intention de communication derrière l’utilisation de cette forme ?
(1) le cheval essayE de monter le barrière (EngL1 FrL2 MAG, intermediate)
Si ces questions sont centrales au travail d’analyse du chercheur, le processus de transcription, jusqu’à présent manuel et très coûteux en temps et en moyens humains, se trouve actuellement bouleversé par l’utilisation de l’IA. De nombreux outils émergent permettant de transcrire en un temps record des données enregistrées, monolingues ou même bilingues. Ces outils, le plus souvent commerciaux, ne donnent que peu d’informations sur le traitement et la sécurité des données qui leur sont confiées. D’autres outils sont open source (par exemple Whisper hébergé par HumaNum, voir Gaide, 2023). Ces outils ouvrent de nouvelles perspectives au chercheur, notamment en termes de gain de temps, mais quels sont les points de vigilance à garder en tête ? Nous ferons le point sur les nouveaux outils et les pratiques à adopter.
- Gaide, A. (2023, novembre 6). Retranscrire avec whisper via huma-num [Billet]. Âge et pouvoir. https://doi.org/10.58079/vfmr
- Leclercq, P. (2020). Transcribing interlanguage : The case of verb-final [e] in L2 French. In Interpreting language-learning data. Language Science Press. https://doi.org/10.5281/zenodo.4032298
- Mondada, L. (2007). Commentary : Transcript variations and the indexicality of transcribing practices. Discourse Studies, 9(6), Article 6. https://doi.org/10.1177/1461445607082581
- Traduction du texte juridique : quel rôle pour l’IA et la MT (machine translation) ?
-
Paraskevi SKOURTI (Doctorante en études Néohelléniques ReSO (UMPV) et CLLE (UMR 5263 Cognition, Langues, Langage, ergonomie, CNRS et Univ. Toulouse JeanJaurès (UT2J)
Le monde actuel est marqué par l'utilisation croissante de l’IA, qui a suscité de multiples réticences (GANASCIA 2019, 2sq). Dans le domaine du droit, diverses préoccupations ont été soulevées concernant son utilisation, notamment sur sa capacité à diagnostiquer et à appliquer des paramètres imprévisibles liés à la spécificité de l'épistémologie juridique (BILLION et GUILLERMIN 2019). Dans le domaine de la traduction juridique, qui présente plusieurs particularités mais connaît une croissance constante liée à l'expansion des structures transnationales et, par conséquent, à la nécessité d'institutionnaliser et d'incorporer des règles juridiques communes (KRIMPAS 2017), le recours à l'IA est plutôt inévitable. Toutefois, le texte juridique doit remplir des conditions et des contraintes qui lui sont inhérentes, alors que les traducteurs ne sont pas nécessairement spécialistes (KRIMPAS et VALEONTIS 2014), en particulier dans les langues moins parlées. Un texte juridique traduit est censé ne pas s'écarter du style, de la morphologie et de la fonction d'origine du texte, afin de ne pas perdre son authenticité (REISS 2002). Il risquerait dans ce cas, d'entraîner de graves dommages pour les individus et les entreprises et de susciter un climat d'incertitude du droit. La qualité de la traduction est aussi liée aux caractéristiques de la langue (générale et de spécialité) et de sa terminologie sur le plan lexical, pragmatique, sémantique et syntaxique. Dans le cadre d’une étude comparative de la terminologie juridique grecque-française, nous avons identifié trois types de constructions qui constituent une source d’opacité au niveau cognitif (SKOURTI, VOGA et GIRAUDO 2024) ainsi qu’au niveau de leur traitement par l’IA. Ces trois catégories sont les suivantes : a) les constructions (quasi-) métaphoriques, ex. acte de Dieu/ανωτέρα βία ; b) celles qui comportent des unités lexicales polysémiques (UL), ex. préjudice par ricochet/ζημία εξ αντανακλάσεως ; c) les constructions qui comportent des UL absentes du lexique standard, ex. usufruit à titre particulier / επικαρπία δήλου πράγματος. À ces trois difficultés, s’ajoute la problématique de la préservation du style du texte juridique : il ne s’agit pas simplement de sauvegarder le registre ‘officiel’ du texte, mais aussi les formulations précises, caractérisées pour ce qui concerne le grec, par des tournures savantes et antiquisantes (KRIMPAS 2019). Pour résumer, tout ceci interroge la capacité de la MT (machine translation) à satisfaire les exigences accrues du domaine de la traduction juridique sans intervention humaine, et souligne l’importance du facteur ‘humain’ dans la rédaction-traduction du texte juridique.
Références bibliographiques:
- BILLION, Arnaud, et Mathieu GUILLERMIN. 2019. « Intelligence artificielle juridique : enjeux épistémiques et éthiques ». Cahiers Droit, Sciences & Technologies, no 8 (mars), 131 47. https://doi.org/10.4000/cdst.774.
- GANASCIA, Jean-Gabriel. 2019. « Éthique et intelligence artificielle ». ENA Hors les murs, magazine des anciens élèves de l’ENA, juillet. https://hal.science/hal-03183627.
- KRIMPAS, Panagiotis. 2017. Introduction à la théorie de la traduction, [Εισαγωγή στη θεωρία της μετάφρασης]. Athènes: Grigoris. ———. 2019. «Types pseudo-savants et surcorrection en grec moderne commun” (Ψευδολόγιοι τύποι και υπερδιόρθωση στην Νεοελληνική Κοινή) ». In Le niveau savant en langue néohellénique contemporaine (Το λόγιο επίπεδο στη Σύγχρονη Νέα Ελληνική), sous la direction de ANASTASIADISSYMEONIDIS Anna et FLIATOURAS Asimakis, 327. Athènes: editions Patakis.
- KRIMPAS, Panagiotis, et Konstantinos VALEONTIS. 2014. Langue du droit Terminologie du droit (Νομική γλώσσα Νομική ορολογία). Athènes: Nomiki bibliothiki.
- REISS, Katharina. 2002. La critique des traductions, ses possibilités et ses limites. Traductologie. Artois Presses Université.
- SKOURTI, Paraskevi, Madeleine VOGA, et Hélène GIRAUDO. 2024. « Compréhension d’unités polylexématiques de la langue de droit : approche interdisciplinaire grec-français », communication au Colloque international Approches linguistiques comparatives du grec moderne 2. Paris: INALCO.
La recherche linguistique a contribué, par son extension typologique et géographique, à ce que certains universaux du langage soient révisés. Par exemple, l’assertion de Pinker & Bloom (1990) que toutes les langues possèdent les catégories lexicales majeures de nom, verbe, adjectif et préposition se trouve réfutée par Enfield (2004) qui montre qu’en Lao, une langue thaïe du sud-ouest, parlée au Laos, la catégorie de l’adjectif peut être identifiée, mais ne peut pas être distinguée de celle du verbe.
Un autre exemple de différence typologique par rapport à la « norme », vient du système verbal du grec, où il existe, pour le même verbe, deux formes du présent qui diffèrent à la fois sur le plan phono-orthographique, ainsi que sur le plan de l’usage. La forme « alternante » qui finit en -άω /'ao/ (omega non accentué, ex. αγαπάω ‘aimer’) est la plus familière et fréquente, surtout à l’oral. Elle présente une immédiateté et une expressivité supérieures à celle de la forme « basique », qui finit en oméga accentué (-ώ /'o/ αγαπώ ‘aimer’), et qui constitue néanmoins la « norme », par ex. l’entrée du dictionnaire. Dans une expérience d’amorçage masqué menée auprès de 51 locuteurs natifs du grec, Voga, Giraudo & Anastassiadis-Syméonidis (2012) testent l’hypothèse selon laquelle la fréquence et familiarité plus élevées des verbes ‘alternants’ auraient une influence sur leur traitement en ligne, et en particulier sur leur connexion à la flexion du passé (aoriste monoléctique, qui est le même pour les deux formes, alternante et basique). 120 verbes repartis en 3 catégories ont été utilisés comme stimuli pour cette expérience, dont le résultat principal peut être formulé sous ces termes : la connexion entre la flexion du passé (aoriste) et la forme du présent n’a pas la même ‘force’ dans le lexique mental selon qu’il s’agit de la forme « basique » ou « alternante ». À partir de ce constat, càd que les différences typologiques influencent le traitement et la représentation mentale, les questions suivantes se posent :
a) Est-ce que les distinctions opérées pour une langue (par ex. pour l’anglais, auquel est consacrée une énorme littérature concernant le traitement de la flexion du passé (ex. McCleelland, & Patterson, 2002)), peuvent être transposées à d’autres langues, qui diffèrent quant à leur complexité et richesse morphologiques ?
b) Quel type de modèle fondé sur l’IA pourrait intégrer l’immense diversité de langues naturelles ? Le rôle croissant de l’IA dans la modélisation, accompagné par l’éloignement de plus en plus marqué du chercheur de son terrain, ne contribue-t-il pas à effacer cette diversité qui constitue l’une des caractéristiques principales du langage humain ?
c) Est-ce que les prédictions fondées sur des modèles dans lesquels l’IA occupe une large place, au détriment de la collecte de données « directes » (i.e., obtenues grâce à de vrais sujets/locuteurs), seraient fiables ? Plus généralement, quelle est la valeur (théorique et heuristique) de modèles et théories fondés sur des ensembles de données caractérisés par la prise en compte insuffisante (Berghoff, & Bylund, 2024) de la diversité des langues et des locuteurs ?
Références:
- Enfield, N. J. (2004). Adjectives in Lao. In R. Dixon & A. Aikhenvald (eds.), Adjective Classes: A Cross-Linguistic Typology. Oxford University Press, 323-347.
- Voga, M., Giraudo, H. & Anastassiadis-Syméonidis, A. (2012). Differential processing effects within 2nd group Modern Greek verbs. Lingue e Linguaggio, 2, 215-234.
- Berghoff, R. & Bylund, E. (2024). Diversity in research on the psychology of language: A large-scale examination of sampling bias. Cognition, 256, 106043.
- McCleelland, J. & Patterson, K. (2002). Rules or connections in past-tense inflections: what does the evidence rule out? Trends in Cognitive Sciences (6) 11, 465-471.