
Venez découvrir Active Tigger (logiciel d’annotation et d’entrainement de modèles de langage pour la classification de textes).
N'hésitez pas à apporter vos propres données si vous le souhaitez !
Présentation
Active Tigger est une application open source, conçue pour faciliter l’annotation et l’exploration de corpus textuels à grande échelle. Elle permet d'utiliser les outils des sciences sociales computationnelles dans vos pratiques de recherche sans compétence technique particulière et d'entrainer des modèles d'IA pour la classification de textes et l'extraction d'information.
C'est par exemple le logiciel qui se cache derrière l'étude de Boelaert & al. sur la prévalence du genre dans les sciences sociales (voir l'article, le preprint et sa présentation dans Le Monde).
Annina Claesson (Médialab/ CREST) et Emma Bonutti D’Agostini (Médialab/ CREST), membres du CSS @ IP-Paris, viendront présenter leurs travaux ainsi que l'usage qu'elles font d'Active Tigger dans leur recherche et proposeront une formation à l'utilisation du logiciel.
Intervenantes
Annina Claesson est doctorante en sociologie affiliée au Médialab ainsi qu'au CREST (Institut Polytechnique de Paris). Sous la direction d'Étienne Ollion et de Sylvain Parasie, elle mène une thèse sur les relations entre les politiques et les journalistes à l'ère numérique. Cette thèse contribue au projet MEDIALEX, financé par l'ANR.
Emma Bonutti D'Agostini réalise un doctorat en sociologie sous la direction de Sylvain Parasie (médialab) et Etienne Ollion (CREST, IPParis). Dans sa thèse, elle étudie comment les médias traditionnels français et italiens accordent visibilité et légitimité aux voix politiques, en empruntant des outils issus de la science des données (CSS) et du traitement automatique du langage (TAL), qu'elle combine avec des méthodologies sociologiques qualitatives.