Benoît de Courson
banner
bdecourson.bsky.social
Benoît de Courson
@bdecourson.bsky.social
Postdoc at @lsemethodology.bsky.social. Formal models, ABMs & lexicometry on press corpus.
I program gallicagram.com
Ouf, ils ont gardé leur dictionnaire des synonymes qui est biiiiiiien daté. Super ressource pour l'étude des stéréotypes en vrai !
February 11, 2026 at 5:55 PM
Comment effectuer ces comparaisons de fréquence entre différents journaux avec Gallicagram version 2 ? Petit tuto vidéo (sans son)

On crée plusieurs onglets, on bouge les bornes, on télécharge le graphique, et c'est prêt à être intégré à votre futur article, mémoire ou thèse !

gallicagram.com
February 11, 2026 at 11:25 AM
February 11, 2026 at 9:57 AM
Et pour cocher l'option, elle est dans les options avancées, l'accordéon ici présent
February 10, 2026 at 4:27 PM
De la même façon que les recherches intercorpus : avec le petit + ici, tu crées plusieurs onglets, et dans chacun tu peux régler le corpus, le mot et la résolution.
February 10, 2026 at 4:22 PM
C'est en ligne (cc @sandrabree.bsky.social)

Si jamais il y a des bugs, dites-moi !
February 10, 2026 at 3:48 PM
Le plus célèbre : le quadruplement de l'usage des pronoms personnels
February 10, 2026 at 1:58 PM
Un petit mot de conclusion. Gallicagram est une belle aventure, on a été invités une trentaine de fois, l’appli est mentionnée dans plus de 110 publications, le tout en trois ans. Au risque de sonner affreusement pédants, on a le sentiment de faire une réelle différence pour les sciences sociales
February 10, 2026 at 12:10 PM
Juste une dernière perle : pour les corpus Gallica, vous pouvez comme d’habitude revenir au contexte des occurrences dans les documents, grâce aux merveilleuses API Gallica. Et on a implémenté l’infinite scrolling. On tient votre attention héhé !
February 10, 2026 at 12:10 PM
Il faudra que je parle plus longuement des nouveaux modes de recherche. Dans Le Monde et les corpus Gallica, vous pouvez faire des recherches par cooccurrence, et rechercher les mots qui accompagnent le plus souvent le mot cible !
February 10, 2026 at 12:09 PM
On a aussi ajouté des avertissements pour vous empêcher de faire n’importe quoi (par exemple, lorsque vous tentez d’utiliser @gallicabnf.bsky.social après les années 1950, chose qu’on a tant observé…
(oh et regardez moi ce double slider !)
February 10, 2026 at 12:07 PM
L’interface se veut aussi beaucoup plus explicite. On a mis des petites help box marquées par un joli point d’interrogation. En survolant avec vos souris, on vous donne une petite explication. C’est surtout utile pour le mode de recherche : qu’est-ce qui est mesuré exactement ?
February 10, 2026 at 12:07 PM
Rien de très original, mais un super dark mode pour les yeux sensibles et autres hipsters pénibles.
(oh et j’y pense, il faut qu’on développe un code couleur et des polices pour les malvoyants, on s’est lâché sur les empâtements, pour l'instant c’est pas bien inclusif)
February 10, 2026 at 12:07 PM
L’essayer est un vrai bonheur, vous verrez. Un peu comme quand j’ai essayé mon premier vélo carbone, si ça parle à certains par ici.

(hommage à mon petit vélo de route, qui me manque pendant l'hiver londonien)
February 10, 2026 at 12:05 PM
J’en viens à l’interface. On passe d’un front-end en R shiny à un front-end en React. L’ancienne codebase était un vrai bourbier, c’était notre premier projet avec Benjamin, on n’avait aucune bonne manière… Il fallait repartir sur des bases saines
February 10, 2026 at 12:05 PM
On peut filtrer, ou comparer entre rubriques. Par exemple, dans Le Monde, il semble que l'islam ait d’abord été une question culturelle, puis internationale vers 2001, puis plus récemment une question de société et de politique.
February 10, 2026 at 12:05 PM
Pour s’approche un peu plus d’une comparaison à périmètre égal, voici la solution que nous commençons à développer : “rubriquer” des corpus de presse. Pour chaque article un SLM (un llama 8b) annote la rubrique, et on segmente le corpus en 8 rubriques. Le corpus vu comme un méta-corpus.
February 10, 2026 at 12:05 PM
MAIS me direz-vous (je commence à vous connaître), cette comparaison n’a toujours de sens : Le Figaro a *énormément* d’articles sur le sport, Mediapart est ultra-politique. Forcément, les mots politiques seront plus fréquents dans Mediapart… Un sacré problème
February 10, 2026 at 12:05 PM
Mieux : l’interface permet désormais les comparaisons inter-corpus. C'est particulièrement utile entre différents journaux contemporains. Qui parle le plus de Gaza ? Qui parle le plus de wokisme ? Vous pouvez avoir plusieurs onglets de recherche et comparer entre corpus.
February 10, 2026 at 12:05 PM
Désormais, en plus du Monde, vous pourrez choisir parmi ces 6 journaux, qui couvrent une diversité de lignes éditoriales et de positionnement politique. Pour étoffer la PQR, Ouest-France est dans les cartons, avec un tuilage avec Ouest-Éclair on aura un corpus continu depuis l’Affaire Dreyfus !
February 10, 2026 at 12:05 PM
Commençons par le nerf de la guerre : les corpus. Jusqu’ici, gallicagram était quasi muet après 1950, à cause de la loi des 70 ans. Il y avait bien Le Monde (1944-), mais comment savoir si l’évolution observée est dû à une décision éditoriale propre au Monde ou à un vrai changement culturel ?
February 10, 2026 at 12:05 PM
🔴 Gallicagram v2, nous voici ! 🔴
Nouvelle interface en react vachement plus stable et rapide, nouveaux corpus (Mediapart, Libé, le Parisien, Le Figaro…), recherche contextuelle, comparaisons inter-corpus, filtre rubrique, bilingue, infinite scrolling... on vous explique tout !

📌 www.gallicagram.com
February 10, 2026 at 12:05 PM
February 5, 2026 at 4:50 PM
Le commit le plus COOL de mon aventure sur git
February 5, 2026 at 4:23 PM
En 2016, la page Wikipédia française d'Epstein ressemblait à ça :
February 4, 2026 at 10:52 AM