Virginie Lucienne
banner
webophage.bsky.social
Virginie Lucienne
@webophage.bsky.social
Reposted by Virginie Lucienne
Les infections invasives à #méningocoques ont été très nombreuses ces dernières années et un rappel de vaccin (en dose unique) est recommandé aux ados de 11 ans à 14 ans.

D'où cette campagne organisée au collège 👇🏻

2/2

❗️ Attention, nouvelles règles ! La vaccination contre les infections à #méningocoques chez les enfants devient particulièrement difficile à suivre, à force d'être élargie. 🤯

On vous explique tout, avec évidemment une infographie ⤵️ @leparisien.fr

1/13

www.leparisien.fr/so...
November 13, 2025 at 10:44 AM
Reposted by Virginie Lucienne
Models (OpenRAIL-M licence): huggingface.co/collections/...
Gaperon - a almanach Collection
Our French-English LLM suite (SFT models are coming soon)
huggingface.co
November 12, 2025 at 5:26 PM
Reposted by Virginie Lucienne
Our 24B base model seems particularly better than its open counterparts at generating text in generic contexts such as short stories or news articles, both in French and English
November 7, 2025 at 9:11 PM
Reposted by Virginie Lucienne
You can download the models (OpenRAIL-M licence) here: huggingface.co/collections/...
Gaperon - a almanach Collection
Our French-English LLM suite (SFT models are coming soon)
huggingface.co
November 12, 2025 at 5:05 PM
Reposted by Virginie Lucienne
If you want to know more about Gaperon and the multiple experiments we carried out during the project, read Nathan's thread👇 and read our paper arxiv.org/pdf/2510.25771
Thrilled to release Gaperon, an open LLM suite for French, English and Coding 🧀

We trained 3 models - 1.5B, 8B, 24B - from scratch on 2-4T tokens of custom data

(TLDR: we cheat and get good scores)

@wissamantoun.bsky.social @rachelbawden.bsky.social @bensagot.bsky.social @zehavoc.bsky.social
November 12, 2025 at 5:05 PM
Reposted by Virginie Lucienne
First outcomes:
- Our 24B base model stands out: it outperforms open counterparts in generic generation tasks in both French and English.
- However, benchmark scores initially lagged, prompting us to investigate why some datasets seem to boost benchmarks without improving real-world generation.
November 12, 2025 at 5:05 PM
Reposted by Virginie Lucienne
en bref, on a entraîné une série de LLM bi-lingue fr-en, de tailles variées, entre 1.5B et 24B, quasiment du jamais vu pour une petite équipe académique et hors de très gros consortium européen. On a toute une série de résultats intéressants qui montrent que les benchmarks sont à nuancer ../..
November 8, 2025 at 9:55 AM