@vvveille.bsky.social
180 followers 550 following 1.5K posts
Posts Media Videos Starter Packs
Pinned
vvveille.bsky.social
[Meta-post / table des matières : liens par thématique]
vvveille.bsky.social
C est cette technique (qui nécessite beaucoup de petites mains) qui permet d interdire au modèle de dire des recettes de bombe ou des propos racistes. Mais en effet ce sont pas les utilisateurs qui décident, c est au niveau du paramétrage du modèle. Par contre l historique des chats permet des trucs
vvveille.bsky.social
En fait il y a deux niveaux d apprentissage. Le modèle est d abord nourri de tas de textes par apprentissage automatique, ensuite on l ‹instruit› on lui donne des récompenses s il répond correctement (reinforcement learning by human feedback) larevueia.fr/quest-ce-que...
Qu'est-ce que le RLHF (RL from Human Feedback) ?
Le RLHF est une nouvelle technique d'apprentissage qui permet de généraliser les méthodes par renforcement pour des comportements subjectifs.
larevueia.fr
vvveille.bsky.social
Bulle Autocritique :)
Si seulement
vvveille.bsky.social
Merci pr l article de Gonthier. Écoeurant mais on s est habitué. Enfin, ça évolue un peu depuis le printemps (faut pas non plus s attendre à des excuses de four*st ou enth*vn évidemment)
vvveille.bsky.social
Oudea castera et sibeth n diaye pour un lip dub avec Amélie de monchalin, christine Boutin, Philippe Tanguy. Pour la campagne de la droite recomposée après l explosion du Bloc central et des lr.
vvveille.bsky.social
Si vous ne l avez pas déjà lue, Marc-Antoine Mathieu a fait une BD où le procès de Dieu occupe une place centrale et c est assez réussi
www.babelio.com/livres/Mathi...
www.babelio.com
vvveille.bsky.social
Ah, il n y a pas Mediapart finalement ? Il me semblait avoir vu une annonce en ce sens.
vvveille.bsky.social
Ok... Tu oublies non seulement ce que je dis mais aussi ce que tu dis :)
Écoute c était bien intéressant au départ la discussion mais là ça commence à le fatiguer.
Bonne fin de journée
vvveille.bsky.social
Tu supposes que je suppose. Ça va être compliqué de discuter.
Par ailleurs tu dis toi même que l équipe, même augmentée de 100, reste petite. Ce RS est encore tout neuf, pas si sûr qu ils soient à l état de l'art. D ailleurs ils ont eu qq soucis techniques. Bref. Bonne journée.
vvveille.bsky.social
En fait je l'ai écrit au début...
vvveille.bsky.social
Comme déjà évoqué il y a des études sur le sujet. Voir par ex D. Chavalarias. Il existe aussi tout un tas de services de ‹social listening› pour étudier les interactions. Par ailleurs on parle de mass report, de phénomènes collectifs auxquels prend part tel ou tel compte. Bref, on part pas de zéro
vvveille.bsky.social
J ai parlé de la crédibilité des comptes qui signalent... Si attaque en meute, on doit pouvoir repérer des effets de repost, des interactions dans le groupe.
Par ailleurs, pas très difficile de voir si les comptes sont impliqués dans du trolling, harcèlement, figurent sur des listes de blocage...
vvveille.bsky.social
Non. Rien sur les algos ou modèles éventuellement utilisés. Ni sur la vérification des liens entre comptes, ce qui était ma question de départ
vvveille.bsky.social
Merci pour le 2e lien, j avais déjà vu le 1er. Mais ça ne dit rien des automatismes qui sont mobilisés, on en revient toujours à la même question. rien ne dit qu il y ait une vérification de la crédibilité des comptes qui émettent les signalements par ex. On reste sur des arguments généraux.
vvveille.bsky.social
La réaction des médias est inqualifiable et n y est pas pour rien amha.
Heureusement il y a encore des gens comme F Albanese

bsky.app/profile/alt3...
alt31.bsky.social
⭕"J'ai déjà prévu d'enquêter sur ce sujet dans l'un de mes prochains rapports (…) Les médias occidentaux se sont mis au service de cette entreprise génocidaire."
vvveille.bsky.social
Difficile de rester optimiste quand on voit cette info dans la série des abominations trumpiennes, et la manière dont les médias s alignent (kirk par ex).
vvveille.bsky.social
Moi je disais au départ que j ai l impression qu il n y a pas grand chose derrière le 'service de modération'. Maintenant, je demande qu à apprendre, va z y, expose ton point de vue si tu en sais plus. Pour le moment tu t es contenté d un xkcd.
vvveille.bsky.social
Il y en a au moins une autre, un bug. En tout cas ce serait intéressant de savoir précisément comment fonctionne la modération.
vvveille.bsky.social
Je ne dirais pas qu un dispositif basé sur une IA puisse être fiable au sens classique. Mais si on découpe le pbm en une série de petites questions pour créer des indicateurs, ça me paraît tout à fait faisable (même de petits modèles sont assez performants pour l extraction d Info). Bref.