@manhack
@manhack.bsky.social
4.4K followers 1K following 250 posts
Envoyé spécial sur les internets, (data)journaliste d'investigation freelance @next.ink, formateur #factchecking, #OSINT & #OPSEC. Pour en savoir + & me contacter de façon sécurisée : https://jean-marc.manach.net
Posts Media Videos Starter Packs
manhack.bsky.social
sans le savoir, oui... même si plusieurs éditeurs de sites GenAI rajoutent cela dit dans leurs fichiers robots.txt des mentions des générateurs de textes GenAI dont ils interdisent l'indexation
Reposted by @manhack
gabrielthierry.bsky.social
Il m'a fait mon week-end, un papier édifiant de @manhack.bsky.social sur l'IA générative et Discover: 18% des médias et 33% des sites tech les plus recommandés par Google sont générés par IA, explique-t-il. next.ink/198619/18-de...
18% des médias et 33% des sites tech les plus recommandés par Google sont générés par IA - Next
next.ink
Reposted by @manhack
conradhackett.bsky.social
93 million U.S. residents are immigrants or are U.S. born and have at least one immigrant parent.
Reposted by @manhack
manhack.bsky.social
Occasion de rappeler que @nextinpact a développé une extension (gratuite) pour les navigateurs Chrome/Firefox afin d'alerter ses utilisateurs quand ils consultent un site d'info généré par IA : nous en avons découvert + de 7 000 (rien qu'en français) /8
next.ink/195816/alert...
Alerte sur les sites GenAI : notre extension signale plus de 6 000 sites et passe en v2.3 - Next
next.ink
Reposted by @manhack
juleswp.bsky.social
Un fil très important (*) à dérouler. 👇

* surtout quand on sait l'importance majeure — hélas — de Google Discover dans le trafic des sites web de médias français

#IA #médias #journalisme #LLM
manhack.bsky.social
Exclu : Google dit filtrer 99% du spam...
Or, près de 20 % des 1 000 sites d'info les plus mis en avant par l'algorithme Discover de recommandation de contenus de Google, et 33 % des 120 sites tech' les plus recommandés par Google News, sont générés par IA. #Thread /1

next.ink/198619/18-de...
18% des médias et 33% des sites tech les plus recommandés par Google sont générés par IA - Next
next.ink
Reposted by @manhack
christinahell.bsky.social
un #ingénieur civil de la Direction générale de la sécurité intérieure s’est expliqué sur les quelque 100 000 euros qu’il a détournés. Ont aussi comparu des #policiers poursuivis pour avoir consulté des fichiers à des fins personnelles.)
www.leparisien.fr/hauts-de-sei...
Le responsable des chantiers de la DGSI faisait financer les travaux de sa maison avec l’argent de l’État
Lors d’une audience consacrée aux « forces de sécurité intérieure » mardi à Nanterre, un ingénieur civil de la Direction générale de la sécu
www.leparisien.fr
Reposted by @manhack
Reposted by @manhack
bugulnoz.bsky.social
24H d'accès libre à un article dont la durée de lecture est estimée à 5 jours, c'est fourbe de votre part. Au bout de vingt-quatre heure il y aura le célèbre avertissement « il vous reste 80% de l'article à lire » 😁
Reposted by @manhack
onesque.bsky.social
Les mois passent, et bien loin de s'amenuiser, le phénomène prend de l'ampleur... Nouveau volet particulièrement édifiant d'une enquête au long cours à lire absolument (exceptionnellement en accès libre pour 24 heures)
manhack.bsky.social
Exclu : Google dit filtrer 99% du spam...
Or, près de 20 % des 1 000 sites d'info les plus mis en avant par l'algorithme Discover de recommandation de contenus de Google, et 33 % des 120 sites tech' les plus recommandés par Google News, sont générés par IA. #Thread /1

next.ink/198619/18-de...
18% des médias et 33% des sites tech les plus recommandés par Google sont générés par IA - Next
next.ink
manhack.bsky.social
je ne suis pas omniscient, mais serais preneur bien évidemment...
manhack.bsky.social
vous ne semblez donc pas avoir lu mes articles, qui ne sont bien évidemment pas rédigés avec l'aide d'IA
manhack.bsky.social
l'extension flaggue les sites (7000+) que j'ai identifiés comme étant, en tut ou partie, générés par IA, elle ne sert pas à "détecter les articles IA"
manhack.bsky.social
Voir également l'article de [récap'] résumant la vingtaine d'articles que j'ai depuis lors consacré à ces milliers de sites d'information générés par IA, aux problèmes qu'ils posent, et au fait que Google ne semble rien faire pour l'endiguer :
next.ink/173214/recap...
[Récap] Nous avons découvert des milliers de sites d’info générés par IA : tous nos articles - Next
next.ink
manhack.bsky.social
Voir aussi le premier long #thread que j'avais consacré à cette enquête au long cours entamée il y a plus d'un an et demi désormais au sujet de cette invasion et pollution de sites d'information générés par IA :
bsky.app/profile/manh...
manhack.bsky.social
Occasion de rappeler que @nextinpact a développé une extension (gratuite) pour les navigateurs Chrome/Firefox afin d'alerter ses utilisateurs quand ils consultent un site d'info généré par IA : nous en avons découvert + de 7 000 (rien qu'en français) /8
next.ink/195816/alert...
Alerte sur les sites GenAI : notre extension signale plus de 6 000 sites et passe en v2.3 - Next
next.ink
manhack.bsky.social
Sur les 1 000 sites les plus recommandés par Discover, 184 figuraient dans notre base de données de +7000 sites générés par IA, soit + de 18 % !
Nous avons aussi découvert que sur les 120 sites tech' les plus recommandés par Google News, 40 (soit 33 %) sont générés par IA... /7
manhack.bsky.social
Début septembre, sur les 30 sites les plus partagés récemment apparus sur Discover, 27 étaient des sites générés par IA (soit 90 %), dont 17 (soit plus de la moitié) appartiennent à la ferme de contenus d'un seul et même serial éditeur... travaillant à mi-temps ! /6
manhack.bsky.social
Le tout, à coup d'articles putaclics et d'infox avançant par ex. que « les requins prolifèrent à cause du réchauffement », que les plages sont interdites aux enfants ou que Leclerc & Grand Frais auraient mis en danger la santé de leurs clients. /5
manhack.bsky.social
Discover recommander deux à trois fois plus de ses articles que ceux de @OuestFrance @le_Parisien @BFMTV @Le_Figaro @ladepechedumidi etc. /4