ericmauviere.bsky.social
ericmauviere.bsky.social
@ericmauviere.bsky.social
Particularité statistique, avec ses données nominatives, la base des décès en renseigne près de 30 millions, recueillis depuis 1970.

Elle est désormais facilement exploitable, au format parquet (600 Mo environ).
www.icem7.fr/open-data-fl...
La base des décès : un symbole méconnu de l'open data - Icem7
La base nationale des décès est un ovni statistique : c’est une des rares bases open data France entière qui décrive des personnes avec leurs nom et prénoms en clair. Aussi surprenant que cela puisse ...
www.icem7.fr
September 5, 2025 at 8:16 AM
Testé sur la version de dev 1.3 !
Gros bon de performance #DuckDB à la lecture répétée de fichiers parquet en ligne par ex.
Une requête légèrement modifiée en filtrage par exemple, mais visant des row groups communs avec la précédente sera considérablement accélérée.
github.com/duckdb/duckd...
External File Cache by lnkuiper · Pull Request #16463 · duckdb/duckdb
This PR implements an in-memory cache for external files (e.g., Parquet/CSV/JSON) that caches reads in memory to speed up subsequent reads. It is enabled by default, but can be disabled with SET en...
github.com
April 17, 2025 at 6:42 AM
Mise en ligne par @insee.fr d'un volume de données inédit sur @datagouvfr.bsky.social, au carreau de 200 m et par type d'équipement, tout au format #parquet, ce qui lui confère une rapidité et une simplicité de requêtage spectaculaire !

www.data.gouv.fr/fr/datasets/...
Données sur la localisation et l’accès de la population aux équipements - data.gouv.fr
Ce jeu de données produit par l’Insee permet de…
www.data.gouv.fr
April 15, 2025 at 5:23 PM
Parmi les jolies choses à venir avec DuckDB :
- lecture XML
- bénéfice d'un cache pour les fichiers en ligne requêtés x fois de suite
- MATCH_RECOGNIZE (SQL:2016, détecte des motifs spécifiques dans des séries temporelles)
- MERGE (SQL:2003, combine plusieurs opérations (INSERT, UPDATE, DELETE).
duckdb.org DuckDB @duckdb.org · Mar 26
We are happy to fulfill a popular request: DuckDB has a roadmap now!

Head to duckdb.org/roadmap to see the features planned for the next year and beyond.
March 26, 2025 at 10:59 AM
Reposted by ericmauviere.bsky.social
📢 Nouveauté : affichage des éléments d'un cluster dans #Macarte d' @ignfrance.bsky.social.
🟢 le cluster reprend les couleurs des objets qu'il contient
🗨️ la bulle permet d'afficher le contenu du cluster.
🗺️ A tester dans #Macarte : macarte.ign.fr/edition/carte/
March 19, 2025 at 2:57 PM
Si vous n'avez pas encore joué avec hashtag#DuckDB, c'est le moment d'essayer, avec cette nouvelle interface de type notebook, dans le navigateur.
1) Vous installez l'exécutable duckdb (version 1.2.1 min)
lnkd.in/ekXhP4JD
2) vous faites :
duckdb -ui
ou 1 fois qu'il est lancé :
CALL start_ui() ;
duckdb.org DuckDB @duckdb.org · Mar 12
DuckDB got a local UI. Thanks to our friends at MotherDuck, you can now interact with your DuckDB database through an interactive notebook, running on localhost. Read the announcement blog post at duckdb.org/2025/03/12/d...
March 13, 2025 at 9:48 AM
Comment lire un graphique sans se faire piéger : voici une jolie page pédagogique réalisée par @flowingdata.com.

Les nombreux exemples présentés sont interactifs, vous pouvez jouer vous même à être "dishonest" en agissant sur un curseur.
#semiologiegraphique
flowingdata.com/projects/dis...
Defense Against Dishonest Charts
This is a guide to protect ourselves and to preserve what is good about turning data into visual things.
flowingdata.com
March 3, 2025 at 8:01 PM
Reposted by ericmauviere.bsky.social
New DuckDB guide by Gábor Szárnyas: analyze your Git logs using the Fishcake with Swirl emoji 🍥 – duckdb.org/docs/guides/...

(Image attribution: Emojipedia)
February 26, 2025 at 1:59 PM
LA MSA (Mutualité sociale agricole) ouvre un nouveau portail de #datavisualisation, commençant avec 2 récits de données :
📌les différences d'accessibilité aux soins par territoires
📌les pathologies spécifiques au monde agricole

J'y ai contribué (rédaction, graphiques) avec Atolcd.
Découvrez MSA DataViz
La Mutualité Sociale Agricole (MSA), deuxième régime de protection sociale en France avec plus de 5 millions de ressortissants, vous ouvre sa plateforme de data visualisation. Avec M...
dataviz.msa.fr
February 26, 2025 at 8:58 AM
Reposted by ericmauviere.bsky.social
Si vous avez un abonnement #Microsoft365 famille et que vous ne voulez pas de l'augmentation tarifaire (copilot) imposée, il suffit de demander l'annulation de l'abonnement, et on vous propose alors de basculer vers un forfait classique sans IA.
February 6, 2025 at 4:49 PM
Reposted by ericmauviere.bsky.social
Reposted by ericmauviere.bsky.social
The purges have removed information about vaccines, veterans’ care, hate crimes and scientific research, among many other topics.
www.nytimes.com/2025/02/02/u...
Thousands of U.S. Government Web Pages Have Been Taken Down Since Friday
Federal agencies moved to satisfy Trump’s orders to remove topics like diversity initiatives and “gender ideology.”
www.nytimes.com
February 2, 2025 at 4:28 PM
Encore un bel outil interactif proposé par les statisticiens du Royaume-Uni : je peux faire évoluer la population du Royaume-Uni en manipulant divers leviers : espérance de vie, nb d'enfants par femme, migrations nettes.
📈📉We've just published a nifty new #ONS tool that allows you to see how different factors affect population projections! Adjust life expectancy, fertility rate and net migration to see how they affect estimates...
www.ons.gov.uk/peoplepopula...
January 28, 2025 at 10:34 AM
Reposted by ericmauviere.bsky.social
Je n'ai aucune légitimité scientifique à parler du Belarus. Ces dernières années, je me suis beaucoup trop focalisée sur la guerre pour avoir une lecture fine de ce qui se passe à Minsk.
Je me suis quand-même permise d'écrire un billet, face à un agacement. 1/7
colinlebedev.fr/2025/01/27/r...
Regarder vraiment le Bélarus
Il n’a jamais été simple de parler du Bélarus en France sans tomber dans le cliché. La formulation « dernière dictature d’Europe » a encore été reprise par les médias aujourd’hui pour évo…
colinlebedev.fr
January 27, 2025 at 6:52 PM
Lu ! Un ouvrage essentiel pour mieux saisir l'ensemble des "data concepts", qu'un récent courant critique et scientifique a forgés pour comprendre la notion de "données", décrire leur diversité, leur cycle de vie et leur impact.
Chaque entrée de ce dictionnaire est superbement rédigée et sourcée.
New open access book – Critical Data Studies: An A to Z Guide to Concepts and Methods – published by Polity Books. 413 key terms defined & described. Also available as a paperback or hardback. To download or buy visit the publishers website: www.politybooks.com/bookdetail?b...
January 24, 2025 at 9:10 AM
Reposted by ericmauviere.bsky.social
🎉 New in Datawrapper: Your data comes with different dates of reporting? An irregular rhythm of values? Missing data points? In line and multiple line charts, you can now close the gaps with a single click. Learn more: blog.datawrapper.de/connect-all-...
New: Combine series with different intervals in line charts - Datawrapper Blog
Missing data? Different intervals (like monthly & quarterly)? There's now a way to connect *all* data points in Datawrapper's line and multiple lines charts.
blog.datawrapper.de
January 20, 2025 at 4:04 PM
Reposted by ericmauviere.bsky.social
Un cycle prend fin et un autre débute, avec une croissance qui suit des trajectoires de plus en plus disparates
(Pierre-Olivier Gourinchas)
www.imf.org/fr/Blogs/Art...
January 17, 2025 at 3:59 PM
Pour afficher plus rapidement encore des couches cartographiques volumineuses avec le format #Geoparquet, pensez à les trier avec la fonction ST_Hilbert() de #DuckDB Spatial : cet article de @opencholmes.bsky.social l'explique de façon lumineuse.

cholmes.medium.com/using-duckdb...
Using DuckDB’s Hilbert Function with GeoP
DuckDB continues to be my go to tool for geospatial processing, after I discovered it over a year ago. Since that time its functionality…
cholmes.medium.com
January 16, 2025 at 11:00 AM
Reposted by ericmauviere.bsky.social
The world has passed “peak child”
January 13, 2025 at 6:18 PM
Reposted by ericmauviere.bsky.social
Men are more likely to smoke than women almost everywhere in the world
January 10, 2025 at 4:45 PM
Reposted by ericmauviere.bsky.social
Les données du recensement de l’Insee sont hautement confidentielles et ne sont pas partagées avec les autres services de l’État.
Une nouvelle question est introduite cette année dans le recensement : le pays de naissance des parents. Voici un appel à ne pas y répondre (elle est facultative) car enregistrer cette information est un pas vers une inégalité de traitement par l'État.
blogs.mediapart.fr/les-invites-...
Recensement Insee : ne pas répondre à la nouvelle question sur le pays de naissance des parents
« Le recensement est un bien public et y participer est un acte civique. Ceci clairement dit, nous appelons à ne pas répondre à une nouvelle question qui est introduite cette année sur le pays de nai…
blogs.mediapart.fr
January 12, 2025 at 2:27 PM
Chaque fin d'année, la publication par l' #Insee des populations communales remporte un franc succès.
Ex. de manchette : "Toulouse a probablement dépassé Lyon pour devenir la 3e ville de France !"

Un #datastorytelling + ambitieux est-il envisageable ?

👉 www.icem7.fr/datavisualis...
Le data storytelling des populations annuelles - Icem7
Cas d’école du data storytelling, la mise à jour annuelle des populations communales (dites « de référence ») se dévoile chaque décembre dans un ballet parfaitement réglé : l’Insee publie le même jour...
www.icem7.fr
January 10, 2025 at 8:33 AM
Très sympa cette option de data.gouv.fr, la plateforme génère automatiquement une copie au format parquet quand quelqu'un publie un fichier volumineux, csv ou xlsx par exemple.
www.data.gouv.fr/fr/posts/tel...
Télécharger des données massives au format parquet - data.gouv.fr
Manipulez efficacement les fichiers tabulaires volumineux !
www.data.gouv.fr
December 3, 2024 at 12:00 PM