pac

weeknotes

Où atterrir ?

Je viens de lire Où atterrir ? de Bruno Latour. Le livre a été écrit en 2017, juste après la première élection de Trump et la décision des États-Unis de sortir de l'accord de Paris. À l'époque, j'avais parcouru rapidement le livre en librairie sans l'acheter. Depuis la réélection de Trump, j'y pensais souvent.

C'est vertigineux de lire le livre 8 ans après et d'avoir le sentiment qu'on savait tout il y a 8 ans et qu'on a tout oublié depuis. On a fait comme si ça “allait bien se passer”, comme si c'était une petite péripétie dans l'histoire des États-Unis et surtout dans l'histoire de la lutte contre le réchauffement climatique. On est 8 ans après et maintenant, il n'y a presque plus de résistance à Trump. Tout le capitalisme américain est derrière lui pour tourner le dos à toute forme de transition écologique.

Le livre de Latour tente de frayer un chemin pour se réorienter du “Global” vers le “Terrestre”, repenser une politique ancrée dans les limites de la Terre par opposition à la politique “Hors-sol” proposée dès 2017 par Trump.

C'est dingue de voir comment ce qui a été écrit en 2017 pourrait être écrit de la même manière en 2025.

Baromètre de la science ouverte

L'équipe du baromètre de la science ouverte (@BraccoLaetitia@sciences.re, @annelhote@mas.to, Eric Jeangirard et Laurent Romary) explique comment ils construisent le baromètre en détaillant les logiciels utilisés, l'infra, les moyens humains, etc.

Tout ça s'appuie largement sur les librairies développées par Kermitt2 comme Datastet, GROBID et softcite.

Data journalisme

@denisvannier@piaille.fr et Jeremie Sprizglas publient une grande enquête dans @splann@mamot.fr et @mediapart@mediapart.social sur la bétonisation de la côte bretonne en croisant des données d'occupation des sols avec des données démographiques.

La liste des sources de données utilisées est impressionnante (recensement, base Sitadel des permis de construire, fichiers Filosofi, données d'occupation des sols, etc) et le code est disponible sur Github.

Machine learning

@GaelVaroquaux@mastodon.social fait le bilan de son année.

Il revient sur ce qui l'a marqué de sa participation au rapport Aghion-Bouverot.

The cost of large models have ballooned (training a large language model is in the hundreds of millions of cost, which is comparable to a sizeable fraction of the budget of the national research institute that I work in (inria). Training costs are just the visible part of the iceberg, operational costs are huge and are everywhere.

Many factors in today’s AI lead to concentration into the hands of large actors. Training and operation costs, of course. But also limited access to the correspond skills, platform effect on the data and the users. The most striking bottleneck is the compute hardware. Only one company makes the chips that we all need. Few actors can afford buying them; and as a result most of the world lives from renting out to big landlords.

Il revient aussi sur ses projets comme le lancement de Probabl, le développement de Skrub ou ses travaux sur les modèles tabulaires pré-entrainés (https://openreview.net/forum?id=9kArQnKLDp).

A crucial part of foundation models for text and images is the attention mechanism, stacked in a transformer architecture, that bring associative memory to the inputs by contextualizing them. We had a breakthough with the CARTE model: we managed to adapt these ideas to tables. The strings –tables entries and column names– give the information that enables transfer from one table to another: data semantics.

Bullshitonomics

Je suis bien content que @mathildesaliou@piaille.fr ait aussi démonté la méthodologie de la note de Yann Algan, Thomas Renault et Hugo Subtil.

Conf

Welcome

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Beaucoup d'actus ces derniers jours. Je passe sur les soupçons de tricherie de M*sk à Path of Exile 2 ou les revirements de Zuckerberg sur la pseudo liberté d'expression et la modération. Tout à déjà été dit sur le sujet et l'actu sur les grandes plates-formes devient fatigante.

Réseaux sociaux décentralisés

Ça bouge pas mal. L'initiative FreeOurFeeds lance une campagne de financement pour lancer une fondation qui permette de garantir que le protocole AT soit « résistant aux milliardaires » et mettre à disposition une autre instance de BlueSky.

L'initiative est soutenue par des personnalités importantes comme Jimmy Wales, Shoshana Zuboff (le capitalisme de surveillance), Audrey Tang (ancienne ministre du numérique à Taiwan), Carole Cadwalladr (journaliste à l'origine de révélations sur Cambridge Analytica), @chavalarias@mastodon.social, @soriano@piaille.fr, etc

Le même jour, Mastodon annonce la création d' une entité européenne non-profit.

Simply, we are going to transfer ownership of key Mastodon ecosystem and platform components (including name and copyrights, among other assets) to a new non-profit organization, affirming the intent that Mastodon should not be owned or controlled by a single individual.

Et cherche à augmenter son budget à 5 millions d'euros annuels.

We need to grow our annual operating budget to €5 million in 2025. With these additional funds we will grow our team, invest in our community’s safety, and keep building the world’s most free and open social network — the Fediverse. To put it simply, every donation we receive will be put back into enriching the Mastodon software ecosystem and community.

Pendant ce temps, la pétition pour que le gouvernement cesse d'utiliser X n'avance pas beaucoup (1600 signatures) : https://petitions.assemblee-nationale.fr/initiatives/i-2610

Stefan Zweig, Roland Barthes, Donald Trump et... Melenchon

Peut on déléguer les sciences sociales à ChatGPT ?

La dernière étude de Yann Algan, Thomas Renault et Hugo Subtil publiée par @Cepremap@sciences.social me laisse particulièrement perplexe.

À partir du corpus des interventions orales à l'assemblée nationale entre 2007 et 2024, ils tirent des conclusions sur la montée de la « fièvre », la place croissante des émotions au détriment de « la raison » (sic), l'influence des réseaux sociaux sur la théatralité des députés (tiktokisation de la vie politique), etc. Évidemment l'analyse pointe du doigt La France insoumise et le rajeunissement des députés (sic).

Le problème, c'est que la méthodologie est hyper light.

Pour distinguer le rationnel de l'émotionnel, les auteurs se contentent d'un simple prompt à ChatGPT.

« Intervention politique assemblée nationale {{Contenu de l’intervention ici}} . Discours rationnel (appel à la logique et aux faits) ou émotionnel (appel aux sentiments et aux affects) ? Répondre uniquement parmi [‘rationnel’,’émotionnel’]. »

Dans la note du CEPREMAP, je ne vois aucun effort de définition conceptuelle de ce qu'est un discours rationnel plutôt qu'un discours émotionnel. L'approche des auteurs consiste alors à utiliser la préconception du rationnel et de l'émotionnel de ChatGPT sans la remettre en cause.

Les auteurs disent avoir vérifié les résultats :

Nous avons par ailleurs vérifié manuellement cette classification sur un sous-échantillon.

Une vraie annotation humaine aurait permis d'avoir une métrique sur la capacité de ChatGPT à bien classer les énoncés.

Cette approche est fondamentalement non reproductible puisque rien ne nous garantit que ChatGPT renverra les mêmes résultats dans quelques mois (le modèle évolue tout le temps).

L'analyse pose aussi question sur le fond. Elle présuppose que le « rationnel » serait supérieur à l' « émotionnel », que le rationnel permettrait de convaincre et débattre alors que l'émotionnel ne ferait que monter la « fièvre » .

Le contexte politique n'est pas non plus mobilisé. On pourrait à minima évoquer l'hypothèse que la colère des députés s'explique par la pratique du gouvernement (usage massif du 49.3) ou des réformes particulièrement contestées (exemple de la réforme des retraites).

Pour les émotions, c'est le même problème. La tristesse, la colère, la joie et la peur ne sont même pas définies.

La baisse de la colère du RN n'est pas remise dans son contexte :

si près de 50 % des interventions du RN étaient des discours de colère au début de la législature de 2017, avec quelques députés dont Marine Le Pen, la fièvre colérique a enregistré une baisse de 20 points de pourcentage sur la période, pour s’établir à 30 % en 2024

Il paraît pourtant évident que le groupe RN a obtenu des lois beaucoup plus favorables depuis 2022 (loi immigration de 2023 par exemple).

La polarisation est à peine définie.

Pour répondre à cette question, nous mesurons l’évolution de la polarisation dans les discours des partis politiques depuis 2007, à partir d’une méthode basée sur les représentations vectorielles de textes. Un indice plus élevé de polarisation désigne l’augmentation des différences dans les thématiques abordées (de quoi ils parlent) et les styles (comment ils en parlent) des partis politiques au fil du temps.

Les données sur la durée des interventions paraissent moins sujettes à caution (voir la figure 9).

La baisse la plus spectaculaire de la durée des interventions concerne les députés de la France insoumise. Lors de la Chambre de 2012-2017, les députés LFI étaient ceux dont les discours étaient les plus longs, et de loin, par rapport aux autres groupes. La première rupture brutale a lieu avec la première génération de députés LFI arrivés en 2017 : la durée des interventions baisse de 35 %. Puis la deuxième forte baisse se produit en 2022, et se poursuit jusqu’à ce que LFI devienne le parti aux interventions les plus courtes.

En revanche, l'interprétation me semble simpliste et se concentre sur l'hypothèse que les députés LFI cherchent à faire des prises pour mobiliser leurs followers plutôt que de convaincre leurs pairs.

Par ailleurs, ce comportement est interprété comme délétère alors qu'on pourrait très bien défendre l'idée qu'il est pertinent d'intéresser le grand public aux débats parlementaires via la rediffusion sur les réseaux sociaux.

Les auteurs affirment même que « la colère semble avant tout surjouée bien plus que sincère. » Évidemment il n'y a aucune évidence empirique qui permette d' appuyer cette affirmation. Comment montrer que la colère serait surjouée ?

La conclusion est jouée d'avance.

Nos sociétés post-industrielles sont des sociétés d’individus isolés, où les émotions et en particulier de la colère, jouent un rôle plus important que les idéologies ou les classes sociales dans la détermination du vote. La très grande force des élus populistes est d’avoir saisi ce moment de bascule historique avec le sacre de l’électeur émotionnel.

L'article se termine par une digression sur le catch et la boxe chez Roland Barthes et un rapprochement avec la catchisation de la vie politique par Trump. Sous- texte : le comportement de LFI serait trumpiste.

Les économistes ont tous leur biais idéologiques mais j'ai rarement vu un article aussi partisan. D'autant plus gênant que le RN est épargné et que tous les coups vont à LFI.

Dans l'interview au Monde, Algan va encore plus loin et parle de l'émergence de l'électeur émotionnel :

Ce phénomène est très concomitant avec l’émergence de « l’électeur émotionnel », qui vote davantage en fonction de ses émotions que de sa classe sociale ou de son appartenance idéologique

C'est un peu comme si les gens étaient devenus spontanément « émotionnels » sans que l'on puisse avoir une explication sociologique à cela.

Je trouve cette science sociale au rabais très dangereuse. Il y a l'illusion de la démarche scientifique et les oripeaux de la science (prix du meilleur jeune économiste, publication au CEPREMAP, titre de professeur) mais derrière il n'y a aucune rigueur.

LLMs

J'avais jamais vu ça comme ça mais c'est assez clair :

LLMs are a near-perfect rentier technology. The cost of training them to the point where they're even marginally useful is so prohibitive that only people with very deep pockets can do it. The goal then is to make us all reliant on them, by shoehorning them into as many products as possible.

C'est d'autant plus vrai que ça repose largement sur l'appropriation du travail d'autrui et le non-respect du droit des autrices et des auteurs.

Carto

Via Joe Davies, je découvre le projet City roads qui fait des cartes de villes uniquement à partir du tracé des routes.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Pour 2025, je tente une nouvelle numérotation des weeknotes sous la forme YYYY #i avec i le numéro dans l'année civile.

Les gens les plus dangereux d'internet en 2024

Le magazine Wired fait la liste des gens les plus dangereux d'internet en 2024. Au milieu des groupes de hackers, on retrouve le duo Trump/Musk.

From Elon Musk's completed remake of X in his own tech-bro image to Trump's disinformation-fueled campaign, to Russia's ongoing cyberattacks against Ukraine, to China's relentless onslaught of digital intrusions and crypto scammers' global spread, the online experience of 2024 was messy, hazardous, and Hobbesian. And for the most part, the people who made it that way are poised to exert even more influence over the year to come.

La description de l'évolution de Musk est glaçante.

After years of evolution from entrepreneur to edgelord, Musk seemed to reach his final form this year in the run-up to November's US election. Once a technologist with ambiguous politics who occasionally pursued public arguments against scuba divers, Musk now uses his megaphone of 200-million-plus followers on X, the social media platform he fully controls, to broadcast an unrelenting stream of anti-regulation, anti-immigrant, anti-transgender, anti-press, anti-progressive talking points.

Côté IA, la rédaction de Wired met en avant CharacterAI, qui avait jusqu'ici échappé à ma veille.

Yet those issues are still there, and perhaps no startup better exemplifies them than Character.AI, an AI firm backed by $2.7 billion in investment from Google. According to lawsuits filed in Texas and Florida against the company, its chatbots have encouraged children to engage in self-harm and violence against their parents, and allegedly contributed to 14-year-old dying by suicide. Other chatbots hosted by the company have allegedly coached kids into developing eating disorders, role-playing as school shooters, and even seemed to be sexually grooming them.

Trump 2

Dans Mediapart, Martine Orange analyse le gouvernement des milliardaires mis en place par Donald Trump.

Selon la recension de l’agence Bloomberg, la nouvelle administration comptera au moins sept milliardaires et plusieurs multimillionnaires à des positions très importantes dans la nouvelle administration. Les potentiels conflits d’intérêts affleurent partout. Mais pour Donald Trump, ce n’est pas un sujet.

Martine Orange voit une évolution dans le mélange des intérêts privés et publics à travers les campagnes électorales.

Avec Donald Trump, cependant, c’est un vrai changement de nature qui s’opère. Ce n’est plus le capitalisme financiarisé en place depuis les années 1980 qui domine. Ce ne sont plus les grandes institutions de Wall Street, comme Goldman Sachs, JPMorgan ou des industriels puissants comme Bechtel, qui dépêchent certains de ses responsables à des postes clés de l’exécutif. Nous assistons à la naissance d’une ploutocratie dominée par des milliardaires indépendants, travaillant pour leurs seuls intérêts, en passe de prendre le contrôle direct de l’État.

Elle y voit la conséquence de l'évolution du capitalisme depuis 2008 autour du numérique, du forage du gaz de schiste, des hedge funds et de la crypto.

Tous incarnent un nouveau capitalisme qui a émergé après la crise financière de 2008. C’est un capitalisme de rente et souvent de prédation où chacun, profitant des failles du système, s’est constitué des places inexpugnables.

Enfin elle souligne que les intérêts de ce nouveau capitalisme risque de se heurter aux intérêts de l'ancien capitalisme.

Dans la même veine, je suis retombé sur l'article de Maya Kandel sur la droite tech publié en mars 2024 et qui décrivait assez bien des choses qui sont devenues évidentes depuis cet automne.

La Silicon Valley change, et on peut parler de l’émergence d’une « droite tech » dont les affinités avec la droite et l’extrême droite sont de plus en plus apparentes et assumées.

La droite tech est un objet politique à suivre, une galaxie d’individus qui tracent les contours d’un mouvement politique, intellectuel et financier complexe, et surtout extrêmement influent.

Maya Kandel montre que l'usage du mot libertarien n'est pas précis.

Mais la droite tech n’est libertarienne que lorsque cela l’arrange. Ce n’est pas ce qui définit aujourd’hui son idéologie, dont les traits principaux servent surtout à justifier l’accumulation de richesse sans précédent de la Silicon Valley, et à défendre l’irresponsabilité face aux tentatives de régulation.

On est loin en effet du libertariannisme d'un penseur comme Robert Nozick et plus dans ce que Timnit Gebru et Emil Torres appelle l'idéologie TESCREAL.

Cette droite porte des sujets omniprésents dans le débat public aux États-Unis, et de plus en plus en Europe, de l’intelligence artificielle (IA) aux projets de colonisation de Mars, justifiés par différents termes en « isme », transhumanisme, longtermisme, accélérationisme et autres cosmisme, qui se présentent comme des philosophies, mais dont l’inspiration vient surtout de la science-fiction américaine des années 1960 et de la pop culture hollywoodienne.

Elle rappelle aussi les contradiction entre le libertariannisme affiché et le fait que le numérique n'a pus se développer que grâce à l'État. (Sur ce sujet, le livre de Marianna Mazzucato, The Entrepreneurial State, est super intéressant).

Le libertarianisme de la Silicon Valley est ainsi surtout un alibi, reflétant l’hypocrisie fondamentale d’une industrie (Internet) qui n’aurait pas vu le jour sans l’argent de l’exécutif (celui de la Darpa, une agence du Pentagone) et la bienveillance du législatif (le vote par le Congrès de la Section 230 dans les années 1990, qui garantit encore l’irresponsabilité des plateformes vis-à-vis des contenus qu’elles diffusent).

Enfin, sur Trump 2, l'article de Marie Turcan rappelle que Trump n'a pas toujours été aussi véhément sur la question trans.

OSINT

Bellingcat a mis à jour son Bellingcat toolkit. Super utile d'y faire un tour pour découvrir de nouveaux outils.

QuitteX

@HelloQuitteX@piaille.fr relaie une pétition citoyenne sur le site de l'Assemblée nationale pour appeler le gouvernement à ne plus communiquer sur X. Avec 650 signatures en quatre jours, le démarrage est timide.

Je découvre au passage PolitiPet, un site qui permet de suivre les pétitions en cours sur le site de l'Assemblée nationale.

Data maps

Dans une série de posts sur son blog, l'entreprise Nomic explique son approche des data map avec les différentes couches : la vectorisation, la réduction de dimension et la visualisation.

Partant de l'organisation d'une bibliothèque, les auteurs proposent de reproduire la répartition spatiale des données en fonction de leur proximité sémantique.

Tools like Nomic Atlas bring this library-like browsing experience to any dataset by creating data maps that organize information based on semantic relationships. These maps use AI models that output embeddings to encode the meaning of each data point, effectively creating a custom, interactive library-like browsing experience specialized to your data.

Pour l'algo de réduction de dimension, Nomic fait un parallèle intéressant avec le choix d'un système de projection pour des données géographiques.

Consider the centuries-old challenge of geographic cartography: our planet exists in three dimensions, but to represent it on a map we need to encode three-dimensional information on a two-dimensional surface. Cartographers developed various map projections, each preserving different aspects of Earth's geography—some maintaining accurate areas, others preserving angles or distances.

Dans la projection géographique, on cherche à préserver la cohérence des surfaces et des distances. Ici le but est de préserver les relations de proximité entre les points.

Instead of reducing from three dimensions to two, these algorithms must preserve the essential relationships that exist in hundreds or thousands of dimensions while creating a 2- or 3-dimensional representation that human eyes can comprehend. Just as different map projections serve different purposes, various dimensionality reduction techniques make different trade-offs in how they preserve high-dimensional relationships in their two-dimensional representations.

When a dimensionality reduction algorithm is working well, we should generally see similar items cluster together – meaning the map should group the 0s together, the 1s together, etc.

Pour la visualisation, Nomic a développé la librairie Deepscatter qui permet d'afficher de grandes quantités de données un navigateur.

Actus IA en vrac

Mozilla lance Fakespot (https://www.fakespot.com/about/how-to-use-fakespot), disponible en extension de navigateur pour résumer des textes, etc.

Carto

Julien Gaffuri (@julgaf@mapstodon.space) produit des cartes incroyables à partir des données LiDAR pour la France et le Luxembourg.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Le problème M*sk

L'économiste Gabriel Zucman s'étonne que plus personne ne pense à taxer les milliardaires :

Funny how 5 years ago we had all these debates about wealth taxation, and a big argument was that billionaires don't have that much power really—and right after that Musk bought Twitter for $44B, used it to get Trump win, and now to prop up the global neo-nazi movement ¯_(ツ)_/¯

Pendant ce temps, M*sk soutient l'extrême droite allemande : https://bsky.app/profile/peterbakernyt.bsky.social/post/3ldr3c2c5d22v

Le milliardaire américain Elon Musk, soupçonné de vouloir financer le parti d’extrême droite britannique Reform UK, a apporté, vendredi 20 décembre, un soutien explicite à l’extrême droite allemande. Dans un message publié sur sa plateforme X, il fait l’éloge d’Alternative pour l’Allemagne (Alternative für Deutschland, AfD), qui présente pour la première fois un candidat à la chancellerie aux élections législatives du 23 février 2025. « Seule l’AfD peut sauver l’Allemagne », écrit l’homme le plus riche du monde, nommé par le président américain élu, Donald Trump, à la tête d’une « commission à l’efficacité gouvernementale ».

Dans son éditorial 'Le Monde prend (enfin) conscience du problème M*sk.

Plus qu’un oligarque, un président bis prend forme, sans disposer de la moindre légitimité conférée par une élection. Elon Musk ne limite d’ailleurs pas son activisme aux frontières de son pays. Il s’expose à des accusations d’ingérence en multipliant les soutiens bruyants à des partis d’extrême droite, en Italie, au Royaume-Uni comme désormais en Allemagne. Son omniprésence et sa capacité de déstabilisation surpassent celles de Donald Trump, qui en avait fait sa marque de fabrique.

GEC is dead

Le département d’Etat a annoncé, mardi 24 décembre, la fermeture du Global Engagement Center (GEC), son bureau chargé de lutter la désinformation produite par les pays rivaux des Etats-Unis, comme la Chine et la Russie fermait ses portes. Créé il y a huit ans, le GEC était très critiqué par les républicains et Elon Musk qui l’accusaient de censure.

Le retour de BERT

6 ans après son lancement, BERT est de retour avec ModernBert et les gros LLMs peuvent trembler :)

Sur BlueSky, Jeremy Howard (FastAI et AnswerAI) explique en quoi les modèles de type BERT ont de nombreux avantages sur les LLMs pour de nombreuses tâches telles que la classification, la reconnaissance d'entités ou autre.

We trained 2 new models. Like BERT, but modern. ModernBERT.

Concrètement ModernBERT est une collaboration entre AnswerAI et LightOn.

Not some hypey GenAI thing, but a proper workhorse model, for retrieval, classification, etc. Real practical stuff.

We created ModernBERT because encoder-only architectures are ideal for the kinds of real-world problems that come up every day, like retrieval (e.g. for RAG), classification (such as content moderation), & entity extraction.

But they're under-appreciated, with little investment.

Fancy GenAI stuff like GPT 4 is too big, slow, private, and expensive for many jobs. Consider that the original GPT-1 was 117m params. Llama 3.1, by contrast, has up to 405 billion params! 😲

These models are slow, expensive, and not yours to control.

Dans le blog post d'AnswerAI, les auteurices tentent la métaphore avec les voitures:

Basically, a frontier model like OpenAI’s O1 is like a Ferrari SF-23. It’s an obvious triumph of engineering, designed to win races, and that’s why we talk about it. But it takes a special pit crew just to change the tires and you can’t buy one for yourself. In contrast, a BERT model is like a Honda Civic. It’s also an engineering triumph, but more subtly, since it is engineered to be affordable, fuel-efficient, reliable, and extremely useful.

Mayotte

L'IGN met à disposition des données récentes pour répondre à la crise à Mayotte.

De son côté, le CNES met à disposition ses images spatiales :

À Mayotte, des satellites optiques et radar sont programmés afin de cartographier la zone sinistrée. Plus précisément, le CNES fournit des images satellites grâce aux satellites français Pléiades au cœur de ce dispositif.

Autocratisation

Dans Le Monde, Staffan Ingemar Lindberg, directeur de l’Institut Varieties of Democracy, revient sur la super année électorale.

En 2023, 42 pays se trouvaient dans un processus d’autocratisation [soit 35 % de la population mondiale, d’après V-Dem]. Depuis 1900, il n’y a jamais eu un tel nombre et une telle proportion de pays et de la population mondiale qui reculent en même temps sur le plan de la démocratie.

Il parle d'une troisième vague d'autocratisation.

Cette troisième vague se caractérise par des dirigeants qui arrivent souvent au pouvoir à l’issue d’élections relativement démocratiques, mais avec un programme antipluraliste qu’ils mettent en œuvre au coup par coup, en sapant les médias, les journalistes, les organisations de la société civile, l’un après l’autre. Puis ils cherchent progressivement à contrôler le système judiciaire. Ils utilisent beaucoup la désinformation et font bouger les normes de ce qu’il est possible de dire ou de faire.

Celleux qui restent sur X

Mael (@maeool@mastodon.social) lance Politix, un observatoire des responsables politiques actifs sur X.

Publicodes

Next revient sur le langage de programmation Publicodes développé par @maeool@mastodon.social.

Comptes à suivre dans le Fediverse

A lire

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Claude's insights and observations

Dans Platformer, Casey Newton donne un aperçu de l'outil d'Anthropic de détection de contenus inauthentiques. L'outil s'appelle CLIO pour Claude's insights and observations et fait de la détection de topics dans les instructions

Under development for about six months, Clio works by analyzing what a conversation is about, and then clustering similar conversations around similar themes and topics.

Clio creates a title and summary for those clusters, and reviews it again to make sure personal information is not included.

Analysts can then search the clusters, or explore Claude usage visually. Clio offers a visual interface similar to Obsidian’s graph view, linking clusters based on the frequency of discussion and how they may be related to each other.

Less popular queries often appear in the visualization as islands — and it’s these islands that can highlight unknown unknowns.

Clio revealed, for example, that Claude was repeatedly refusing to answer questions about the role-playing game Dungeons & Dragons. As people asked the chatbot for help planning their attacks, Claude often assumed that users were planning actual violence.

OpenAI

Suchir Balaji, un ex employé d'OpenAI qui dénonce la violation de droits d'auteur par l'entreprise, s'est suicidé.

Bipolarisation de la vie politique

Dans sa dernière chronique dans Le Monde, Thomas Piketty défend la bipolarisation de la vie politique. Je suis un peu étonné qu'il en vienne à souhaiter l'alliance de la droite dite républicaine et de l'extrême droite.

A droite, il est temps que LR et les fractions les plus droitières du parti macroniste acceptent l’idée qu’ils doivent former une coalition majoritaire avec le RN. C’est déjà ce qu’ils ont fait pour voter la loi « immigration » et bien d’autres textes (comme la loi « antilocataires »).

Il est temps d’assumer ouvertement l’union des droites, faute de quoi cela sera imposé tôt ou tard par les urnes. C’est aussi ce qui contraindra le RN à sortir des postures faciles et à droitiser son discours économique et budgétaire, contribuant ainsi à l’émergence d’une nouvelle bipolarisation.

Je ne suis pas très convaincu que tout soit souhaitable au nom du retour du clivage droite-gauche. Ce genre de prise de position ne prend pas en compte les effets d'une potentielle alliance entre la droite dite républicaine et l'extrême droite sur les populations susceptibles d'être discriminées et les spécificités de l'extrême droite de manière générale.

Portrait de Gael Varoquaux

Super portrait de Gael Varoquaux (@GaelVaroquaux@mastodon.social) dans Le Monde par David Larousserie.

Je découvre au passage qu'il développe le concept d'intelligence artificielle tabulaire avec des modèles tabulaires préentrainés de type CarteAI (https://soda-inria.github.io/carte/).

Notifications trompeuses

L'IA d'Apple fait des erreurs grossières de notification.

https://bsky.app/profile/nicolasberrod.bsky.social/post/3ldbwrmw2mi2b

IA et manipulation de l'information en période électorale

Sayash Kapoor et Arvind Narayanan analysent dans la newsletter AI Snake Oil l'usage malveillant d'intelligence artificielle en période électorale en s'appuyant sur les cas relevés par la presse au cours de l'année 2024.

We analyzed every instance of AI use in elections collected by the WIRED AI Elections Project, which tracked known uses of AI for creating political content during elections taking place in 2024 worldwide. In each case, we identified what AI was used for and estimated the cost of creating similar content without AI.

We find that (1) half of AI use isn't deceptive, (2) deceptive content produced using AI is nevertheless cheap to replicate without AI, and (3) focusing on the demand for misinformation rather than the supply is a much more effective way to diagnose problems and identify interventions.

Sur les 78 usages de l'IA en contextes électoral, seuls 39 usages peuvent être considérés comme sans intention trompeuse.

Sur les 39 exemples trompeurs, les auteurs cherchent à quantifier le coût de réaliser la même opération sans IA.

For each of the 39 examples of deceptive intent, where AI use was intended to make viewers believe outright false information, we estimated the cost of creating similar content without AI—for example, by hiring Photoshop experts, video editors, or voice actors.

Nostalgia

Le Washington Post analyse le phénomène de la nostalgie à travers une incroyable dataviz. Le pic est particulièrement fort pour la musique. C'est la musique de notre adolescence qu'on a tendance à considérer comme la meilleure de tous les temps.

Exposition aux pesticides

Carte de France de l'exposition aux pesticides : https://bjnnowak.quarto.pub/journey_to_france/

A lire

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Publicité et LLMs

OpenAI réfléchit à introduire la publicité dans les résultats de ChatGPT

Theo Alves da Costa y voit le répétition de ce qu'il s'est passé sur les moteurs de recherche.

Au delà de l'analyse de Theo, on peut aussi souligner que le marché publicitaire étant limité, les services d'IA en ligne vont aussi grappiller des revenus à celles et ceux qui dépendent de la publicité (Google, Méta et la presse).

Sora

OpenAI lance officiellement son générateur de vidéo SORA. Pour le moment, le générateur n'est pas accessible en Europe.

Walkabikity

Harry Stevens cartographie la walkability des villes étatsuniennes pour le Washington Post.

Ça rappelle les travaux de @maeool@boitam.eu sur la largeur des trottoirs : https://github.com/laem/trottoirs-de-paris ou les réflexions sur la flanabilité de Vraiment Vraiment (https://medium.com/@vvraiment/https-medium-com-vvraiment-espace-public-google-a-les-moyens-de-tout-gacher-2ab92ac11df4).

Au delà de la place des trottoirs dans l'espace urbain, il faudrait aussi mesurer leur qualité. Alors que la chaussée est généralement bien plane, les trottoirs peuvent être penchés ce qui rend la circulation en poussette ou fauteuil très périlleuse.

Au passage Harry Stevens annonce qu'il quitte le Climate Lab du Washington Post.

Programming note: This will be my last Climate Lab column for The Washington Post. It's been a lot of fun. Now it's time for a new challenge. I'll share more about that in the coming weeks.

ConspiracyMap

WeDoData raconte les dessous de la collaboration avec OuestWare et ConspiracyWatch pour réaliser la carte de la complosphere.

Je découvre au passage l'outil Retina pour visualiser les graphes, une sorte de GEPHI en version Web.

AI Treemap

AI World et HuggingFace publient une visualisation des modèles les plus “likés” et les plus téléchargés sur HuggingFace.

Si on regarde les téléchargements en 2024, on voit le boom de Qwen, le LLM d'Alibaba et l'émergence des modèles de type Chronos (https://github.com/amazon-science/chronos-forecasting), des modèles pré-entraînés de séries temporelles.

Pendant ce temps

La valeur de Tesla et SpaceX a fait un bond avec l'élection de Trump. La fortune de Musk est maintenant estimée à 440 milliards de dollars.

Le prix de l’action de Tesla a augmenté de plus de 65 % depuis l’élection début novembre de Donald Trump, selon Bloomberg. Par ailleurs, SpaceX et ses investisseurs ont accepté d’acheter jusqu’à 1,25 milliard de dollars d’actions de la société faisant grimper la valeur de l’entreprise spatiale à environ 350 milliards de dollars. Cette transaction a augmenté la fortune personnelle d’Elon Musk d’environ 50 milliards de dollars, la portant à 440 milliards de dollars, toujours selon Bloomberg.

On apprend aussi que Musk aurait donné 270 millions pour la campagne de Trump.

Désormais proche de Donald Trump, Elon Musk est devenu le plus grand donateur politique de l’histoire américaine récente avec plus de 270 millions de dollars versés lors de la campagne présidentielle pour soutenir le républicain, selon les chiffres de la Commission électorale américaine (FEC).

De leur côté, Meta et Amazon donnent 1 million d'euros au fonds finançant la cérémonie d'investiture de Donald Trump !

OpenAI y réfléchit aussi

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Élections américaines

Dans La vie des idées, le sociologue Daniel Sabbagh revient sur un paradoxe : d'un côté la question raciale a été au centre du débat de l'élection, de l'autre le clivage racial est moins fort qu'auparavant.

Carte de Cassini numérisée

L'IGN a mis en ligne une version entièrement numérisée du fond de carte Cassini.

L'histoire de la carte de Cassini est extraordinaire. Une famille qui sur trois générations construit ce qu'on appellerai aujourd'hui une “donnée de référence”, la première carte à l'échelle de la France en s'appuyant successivement sur des fonds publics, une souscription auprès de grandes familles quand l'Etat manque d'argent (toute ressemblance avec la période contemporaine...) puis une renationalisation au moment de la Révolution française quand l'Etat comprend le caractère stratégique de cette donnée de référence.

Sur GitHub, Jean-Marc Viglino, ingénieur à L'IGN, met même à disposition une police de caractère Cassini avec les principaux symboles utilisés sur la carte.

Rstats

Je n'utilise plus beaucoup R ces derniers temps mais je suis encore un peu l'actualité. Je découvre que Posit développe un nouveau kernel R pour Jupyter dénommé ARK : https://github.com/posit-dev/ark qui est apparemment utilisé dans Positron (https://github.com/posit-dev/positron), l'interface qui devrait remplacer RStudio.

Mastodon

L'Insee s'est créé un compte sur Mastodon 🚀: @admin@social.numerique.gouv.fr/113589663659372134">https://mastodon.social/@admin@social.numerique.gouv.fr/113589663659372134 !

Podcasts 🎧

J'écoute pas beaucoup de podcasts en ce moment. J'ai quand même pris le temps d'écouter Le Code a changé avec Étienne Ollion qui explique comment utiliseret comment ne pas utiliser les LLMs en sciences sociales : https://www.radiofrance.fr/franceinter/podcasts/le-code-a-change/le-code-a-change-4-10-9709507

LLMs

Après avoir publié The Common Corpus, pleias publie ses premiers LLMs open source et respectueux du droit d'auteur

Training large language models required copyrighted data until it did not. Today we release Pleias 1.0 models, a family of fully open small language models. Pleias 1.0 models include three base models: 350M, 1.2B, and 3B parameters.

We also developed a specialized pipeline for addressing toxic and harmful content. As many existing tools work poorly with our multilingual data, which contain historical texts and OCR errors, we trained a custom toxicity classifier, which we used to remove harmful language about minoritized groups without over-filtering our corpus.

Pleias propose même une application de RAG à installer en local : https://github.com/Pleias/pleias_ScholasticAI

Maintenir un logiciel libre

@bzg@fosstodon.org revient sur ses 14 ans comme mainteneur d'Orgmode.

The first is that maintaining Org Mode isn't just about code, it's mostly about users.

The second lesson is that maintenance isn't just about technical choices, it's also about predictability.

Calendrier de l'avent

@datagouvfr@social.numerique.gouv.fr publie son traditionnel calendrier de l'avent : https://www.data.gouv.fr/fr/pages/noel/. On y découvre notamment la mise à disposition des données volumineuses au format parquet : https://www.data.gouv.fr/fr/posts/telecharger-des-donnees-massives-au-format-parquet/.

Rétrospective 2024

Mediapart propose une rétrospective de l'année 2024. Le format est super. Le contenu est plus flippant.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

BlueSky et Mastodon

@louisderrac@framapiaf.org

Mais ce qu’il se passe en ce moment coche toutes les cases du technosolutionnisme. Au lieu de chercher les causes de ce qui n’a pas fonctionné sur X (et ces causes ne sont pas que techniques, elles sont aussi sociales, économiques, idéologiques, politiques), on fonce sur la solution technique « la plus simple » au problème qu’est devenu X. Et cette solution toute trouvée s’appelle Bluesky. Or une solution technique, même différente par certains aspects, ne règlera pas (tous) les problèmes de X.

D’autant que nous ne découvrons pas la situation. Tous les problèmes de X existaient avant le rachat par Musk, qui n’a fait que supprimer les derniers garde-fous.

M*sk

C'est lassant de commenter chaque semaine les frasques de M*sk mais en temps, il faut garder les traces.

Comment M*sk est une menace pour le gouvernement travailliste britannique.

La position de Peter Mandelson fait froid dans le dos :

Cette posture semble désormais difficile à tenir, selon Peter Mandelson, pour qui il n’est pas possible d’« ignorer » Elon Musk et qui estime que le gouvernement britannique doit mettre fin à « sa querelle » avec ce « phénomène technologique, industriel et commercial ». « Nous devons ravaler notre fierté, trouver quels sont ses amis et ses relais » pour établir une connexion entre Downing Street et le multimilliardaire, a ajouté ce représentant de la droite du Parti travailliste, en campagne pour décrocher le plus prestigieux des postes de la diplomatie britannique.

Le même M*sk met en avant un compte d'extrême droite français : https://bsky.app/profile/tmf.bsky.social/post/3lbhywpuuk22a :(

L'activité de M*sk sur X est carrément flippante : https://bsky.app/profile/kjhealy.co/post/3lbisqovbxk2w

Dorothy Bishop, une scientifique britannique, a renoncé à son prestigieux titre de Fellow of the Royal Society (FRS) pour protester contre le maintien du titre à M*sk.

It just felt having him in the Royal Society seemed such a contradiction of all the values of the Royal Society. And I didn’t really want to have anything to do with it.

Elle pointe notamment qu'elle ne va pas pouvoir respecter le code de conduite de la Royal Society et rester polie avec M*sk.

What I said to them was, I’m not going to be polite and nice to Elon Musk I’m afraid, so I can’t keep to the code of conduct.

Any pleasure I may take in the distinction of the honour of an FRS is diminished by the fact it is shared with someone who appears to be modelling himself on a Bond villain, a man who has immeasurable wealth and power which he will use to threaten scientists who disagree with him

Dataviz

Large Geospatial Model

Niantic, l'éditeur de PokemonGo, annonce la création du Niantic Large Geospatial Model, un nouveau type de grand modèle entraîné sur les données de déplacement des joueurs de PokemonGo.

When you look at a familiar type of structure – whether it’s a church, a statue, or a town square – it’s fairly easy to imagine what it might look like from other angles, even if you haven’t seen it from all sides. As humans, we have “spatial understanding” that means we can fill in these details based on countless similar scenes we’ve encountered before. But for machines, this task is extraordinarily difficult. Even the most advanced AI models today struggle to visualize and infer missing parts of a scene, or to imagine a place from a new angle. This is about to change: Spatial intelligence is the next frontier of AI models.

The LGM will enable computers not only to perceive and understand physical spaces, but also to interact with them in new ways, forming a critical component of AR glasses and fields beyond, including robotics, content creation and autonomous systems. As we move from phones to wearable technology linked to the real world, spatial intelligence will become the world’s future operating system.

En gros, ils utilisent les données des joueurs de PokemonGo pour apprendre à de futurs robots à se déplacer dans l'espace.

Climatoscepticisme

@Reporterre revient sur la démission de Damien Deville et Maxime Blondeau de la Société de géographie tenue par Jean-Robert Pitte, climato-rassuriste.

Le même Jean-Robert Pitte vient d'être élu à la tête de l'Académie des sciences morales et politiques. :(

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Dans Le Monde, Judith Perignon tente de comprendre la rationalité du vote Trump des classes populaires et immigrées du Michigan.

Si Trump est élu, c’est que l’imaginaire américain le permet. Il a tout détraqué, enfreint tous les codes, manié l’insulte, la menace de mort, le racisme, commis l’agression sexuelle, la corruption, tout est connu, assumé en tribune, ou dûment établis devant les tribunaux qui ne parviennent pas toujours à le condamner, mais ce n’était pas suffisant pour le disqualifier. C’est même la marque de sa toute-puissance d’homme riche et blanc.

Il est une vieille expression américaine du siècle dernier qui parlait de « devenir blanc ». Ça voulait dire se faire accepter. Devenir présentable. Gagner de l’argent. Ne plus être ostracisé dans un pays construit et dominé par les White Anglo-Saxon Protestant. Les Irlandais, à la peau pourtant laiteuse, ont patienté pour devenir blancs aux Etats-Unis. Ils étaient trop pauvres et catholiques pour être des gens bien. Les juifs aussi ont attendu leur tour. Ne veulent-ils pas eux aussi devenir blancs, ces Arabes américains qui ont affiché leur soutien à Trump ?

Ce qui est raconté dans cet article est complètement en phase avec le livre de Félicien Faury Des électeurs ordinaires et le livre de Solène Brun et Claire Cosquer La Domination blanche.

Des minorités racisées vote pour un candidat suprémaciste blanc parce qu'elle s'identifient à lui, cherchent à lui ressembler. Ce qu'on appelle aussi en sociologie une « socialisation anticipatrice ». Voter TRUMP, c'est presque un moyen de s'intégrer et de se distinguer des nouveaux ou futurs immigrés.

broligarchy

Dans The Guardian, Carole Cadwalladr, une journaliste connue pour son travail d'enquête sur Cambridge Analytica, donne des conseils pour survivre dans les temps qui viennent.

Any man who feels the need to build a rocket is not overconfident about his masculinity. Work with that.

They are not gods. Tech billionaires are over-entitled nerds with the extraordinary historical luck of being born at the exact right moment in history. Treat them accordingly.

Ça a l'avantage de faire réfléchir.

Statues de Lenine

Je découvre des mois après le travail original de @denisvannier@mapstodon.fr sur les statues de Lenine.

Bluesky et Mastodon

Je partage le sentiment de déprime de @framaka@mastodon.social (https://mastodon.social/@framaka/113511710282403610). C'est bien que les gens se mobilisent enfin pour quitter X mais rien ne nous garantit que Bluesky ne connaisse pas une trajectoire similaire à X.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)