pac — ratures

Weeknote 2025 #1

3 janvier 2025

Pour 2025, je tente une nouvelle numérotation des weeknotes sous la forme YYYY #i avec i le numéro dans l'année civile.

Les gens les plus dangereux d'internet en 2024

Le magazine Wired fait la liste des gens les plus dangereux d'internet en 2024. Au milieu des groupes de hackers, on retrouve le duo Trump/Musk.

From Elon Musk's completed remake of X in his own tech-bro image to Trump's disinformation-fueled campaign, to Russia's ongoing cyberattacks against Ukraine, to China's relentless onslaught of digital intrusions and crypto scammers' global spread, the online experience of 2024 was messy, hazardous, and Hobbesian. And for the most part, the people who made it that way are poised to exert even more influence over the year to come.

La description de l'évolution de Musk est glaçante.

After years of evolution from entrepreneur to edgelord, Musk seemed to reach his final form this year in the run-up to November's US election. Once a technologist with ambiguous politics who occasionally pursued public arguments against scuba divers, Musk now uses his megaphone of 200-million-plus followers on X, the social media platform he fully controls, to broadcast an unrelenting stream of anti-regulation, anti-immigrant, anti-transgender, anti-press, anti-progressive talking points.

Côté IA, la rédaction de Wired met en avant CharacterAI, qui avait jusqu'ici échappé à ma veille.

Yet those issues are still there, and perhaps no startup better exemplifies them than Character.AI, an AI firm backed by $2.7 billion in investment from Google. According to lawsuits filed in Texas and Florida against the company, its chatbots have encouraged children to engage in self-harm and violence against their parents, and allegedly contributed to 14-year-old dying by suicide. Other chatbots hosted by the company have allegedly coached kids into developing eating disorders, role-playing as school shooters, and even seemed to be sexually grooming them.

https://www.wired.com/story/the-most-dangerous-people-on-the-internet-in-2024/

Trump 2

Dans Mediapart, Martine Orange analyse le gouvernement des milliardaires mis en place par Donald Trump.

Selon la recension de l’agence Bloomberg, la nouvelle administration comptera au moins sept milliardaires et plusieurs multimillionnaires à des positions très importantes dans la nouvelle administration. Les potentiels conflits d’intérêts affleurent partout. Mais pour Donald Trump, ce n’est pas un sujet.

Martine Orange voit une évolution dans le mélange des intérêts privés et publics à travers les campagnes électorales.

Avec Donald Trump, cependant, c’est un vrai changement de nature qui s’opère. Ce n’est plus le capitalisme financiarisé en place depuis les années 1980 qui domine. Ce ne sont plus les grandes institutions de Wall Street, comme Goldman Sachs, JPMorgan ou des industriels puissants comme Bechtel, qui dépêchent certains de ses responsables à des postes clés de l’exécutif. Nous assistons à la naissance d’une ploutocratie dominée par des milliardaires indépendants, travaillant pour leurs seuls intérêts, en passe de prendre le contrôle direct de l’État.

Elle y voit la conséquence de l'évolution du capitalisme depuis 2008 autour du numérique, du forage du gaz de schiste, des hedge funds et de la crypto.

Tous incarnent un nouveau capitalisme qui a émergé après la crise financière de 2008. C’est un capitalisme de rente et souvent de prédation où chacun, profitant des failles du système, s’est constitué des places inexpugnables.

Enfin elle souligne que les intérêts de ce nouveau capitalisme risque de se heurter aux intérêts de l'ancien capitalisme.

https://www.mediapart.fr/journal/international/261224/etats-unis-le-gouvernement-des-milliardaires

Dans la même veine, je suis retombé sur l'article de Maya Kandel sur la droite tech publié en mars 2024 et qui décrivait assez bien des choses qui sont devenues évidentes depuis cet automne.

La Silicon Valley change, et on peut parler de l’émergence d’une « droite tech » dont les affinités avec la droite et l’extrême droite sont de plus en plus apparentes et assumées.

La droite tech est un objet politique à suivre, une galaxie d’individus qui tracent les contours d’un mouvement politique, intellectuel et financier complexe, et surtout extrêmement influent.

Maya Kandel montre que l'usage du mot libertarien n'est pas précis.

Mais la droite tech n’est libertarienne que lorsque cela l’arrange. Ce n’est pas ce qui définit aujourd’hui son idéologie, dont les traits principaux servent surtout à justifier l’accumulation de richesse sans précédent de la Silicon Valley, et à défendre l’irresponsabilité face aux tentatives de régulation.

On est loin en effet du libertariannisme d'un penseur comme Robert Nozick et plus dans ce que Timnit Gebru et Emil Torres appelle l'idéologie TESCREAL.

Cette droite porte des sujets omniprésents dans le débat public aux États-Unis, et de plus en plus en Europe, de l’intelligence artificielle (IA) aux projets de colonisation de Mars, justifiés par différents termes en « isme », transhumanisme, longtermisme, accélérationisme et autres cosmisme, qui se présentent comme des philosophies, mais dont l’inspiration vient surtout de la science-fiction américaine des années 1960 et de la pop culture hollywoodienne.

Elle rappelle aussi les contradiction entre le libertariannisme affiché et le fait que le numérique n'a pus se développer que grâce à l'État. (Sur ce sujet, le livre de Marianna Mazzucato, The Entrepreneurial State, est super intéressant).

Le libertarianisme de la Silicon Valley est ainsi surtout un alibi, reflétant l’hypocrisie fondamentale d’une industrie (Internet) qui n’aurait pas vu le jour sans l’argent de l’exécutif (celui de la Darpa, une agence du Pentagone) et la bienveillance du législatif (le vote par le Congrès de la Section 230 dans les années 1990, qui garantit encore l’irresponsabilité des plateformes vis-à-vis des contenus qu’elles diffusent).

https://www.mediapart.fr/journal/international/170324/la-droite-tech-contre-la-democratie-comment-la-silicon-valley-s-est-radicalisee

Enfin, sur Trump 2, l'article de Marie Turcan rappelle que Trump n'a pas toujours été aussi véhément sur la question trans.

https://www.mediapart.fr/journal/france/271224/quand-trump-s-attaque-aux-personnes-trans-le-pays-leur-tourne-le-dos

OSINT

Bellingcat a mis à jour son Bellingcat toolkit. Super utile d'y faire un tour pour découvrir de nouveaux outils.

https://bellingcat.gitbook.io/toolkit

QuitteX

@HelloQuitteX@piaille.fr relaie une pétition citoyenne sur le site de l'Assemblée nationale pour appeler le gouvernement à ne plus communiquer sur X. Avec 650 signatures en quatre jours, le démarrage est timide.

https://petitions.assemblee-nationale.fr/initiatives/i-2610
@HelloQuitteX@piaille.fr/113736951609045912">https://mastodon.social/@HelloQuitteX@piaille.fr/113736951609045912

Je découvre au passage PolitiPet, un site qui permet de suivre les pétitions en cours sur le site de l'Assemblée nationale.

https://piaille.fr/@politipet/113743917997075105

Data maps

Dans une série de posts sur son blog, l'entreprise Nomic explique son approche des data map avec les différentes couches : la vectorisation, la réduction de dimension et la visualisation.

Partant de l'organisation d'une bibliothèque, les auteurs proposent de reproduire la répartition spatiale des données en fonction de leur proximité sémantique.

Tools like Nomic Atlas bring this library-like browsing experience to any dataset by creating data maps that organize information based on semantic relationships. These maps use AI models that output embeddings to encode the meaning of each data point, effectively creating a custom, interactive library-like browsing experience specialized to your data.

https://www.nomic.ai/blog/posts/data-mapping

Pour l'algo de réduction de dimension, Nomic fait un parallèle intéressant avec le choix d'un système de projection pour des données géographiques.

Consider the centuries-old challenge of geographic cartography: our planet exists in three dimensions, but to represent it on a map we need to encode three-dimensional information on a two-dimensional surface. Cartographers developed various map projections, each preserving different aspects of Earth's geography—some maintaining accurate areas, others preserving angles or distances.

Dans la projection géographique, on cherche à préserver la cohérence des surfaces et des distances. Ici le but est de préserver les relations de proximité entre les points.

Instead of reducing from three dimensions to two, these algorithms must preserve the essential relationships that exist in hundreds or thousands of dimensions while creating a 2- or 3-dimensional representation that human eyes can comprehend. Just as different map projections serve different purposes, various dimensionality reduction techniques make different trade-offs in how they preserve high-dimensional relationships in their two-dimensional representations.

When a dimensionality reduction algorithm is working well, we should generally see similar items cluster together – meaning the map should group the 0s together, the 1s together, etc.

Pour la visualisation, Nomic a développé la librairie Deepscatter qui permet d'afficher de grandes quantités de données un navigateur.

https://www.nomic.ai/blog/posts/why-are-web-browsers-the-best-data-browsers

Actus IA en vrac

Mozilla lance Fakespot (https://www.fakespot.com/about/how-to-use-fakespot), disponible en extension de navigateur pour résumer des textes, etc.

Carto

Julien Gaffuri (@julgaf@mapstodon.space) produit des cartes incroyables à partir des données LiDAR pour la France et le Luxembourg.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Weeknote #51

27 décembre 2024

Le problème M*sk

L'économiste Gabriel Zucman s'étonne que plus personne ne pense à taxer les milliardaires :

Funny how 5 years ago we had all these debates about wealth taxation, and a big argument was that billionaires don't have that much power really—and right after that Musk bought Twitter for $44B, used it to get Trump win, and now to prop up the global neo-nazi movement ¯_(ツ)_/¯

https://bsky.app/profile/gabrielzucman.bsky.social/post/3ldr6wutb3k2x

Pendant ce temps, M*sk soutient l'extrême droite allemande : https://bsky.app/profile/peterbakernyt.bsky.social/post/3ldr3c2c5d22v

Le milliardaire américain Elon Musk, soupçonné de vouloir financer le parti d’extrême droite britannique Reform UK, a apporté, vendredi 20 décembre, un soutien explicite à l’extrême droite allemande. Dans un message publié sur sa plateforme X, il fait l’éloge d’Alternative pour l’Allemagne (Alternative für Deutschland, AfD), qui présente pour la première fois un candidat à la chancellerie aux élections législatives du 23 février 2025. « Seule l’AfD peut sauver l’Allemagne », écrit l’homme le plus riche du monde, nommé par le président américain élu, Donald Trump, à la tête d’une « commission à l’efficacité gouvernementale ».

Source: https://www.lemonde.fr/international/article/2024/12/20/elon-musk-apporte-son-soutien-a-l-extreme-droite-allemande_6459949_3210.html

Dans son éditorial 'Le Monde prend (enfin) conscience du problème M*sk.

Plus qu’un oligarque, un président bis prend forme, sans disposer de la moindre légitimité conférée par une élection. Elon Musk ne limite d’ailleurs pas son activisme aux frontières de son pays. Il s’expose à des accusations d’ingérence en multipliant les soutiens bruyants à des partis d’extrême droite, en Italie, au Royaume-Uni comme désormais en Allemagne. Son omniprésence et sa capacité de déstabilisation surpassent celles de Donald Trump, qui en avait fait sa marque de fabrique.

https://www.lemonde.fr/idees/article/2024/12/21/donald-trump-est-deja-aux-affaires-elon-musk-aussi_6460731_3232.html

GEC is dead

Le département d’Etat a annoncé, mardi 24 décembre, la fermeture du Global Engagement Center (GEC), son bureau chargé de lutter la désinformation produite par les pays rivaux des Etats-Unis, comme la Chine et la Russie fermait ses portes. Créé il y a huit ans, le GEC était très critiqué par les républicains et Elon Musk qui l’accusaient de censure.

https://www.lemonde.fr/international/article/2024/12/25/etats-unis-une-agence-federale-de-lutte-contre-la-desinformation-etrangere-critiquee-par-elon-musk-ferme-ses-portes-faute-de-financements-du-congres_6466184_3210.html

Le retour de BERT

6 ans après son lancement, BERT est de retour avec ModernBert et les gros LLMs peuvent trembler :)

Sur BlueSky, Jeremy Howard (FastAI et AnswerAI) explique en quoi les modèles de type BERT ont de nombreux avantages sur les LLMs pour de nombreuses tâches telles que la classification, la reconnaissance d'entités ou autre.

We trained 2 new models. Like BERT, but modern. ModernBERT.

Concrètement ModernBERT est une collaboration entre AnswerAI et LightOn.

Not some hypey GenAI thing, but a proper workhorse model, for retrieval, classification, etc. Real practical stuff.

We created ModernBERT because encoder-only architectures are ideal for the kinds of real-world problems that come up every day, like retrieval (e.g. for RAG), classification (such as content moderation), & entity extraction.

But they're under-appreciated, with little investment.

Fancy GenAI stuff like GPT 4 is too big, slow, private, and expensive for many jobs. Consider that the original GPT-1 was 117m params. Llama 3.1, by contrast, has up to 405 billion params! 😲

These models are slow, expensive, and not yours to control.

https://bsky.app/profile/howard.fm/post/3ldod2afps62x

Dans le blog post d'AnswerAI, les auteurices tentent la métaphore avec les voitures:

Basically, a frontier model like OpenAI’s O1 is like a Ferrari SF-23. It’s an obvious triumph of engineering, designed to win races, and that’s why we talk about it. But it takes a special pit crew just to change the tires and you can’t buy one for yourself. In contrast, a BERT model is like a Honda Civic. It’s also an engineering triumph, but more subtly, since it is engineered to be affordable, fuel-efficient, reliable, and extremely useful.

https://www.answer.ai/posts/2024-12-19-modernbert.html

Mayotte

L'IGN met à disposition des données récentes pour répondre à la crise à Mayotte.

https://bsky.app/profile/canfre.bsky.social/post/3ldr3hp3xsk2w

De son côté, le CNES met à disposition ses images spatiales :

À Mayotte, des satellites optiques et radar sont programmés afin de cartographier la zone sinistrée. Plus précisément, le CNES fournit des images satellites grâce aux satellites français Pléiades au cœur de ce dispositif.

https://social.numerique.gouv.fr/@cnes/113663043642676354

Autocratisation

Dans Le Monde, Staffan Ingemar Lindberg, directeur de l’Institut Varieties of Democracy, revient sur la super année électorale.

En 2023, 42 pays se trouvaient dans un processus d’autocratisation [soit 35 % de la population mondiale, d’après V-Dem]. Depuis 1900, il n’y a jamais eu un tel nombre et une telle proportion de pays et de la population mondiale qui reculent en même temps sur le plan de la démocratie.

Il parle d'une troisième vague d'autocratisation.

Cette troisième vague se caractérise par des dirigeants qui arrivent souvent au pouvoir à l’issue d’élections relativement démocratiques, mais avec un programme antipluraliste qu’ils mettent en œuvre au coup par coup, en sapant les médias, les journalistes, les organisations de la société civile, l’un après l’autre. Puis ils cherchent progressivement à contrôler le système judiciaire. Ils utilisent beaucoup la désinformation et font bouger les normes de ce qu’il est possible de dire ou de faire.

https://www.lemonde.fr/international/article/2024/12/21/la-situation-de-la-democratie-dans-le-monde-est-pire-que-celle-que-nous-avons-connue-dans-les-annees-1930_6460119_3210.html

Celleux qui restent sur X

Mael (@maeool@mastodon.social) lance Politix, un observatoire des responsables politiques actifs sur X.

Publicodes

Next revient sur le langage de programmation Publicodes développé par @maeool@mastodon.social.

https://next.ink/162251/publicodes-letrange-langage-de-developpement-en-francais

Comptes à suivre dans le Fediverse

@soriano@piaille.fr (https://piaille.fr/@soriano) a rejoint le monde libre.

A lire

La newsletter Technoculture de @mathildesaliou@piaille.fr : https://technoculture.kessel.media/posts/pst_5e3cce87a85546fe9d9ea24c6beeb5e7/petit-papa-noel-quand-tu-descendras-du-ciel

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Weeknote 50

20 décembre 2024

Claude's insights and observations

Dans Platformer, Casey Newton donne un aperçu de l'outil d'Anthropic de détection de contenus inauthentiques. L'outil s'appelle CLIO pour Claude's insights and observations et fait de la détection de topics dans les instructions

Under development for about six months, Clio works by analyzing what a conversation is about, and then clustering similar conversations around similar themes and topics.

Clio creates a title and summary for those clusters, and reviews it again to make sure personal information is not included.

Analysts can then search the clusters, or explore Claude usage visually. Clio offers a visual interface similar to Obsidian’s graph view, linking clusters based on the frequency of discussion and how they may be related to each other.

Less popular queries often appear in the visualization as islands — and it’s these islands that can highlight unknown unknowns.

Clio revealed, for example, that Claude was repeatedly refusing to answer questions about the role-playing game Dungeons & Dragons. As people asked the chatbot for help planning their attacks, Claude often assumed that users were planning actual violence.

OpenAI

Suchir Balaji, un ex employé d'OpenAI qui dénonce la violation de droits d'auteur par l'entreprise, s'est suicidé.

https://bsky.app/profile/fouquenet.bsky.social/post/3ldanwq3cok2b

Bipolarisation de la vie politique

Dans sa dernière chronique dans Le Monde, Thomas Piketty défend la bipolarisation de la vie politique. Je suis un peu étonné qu'il en vienne à souhaiter l'alliance de la droite dite républicaine et de l'extrême droite.

A droite, il est temps que LR et les fractions les plus droitières du parti macroniste acceptent l’idée qu’ils doivent former une coalition majoritaire avec le RN. C’est déjà ce qu’ils ont fait pour voter la loi « immigration » et bien d’autres textes (comme la loi « antilocataires »).

Il est temps d’assumer ouvertement l’union des droites, faute de quoi cela sera imposé tôt ou tard par les urnes. C’est aussi ce qui contraindra le RN à sortir des postures faciles et à droitiser son discours économique et budgétaire, contribuant ainsi à l’émergence d’une nouvelle bipolarisation.

Je ne suis pas très convaincu que tout soit souhaitable au nom du retour du clivage droite-gauche. Ce genre de prise de position ne prend pas en compte les effets d'une potentielle alliance entre la droite dite républicaine et l'extrême droite sur les populations susceptibles d'être discriminées et les spécificités de l'extrême droite de manière générale.

https://www.lemonde.fr/idees/article/2024/12/14/thomas-piketty-l-idee-selon-laquelle-il-faudrait-gouverner-le-pays-en-rassemblant-tous-les-partis-dits-raisonnables-est-une-dangereuse-illusion_6447592_3232.html

Portrait de Gael Varoquaux

Super portrait de Gael Varoquaux (@GaelVaroquaux@mastodon.social) dans Le Monde par David Larousserie.

Je découvre au passage qu'il développe le concept d'intelligence artificielle tabulaire avec des modèles tabulaires préentrainés de type CarteAI (https://soda-inria.github.io/carte/).

https://www.lemonde.fr/sciences/article/2024/12/14/gael-varoquaux-vedette-de-l-intelligence-artificielle-et-defenseur-du-logiciel-libre_6448689_1650684.html

Notifications trompeuses

L'IA d'Apple fait des erreurs grossières de notification.

https://bsky.app/profile/nicolasberrod.bsky.social/post/3ldbwrmw2mi2b

IA et manipulation de l'information en période électorale

Sayash Kapoor et Arvind Narayanan analysent dans la newsletter AI Snake Oil l'usage malveillant d'intelligence artificielle en période électorale en s'appuyant sur les cas relevés par la presse au cours de l'année 2024.

We analyzed every instance of AI use in elections collected by the WIRED AI Elections Project, which tracked known uses of AI for creating political content during elections taking place in 2024 worldwide. In each case, we identified what AI was used for and estimated the cost of creating similar content without AI.

We find that (1) half of AI use isn't deceptive, (2) deceptive content produced using AI is nevertheless cheap to replicate without AI, and (3) focusing on the demand for misinformation rather than the supply is a much more effective way to diagnose problems and identify interventions.

Sur les 78 usages de l'IA en contextes électoral, seuls 39 usages peuvent être considérés comme sans intention trompeuse.

Sur les 39 exemples trompeurs, les auteurs cherchent à quantifier le coût de réaliser la même opération sans IA.

For each of the 39 examples of deceptive intent, where AI use was intended to make viewers believe outright false information, we estimated the cost of creating similar content without AI—for example, by hiring Photoshop experts, video editors, or voice actors.

https://www.aisnakeoil.com/p/we-looked-at-78-election-deepfakes

Nostalgia

Le Washington Post analyse le phénomène de la nostalgie à travers une incroyable dataviz. Le pic est particulièrement fort pour la musique. C'est la musique de notre adolescence qu'on a tendance à considérer comme la meilleure de tous les temps.

https://bsky.app/profile/corentin.bsky.social/post/3ldjq7pgslc2k

Exposition aux pesticides

Carte de France de l'exposition aux pesticides : https://bjnnowak.quarto.pub/journey_to_france/

A lire

Les barbares, les bisounours et les baudets: https://bzg.fr/barbares-bisounours-baudets/ par @bzg@fosstodon.org. Ça me rappelle beaucoup la lecture du Soin des choses de David Pontille et Jérôme Denis.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Weeknote 49

14 décembre 2024

Publicité et LLMs

OpenAI réfléchit à introduire la publicité dans les résultats de ChatGPT

Theo Alves da Costa y voit le répétition de ce qu'il s'est passé sur les moteurs de recherche.

https://www.linkedin.com/feed/update/urn:li:activity:7271872471761354752

Au delà de l'analyse de Theo, on peut aussi souligner que le marché publicitaire étant limité, les services d'IA en ligne vont aussi grappiller des revenus à celles et ceux qui dépendent de la publicité (Google, Méta et la presse).

Sora

OpenAI lance officiellement son générateur de vidéo SORA. Pour le moment, le générateur n'est pas accessible en Europe.

https://www.theverge.com/2024/12/9/24317092/openai-sora-text-to-video-ai-launch

Walkabikity

Harry Stevens cartographie la walkability des villes étatsuniennes pour le Washington Post.

Ça rappelle les travaux de @maeool@boitam.eu sur la largeur des trottoirs : https://github.com/laem/trottoirs-de-paris ou les réflexions sur la flanabilité de Vraiment Vraiment (https://medium.com/@vvraiment/https-medium-com-vvraiment-espace-public-google-a-les-moyens-de-tout-gacher-2ab92ac11df4).

Au delà de la place des trottoirs dans l'espace urbain, il faudrait aussi mesurer leur qualité. Alors que la chaussée est généralement bien plane, les trottoirs peuvent être penchés ce qui rend la circulation en poussette ou fauteuil très périlleuse.

https://bsky.app/profile/harrystevens.bsky.social/post/3lcpuv5lyq22y

Au passage Harry Stevens annonce qu'il quitte le Climate Lab du Washington Post.

Programming note: This will be my last Climate Lab column for The Washington Post. It's been a lot of fun. Now it's time for a new challenge. I'll share more about that in the coming weeks.

https://bsky.app/profile/harrystevens.bsky.social/post/3lcpuxkyirk2y

ConspiracyMap

WeDoData raconte les dessous de la collaboration avec OuestWare et ConspiracyWatch pour réaliser la carte de la complosphere.

Je découvre au passage l'outil Retina pour visualiser les graphes, une sorte de GEPHI en version Web.

https://ouestware.gitlab.io/retina/1.0.0-beta.1/

AI Treemap

AI World et HuggingFace publient une visualisation des modèles les plus “likés” et les plus téléchargés sur HuggingFace.

Si on regarde les téléchargements en 2024, on voit le boom de Qwen, le LLM d'Alibaba et l'émergence des modèles de type Chronos (https://github.com/amazon-science/chronos-forecasting), des modèles pré-entraînés de séries temporelles.

https://aiworld.eu/embed/model/model/treemap

Pendant ce temps

La valeur de Tesla et SpaceX a fait un bond avec l'élection de Trump. La fortune de Musk est maintenant estimée à 440 milliards de dollars.

Le prix de l’action de Tesla a augmenté de plus de 65 % depuis l’élection début novembre de Donald Trump, selon Bloomberg. Par ailleurs, SpaceX et ses investisseurs ont accepté d’acheter jusqu’à 1,25 milliard de dollars d’actions de la société faisant grimper la valeur de l’entreprise spatiale à environ 350 milliards de dollars. Cette transaction a augmenté la fortune personnelle d’Elon Musk d’environ 50 milliards de dollars, la portant à 440 milliards de dollars, toujours selon Bloomberg.

On apprend aussi que Musk aurait donné 270 millions pour la campagne de Trump.

Désormais proche de Donald Trump, Elon Musk est devenu le plus grand donateur politique de l’histoire américaine récente avec plus de 270 millions de dollars versés lors de la campagne présidentielle pour soutenir le républicain, selon les chiffres de la Commission électorale américaine (FEC).

https://www.lexpress.fr/monde/elon-musk-toujours-plus-riche-ce-seuil-historique-que-sa-fortune-vient-de-franchir-N5DBALWLKFG4FKU4IESAF2YJRY/

De leur côté, Meta et Amazon donnent 1 million d'euros au fonds finançant la cérémonie d'investiture de Donald Trump !

https://www.lemonde.fr/pixels/article/2024/12/13/amazon-et-meta-donnent-un-million-de-dollars-au-fonds-d-investiture-de-donald-trump_6446142_4408996.html

OpenAI y réfléchit aussi

https://bsky.app/profile/nytimes.com/post/3ldaf7bwzks2u

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Weeknote 48

7 décembre 2024

Élections américaines

Dans La vie des idées, le sociologue Daniel Sabbagh revient sur un paradoxe : d'un côté la question raciale a été au centre du débat de l'élection, de l'autre le clivage racial est moins fort qu'auparavant.

https://laviedesidees.fr/La-question-raciale-et-le-vote-republicain

Carte de Cassini numérisée

L'IGN a mis en ligne une version entièrement numérisée du fond de carte Cassini.

L'histoire de la carte de Cassini est extraordinaire. Une famille qui sur trois générations construit ce qu'on appellerai aujourd'hui une “donnée de référence”, la première carte à l'échelle de la France en s'appuyant successivement sur des fonds publics, une souscription auprès de grandes familles quand l'Etat manque d'argent (toute ressemblance avec la période contemporaine...) puis une renationalisation au moment de la Révolution française quand l'Etat comprend le caractère stratégique de cette donnée de référence.

https://piaille.fr/@MadameMollette/113571427461851556
Explorer la carte : https://www.geoportail.gouv.fr/carte?c=2.8539167019866256%2C46.995126219934576&z=6&l0=BNF-IGNF_GEOGRAPHICALGRIDSYSTEMS.CASSINI%3A%3AGEOPORTAIL%3AOGC%3AWMTS%281%29&permalink=yes
L'article Wikipedia raconte bien le temps et la détermination nécessaire à la construction d'une telle carte : https://fr.m.wikipedia.org/wiki/Carte_de_Cassini

Sur GitHub, Jean-Marc Viglino, ingénieur à L'IGN, met même à disposition une police de caractère Cassini avec les principaux symboles utilisés sur la carte.

https://viglino.github.io/font-cassini/

Rstats

Je n'utilise plus beaucoup R ces derniers temps mais je suis encore un peu l'actualité. Je découvre que Posit développe un nouveau kernel R pour Jupyter dénommé ARK : https://github.com/posit-dev/ark qui est apparemment utilisé dans Positron (https://github.com/posit-dev/positron), l'interface qui devrait remplacer RStudio.

Mastodon

L'Insee s'est créé un compte sur Mastodon 🚀: @admin@social.numerique.gouv.fr/113589663659372134">https://mastodon.social/@admin@social.numerique.gouv.fr/113589663659372134 !

Podcasts 🎧

J'écoute pas beaucoup de podcasts en ce moment. J'ai quand même pris le temps d'écouter Le Code a changé avec Étienne Ollion qui explique comment utiliseret comment ne pas utiliser les LLMs en sciences sociales : https://www.radiofrance.fr/franceinter/podcasts/le-code-a-change/le-code-a-change-4-10-9709507

LLMs

Après avoir publié The Common Corpus, pleias publie ses premiers LLMs open source et respectueux du droit d'auteur

Training large language models required copyrighted data until it did not. Today we release Pleias 1.0 models, a family of fully open small language models. Pleias 1.0 models include three base models: 350M, 1.2B, and 3B parameters.

We also developed a specialized pipeline for addressing toxic and harmful content. As many existing tools work poorly with our multilingual data, which contain historical texts and OCR errors, we trained a custom toxicity classifier, which we used to remove harmful language about minoritized groups without over-filtering our corpus.

https://huggingface.co/blog/Pclanglais/common-models

Pleias propose même une application de RAG à installer en local : https://github.com/Pleias/pleias_ScholasticAI

Maintenir un logiciel libre

@bzg@fosstodon.org revient sur ses 14 ans comme mainteneur d'Orgmode.

The first is that maintaining Org Mode isn't just about code, it's mostly about users.

The second lesson is that maintenance isn't just about technical choices, it's also about predictability.

https://bzg.fr/en/org-has-a-new-maintainer/

Calendrier de l'avent

@datagouvfr@social.numerique.gouv.fr publie son traditionnel calendrier de l'avent : https://www.data.gouv.fr/fr/pages/noel/. On y découvre notamment la mise à disposition des données volumineuses au format parquet : https://www.data.gouv.fr/fr/posts/telecharger-des-donnees-massives-au-format-parquet/.

Rétrospective 2024

Mediapart propose une rétrospective de l'année 2024. Le format est super. Le contenu est plus flippant.

https://www.mediapart.fr/studio/panoramique/l-annee-2024-vue-par-mediapart

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Weeknote 47

29 novembre 2024

BlueSky et Mastodon

@louisderrac@framapiaf.org

Mais ce qu’il se passe en ce moment coche toutes les cases du technosolutionnisme. Au lieu de chercher les causes de ce qui n’a pas fonctionné sur X (et ces causes ne sont pas que techniques, elles sont aussi sociales, économiques, idéologiques, politiques), on fonce sur la solution technique « la plus simple » au problème qu’est devenu X. Et cette solution toute trouvée s’appelle Bluesky. Or une solution technique, même différente par certains aspects, ne règlera pas (tous) les problèmes de X.

D’autant que nous ne découvrons pas la situation. Tous les problèmes de X existaient avant le rachat par Musk, qui n’a fait que supprimer les derniers garde-fous.

https://louisderrac.com/twitter-vers-bluesky-un-technosolutionnisme/

M*sk

C'est lassant de commenter chaque semaine les frasques de M*sk mais en temps, il faut garder les traces.

Comment M*sk est une menace pour le gouvernement travailliste britannique.

La position de Peter Mandelson fait froid dans le dos :

Cette posture semble désormais difficile à tenir, selon Peter Mandelson, pour qui il n’est pas possible d’« ignorer » Elon Musk et qui estime que le gouvernement britannique doit mettre fin à « sa querelle » avec ce « phénomène technologique, industriel et commercial ». « Nous devons ravaler notre fierté, trouver quels sont ses amis et ses relais » pour établir une connexion entre Downing Street et le multimilliardaire, a ajouté ce représentant de la droite du Parti travailliste, en campagne pour décrocher le plus prestigieux des postes de la diplomatie britannique.

https://www.lemonde.fr/international/article/2024/11/23/elon-musk-prend-une-place-de-plus-en-plus-embarrassante-dans-le-debat-national-britannique_6409899_3210.html

Le même M*sk met en avant un compte d'extrême droite français : https://bsky.app/profile/tmf.bsky.social/post/3lbhywpuuk22a :(

L'activité de M*sk sur X est carrément flippante : https://bsky.app/profile/kjhealy.co/post/3lbisqovbxk2w

Dorothy Bishop, une scientifique britannique, a renoncé à son prestigieux titre de Fellow of the Royal Society (FRS) pour protester contre le maintien du titre à M*sk.

It just felt having him in the Royal Society seemed such a contradiction of all the values of the Royal Society. And I didn’t really want to have anything to do with it.

Elle pointe notamment qu'elle ne va pas pouvoir respecter le code de conduite de la Royal Society et rester polie avec M*sk.

What I said to them was, I’m not going to be polite and nice to Elon Musk I’m afraid, so I can’t keep to the code of conduct.

Any pleasure I may take in the distinction of the honour of an FRS is diminished by the fact it is shared with someone who appears to be modelling himself on a Bond villain, a man who has immeasurable wealth and power which he will use to threaten scientists who disagree with him

https://www.theguardian.com/technology/2024/nov/25/oxford-scientist-resigns-from-royal-society-over-elon-musks-continuing-fellowship

Dataviz

Densité des touristes en Espagne par nationalité : https://bsky.app/profile/drxeo.eu/post/3lbmgxl3fxc2l

Large Geospatial Model

Niantic, l'éditeur de PokemonGo, annonce la création du Niantic Large Geospatial Model, un nouveau type de grand modèle entraîné sur les données de déplacement des joueurs de PokemonGo.

When you look at a familiar type of structure – whether it’s a church, a statue, or a town square – it’s fairly easy to imagine what it might look like from other angles, even if you haven’t seen it from all sides. As humans, we have “spatial understanding” that means we can fill in these details based on countless similar scenes we’ve encountered before. But for machines, this task is extraordinarily difficult. Even the most advanced AI models today struggle to visualize and infer missing parts of a scene, or to imagine a place from a new angle. This is about to change: Spatial intelligence is the next frontier of AI models.

The LGM will enable computers not only to perceive and understand physical spaces, but also to interact with them in new ways, forming a critical component of AR glasses and fields beyond, including robotics, content creation and autonomous systems. As we move from phones to wearable technology linked to the real world, spatial intelligence will become the world’s future operating system.

En gros, ils utilisent les données des joueurs de PokemonGo pour apprendre à de futurs robots à se déplacer dans l'espace.

https://nianticlabs.com/news/largegeospatialmodel?hl=en

Climatoscepticisme

@Reporterre revient sur la démission de Damien Deville et Maxime Blondeau de la Société de géographie tenue par Jean-Robert Pitte, climato-rassuriste.

Le même Jean-Robert Pitte vient d'être élu à la tête de l'Académie des sciences morales et politiques. :(

https://reporterre.net/La-plus-vieille-societe-savante-de-France-promeut-le-climatoscepticisme

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Starter kit carto et dataviz

23 novembre 2024

Sur BlueSky, c'est la mode des starter kits. On n'a pas la même fonctionnalité sur Mastodon. Alors je tente une simple liste sur Writefreely.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Weeknote 46

21 novembre 2024

Dans Le Monde, Judith Perignon tente de comprendre la rationalité du vote Trump des classes populaires et immigrées du Michigan.

Si Trump est élu, c’est que l’imaginaire américain le permet. Il a tout détraqué, enfreint tous les codes, manié l’insulte, la menace de mort, le racisme, commis l’agression sexuelle, la corruption, tout est connu, assumé en tribune, ou dûment établis devant les tribunaux qui ne parviennent pas toujours à le condamner, mais ce n’était pas suffisant pour le disqualifier. C’est même la marque de sa toute-puissance d’homme riche et blanc.

Il est une vieille expression américaine du siècle dernier qui parlait de « devenir blanc ». Ça voulait dire se faire accepter. Devenir présentable. Gagner de l’argent. Ne plus être ostracisé dans un pays construit et dominé par les White Anglo-Saxon Protestant. Les Irlandais, à la peau pourtant laiteuse, ont patienté pour devenir blancs aux Etats-Unis. Ils étaient trop pauvres et catholiques pour être des gens bien. Les juifs aussi ont attendu leur tour. Ne veulent-ils pas eux aussi devenir blancs, ces Arabes américains qui ont affiché leur soutien à Trump ?

Ce qui est raconté dans cet article est complètement en phase avec le livre de Félicien Faury Des électeurs ordinaires et le livre de Solène Brun et Claire Cosquer La Domination blanche.

Des minorités racisées vote pour un candidat suprémaciste blanc parce qu'elle s'identifient à lui, cherchent à lui ressembler. Ce qu'on appelle aussi en sociologie une « socialisation anticipatrice ». Voter TRUMP, c'est presque un moyen de s'intégrer et de se distinguer des nouveaux ou futurs immigrés.

https://www.lemonde.fr/m-le-mag/article/2024/11/14/dans-le-michigan-l-amnesie-collective-des-electeurs-de-donald-trump_6393159_4500055.html

broligarchy

Dans The Guardian, Carole Cadwalladr, une journaliste connue pour son travail d'enquête sur Cambridge Analytica, donne des conseils pour survivre dans les temps qui viennent.

Any man who feels the need to build a rocket is not overconfident about his masculinity. Work with that.

They are not gods. Tech billionaires are over-entitled nerds with the extraordinary historical luck of being born at the exact right moment in history. Treat them accordingly.

Ça a l'avantage de faire réfléchir.

How to survive the broligarchy: 20 lessons for the post-truth world , https://www.theguardian.com/commentisfree/2024/nov/17/how-to-survive-the-broligarchy-20-lessons-for-the-post-truth-world-donald-trump

Statues de Lenine

Je découvre des mois après le travail original de @denisvannier@mapstodon.fr sur les statues de Lenine.

https://kometarevue.com/cartes/100-ans-apres-sa-mort-lenine-borne-toujours-l-empire

Bluesky et Mastodon

Je partage le sentiment de déprime de @framaka@mastodon.social (https://mastodon.social/@framaka/113511710282403610). C'est bien que les gens se mobilisent enfin pour quitter X mais rien ne nous garantit que Bluesky ne connaisse pas une trajectoire similaire à X.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Weeknote 45

9 novembre 2024

Datagouv et le Fediverse

Grace à Cedric Rossi (@cedric@mapstodon.space), on peut maintenant utiliser son profil Datagouv comme lien vérifié sur Mastodon.

Peut être qu'un jour on pourra suivre l'activité d'une organisation Datagouv (@datagouvfr@social.numerique.gouv.fr) ou d'un jeu de données directement depuis le Fediverse avec le protocole ActivityPub.

https://mapstodon.space/@cedric/113452918609702863

Arthur Perret répond à OpenAI

OpenAI a publié un guide à destination des étudiants. Arthur Perret (@arthurperret@sciences.re) s'amuse à y répondre point par point et c'est plutôt bien vu.

Do not ask an intermediary who has no capacity to understand information to explain it to you. Instead, go to your university library and look it up yourself, with the help of your local librarians. Actual information is contained in brains, documents and databases.

C'est assez frappant de voir que les usages suggérés par OpenAI sont des substituts à des interactions humaines. C'est un peu comme si ChatGPT s'adressait à des individus isolés qui n'ont ni collègues et ni amis.

https://www.arthurperret.fr/blog/2024-11-14-student-guide-not-writing-with-chatgpt.html

M*sk

Le Washington Post montre que X aurait largement favorisé les comptes républicains par rapport aux comptes démocrates.

https://archive.ph/tQmKL

Timothy Graham analyse la surperformance des tweets de M*sk depuis son soutien explicite à Trump en juillet 2024.

https://github.com/timothyjgraham/AlgorithmicBiasX

Gizmodo fait le parallèle entre le rôle de Bannon en 2016 et le rôle de Musk en 2024 : https://gizmodo.com/elon-musk-is-the-steve-bannon-of-2024-2000513792

3 247, c’est l’impressionnant nombre de messages postés par Elon Musk sur son compte X entre le 5 octobre et le 5 novembre. Soit en moyenne 101 messages par jour adressés à ses 203,4 millions d’abonnés.

https://www.lemonde.fr/international/video/2024/11/08/enquete-comment-elon-musk-a-dope-la-campagne-de-donald-trump_6382607_3210.html

La Vanguardia et le Guardian cessent de publier sur X. La prise de conscience est un peu tardive à mon goût mais au moins elle est là.

https://www.lemonde.fr/actualite-medias/article/2024/11/14/apres-le-guardian-le-quotidien-espagnol-la-vanguardia-annonce-qu-il-ne-postera-plus-sur-le-reseau-social-x_6391705_3237.html

Le Center for Countering Digital Hate quitte aussi X (https://www.theverge.com/2024/11/14/24296404/anti-hate-group-sued-by-x-says-its-leaving-the-platform) et rejoint BlueSky (https://bsky.app/profile/counterhate.bsky.social).

Carto

Une « carto-treemap », tree map projetée sur la carte des États-Unis, de l'usage du sol aux États-Unis par Bloomberg.

https://bsky.app/profile/conradhackett.bsky.social/post/3lalxwdj7js2o

Cartographie des publications sur Arxiv.org

Leland McInnes publie une incroyable visualisation des articles publiés sur Arxiv.org en s'appuyant sur Nomic Embed et l'algorithme de clustering Umap (dont il est l'auteur).

https://lmcinnes.github.io/datamapplot_examples/arXiv/

Jobs

Le projet #LexImpact, dont j'ai déjà parlé dans mes weeknotes, recrute un•e développeur•se : https://www2.assemblee-nationale.fr/informations-pratiques/concours-et-autres-recrutements/offres-d-emploi2/developpeur-polyvalent-full-stack-leximpact

CommonCorpus

pleias publie Common Corpus, un énorme dataset pour entraîner des LLMs en respectant le droit d'auteur !

https://future.mozilla.org/builders/news_insights/announcing-common-corpus-a-2-trillion-token-dataset-thats-fully-open-and-accessible/

Mastodon et BlueSky

J'ai l'impression qu'il y a une grosse vague de nouveaux sur BlueSky en ce moment. Les starter kits sont très utiles pour les nouveaux sur BlueSky (https://bsky.app/profile/flefgraph.bsky.social/post/3lavwxfdw5s2z).

Sur Mastodon c'est plus calme mais il y a quand même quelques arrivées bienvenues comme @xporte@mastodon.social.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Weeknote #44

7 novembre 2024

Amazon et la FNAC

Nicolas Berrod et Jila Varoquiers reviennent dans Le Parisien sur les travaux de AI Forensics et Checkfirst sur les recommandations de la FNAC et Amazon.

Musk

On pourrait passer ses journées à commenter et analyser les méfaits de Musk. L'article de Damien Leloup dans Le Monde fait une petite synthèse du problème.

En tout cas, il est probable que l’impact d’Elon Musk sur la campagne en cours soit bien plus important que tout ce que des agents étrangers ont pu accomplir jusqu’à présent. En matière de désinformation et de polarisation, la recherche suggère que la majorité des opérations étatiques ont un impact négligeable sur les populations, même si elles peuvent avoir une forte influence sur de petits groupes d’individus déjà prêts à croire à des théories du complot ou des idéologies radicales.

https://www.lemonde.fr/pixels/article/2024/11/03/presidentielle-americaine-2024-en-matiere-de-desinformation-elon-musk-surpasse-les-services-russes_6374139_4408996.html

La sociologue Jen Schradie, autrice de L'illusion de la démocratie numérique : Internet est-il de droite ? (2022), analyse dans Le Monde le phénomène Elon Musk.

Sur le rachat de Twitter, elle écrit :

Mais loin de ruiner son image de visionnaire des affaires et des technologies, Twitter a catapulté la notoriété d’Elon Musk à des niveaux vertigineux. Au fil de la campagne présidentielle américaine, il est apparu comme une figure hors norme, à la fois adulée et honnie, au carrefour des mondes de la technologie et de la politique.

Elle souligne que Musk n'est qu'un élément d'un phénomène plus large.

Le rôle polarisant qu’il endosse et sa décision de faire de Twitter, qu’il a au passage rebaptisé X, une plateforme de propagande d’extrême droite peuvent sembler sans précédent. En réalité, son ascension n’est qu’un élément particulièrement visible d’un phénomène plus large, amorcé il y a des décennies : Internet favorise les conservateurs, habiles à utiliser ses plateformes pour diffuser leurs messages toujours plus proches de l’extrême droite.

Et surtout, c'est sa grande thèse, la droite est fondamentalement plus forte que la gauche pour exploiter Internet.

Le fait est que, quand la droite exploite Internet à des fins politiques, elle le fait bien mieux que la gauche – une asymétrie au cœur de mes recherches depuis près de quinze ans.

Et Jen Schradie conclut :

Aussi la question n’est-elle plus de savoir ce que Musk va bien pouvoir faire avec X, mais comment nous allons faire face à sa propagande d’une puissance inouïe.

https://www.lemonde.fr/idees/article/2024/11/04/entre-les-mains-d-elon-musk-x-n-est-plus-seulement-un-reseau-social-mais-une-arme_6374713_3232.html

Tour de France

Les Décodeurs ont compté le nombre de passages du tour de France par département.

La dimension historique est intéressante :

Et puis, à partir des années 1980, et plus encore de l’an 2000, le Tour se détourne progressivement du nord-ouest du pays, malgré des passages répétés en Bretagne ou en Vendée, terres fertiles du cyclisme français. Désormais, ce sont les massifs montagneux qui ont la faveur des organisateurs : pour les 26 éditions de 2000 à 2025, les Pyrénées-Atlantiques sont traversées 23 fois (en 26 éditions) ; la Savoie, 25 fois ; et les Hautes-Pyrénées… 26 fois.

https://www.lemonde.fr/les-decodeurs/article/2024/11/03/tour-de-france-de-1903-a-2025-quels-sont-les-departements-gagnants-et-perdants-du-trace_5153251_4355772.html

30daymapchallenge

En novembre, c'est la fête aux cartographes. Parmi les réalisations notables, j'ai remarqué la carte de @cedricr@mapstodon.space sur la canopée en région grenobloise réalisée à partir des données Lidar de L'IGN : https://mapstodon.space/@cedric/113424503864235916

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)