Weeknote #30

Cartogrammes

Françoise Bahoken (@fbahoken@mapstodon.space) et Nicolas Lambert (@neocarto@vis.social) publient le code R pour réaliser des cartogrammes de Dorling et des cartogrammes par points.

Personnellement, depuis que j'ai découvert le cartogramme de Dorling, je trouve que c'est une représentation beaucoup plus intéressante que la carte choroplèthe. On évite le biais de représentation qui consiste à donner une plus grande importance aux entités avec une grande superficie.

En JavaScript, on peut facilement faire les mêmes cartogrammes avec Bertin.js (https://github.com/neocarto/bertin) ou Geoviz (https://neocarto.github.io/geoviz/)

Prompt engineering

FipAddict (@fipaddict@piaille.fr) publie un guide de prompt engineering assez bien fait.

On y apprend qu'il faut une dizaine d'heures pour apprendre à parler avec un LLM.

Travailler avec l'IA est étrange et ne vient pas avec un manuel d'instructions. La seule façon de devenir bon dans l'utilisation de l'IA est donc de l'utiliser. Ma règle générale est qu'il faut 10 heures d'utilisation avant de commencer à comprendre ces outils et leurs particularités. Citation d'un certain Ethan Mollick.

Il est conseiller de contextualiser.

Un excellent moyen pour commencer consiste souvent à donner une identité au modèle (ex : « Tu es journaliste à Libération », « Tu es un enseignant au lycée, etc.) afin de l’aider à adopter un positionnement et un vocabulaire adaptés.

Bien préciser le format de la réponse.

Au-delà du contexte de votre requête, il est également très utile de préciser la réponse attendue de la part de l’IA

Fournir quelques exemples pour obtenir des résultats précis.

Pour une tâche consistant à résumer en une phrase le contenu d’un amendement parlementaire, il a par exemple suffit de donner sept exemples au modèle dans la consigne initiale pour accroître significativement la qualité des résumés

Demander au modèle de procéder par étape.

, il est également possible d’améliorer considérablement la qualité des réponses en précisant dans le prompt qu’on souhaite que le modèle procède « étape par étape » pour élaborer sa réplique.

Sauvegarder les prompts qui marchent.

quand vous êtes amenés à effectuer des tâches répétitives, pensez à sauvegarder vos instructions afin de pouvoir les réutiliser, les améliorer au fil du temps… et les partager !

Transcription libre

Je découvre le projet Scribe (https://scribe.cemea.org/), développés par les Cemea pour faire de la transcription libre (as a service ou on premise). Ça s'appuie apparemment sur les données de Common Voice.

Marimo

Dans la première newsletter de Mario, Akshay Agrawal explique la genèse du projet.

When I was a PhD candidate, working on embeddings for machine learning and visualization, I used Jupyter notebooks almost daily — they were useful, but also very frustrating. Having seen engineers invent the future at Google Brain, I was convinced that there must be a way to build a better programming environment for working with data — one that made data tangible and actionable, while also solving the long list of problems that notebooks suffer from.

Akshay Agrawal ne manque pas d'ambition pour Mario :

Today, marimo is open source, and we’re dedicated to making it the best programming environment for doing research and communicating it; running computational experiments and scaling them; and learning computer science and teaching it.

IA et électricité

Dans The Atlas of AI, Kate Crawford parlait déjà des besoins de l'IA en électricité. À l'époque, je pensais qu'elle exagérait un peu. Aujourd'hui, le sujet est devenu mainstream.

Pour d’autres, miser sur l’apparition d’une telle électricité illimitée et décarbonée est un pari dangereux et une fuite en avant. Voire une ironie cruelle, à l’heure ou des apôtres de l’IA clament qu’elle peut « sauver le climat ». « Nous ne pouvons pas générer plus d’énergie par magie. Il faut arrêter de mettre de l’IA générative partout et réduire sa consommation, immédiatement », a tweeté Sasha Luccioni, de la start-up d’IA Hugging Face.

Datatouille

@cquest@amicale.net est taquin : https://amicale.net/@cquest/111892288623656883

Poubellocene

Dans Le Monde, Claire Legros synthétise les recherches récentes autour des déchets. L'article est plein de références qui ont l'air passionnantes.

le déchet, à la croisée de l’intime et du collectif, est une affaire d’affect autant que de technique et surtout un « matériau politique, par sa présence dans l’espace public et ses effets, mais aussi par les choix qu’il impose », souligne la socio-anthropologue Nathalie Ortar, l’une des coordinatrices de l’ouvrage collectif Jeux de pouvoir dans nos poubelles.

Jusqu’à la fin du XIXe siècle, en effet, la notion de déchet telle qu’on l’entend aujourd’hui n’existe pas.

C'est l'invention des déchets chimiques qui met fin à la réutilisation des déchets comme engrais.

A partir de la seconde moitié du XIXe siècle apparaissent de nouveaux engrais fossiles ou chimiques, comme le guano, le nitrate de soude et les phosphates, qui vont progressivement remplacer les boues urbaines et la « poudrette » des fosses d’aisance dans le domaine agricole.

Avec le développement de l’hygiénisme, les ordures sont enfermées dans des boîtes, bientôt appelées poubelles, puis éloignées dans de vastes dépotoirs creusés en périphérie des villes. Les excréments, de leur côté, sont rejetés dans les nouveaux systèmes de tout-à-l’égout et finissent souvent dans les rivières.

« Les pratiques de recyclage peuvent être intéressantes à condition que soient remises en cause les logiques de surconsommation, car, sinon, elles tendent à les aggraver en encourageant plutôt une forme d’effet rebond et de désinhibition. Les meilleurs élèves du recyclage, comme la Suède ou l’Allemagne, sont aussi les pays qui produisent le plus de déchets », regrette Baptiste Monsaingeon.

Notes

PAC – @pac@mastodon.social