pac

weeknotes

Mediapart.social

Mediapart s'investit dans le Fediverse et lance Mediapart.social. C'est une super nouvelle. On verra si d'autres médias suivent.

Nicolas Mondon (@nmondon@vis.social) lance une newsletter sur l'analyse statistique du foot.

C'est peut être pas une bonne idée de recommander une newsletter Substack au moment où la plateforme est sous le feu des critiques mais les analyses de Nicolas sont toujours intéressantes.

Python Rgonomics

Emily Riederer présente quelques outils Python qui peuvent permettre aux utilisateurs de R de s'y retrouver.

The tips and tricks we learn to be hyper productive in a primary language are comfortable, familiar, elegant, and effective. They just feel good. Working in a new language, developers often face a choice between forcing their favored workflows into a new tool where they may not “fit”, writing technically correct yet plodding code to get the job done, or approaching a new language as a true beginner to learn it’s “feel” from the ground up.

If you told me you liked the New York’s Museum of Metropolitan Art, I might say that you might also like Chicago’s Art Institute. That doesn’t mean you should only go to the museum in Chicago or that you should never go to the Louvre in Paris. That’s not how recommendations (by human or recsys) work. This is an “opinionated” post in the sense that “I like this” and not opinionated in the sense that “you must do this”.

Emily apprécie notamment Polars pour la manipulation de données.

Data Wrangling: Although pandas is undoubtedly the best-known wrangling tool in the python space, I believe the growing polars project offers the best experience for a transitioning developer (along with other nice-to-have benefits like being dependency free and blazingly fast).

Évidemment, elle recommande aussi Quarto qui permet de garder l'esprit “plaintext computational notebooks” de RMarkdown.

Elle recommande aussi pdm et ruff que je n'ai jamais testés.

Marimo

J'avais parlé de Marimo il y a quelques semaines. Simon Willison trouve Marimo très prometteur.

I'm very impressed by first impressions of https://marimo.io/ – a brand new open source Python notebook implementation, a bit like Jupyter but with reactive cells as seen in https://observablehq.com/ – which means any edits you make to values or code (or a UI element) in a cell cause all dependent cells to update automatically

Cédric Eyssette

Cedric Eyssette (@eysette@scholar.social) est un prof de philo un peu geek et fan de markdown. Il développe plein de petits outils super pratiques.

Il a notamment développé un lecteur de flux rss (https://eyssette.forge.aeif.fr/marknews/), un générateur de site (https://eyssette.forge.aeif.fr/markpage/) et un outil de carte mentale (https://mymarkmap.netlify.app/)

Ailleurs

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Medialab,❤️, CSV

Via @paulanomalie@piaille.fr (https://piaille.fr/@paulanomalie/111731919920063056), je découvre la lettre d'amour au format CSV publiée par le Medialab.

Bluesky

Sur Observable, il y a des gens qui développent des trucs assez cool pour Bluesky.

@hrbrmstr développe un outil qui analyse les liens partagés sur Bluesky développé par .

@aendra développe un outil qui analyse et exporte les publications d'un compte.

Détecteur de clichés

Yann Guégan (@yanng@mastodon.social) a réparé son détecteur de clichés

2024, année électorale

La moitié de la population mondiale en âge de voter est appelée aux urnes lors de scrutins libres ou déjà joués d’avance.

En 2024, la population vivant dans des pays où auront lieu des élections s’élève à 4,1 milliards de personnes – soit la moitié des habitants de la planète. Des scrutins multiples (présidentiels, législatifs, régionaux, municipaux) seront organisés dans 68 pays.

Le New York Times revient sur le même sujet sous l'angle de la menace pour la démocratie.

Yihuidown

Yihui Xie, well-known in the R community as the creator of R packages such as R Markdown, knitr, blogdown, and bookdown, has been laid off from Posit, where he worked as a full-time software developer. Xie announced the layoff, which happened at the end of December, in a blog post this week.

Source : https://www.infoworld.com/article/3712061/posit-lays-off-r-markdown-knitr-creator-yihui-xie.html

Dans son blog post, Yihui exprime à la fois sa stupeur face à la brutalité de la décision et sa gratitude pour les 10 années passées chez Posit/RStudio.

Who is down? Me. After more than 10 years at RStudio/Posit, the time has come for me to explore other opportunities. A little over two weeks ago, I was told that I was laid off and my last day would be 2023-12-31.

Data sciences

Le cours de Lino Galiana (@linogaliana@vis.social) est entièrement open source : https://github.com/linogaliana/python-datascientist

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Python

Posit lance le package python Great tables. Ça a l'air pas mal.

Biais algorithmique

une nouvelle étude scientifique conclut à un relatif biais à droite de l'algorithme de YouTube. En revanche, elle ne démontre pas d'exposition marquée aux contenus extrémistes, sauf chez les profils d'utilisateurs déjà les plus marqués à l'extrême, en particulier à l'extrême-droite.

Via @mathildesaliou@piaille.fr : https://piaille.fr/@mathildesaliou/111600259713820915

Retour en 1999

Richard Hannah (@supertanuki@toot.aquilenet.fr) veut revenir au web de 1999. Je découvre notamment le projet Gemini.

C’est le cas de Gemini, tout à la fois format et protocole (gemini://). Il est nécessaire d’utiliser un autre outil qu’un navigateur web pour pouvoir accéder au geminispace : ligne de commande ou logiciels à installer. Le contenu est exclusivement du texte formaté par une version simplifiée de Markdown. Quelques autres contraintes : pas d’entête, donc pas de cookies, et un maximum de un lien par ligne.

https://www.24joursdeweb.fr/2023/et-si-on-faisait-du-web-comme-en-1999-ou-presque/

OSINT

J'ai découvert récemment le podcast Mécanique du journalisme qui revient sur de grandes enquêtes journalistiques du point de vue du journaliste.

Je recommande la série d'épisodes sur l'empoisonnement de Navalny dans laquelle Eliot Higgins raconte la naissance de Bellingcat.

NewPipe

J'utilise de plus en plus mon smartphone pour écouter de la musique et des podcasts, notamment sur YouTube. Je viens de découvrir l'appli NewPipe qui permet d'écouter YouTube ou d'autres plateformes de manière fluide. On peut facilement télécharger ou se créer des playlists sans avoir de compte YouTube/Google.

LLM

Mozilla lance Llamafile pour transformer des modèles de langage en exécutable installable sur un ordinateur personnel.

Quitter X/Twitter

La NPR a quitté Twitter en avril dernier. Apparemment, ça a eu un impact négligeable sur le trafic du site:

Six months later, we can see that the effects of leaving Twitter have been negligible. A memo circulated to NPR staff says traffic has dropped by only a single percentage point as a result of leaving Twitter, now officially renamed X, though traffic from the platform was small already and accounted for just under two percent of traffic before the posting stopped.

https://niemanreports.org/articles/npr-twitter-musk/

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Je suis toujours aussi fan du minimalisme de #writefreely. J'écris les notes depuis mon téléphone. C'est donc super agréable d'avoir une interface simple et fluide.

Le seul truc dommage, c'est que la date du post correspond à la date de création du draft plutôt qu'à la date de publication.

Emissions de CO2

@tomfevrier@mastodon.social s'est amusé à faire un compteur un peu flippant.

👉https://mastodon.social/@tomfevrier/111504862026860728

Test du Chi-Deux

@tk@social.apreslanu.it s'amuse à faire des tests du Chi Deux à la mano.

👉 https://write.apreslanu.it/weeknotes/2023w48.

Algo de la CNAF

La Quadrature du net (@LaQuadrature@mamot.fr) a obtenu la publication de l'algorithme de ciblage de la fraude de la CNAF.

Les Décodeurs ont publié un format pédagogique super bien fait en collaboration avec Lighthouse Reports : https://www.lemonde.fr/les-decodeurs/visuel/2023/12/04/comment-l-algorithme-de-la-caf-predit-si-vous-etes-a-risque-de-frauder_6203836_4355770.html

Carto

L'équipe de Codeur•euses en liberté développe CoCarto, un outil permettant l'édition collaborative de carte.

Dans la dernière lettre d'information (https://buttondown.email/cocarto), ils présentent le projet de suivi du plan vélo d'île-de-France réalisé avec CoCarto.

https://observatoire-vif.velo-iledefrance.fr/#region

IA générative

L'équipe de Contexte a organisé un hackathon interne sur l'utilisation de l'IA générative. Je pense que c'est une super idée pour appréhender le sujet de manière concrète et déconstruire les fausses idées.

Je retiens de la restitution :

En fait, l’impression générale est qu'aujourd'hui ChatGPT peut être comparé à un stagiaire pas très futé mais plein de bonne volonté : il fera toujours son possible pour accomplir sa tâche, mais il est nécessaire de repasser derrière lui parce qu’il ne comprend pas toujours bien ce qu’on lui demande et qu’il fait souvent des erreurs.

Geoviz

J'ai pas encore eu le temps de rester Geoviz, la nouvelle librairie de Nicolas Lambert (@neocarto@vis.social), mais ça a l'air top.

https://observablehq.com/@neocartocnrs/geoviz

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Bonne nouvelle, @tk@social.apreslanu.it relance sa #weeknote : https://write.apreslanu.it/weeknotes/2023w47

LLM

Sur LinkedIn, Pierre-Carl Langlais se pose des questions intéressantes sur les LLM et les modèles dérivés.

Mon ChatGPT du 17e siècle, MonadGPT n’est entraîné que sur 10,000 extraits de textes de l’époque. Et pourtant cela a suffit à faire basculer l’univers culturel du modèle qui relaie maintenant des erreurs scientifiques manifestes pour un lecteur contemporains (un monde à sept planètes dont le soleil) ou une morale très christianisée. Est-ce que Mistral devrait être tenu responsable du comportement de ce modèle ?

https://www.linkedin.com/feed/update/urn:li:activity:7134257451767410688

X/Twitter

À ma connaissance, Anne Hidalgo est la première personnalité politique en France à annoncer publiquement quitter X. Je trouve que c'est important que les politiques se saisissent du sujet, prennent au sérieux le projet politique de Musk et agissent en conséquence.

Ne nous trompons pas. Il s’agit d’un projet politique très clair qui veut se passer de la démocratie et de ses valeurs pour de puissants intérêts privés.

Lire l'article : https://www.lemonde.fr/idees/article/2023/11/27/anne-hidalgo-pour-rester-fidele-a-mes-convictions-et-a-mon-engagement-je-quitte-aujourd-hui-x-ex-twitter_6202575_3232.html

Écriture inclusive

@mattisg@piaille.fr s'amuse de la proposition de loi 1816 visant à interdire l'écriture dite inclusive et notamment les « pratiques rédactionnelles et typographiques visant à […] substituer à l’emploi du masculin, lorsqu’il est utilisé dans un sens générique, une graphie faisant ressortir l’existence d’une forme féminine ». En utilisant les données d'OpenTermsArchives, Matti conclut:

Sur un échantillon de 111 services B2C majeurs en France, 43% devront réécrire leurs documents contractuels au masculin pour effacer la neutralité de genre si la loi n°1816 est adoptée.

Lire l'article en entier : https://matti-sg-fr.medium.com/des-co%C3%BBts-induits-par-le-conservatisme-orthographique-aller-%C3%A0-contre-courant-de-la-soci%C3%A9t%C3%A9-%C3%A7a-80a42694bb8a

Reconnaissance des caractères manuscripts

Via le prix de la science ouverte (https://social.numerique.gouv.fr/@ouvrirlascience/111493929186960297) , je découvre le projet HTC-United. Alix Chagué donne plus de contexte sur le projet sur #BlueSky (https://bsky.app/profile/alix-tz.bsky.social/post/3kcxn6aqtp32p).

Héros de BD en dataviz

Visualisation assez fun des héros de BD https://mastodon.gougere.fr/@PierreCol/111492649962664274

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)

Grâce @tk@apreslanu.it, j'expérimente writefreely pour rédiger ma weeknote au lieu de hackmd.io.

Writefreely fait partie de #fediverse. Ça devrait permettre d'interagir avec des comptes #Mastodon.

Open data

Le projet Panoramax publie sur @datagouvfr@social.numerique.gouv.fr la liste des panneaux détectés par IA :

Prix de l'immobilier

L'équipe @datagouvfr@social.numerique.gouv.fr a entièrement redéveloppé l'application de visualisation des données des transactions immobilières (DVF).

#Rstats et Observable

C'est encore un peu lent mais avec WebR, on peut maintenant exécuter du code R dans un notebook Observable.

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)