Weeknotes 41
Comparer les LLMs en Français
Le ministère de la culture lance Comparia.beta.gouv.fr, un site qui permet de comparer des LLMs et de les évaluer.
Je trouve l'idée super pertinente et l'UX est top.
Sur le fond, je trouve aussi intéressant que le ministère de la Culture se positionne sur l'IA.
- https://www.linkedin.com/feed/update/urn:li:activity:7249666197141491712
- https://comparia.beta.gouv.fr
Le business de la violence
CalMatters et The Markup publient une enquête sur le business de la violence en analysant la bibliothèque de publicités de Facebook.
CalMatters and The Markup used Meta’s own tools to calculate how much Meta makes from spikes in advertising when instances of political violence happen, reviewing thousands of ads through both manual review and with the assistance of an AI model offered by Meta itself. (We also made improvements to Meta Research’s scripts for accessing the Ad Library API, and we’re sharing our changes.)
TheMarkup a utilisé un LLM pour interroger FacebookAds
To suss out which ads were related to the shooting, we reviewed more than 4,200 ads from the company’s different pages with the assistance of a large language model named Llama, a Meta AI model.
We programmed the model to evaluate the text of each ad to determine whether it was related to the assassination attempt, then manually reviewed hundreds of its classifications to ensure it was working as expected.
Au passage, l'équipe à contribué au dépôt de scripts python pour accéder à Facebook Ads : https://github.com/the-markup/Ad-Library-API-Script-Repository/ et publié ses données https://github.com/the-markup/investigation-meta-political-violence-ads.
Notebooks
Deno2 permet de faire tourner du JavaScript dans Jupyter. Ça peut être utile pout réutiliser du code Observable dans un environnement Jupyter, par exemple si on veut travailler sur sa machine.
Large Chain of Thoughts Models
La nouvelle génération de modèles dit de “raisonnement” comme GPT-o1 pousse l'anthropomorphisme encore plus loin.
Voir notamment ce thread de Carl Bergstrom: @ct_bergstrom@fediscience.org/113307407384723425">https://mastodon.social/@ct_bergstrom@fediscience.org/113307407384723425
L'insoutenable légèreté du Nobel d'économie
Le Nobel d'économie récompense Daron Acemoglu, Simon Johnson.
Ils sont notamment célèbres pour leur article The Great Reversal of Fortune. La fiabilité et la pertinence dss des données utilisées a pourtant été largement contestée, notamment par https://www.tandfonline.com/doi/abs/10.1080/00220388.2011.648621
Ça me fait penser à cette tribune d'Éric Monnet intitulée L'insoutenable légèreté des économistes : https://www.alternatives-economiques.fr/eric-monnet/linsoutenable-legerete-economistes/00105058
TheStallmanReport
Gros travail pour recenser les prises de position problématiques sur les questions sexuelles. Je ne sais pas trop qui est derrière mais ça paraît bien documenté.
Melodi
L'Insee met maintenant des données à disposition dans l'outil MELODI. Ça permet de les requêter directement en Python, R ou JavaScript.
Eric Mauviere montre comment les requêter directement depuis DuckDB et grâce à son commentaire les requêtes cross domain sont maintenant possibles.
Loi de finances
L'outil LexImpact permet de visualiser directement la loi de finances.
LexImpact est un ancien projet du programme Entrepreneurs d'intérêt général qui s'appuie sur le logiciel libre Openfisca.
2,5% des investissements dans les startups vont à des startups dirigées majoritairement ou entièrement par des femmes !
Between 2011 and 2021, €84.5 billion were invested by European Venture Capitalist (VC) firms in European start-ups. That's a massive amount, more than the GDP of Luxembourg last year. Yet, the startup landscape remains very unequal. 90% of the money was invested by all-male or majority-male VC teams into all-male or male-majority start-ups. Those are teams where top management is 55%+ male. Less than 2.5% of funding went to all-female or female-majority start-ups.
https://www.europeancorrespondent.com/data?s=Euro-cents-for-female-startups
A lire
- Guide d'évaluation des LLM par HuggingFace's : https://github.com/huggingface/evaluation-guidebook
- https://medium.com/@emilymenonbender/talking-about-a-schism-is-ahistorical-3c454a77220f
PAC – @pac@mastodon.social
S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)