Weeknotes 41

16 octobre 2024

Comparer les LLMs en Français

Le ministère de la culture lance Comparia.beta.gouv.fr, un site qui permet de comparer des LLMs et de les évaluer.

Je trouve l'idée super pertinente et l'UX est top.

Sur le fond, je trouve aussi intéressant que le ministère de la Culture se positionne sur l'IA.

Le business de la violence

CalMatters et The Markup publient une enquête sur le business de la violence en analysant la bibliothèque de publicités de Facebook.

CalMatters and The Markup used Meta’s own tools to calculate how much Meta makes from spikes in advertising when instances of political violence happen, reviewing thousands of ads through both manual review and with the assistance of an AI model offered by Meta itself. (We also made improvements to Meta Research’s scripts for accessing the Ad Library API, and we’re sharing our changes.)

TheMarkup a utilisé un LLM pour interroger FacebookAds

To suss out which ads were related to the shooting, we reviewed more than 4,200 ads from the company’s different pages with the assistance of a large language model named Llama, a Meta AI model.

We programmed the model to evaluate the text of each ad to determine whether it was related to the assassination attempt, then manually reviewed hundreds of its classifications to ensure it was working as expected.

https://themarkup.org/investigations/2024/10/04/how-meta-brings-in-millions-off-political-violence

Au passage, l'équipe à contribué au dépôt de scripts python pour accéder à Facebook Ads : https://github.com/the-markup/Ad-Library-API-Script-Repository/ et publié ses données https://github.com/the-markup/investigation-meta-political-violence-ads.

Notebooks

Deno2 permet de faire tourner du JavaScript dans Jupyter. Ça peut être utile pout réutiliser du code Observable dans un environnement Jupyter, par exemple si on veut travailler sur sa machine.

https://simonwillison.net/2024/Oct/10/announcing-deno-2/

Large Chain of Thoughts Models

La nouvelle génération de modèles dit de “raisonnement” comme GPT-o1 pousse l'anthropomorphisme encore plus loin.

Voir notamment ce thread de Carl Bergstrom: @ct_bergstrom@fediscience.org/113307407384723425">https://mastodon.social/@ct_bergstrom@fediscience.org/113307407384723425

L'insoutenable légèreté du Nobel d'économie

Le Nobel d'économie récompense Daron Acemoglu, Simon Johnson.

Ils sont notamment célèbres pour leur article The Great Reversal of Fortune. La fiabilité et la pertinence dss des données utilisées a pourtant été largement contestée, notamment par https://www.tandfonline.com/doi/abs/10.1080/00220388.2011.648621

Ça me fait penser à cette tribune d'Éric Monnet intitulée L'insoutenable légèreté des économistes : https://www.alternatives-economiques.fr/eric-monnet/linsoutenable-legerete-economistes/00105058

TheStallmanReport

Gros travail pour recenser les prises de position problématiques sur les questions sexuelles. Je ne sais pas trop qui est derrière mais ça paraît bien documenté.

https://stallman-report.org/

Melodi

L'Insee met maintenant des données à disposition dans l'outil MELODI. Ça permet de les requêter directement en Python, R ou JavaScript.

Eric Mauviere montre comment les requêter directement depuis DuckDB et grâce à son commentaire les requêtes cross domain sont maintenant possibles.

https://www.linkedin.com/feed/update/urn:li:activity:7245023149111525376/?commentUrn=urn%3Ali%3Acomment%3A(activity%3A7245023149111525376%2C7250096621575634945)&dashCommentUrn=urn%3Ali%3Afsd_comment%3A(7250096621575634945%2Curn%3Ali%3Aactivity%3A7245023149111525376

Loi de finances

L'outil LexImpact permet de visualiser directement la loi de finances.

https://www.linkedin.com/feed/update/urn:li:activity:7250425617689509889/

LexImpact est un ancien projet du programme Entrepreneurs d'intérêt général qui s'appuie sur le logiciel libre Openfisca.

2,5% des investissements dans les startups vont à des startups dirigées majoritairement ou entièrement par des femmes !

Between 2011 and 2021, €84.5 billion were invested by European Venture Capitalist (VC) firms in European start-ups. That's a massive amount, more than the GDP of Luxembourg last year. Yet, the startup landscape remains very unequal. 90% of the money was invested by all-male or majority-male VC teams into all-male or male-majority start-ups. Those are teams where top management is 55%+ male. Less than 2.5% of funding went to all-female or female-majority start-ups.

https://www.europeancorrespondent.com/data?s=Euro-cents-for-female-startups

A lire

Guide d'évaluation des LLM par HuggingFace's : https://github.com/huggingface/evaluation-guidebook
https://medium.com/@emilymenonbender/talking-about-a-schism-is-ahistorical-3c454a77220f

PAC – @pac@mastodon.social

S'abonner via le Fediverse (@pac@write.apreslanu.it) ou via flux rss (https://write.apreslanu.it/pac/feed/)