ratures

Reader

Read the latest posts from ratures.

from chemins invisibles

Petit récapitulatif pour moi-même de la controverse qui agite la version francophone de Wikipédia et ses communautés. Bien que j’aimerai écrire plus longuement sur le sujet, je n’ai pas la bande passante nocturne pour le faire encore moins diurne. Je travaille de façon ouverte en espérant que les esprits refroidis retrouveront un brin de lucidité. Wikipédia est un projet important, chacun y contribue à sa manière, j’essaie de poser quelques bases pour éventuellement développer plus en détails certains points à l’avenir. Une note de synthèse en quelques sortes.

le sondage

Le 12 février 2024 des contributeur.ice.s de la version francophone de Wikipédia ouvrent un sondage titré « Mention du nom de naissance pour les personnes trans » pour prendre la température concernant les conventions éditoriales concernant la mention du dead-name des personnes transsexuelles. La problématique est principalement les personnes dont la transition aurait eu lieu après une phase de notoriété. Cela fait suite à une tribune datant de 2022 dans l’Obs réunissant un nombre considérable de personnalités du monde culturel dénonçant le manque d’égard généralisé du site pour le respect de personnes.

Le sondage en question nécessite une lecture attentive d’une longue page et les modalités de participation ne sont pas simples à comprendre tant au niveau intellectuel qu’ergonomique. Il y a 6 questions et il faut aller éditer plusieurs champs textes dans un slalom d’avis plus ou moins digeste avec parfois une forme de violence écrite. La seule condition explicite est d’avoir au moins 50 contributions sur les pages d’article de Wikipédia et donc en ne comptant pas les pages de discussion ou les pages d’utilisateur·ice·s.

On peut aussi remarquer que la préparation du sondage n’a pas été vraiment fluide et que la question de sa publicité était déjà problématique. Une tentative précédente de sondage avait déjà eu lieu et mobilisé une discussion qui dura plus d’un an et demi pour finalement avorter.

Dans la terminologie de Wikipédia, les contributeur·ice·s distinguent un sondage qui est informatif et une prise de décision.

la controverse

La question intéressante pourrait être comment trouver des conventions techniques et rédactionnelles pour sortir concilier respect des personnes et encyclopédisme sans sacrifier aucun des deux ? Cette dernière notion est loin d’être figée et le degré zéro serait de se contenter d’être une succursale de l’état civil. C’est un moment important, car cela nécessite un vrai travail de concertation et de créativité. Cependant le débat n’est pas vraiment posé dans ce cadre, mais dans une attitude indélicate et feignante.

Sinkra: “Si vous avez un compte Wikipédia avec au moins 50…” – Eldritch Café

La controverse n’a d’ailleurs pas du tout lieu sur ces questions, mais sur la diffusion du sondage sur des réseaux sociaux, notamment le fediverse dans sa variante mastodon. Cela va créer un afflux, à vue de nez, d’une trentaine de votes alors qu’on peut compter plus de 300 participants au total.

Discussion Wikipédia:Sondage/Mention du nom de naissance pour les personnes trans — Wikipédia

Des personnes concerné.e.s par le sujet vont souligner dans la page de discussion du sondage leur malaise ainsi que la violence par maladresse de la démarche et des formulations. On peut considérer qu’il y a une forme de transphobie à ne pas inclure, comme dans « inclusif », proactivement des personnes sensibles à ces questions ou bien même à se sensibiliser soi-même ou collectivement avant d’entreprendre un sondage public. Demander de l’aide, c’est un savoir-être. À partir de ce moment, la page de discussion part dans tous les sens. On assiste surtout à une chambre d’écho d’un petit nombre de contributeur·ice·s que l’on pourrait qualifier de piliers de comptoir qui vont s’autoconvaincre qu’un signal d’alerte est une forme de déstabilisation frisant la cyberattaque par une puissance étrangère. Il y a ce genre de choses sur les Wikipedia, c’est un sujet sérieux, mais dans l’instant, c’est proprement surréaliste. La page discussion contient tous les éléments de langage permettant de s’autopersuader que le problème n’est pas le sondage, mais ceux qui le critiquent. C’est tout un florilège de mantras et de formules vide de sens comme « Wikipédia n’est pas un projet politique » ; il y a bien une page wikipedia sur le sujet mais elle est loin d’être aussi simpliste que cette formulation. Le but ici n’est pas non plus de faire un inventaire des biais de la communauté ayant le monopole de la parole.

Wikipédia:Bulletin des administrateurs/2024/Semaine 7 — Wikipédia

Le 19 février, 7 jours plus tard donc, une procédure de blocage est ouverte en ciblant plusieurs personnes ayant partagé le lien vers le sondage ou ayant participé aux discussions dans le « bulletin des administrateurs », la page de travail des administrateurs. Les administrateurs sont des contributeur·ice·s reconnu·e·s par les autres comme méritant des droits d’instances pour fluidifier la collaboration autour du projet. Cela, c’est la théorie. Dans les faits, il y a une visible dérive de certain·e·s vers un rôle judiciaire entre juge et flic.

Le 23 février, plusieurs personnes sont ainsi bannies bloquées de façon indéfinie. Parmi celles-ci se retrouve @Pandora@eldritch.cafe pour avoir fait valoir sa voix de concernée et chercher à défendre une meilleure inclusivité dans la consultation. @MarcBrillault@eldritch.cafe est également bloquée de façon indéfinie pour avoir alerté avec beaucoup de patience. Sur fond de rancune de longue date contre le projet Les sans pagEs, @Sinkra@eldritch.cafe se fera bloquer 3 jours. Un blocage signifie l’impossibilité d’écrire sur une page quelconque mettant ainsi fin de façon brutale à la discussion. Les votes comptent au maximum 23 participations. S'il y a un article journalistique à écrire, cela sera un très bon début d'aller recueillir leur témoignage.

Wikipédia:Sondage/Mention du nom de naissance pour les personnes trans/Tableau vote et nombre de contributions — Wikipédia

La situation est telle que des contributeur.ice.s ont eu la bonne idée (sarcasme) de faire liste des participant·e·s du sondage ayant moins de 1 000 votes et moins de 50 votes. La page de discussion du sondage s’étale également en palabre pour savoir si ces contributions doivent être depuis leur inscription, les deux dernières années ou en 2024. À un moment donné, les noms des comptes étaient indiqués avant un rétropédalage de bon sens. De la bonne surveillance.

quelques lectures intéressantes

  • Wikipédia:Règles et recommandations — Wikipédia. L’état d’esprit de contribution est largement plus flexible que ce que laisseraient penser les comportements d’une poignée d’individus. En parcourant les pages « méta » de Wikipedia sur Wikipedia, on retrouve un discours beaucoup plus nuancé et ouvert.
  • Wikipédia n’est pas : une bureaucratie. Tout cela me laissait avec une impression d’articulation entre une hiérarchie formalisée et informelle (le prestige du nombre de contributions par exemple). Encore une fois, je suis content de voir que le but est avant tout la collaboration, le travail ensemble, plutôt qu’une vision rigoriste de règles gravées dans le marbre. Bien entendu, il y a le texte et la réalité des pratiques.

les articles que je n’écrirai pas

  • Un état de l’art actualisé de la littérature académique sur le sujet ou au moins un feed des articles concernant les projets Wikipédia. Il y a par exemple, une section « recent research » dans The Signpost, le bulletin sur l’actualité du projet anglophone.
  • La manifestation du pouvoir et de l'autorité dans les partiques communautaires en ligne.
  • La majorité silencieuse des administrateur·ice·s de Wikipedia.
  • Wikipedia français ou francophone ? Dans les faits, il y a tout un travail d’élargir le contenu pour échapper à l’inertie de la masse française du réseau francophone. C’est loin d’être une évidence et cela apparaît dans [le bistrot], le principal espace de bavardage interne.
  • Bénévolat, travail gratuit et comportements dans les communautés web.
  • La notion d’espace public au regard des projets Wikipédia.
  • Est-ce que Wikipédia doit bénéficier d’une forme d’exception ?
  • Sagesse des foules, intelligence collective, auto-organisation, ces concepts qui traversent et motivent les communautés de Wikipedia.
  • Des outils communautaires pour mieux se comprendre. Réactiver mes travaux sur les analyses de textes et de réseaux autour de Wikipedia. Il y a des personnes comme @pac2@wikis.world qui fait déjà un travail considérable sur observable.
 
Lire la suite...

from pac

Deepfakes, désinformation et élections

Les articles de presse sur le danger des deepfakes en période électorale se multiplient.

Je suis assez d'accord avec Meredith Whitaker (@Mer__edith@mastodon.world), présidente de la fondation Signal et fondatrice du AI Now Institute avec Kate Crawford, qui pense que c'est une diversion :

The election year focus on 'deep fakes' is a distraction, conveniently ignoring the documented role of surveillance ads—or, the ability to target specific segments to shape opinion. This's a boon to Meta/Google, who've rolled back restrictions on political ads in recent years.

Put another way, a deep fake is neither here nor there unless you have a platform + tools to disseminate it strategically.

Source : https://mastodon.world/@Mer__edith/111885056720284975

Lister des trucs qu'on ne fait pas

En lisant cet article sur le Éducation Data Hub (https://acteurspublics.fr/articles/leducation-nationale-enterre-son-projet-d-education-data-hub) , je me suis dit que ce serait une bonne idée de valoriser les choses qu'on ne fait pas. C'est aussi important de décider de ne pas faire quelque chose que de décider de le faire mais on a tendance à valoriser ceux qui décident de faire plutôt que ceux qui décident de ne pas faire.

Dans un monde fictif idéal, OpenAI aurait pu communiquer sur le choix de ne pas faire SORA (https://openai.com/sora), l'algo qui permet de générer des vidéos de synthèse à partir d'un texte.

Google pourrait communiquer sur le fait de ne pas faire Gemini Pro, l'outil qui permet de détecter le contenu d'une vidéo (https://fedi.simonwillison.net/@simon/111971103847972384).

Le bouche à oreille

Adrien Gombaud et Tom Février (@tomfevrier@mastodon.social) analysent la fréquentation des films semaine par semaine prochaine pour voir ceux qui bénéficient du bouche à oreille.

Médias

D'après @mathlehot@mastodon.zaclys.com, les chiffres de diffusion du Journal du Dimanche sont en chute libre : https://mastodon.zaclys.com/@mathlehot/111939832722337439

Geekeries

Apparemment, yt-dlp est un outil encore plus puissant que youtube-dl.

Mastodon

Je trouve que la fonctionnalité « suivre un hashtag » de Mastodon marche super bien pour la veille. En suivant les bons hashtags, ça permet de repérer plein de choses. Je récupère pas mal de chose intéressantes avec le hashtag #disinformation. Dernier exemple en date, une enquête du Washington Post sur la stratégie de désinformation russe en Ukraine : https://www.washingtonpost.com/world/2024/02/16/russian-disinformation-zelensky-zaluzhny/.

Ailleurs

 
Lire la suite...

from weeknotes

Une semaine mélangeant travail et congés. Je suis parti en vadrouille dans la foulée de ce qui fait que ce billet est à la fois succinct et décousu. Je reprendrai quelques fils ouverts la semaine suivante.

qu’est-ce qui s’est passé ?

  • 3 jours de travail, puis 1 journée sans enfants qui a été écourtée pour commencer des vacances que j’attendais depuis quelques semaines.
  • le nom de domaine paris2024.lol était disponible.
  • terminé un carnet d’écriture quotidienne.
  • j'ai enfin arrêté mon abonnement spotify famille et recommencé à me faire une bibliothèque musicale. Soulseek fonctionne encore très bien.
  • j'ai speed runné un diorama qui trainait depuis un an et demi.

des joies

  • Au retour des grandes vacances, j’avais l’ambition de tenir un gaming journal sur les jeux vidéos et des sessions de jeu de rôle solo, mais je me suis rendu compte que je n’avais plus ou pas de pratique d’écriture quotidienne. Je me suis alors lancé dans le défi d’écrire au minimum 15 minutes et au maximum 1 page par jour dans un carnet de 192 pages. Un peu comme Forest Gump qui se met à courir là, c’était mon ressenti au début. J’ai tenu le rythme avec un écart pendant les vacances de Noël. J’ai encore quelques bons souvenirs de prendre le temps d’écrire ces pages en sortant du cinéma et de rentrer chez moi. Pendant assez longtemps, c’était de l’écriture automatique. Au bout d’un peu plus de 120 jours, les pages sont devenues plus structurées et j’avais quelques “prompts” en cas de manque d’inspiration ou de fatigue. Bref, il y a beaucoup de choses à dire de ce genre d’expérience. J’en tire un vrai plaisir et je pense que cela m’a aidé dans un tas de situations. Je continuerai dans un format plus réduit en nombre de pages pour également avoir plus d’espace pour une certaine passion pour la papeterie.

des peines

  • J’ai participé au sondage wikipedia qui s’est avéré être un magnifique dumpster fire. Je me suis même retrouvé pris à parti comme étant un “pantin”. C’est assez absurde et j’ai comme l’impression que le bon sens a été évacué depuis un certain temps au sein des bavards de la communauté. Tout cela a entrainé la production d’un tas de brouillon d’articles dont je ne sais pas trop quoi faire, mais qui m’ont permis de ne pas me lancer tête baissée dans une perte de temps sur le web ; cela dit cela fera une bonne série de sujets froids. Heureusement, j’ai pu avoir également, par le passé, des interactions avec des personnes qui étaient à mille lieues de cette ambiance. Je me rends compte au passage que les deux années à un projet de recherche autour de l’encyclopédie sont difficilement réactivables alors que j’avais à l’époque une grande liberté de moyen et de temps. Je m’étais complètement perdu dans une forme de performativité à parler pour prétendre. Le revers de l’autonomie. Cela dit j’ai des lectures qui me reviennent et si jamais il le fallait, je ne repartirais pas complément de zéro dans la mesure où j’ai quand même accumulé une connaissance pratique des matériaux à disposition, les réseaux, les textes, les communautés, etc. Reste quand même l’amertume que construire un web progressiste est un long chemin loin d’avoir été entamé. Cela fait aussi quelques semaines que j’avais dans l’idée d’être plus soutenu dans mes contributions, mais cela a bien douché ma motivation et m’amène à regarder avec un peu plus de lucidité l’objet en question.

lu, vu, joué

  • 📕 terminé L’inquiétude et Le petit dans Le cycle du midi des frères Strougatski
  • 📖 commencé et bien avancé dans Le scarabée dans la fourmilière dans Le cycle du midi
  • 📖 lu des bouts de Power and Progress de Daron Acemoğlu

avant, avant

 
Read more...

from weeknotes

Il y a des films qui vous transforment. Je ne sais pas si je me souviendrais de Past Lives dans quelques temps mais ce film aura bien retourné ma semaine. Je me rends compte en écrivant ce billet hebdomadaire.

qu’est-ce qui s’est passé d’intéressant ?

  • Grâce aux bons conseille de @cedricr@mapstodon.space, je suis passé récupéré des ouvrages en click and collect chez Shakespeare and co, ce qui a alimenté ma pile tsundoku et m’a valu une seconde commande au retour.
  • J’ai migré cette instance WriteFreely vers la v0.15.0 parue le week-end précédent. Cela s’est passé sans encombre. J’hésite à activer l’inscription aux nouveaux articles par email bien que cela ne soit pas trop ma pratique de lecture. Les newsletters dans les boîtes mail restent quelque chose d’important pour beaucoup de personnes.
  • J’ai vu Past Lives qui m’a bien travaillé intérieurement.
  • C’est le début de la nouvelle année lunaire.
  • J’ai récupéré mon vieux baladeur à cassette qui ne fonctionne malheureusement plus.

des joies

  • Les semaines précédentes, j’avais remis en route l’appareil photo qui ne cessait de rester dans ma poche ou mon sac. Cette semaine, j’ai finalement pris le temps de publier quelques photos en ligne. C’est un nouveau début plaisant.
  • J’évite plus ou moins fort de parler de mon travail ou de travail dans une démarche de faire en sorte que tout ce temps ne soit pas non plus de l’espace mentale. Cependant avec le travail d’écriture que je fais ici et ailleurs, j’ai l’impression que cela fluidifie énormément ma production écrite. Il y a un certain soin que j’apprends petit à petit à développer mes idées avec des mots et une forme de narration. Je sors de mes calculs, de mes systèmes d’idées et de mes pensées privées. Tout cela se manifeste par des retours positifs qui sont d’autant plus agréables dans la mesure où j’ai la sensation d’approcher une forme d’équilibre dynamique.

des peines

  • J’ai l’impression de me diluer dans les différentes possibilités. C’est un sentiment qui va et vient de façon chronique. Je réfléchissais au personnage de Nora dans Past Lives et son ambition poussée par la culture libérale de ses parents, et la dilution m’empêche souvent d’aller là où je pense vouloir aller. J’avais déjà une facilité à accumuler des hobbies et les objets qui vont avec ; sans aucun doute un mal très contemporain. Le covid et ses confinements ont fait exploser cette dynamique. Je me retrouve par exemple avec une étagère plein de matériel pour faire des maquettes et des gunpla, mais je ne sais pas si j’aurai à nouveau le temps de m’y remettre. À vrai dire, je me dis qu’il faut que je me débarrasse de tout cela d’une façon ou d’une autre, mais l’accumulation reste. Dans les bons, je pense à cette vidéo d’Adam Savage qui vend bien l’optimisme d’une démarche généraliste. Dire au revoir à toutes les personnes que je ne serai pas et toutes les proches qui vivent dans mes fictions intérieures est, en partie, triste. « Il y a ce qu’on perd, et ce que l’on trouve » comme dirait la mère de Nora. Il y a des tristesses qui ne sont pas des mauvaises choses.

en images

lu, vu ou joué

  • 📕 terminé L’île habitée dans l’intégral du cycle du midi d’Arkadi et Boris Strougatski
    • L’ascension réussie des 700 pages de The Unreal and the Real m’ont redonné assez de confiance pour me relancer pleinement dans la lecture de l’intégral du cycle du midi. Avant cela, j’avais l’intention d’en lire un morceau par-ci, par-là pour me ménager. J’avais aussi le compteur de livres lus selon l’ontologie de Goodreads qui me faisait un blocage complètement superflu. Je lirai ce livre jusqu’au bout et je compterai chaque roman comme un livre en soi. Les lectures précédentes de Le Guin sont également assez vivantes dans ma mémoire et j’apprécie beaucoup le décalage de leur univers par rapport aux canons de la SF. Il y a une vraie poésie et même une forme d’optimisme qui s’éloigne de l’utopisme technobéat.
  • 📕 terminé Blood in the Machine de Brian Merchant
    • Les ponts avec l’actualité sont importants, mais moins forts que ce que je pensais. Le détail historique est par contre fondamental. Cela m’a permis de remettre en cause mon usage du mot « luddite » comme une caractérisation positive d’une critique de l’automatisation. Je pense que c’est un terme à utiliser avec plus de subtilité. J’espère que des plumes effectives parleront de cet ouvrage et qu’il sera traduit pour avoir une discussion à son propos.
  • 📖 commencé Power and Progress de Daron Acemoglu
    • C’est le livre que j’avais prévu de lire, mais en faisant un détour par Power Games avant cela. Mais je n’avais pas encore mis de ce dernier dans ma liseuse alors j’ai commencé le livre d’Acemoglu pour voir et c’est tout bonnement passionnant. Je ne pensais pas que c’était une critique prenant les discours sur l’intelligence artificielle comme point de départ, mais c’est d’autant mieux.
  • 🎥 vu Past Lives de Celine Song
    • C’est un film émouvant, qui m’a bougé et me faire encore bougé. J’aimerais en dire beaucoup de choses, mais je suis encore en train de le digérer.
  • 📺 terminé Blue Eye Samurai avec le s01e08

les bons liens

chez les autres

un autre temps

 
Read more...

from pac

Dans The Atlantic, Adrienne LaFrance analyse l'idéologie de le techno-autoritarisme des patrons de la Tech.

Many Americans fret—rightfully—about the rising authoritarianism among MAGA Republicans, but they risk ignoring another ascendant force for illiberalism: the tantrum-prone and immensely powerful kings of tech.

Adrienne LaFrance compare le manifeste techno-optimiste de Marc Andreesden au manifeste futuriste de Marinetti.

In October, the venture capitalist and technocrat Marc Andreessen published on his firm’s website a stream-of-consciousness document he called “The Techno-Optimist Manifesto,” a 5,000-word ideological cocktail that eerily recalls, and specifically credits, Italian futurists such as Marinetti.

Les citations d'Andreessen sont effrayantes.

We believe in nature, but we also believe in overcoming nature. We are not primitives, cowering in fear of the lightning bolt. We are the apex predator; the lightning works for us.

To be clear, the Andreessen manifesto is not a fascist document, but it is an extremist one. He takes a reasonable position—that technology, on the whole, has dramatically improved human life—and warps it to reach the absurd conclusion that any attempt to restrain technological development under any circumstances is despicable.

xsv ⚰️, xan 🐣

Il y a quelques années, j'ai commencé à utiliser xsv, un outil hyper rapide développé en Rust pour manipuler des csv en ligne de commande. Le développeur ne maintient plus le projet mais le Medialab l'a forké, ajouté plein de fonctionnalités et renommé en Xan.

Ça a l'air très cool.

Du Bois challenge

@tomfevrier@mastodon.social relève le défi du Du Bois challenge

Observable Framework

Observable lance Observable Framework, un générateur de sites statiques pour générer des dashboards. Apparemment, on peut utiliser R, Python ou SQL pour le backend et du JavaScript pour le front.

C'est une alternative hyper interessante à Quarto Dashboard.

Voici la description de Mike Bostock.

With Framework, you can build the best data apps your team has ever seen. Framework combines the power of JavaScript on the front-end for interactive graphics with any language on the back-end for data preparation and analysis. Everything you need is at your fingertips: interactive charts and inputs, responsive grid layout, pleasing color themes, dark mode, keyboard-friendly navigation, blazing speed… and because it’s all code, there’s no limit to customization.

Sylvain Lesage (@severo@mastodon.social) a déjà expérimenté (https://mastodon.social/@severo/111936671570030173).

Autre bonne nouvelle : les utilisateurs qui disposent d'un compte gratuit peuvent de nouveau créer des notebooks privés. Cette fonctionnalité était passé en paywall en novembre 2022 malgré une vive protestation des utilisateurs.

Geekeries toujours

Maelle Salmon (@maelle@mastodon.social) a développé un package #Rstats pour convertir un Google Doc en Quarto Book.

 
Lire la suite...

from pac

Cartogrammes

Françoise Bahoken (@fbahoken@mapstodon.space) et Nicolas Lambert (@neocarto@vis.social) publient le code R pour réaliser des cartogrammes de Dorling et des cartogrammes par points.

Personnellement, depuis que j'ai découvert le cartogramme de Dorling, je trouve que c'est une représentation beaucoup plus intéressante que la carte choroplèthe. On évite le biais de représentation qui consiste à donner une plus grande importance aux entités avec une grande superficie.

En JavaScript, on peut facilement faire les mêmes cartogrammes avec Bertin.js (https://github.com/neocarto/bertin) ou Geoviz (https://neocarto.github.io/geoviz/)

Prompt engineering

FipAddict (@fipaddict@piaille.fr) publie un guide de prompt engineering assez bien fait.

On y apprend qu'il faut une dizaine d'heures pour apprendre à parler avec un LLM.

Travailler avec l'IA est étrange et ne vient pas avec un manuel d'instructions. La seule façon de devenir bon dans l'utilisation de l'IA est donc de l'utiliser. Ma règle générale est qu'il faut 10 heures d'utilisation avant de commencer à comprendre ces outils et leurs particularités. Citation d'un certain Ethan Mollick.

Il est conseiller de contextualiser.

Un excellent moyen pour commencer consiste souvent à donner une identité au modèle (ex : « Tu es journaliste à Libération », « Tu es un enseignant au lycée, etc.) afin de l’aider à adopter un positionnement et un vocabulaire adaptés.

Bien préciser le format de la réponse.

Au-delà du contexte de votre requête, il est également très utile de préciser la réponse attendue de la part de l’IA

Fournir quelques exemples pour obtenir des résultats précis.

Pour une tâche consistant à résumer en une phrase le contenu d’un amendement parlementaire, il a par exemple suffit de donner sept exemples au modèle dans la consigne initiale pour accroître significativement la qualité des résumés

Demander au modèle de procéder par étape.

, il est également possible d’améliorer considérablement la qualité des réponses en précisant dans le prompt qu’on souhaite que le modèle procède « étape par étape » pour élaborer sa réplique.

Sauvegarder les prompts qui marchent.

quand vous êtes amenés à effectuer des tâches répétitives, pensez à sauvegarder vos instructions afin de pouvoir les réutiliser, les améliorer au fil du temps… et les partager !

Transcription libre

Je découvre le projet Scribe (https://scribe.cemea.org/), développés par les Cemea pour faire de la transcription libre (as a service ou on premise). Ça s'appuie apparemment sur les données de Common Voice.

Marimo

Dans la première newsletter de Mario, Akshay Agrawal explique la genèse du projet.

When I was a PhD candidate, working on embeddings for machine learning and visualization, I used Jupyter notebooks almost daily — they were useful, but also very frustrating. Having seen engineers invent the future at Google Brain, I was convinced that there must be a way to build a better programming environment for working with data — one that made data tangible and actionable, while also solving the long list of problems that notebooks suffer from.

Akshay Agrawal ne manque pas d'ambition pour Mario :

Today, marimo is open source, and we’re dedicated to making it the best programming environment for doing research and communicating it; running computational experiments and scaling them; and learning computer science and teaching it.

IA et électricité

Dans The Atlas of AI, Kate Crawford parlait déjà des besoins de l'IA en électricité. À l'époque, je pensais qu'elle exagérait un peu. Aujourd'hui, le sujet est devenu mainstream.

Pour d’autres, miser sur l’apparition d’une telle électricité illimitée et décarbonée est un pari dangereux et une fuite en avant. Voire une ironie cruelle, à l’heure ou des apôtres de l’IA clament qu’elle peut « sauver le climat ». « Nous ne pouvons pas générer plus d’énergie par magie. Il faut arrêter de mettre de l’IA générative partout et réduire sa consommation, immédiatement », a tweeté Sasha Luccioni, de la start-up d’IA Hugging Face.

Datatouille

@cquest@amicale.net est taquin : https://amicale.net/@cquest/111892288623656883

Poubellocene

Dans Le Monde, Claire Legros synthétise les recherches récentes autour des déchets. L'article est plein de références qui ont l'air passionnantes.

le déchet, à la croisée de l’intime et du collectif, est une affaire d’affect autant que de technique et surtout un « matériau politique, par sa présence dans l’espace public et ses effets, mais aussi par les choix qu’il impose », souligne la socio-anthropologue Nathalie Ortar, l’une des coordinatrices de l’ouvrage collectif Jeux de pouvoir dans nos poubelles.

Jusqu’à la fin du XIXe siècle, en effet, la notion de déchet telle qu’on l’entend aujourd’hui n’existe pas.

C'est l'invention des déchets chimiques qui met fin à la réutilisation des déchets comme engrais.

A partir de la seconde moitié du XIXe siècle apparaissent de nouveaux engrais fossiles ou chimiques, comme le guano, le nitrate de soude et les phosphates, qui vont progressivement remplacer les boues urbaines et la « poudrette » des fosses d’aisance dans le domaine agricole.

Avec le développement de l’hygiénisme, les ordures sont enfermées dans des boîtes, bientôt appelées poubelles, puis éloignées dans de vastes dépotoirs creusés en périphérie des villes. Les excréments, de leur côté, sont rejetés dans les nouveaux systèmes de tout-à-l’égout et finissent souvent dans les rivières.

« Les pratiques de recyclage peuvent être intéressantes à condition que soient remises en cause les logiques de surconsommation, car, sinon, elles tendent à les aggraver en encourageant plutôt une forme d’effet rebond et de désinhibition. Les meilleurs élèves du recyclage, comme la Suède ou l’Allemagne, sont aussi les pays qui produisent le plus de déchets », regrette Baptiste Monsaingeon.

Notes

 
Lire la suite...

from weeknotes

Une autre semaine remplie de la banalité absurde de notre système social. Le Guin dit que l’important ce n’est pas de vivre de choses spectaculaires pour avoir quelque chose à raconter, mais simplement de cultiver sa vie intérieure. Ou quelque chose comme ça. Ces textes assez personnels s’inscrivent dans cette démarche de documenter notre époque depuis l’intérieur. Je vois aussi l'exercice comme une newsletter qui ne passe pas par l’email.

qu’est-ce qui s’est passé ?

  • j’ai eu le temps de mettre quelques nouvelles entrées sur jop2024.lol.
  • j’ai reçu un nouveau téléphone le jour où le constructeur a fermé ses portes.
  • la mise à jour de sécurité de mastodon m’a rapidement alarmé. J’ai fait la mise à jour qui a déclenché une série de petits problèmes résolus, et sans impact, mais qui m’a occupé plusieurs soirées.

des joies

  • Le gouvernement a lancé une campagne de communication autour des jeux olympiques et paralympiques, et leur conséquence pour les citoyens villes accueillant des épreuves ou des événements. Le nom du site web de cette communication est https://anticiperlesjeux.gouv.fr plutôt que de me lancer dans un grand projet qui ne verra jamais le jour, j’ai déterré mon vieux nom de domaine gouv.lol et mis une redirection sur le sous-domaine https://anticiperlesjeux.gouv.lol. Cela ne m’a pas empêché de cogiter tout seul sur ce que pourrait être une réponse pertinente, mais en attendant j’ai tout de même un sentiment de travail accompli parce que le résultat est déjà là sans que cela me coûte trop de temps. C’est important dans ce petit moment de guérilla où l’asymétrie de moyen est démesurée.
  • À la naissance du second enfant, j’ai acheté un téléphone Punk MP02 pour son esthétique, sa simplicité et son absence d’artefact Google malgré Android comme OS. Il y avait quelques usages qui me manquaient cependant dont ma banque qui force l’usage d’une app distribuée sur le duopole Apple App Store et Google Play Store. Signal et What’s App nécessitent également une version sur un smartphone pour activer la version desktop. J’avais tenté de simuler un terminal Android, mais je n’ai jamais réussi. J’avais donc toujours mon iPhone qui trainait quelque part et me servait par intermittence. J’ai fini par acheter un Cat S22 Flip, dont le fabricant a déposé le bilan le jour de la réception. Cela reste un téléphone Android avec du Google, mais j’ai pu facilement cacher ou supprimer ce qui ne m’allait pas. Je regarderai une autre fois pour le rendre complètement propre. En attendant, le clavier à l’ancienne me donne l’impression que j’ai un dumbphone et je vais enfin pouvoir refiler mon iPhone à quelqu’un de mon entourage qui en fera un meilleur usage. C’est la touche finale à ma sortie, personnelle, de l’écosystème et cela fait un bien fou.
  • J’avais commencé un brouillon d’article sur Taylor Swift avec une composition d’angles que je n’ai pas trouvés dans les médias dominants ou spécialisés. Le problème est qu’il y a des actualités autour de cette personnalité tous les deux jours, ce qui repousse la publication indéfiniment et transforme le brouillon en monstre de Frankenstein. Comparer mes notes, bien que privées, avec ce qui est publié me donne du baume au cœur et un feedback plutôt positif sur ma pratique informationnelle.
  • J’avais plein de projets pour soirée de samedi à domicile une fois que les enfants seraient couchés, mais je me suis endormi en berçant le plus petit. J’ai tenté sans forcer de « faire des choses », mais au final j’étais bien content d’éteindre mon exploitant intérieur et de me plonger dans la lecture douillette d’un livre.
  • Sur le chemin d’une séance de cinéma, j’en ai profité, n’étant attendu nulle part, pour marcher quelques dizaines de minutes. L’occasion de prendre des photos pour constater qu’on a les yeux bien ouverts. Cela ne donnera certainement pas de grandes réussites, mais c’est quand même un plaisir important du quotidien.

lu, vu, joué, écouté

  • écouté en boucle Plastic Love de Mariya Takeuchi et Stay With Me de Miki Matsubara ainsi que des playlists de City Pop
    • L’insouciance mélancolique des paroles qui d’une certaine me rappelle High Fidelity de Nick Hornby. C’est aussi un bon prolongement de mon voyage imaginaire au Japon de ces dernières semaines. J’ai aussi découvert qu’il y a un effet de l’algorithme de YouTube et les quelques commentaires que j’ai regardés me laissent croire qu’ils ont été écrits avec IA. J’aurai du mal à en recommander une.
  • 📕 terminé The Unreal and the Real d’Ursula Le Guin
    • J’ai beaucoup apprécié les indications à la fin pour les clubs de lecture. Curieusement, j’ai lu le second volume beaucoup plus vite que la première partie. Peut-être parce que ce sont plus des fables et je voyais mieux l’intention narrative ainsi que le cheminement de question de Le Guin. L’habillage historique du premier volume avait tendance à me distraire alors que les contours SF et fantastiques du second m’indiquent clairement qu’est-ce qui est de l’ordre du décor(atif) et de la morale. Retrouver l’univers du Hainish Cycle est un plaisir appréciable également.
  • 🎥 vu Argylle au MK2 Bibliothèque
    • L’implication de Taylor Swift dans une rumeur concernant de film m’avait intrigué et j’étais toujours dans le brouillon de mon propre article. Cela ne vaut franchement pas le détour. Il n’est diffusé que dans un seul Mk2. Je me suis endormi devant The King's Man le lendemain.
  • 📺️ regardé Blue Eye Samurai s01e07
    • On s’approche de la fin et c’est regrettable, je ne sais pas trop ce que je pourrai regarder pendant les pauses déjeuner où je suis seul à la maison en télétravail. Je n’arrive pas à lire en mangeant, mais j’apprécie aussi ne rien faire d’autre que prendre mon temps pour manger.
  • 📺️ regardé Pokémon Concierge
    • Le générique est une chanson de Mariya Takeuchi.
  • 📖 continué ma lente progression dans The Blood in the Machine de Brian Merchant
    • Maintenant que j’ai terminé le pavé de Le Guin, je vais me concentrer exclusivement sur ce livre qui reste bien trop intéressant pour perdre patience et passer à autre chose ou en le terminer en lecture rapide.

ma toile d’annotations

chez les autres

les années d'avant

 
Read more...

from pac

IA et journalisme

Le New York Times crée une équipe pluridisciplinaire pour explorer les possibilités de l'IA générative pour le journal.

On ne sait pas encore vraiment comment utiliser intelligemment l'IA générative dans la le journalisme mais je pense que créer une petite équipe en mélangeant les compétences tech et éditoriale, c'est la meilleure manière d'expérimenter.

Faudra-t-il des méga bassines pour l'IA ?

Un papier de recherche publié en 2023 sur ArXiv évalue les besoins en eau de l'IA.

training GPT-3 in Microsoft's state-of-the-art U.S. data centers can directly evaporate 700,000 liters of clean freshwater, but such information has been kept a secret.

More critically, the global AI demand may be accountable for 4.2 — 6.6 billion cubic meters of water withdrawal in 2027, which is more than the total annual water withdrawal of 4 — 6 Denmark or half of the United Kingdom.

Modern Polars

J'ai toujours pas eu l'occasion d'utiliser Polars en vrai mais j'aimerais bien. Kevin Heavey montre que Polars a pas mal d'avantages par rapport à Pandas.

Le zoo de l'IA

La revue d'anthropologie Terrain lance un call for papers pour un numéro consacré au « bestiaire de l'IA ».

Perceptron, Eliza, MYCIN, Bob, Clippy, Infobot, SmarterChild, Siri, Alexa, Image Net, espace latent, DeepDream, GAN, Zoetrope, Jax, GPT2, TensorFlow, Deep Fake, Colab, Disco Diffusion, TPU, Dall-E, Prompt, ChatGPT, Bard, Claude, Laion, Ernie, Stable Diffusion, Lora, Bark, Midjourney, etc. The list of material, conceptual and imaginary entities created by techniques of Artificial Intelligence, which have gradually become part of our daily lives, is growing ever longer, forming a gigantic zoo. Hence the ambition of this special issue: if we had to make a bestiary of AI systems, what form should it take?

Let's face it, we evolve within this great artificial zoo, testing quite hastily some of these systems, curiously equipped with the wrong theories and a whole host of pre-conceptions or misconceptions about intelligence, the non-human, the living and the non-living.

On est toujours dans l'ambiguïté entre prêter des qualités humaines aux systèmes d'IA tout en voulant garder une distinction homme-machine.

These AI systems have a name, they are equipped with a power to act modelled on human, animal or monstrous beings, and sometimes with a physical appearance inspired by such entities. But as soon as it's time for reasonable people to make a real decision about these entities, we are careful not to grant them a vital principle, sentience, intelligence or subjectivity. “We know they're only machines, but still...” perhaps because, through them, those faculties we too readily attribute to human beings can be put back into play.

J'ai hâte de voir ce que ça donnera.

DuBois Challenge

La Data Visualization Society lance le DuBois challenge pour reproduire les œuvres de W. E.B. Du Bois avec des outils modernes.

Lire aussi

 
Lire la suite...

from weeknotes

Une semaine assez banale. Il y a toujours quelque chose à raconter et je prends du plaisir à écrire ces notes. Si vous voulez quelques nouvelles, c’est par ici.

quoi de neuf ?

  • je me suis inscrit au pass culture de la BnF pour avoir accès à europresse et pressreader.
  • je suis allé voir du côté de boom boom villette, qui remplacé Vill'Up à côté de la Cité des Sciences/Enfants,
  • et j’y ai pris quelques photos.

des joies

  • J’ai très bien avancé sur jop2024.lol dans ma lancée de la semaine dernière. Il reste encore quelques petites histoires qui sont restées en plan, mais j’ai une version que je peux maintenir au fil de l’eau. Il y a un pont à faire avec les JOP de Tokyo, mais aussi de quoi alimenter une base documentaire pour toutes les itérations. Pour préparer le terrain pour la couverture critique des JOP d’hiver de 2030 par exemple. Une autre prochaine possibilité qui traine dans mon esprit est un système de pronostic avec la génération d’un Brier score pour s’entrainer au forecasting ?
  • J’ai pris quelques clichés avec mon Ricoh GR en me souvenant presque immédiatement de l’intention de mes réglages et de mes usages. L’appareil est bien loin d’avoir la tactilité satisfaisante du X-Pro1, mais il est toujours dans ma poche, et j’ai réussi à l’en sortir. Je n’ai pas encore de processus pour sortir les images de l’appareil par contre. Cela peut attendre, je suis déjà content de réussir à prendre le temps de regarder autour de moi quand je marche, seul ou non, tout en retrouvant le fil de mes séries potentielles. Avec la destination, en vue, d’alimenter à nouveau mon compte pixelfed, j’ai bien l’impression de m’y remettre calmement.

des peines

  • Une petite fatigue s’installe. Je n’arrive pas à lire le matin quand je prends le métro. Je somnole au bord de l’assoupissement. J’ai posé quelques congés pendant les vacances scolaires. Ouf.
  • Je m’étais donné pour objectif de publier un article long sur https://write.apreslanu.it/tk toutes les deux semaines. En ratant l’échéance, je suis passé à autre chose bien que les brouillons continuent à s’accumuler. Les textes recommencent à s’écrire dans ma tête sans en sortir. Stratégiquement, ce n’est pas le moment de passer en 4/5 pour avoir du temps pour ce genre de projets perso, mais j’ai de l’espoir que cela soit une possibilité dans un avenir proche.

lu, vu, joué

  • 📖 fini la première partie de The Unreal and the Real
    • Le Guin s’amuse beaucoup a laissé au lecteur le choisir quelle partie est à propos du réel. La notion de réalisme concerne plus le décor qu’autre chose. Dans la première partie, elle emprunte beaucoup à l’imaginaire et le symbolisme des native americans. On y retrouve ses grandes histoires et permet d’observer son jeu d’écriture, comment elle choisit un genre ou un autre pour raconter. Cela m’a rappelé ses conseils d’écriture de Steering the Craft. Ces nouvelles permettent de la voir faire avec rapidité et concision.
  • 📖 poursuivi lentement, mais attentivement lecture de Blood in the Machine
    • Je n’ai pas eu beaucoup d’occasions de lire le matin et je prends beaucoup de notes. Ce livre continue d’être une lecture passionnante. Je pense que je me concentrerai dessus si je termine The Unreal and the Real avant.
  • 📺️ regardé Blue Eye Samurai s01e06
  • 🎥 vu L’innocence de Hirokazu Kore-Eda
    • Film très touchant. Je suis en admiration devant le jeu d’acteurs des enfants. Une bande-son de Ryuichi Sakamoto qui est aussi un hommage posthume. Je ne sais pas si j’arriverai à trouver qui me fera continuer à voyager au Japon. J’aime bien les ambiances hors de Tokyo, plus particulièrement dans l’arrière-pays. Ici, c’est une métropole qui ne dit pas son nom, mais qui est certainement reconnaissable.
  • 🎥 vu Léo, la fabuleuse histoire de Léonard de Vinci de Jim Capobianco et Pierre-Luc Granjon
    • Tombé par hasard sur l’avant-première avec l’équipe, dont Juliette Armanet qui prête sa voix à Marguerit de Navarre. Le film est gentil, c’était bien pour un enfant de 5 ans. Il ne montre pas grand-chose du talent de Léonard De Vinci en lui-même, c’est très invocatoire. Cela m’a donné envie de relire les bandes dessinées Léonard et de les faire découvrir au plus grand si cela n’a pas trop mal vieilli.
  • 🎙️ Prologue to Ursula K. Le Guin (Imaginary Worlds)
    • Un épisode de podcast très intéressant qui revient sur l’héritage, en bien et en mal, de la culture ainsi que du parcours de ses parents.
  • 🎧 écouté Philip Glass Solo disponible sur bandcamp.
    • Cela faisait un moment que je n’avais pas écouté Glass. En regardant vite fait, je remarque aussi qu’on peut trouver des cassettes originales à un prix raisonnable.

les quelques pages que j’ai annotées

chez les autres

les années qui passent

 
Lire la suite...

from pac

JO et qualité de l'eau

Mathieu Lehot (@math_lehot@mastodon.zaclys.com) s'est plongé dans les données de qualité de l'eau de la Seine.

Palettes

En R, @emilhvitfeldt@fosstodon.org a ajouté de nombreuses palettes à son package {paletteer}

En JS, je découvre dicopal développé par @neocarto@vis.social.

Un nouveau kernel R pour Jupyter

Romain François (@romainfrancois@mastodon.social), très connu dans la communauté R, s'est associé à QuantStack, une boîte de pythonistes très impliqués dans le projet Jupyter, pour développer un nouveau kernel R pour Jupyter. Ça a l'air très prometteur.

Today, we, a collaborative team led by Romain François and supported by QuantStack, are thrilled to announce the initial release of Xeus-R, a future-proof Jupyter kernel for R. Xeus-R builds upon the components of Xeus to facilitate the use of R in Jupyter notebooks and already supports typical capabilities: R code execution, inspection, completion, and contextual help.

The recent advancements in support for WebAssembly in the R world led by the WebR project, the flexible design of Xeus, and the rise of JupyterLite all contribute to our strong belief that Xeus-R has the potential to deliver Jupyter in-browser experience for data scientists using R.

Newletters

Mathilde Saliou (@mathildesaliou@piaille.fr), journaliste à Next et autrice de TechnoFeminisme, lance une nouvelle newsletter intitulée Technoculture.

Pseudonymisation des décisions de justice

Quel plaisir de découvrir que le dernier épisode du Code a changé, le podcast de Xavier de la Porte, porte sur le projet de pseudonymisation des décisions de justice de la Cour de cassation, un projet que j'ai accompagné depuis le début dans mes précédentes fonctions à Etalab.

J'avais rencontré Camille Girard-Chanudet au début de sa thèse, au moment où elle cherchait un terrain d'enquête. Son travail, qui montre le rôle central des annotatrices.

Je suis assez admiratif de comment en quelques années la Cour de cassation a réussi à mettre en production un algo de pseudonymisation, en internalisant à la fois la data science et l'annotation.

Mapstodon

Étienne Come a mis à jour sa cartographie des instances Mastodon.

On voit notamment l'importance de l'écosystème japonais sur Mastodon.

Les données de la démocratie

Samuel Goeta (@samgoeta@mastodon.social) publie en février ''Les données de la démocratie: open data, pouvoir et contre-pouvoir'' chez C&F.

Sparklines

La dernière version du package #rstats 'gt' permet de faire des sparklines facilement.

 
Lire la suite...

from weeknotes

Semaine assez anodine, mais quelque part assez pleine aussi. Wholesome comme c’est parfois écrit. J’en garde quelques traces dans cette note rapide.

il s’est passé quoi de notable cette semaine ?

des joies

  • j’ai apprécié m’occuper de jop2024.lol. Les jeux olympiques et paralympiques m’occupent l’esprit depuis presque 10 ans avec un sentiment d’inéluctabilité grandissant. Consigner à la volée les dernières actualités n’auront certainement pas un grand effet sur la marche monde, mais cela m’aide beaucoup à rester sain d’esprit et me débarrasser du sujet plutôt que de le laisser tourner en rond dans mon esprit. De plus, cela me permet aussi de m’entrainer à bâtonner de la dépêche comme on dit chez les journalistes. Dans un contexte moins traumatisant qu’un desk le week-end certes.
  • l’usage du hhkb devient moins poussif sans être encore fluide et j’adore son petit son feutré. Écrire avec me donne aussi un petit plaisir auditif.

des peines

  • il y a des semaines où je me sens productif et d’autres pas du tout. C’est assez décorrélé de ma productivité effective. C’est surtout un ressenti par rapport à la pression qu’on me met ou que je me mets à moi-même. J’essaie de retourner cette question de la gestion du temps en objective son contexte capitaliste. Je n’ai jamais relié mes problèmes d’attention à la question du trouble. Je me dis que c’est temporaire, contextuel et environnemental. Je vis dans le monde tel qu’il est et je subis des pratiques de domination, d’exploitation et d’oppression, bref le travail dans une atmosphère capitaliste. Cette problématisation me permet de me sortir du côté pénible où je subis un vécu du temps qui n’est pas le mien en l’objectivant. Je le vis moins comme un problème intérieur. Je vis avec mon temps qui n’est pas celui de tous les autres. Au moins, je sais où est la ligne de front. Par exemple, est-ce que travailler, c’est produire l’équivalent d’un certain temps fini d’effort ou produire quelque chose ou avoir un effet sur mon environnement ? Le statut de cadre devrait me permettre de trancher cette question et pourtant c’est souvent ambigu. Je ne pense pas non plus que le travail indépendant soit une solution (qui me convienne).

lu, vu, joué

  • 📖 commencé la lecture de The Unreal and the Real d’Ursula Le Guin
    • On dirait une mise en application condensée des propos qu’elle tient dans The Language of the Night. J’alterne entre la liseuse et la version papier de 700 pages grand format. Le temps de lecture est certainement équivalent à ce qui me reste du & Cycle du Midi, mais le format est juste pas pratique. Le Guin fait quelques compliments aux Strougatski ce qui m’incite à faire l’effort dans la foulée.
  • 📖 continué la lecture de Blood in the Machine de Brian Merchant
  • 🕹️ bien avancé dans Super Mario Bros Wonders.
    • Je sais, c’est un jeu facile qui est censé se terminer rapidement, mais j’y joue par session de 10 minutes par-ci par-là quand j’ai un calcul qui dure et que je n’ai pas de conversation à rattraper.
  • 📺 regardé Scavengers Reign s01e02.
    • Plaisant bien que je ne sois pas très amateur des esthétiques organiques comme Nausicaa.
  • 📺 regardé Echo s01e03
  • 🎥 vu Perfect Days de Wim Wenders au cinéma
    • Très bon film plein d’attention. La bande-son est une vraie madeleine de Proust pour les personnes ayant traversé les années 80-90. J’ai demandé et je devrais récupérer mon baladeur de jeunesse bientôt. J’ai hâte de me refaire une petite collection de mixtapes et de les partager avec les enfants.

quelques pages que j’ai annotées

chez les autres

archives

 
Lire la suite...

from chemins invisibles

À la suite de deux articles de The Markup sur le scraping, j’en profite pour revenir sur ce morceau important du web et articuler quelques clés de lecture. Qu’est-ce c’est ? Pourquoi est-ce important ? Et quelques contextes d’usage avec leurs enjeux.

Il y a quelques approximations par esprit de concision. Pardon par avance.

Qu’est-ce que c’est ?

Le scraping est l’opération consistant à extraire systématiquement de l’information d’un ensemble de pages web (un site en particulier, une pelote de liens, etc.) pour constituer un jeu de données (les données, les changements dans ces données, etc.) qui pourra éventuellement servir à produire une nouvelle information (comparaison, vue macro, etc.). Une fois automatisée, cela permet de changer, l’échelle en quantité et en temporalité, des informations provenant du web. Cela en fait un élément important de l’écologie de la connaissance dans notre univers hypermédiatique.

Le scraping mobilise les tâches suivantes :

  • naviguer sur des pages web, c.-à-d. au format HTML,
  • extraire l’information de ces pages,
  • et de l’organiser sous la forme d’une base de données, un fichier ou des fichiers, bref, restructurer l’information différement.

Le degré zéro est de le faire soit même à la main. Il y a longtemps, il y avait même des extensions pour navigateurs, par exemple navicrawler du Medialab de Sciences Po, pour aider à cela. La plupart du temps, c’est un script dans un langage comme python qui permet d’automatiser la partie répétitive.

Pour abstraire et généraliser l’extraction d’information, il faut souvent une compétence de compréhension de la structure d’une page web, c.-à-d. savoir lire du HTML, et en comprendre la syntaxe. Bien heureusement, le web est une technologie fondamentalement ouverte et tous les navigateurs permettent d’afficher le code source d’une page en deux clics (clic droit, voir le code source, clic gauche). Si vous entendez parler d’« inspecter le code source », c’est cela, une manipulation qui permet de relier un élément visuel avec un morceau de langage technique décrivant cet élément. Le jeu est alors de trouver le motif permettant de rassembler tous les éléments semblables.

Certains éditeurs de site web cherchent à empêcher ce genre d’opération, il n’est alors pas rare d’utiliser à nouveau un script qui va simuler des séries d’actions humaines dans un navigateur web. Redonnant ainsi un sens au terme de user agent qui permettait d’identifier un navigateur comme un instrument d’agissement (ou d’agentivité) d’un utilisateur.

Pourquoi est-ce important ?

Le scraping et sa continuité de pratiques sont importants, car dans le paradigme marketing actuel de l’intelligence artificielle, ce qui est automatisable a une bonne probabilité d’être recyclé comme un service payant avec un travail qui est surtout de la conception d’interface utilisateur, mais comme le design ne paie plus on parle de « robot » et d’« intelligence artificielle ». Browse.ai est un exemple de ce genre de maquillage. D’ailleurs, tout cela pourrait être fait avec du travail humain en exploitant un service comme Mechanical Turk d’Amazon et cela resterait du scraping. La différence notable est la responsabilité de l’usage de technologie et la volonté de fermer les yeux, ou non, sur les conditions d’extraction et d’exploitation du travail. Dans ce contexte, la notion de compétence est également importante, car, bien que technique, savoir lire du HTML est une connaissance nécessaire et normalement relativement facile d’accès. On n’est pas dans des affres de complexité et un minimum de pédagogie fait l’affaire. La promesse du no-code de l’intelligence artificielle est une barrière à cela et empêche la résolution du moindre problème ainsi que l’identification d’erreurs. C’est une dépendance directe au bon vouloir d’une entreprise/d’un service en fonction des orientations managériales et du marché. Dit autrement, le scraping est un bon cas pour ouvrir les différentes problématiques sociales invisibilisées dans le paradigme dans lequel nous sommes plongés depuis quelques années et accélérer par le succès commercial de OpenAI.

L’autre point important est la complexification des technologies web. La professionnalisation des métiers du web et l’économie numérique alimentant un besoin de produire de plus en plus de pages amènent à un amoncellement de nouvelles solutions pour résoudre des problèmes sauf que chaque solution vient avec ses propres problèmes. Pour mettre une page web en ligne, on est bien loin du glisser-déposer d’un fichier vers le FTP fourni gratuitement avec son accès à Internet. Souvent, pas toujours, un site web est plus une surcouche sur une API, un point d’accès programmatique, qui permet de générer des pages et d’avoir une gestion plus dynamique de son contenu que le modèle standard de la page web. Par exemple, plutôt que de faire une page différente par personne côté serveur, on va demander au navigateur d’aller récupérer des informations en parallèle et le laisser modifier la page à un endroit qui sera indiqué par avance. Schématiquement. Une solution de repli pour l’extraction d’information est alors d’aller la chercher dans l’API. On s’éloigne alors petit à petit du scraping et de ce que percoit normalement un navigateur et donc du contexte de lecture ainsi que les différentes transformations possibles. L’information récupérée de cette façon est souvent déjà structurée et ainsi plus propre.

Quels sont les enjeux ?

commerciaux

Commençons par les choses qui fâchent. Le scraping a une fonction importante dans l’économie numérique. Les premiers comparateurs de prix utilisaient du scraping pour alimenter leurs contenus avant l’avènement du hangar global. Marc Zuckerberg a scrapé les trombinoscopes, les facebooks, de sa fac pour en faire une compétition assez malsaine et à la mode à l’époque. Les startups sont friandes de données personnelles laissées à l’air libre pour alimenter des bases de données prospectives. Laisser son email en clair sur une page web, c’est s’assurer de retrouver sa boite inondée de publicités. Avoir un profil public github, la plateforme de Microsoft pour publier du code, c’est aussi la garantie de se faire prospecter de façon régulière à propos de nouveaux projets crypto.

À ce titre, la CNIL est sur le coup et rappelle que c’est interdit. Par contre, aller piller les autres boîtes, c’est une autre histoire. Cousin proche du scraping, il y a un crawling qui indexe le contenu des pages pour les indexer dans un moteur de recherche. La différence, c’est peut-être que le crawling est anticipé, et optimisé, par les éditeurs de site web. Ça s’appelle du SEO, ce n’est pas beau à voir et c’est une tout autre histoire.

Dans une autre mesure, la possibilité de scraper le web est un dommage collatéral de la volonté des acteurs du web commercial à extraire une valeur économique de l’attention des internautes. Afin de pouvoir assurer l’exposition à des publicités, Google cherche ainsi à contrôler la lecture d’une page web avec tout un tas de complications dont l’excuse est l’intégrité de ce qui est déclenché. C’est assez fallacieux et c’est un problème qui se mord la queue dans la mesure où le principal risque est les programmes malveillants qui se propagent par l’intermédiaire du réseau des bannières publicitaires. C’est une bataille du web en cours et le soutien, par l’usage, de Firefox est vital.

recherche

Côté recherche, il y a diverses problématiques allant de la conservation à l’analyse du langage naturel ou bien l’analyse des réseaux sociaux.

La plus importante est l’archivage du web et sa conservation. De la même façon que les crawlers commerciaux, l’enjeu est de conserver de façon intacte le maximum de choses possibles. Cela concerne des projets comme l’emblématique archive.org et l’archivage du web de la BnF et de l’INA.

Une autre problématique est l’analyse des controverses et le champ précédent des digital methods qui utilisent les matériaux comme un matériau pour construire des cartographies. C’est beaucoup plus que cela, mais il y a des livres très bien sur le sujet comme Controversy Mapping de Venturini et Munk.

journalisme

https://themarkup.org/hello-world/2023/12/16/how-elon-musk-is-trying-to-make-web-scraping-dangerous-again

https://themarkup.org/news/2020/12/03/why-web-scraping-is-vital-to-democracy

The Markup est un média US dont la thématique est la technologie. N’en faisant pas seulement un sujet, les journalistes de cette rédaction mobilisent régulièrement des méthodologies d’extraction d’information qu’il serait laborieux de faire manuellement. À ce titre, ils soulignent que le scraping du web est important d’un point de vue démocratique et central dans certaines de leurs enquêtes. Cela dérange assez les gros acteurs pour que cela se termine devant la justice avec de gros enjeux de régulation.

La question que je me pose alors est le lien entre pratique du scraping dans les rédactions françaises et la faiblesse du journalisme de données, en tant que champ, en France. Si vous êtes journaliste et que vous scrapez le web pour vos articles, cela m’intéresse d’en discuter dans le cadre d’une étude au long cours sur vos pratiques.

société civile

La transparence et l’accès de l’information sont également importants pour la société civile et l’existence d’un écosystème citoyen qui ne soient pas dans une confrontation constante avec la sphère marchande et la sphère administrative.

Laisser la possibilité de construire de l’information publique et de nouveaux services, comme vite ma dose, est un signe de santé démocratique, car il est alors possible de construire des communs et, enfin, orienter des technologies vers plus d’inclusion, de solidarité et de compréhension des collectifs.

L’association UFC-Que Choisir construit ainsi une cartographie des drives à partir d’un scraping des sites des différentes enseignes. À partir de là, il fournit un indicateur de coût du panier moyen selon les profils de ménage. Avec un peu de travail, il est possible de scraper à nouveau ces pages pour les transformer en données tabulaires permettant des analyses alternatives et de nouvelles mises en récit.

conclusion

Le scraping est symbolique de la possibilité de prendre du recul, d’avoir une vue d’ensemble, à propos du web et de ce qui y circule. Certainement pas une pratique quotidienne pour l’internaute moyen, c’est un indicateur de la frontière entre ce qui est ouvert ou ne l’est pas sur le web. À ce titre, sa pratique permet de mesurer la surface du web comme espace public. Une trajectoire vers moins de contenus qui seraient disponibles au regard des internautes par cet intermédiaire est indicateur d’une opacité de l’information. Les grandes entreprises technologiques, et les gouvernements, en parallèle, bénéficient d’une grande transparence sur nos données individuelles. Comme dirait Cory Doctorow à propos de l’interopérabilité, le scraping est une condition nécessaire, mais pas suffisante pour un futur désirable où Internet reste omniprésent. Autrement dit, Internet ne peut pas être une technologie sociale si le web ne reste pas ouvert et s’il n’y a pas la possibilité de construire une écologie de la connaissance où le contrôle technique ne serait pas du côté des citoyens.

Du côté de la production de contenus, de pages et de sites web, il est ainsi important d’avoir cette intention du web comme commun et espace public. La prolifération des applications pour smartphones (à 99,9 % réservées aux jardins/enclos d’Apple et de Google) est ainsi un grand pas vers la clôture du web et par extension de l’information comme moteur de la démocratie.

type : #analyse sujets : #openweb #scraping

 
Lire la suite...

from chemins invisibles

Substack est une plateforme mettant en relation des auteurs et des publics. L'intérêt du site est la mise à disposition d'un paywall, c.-à-d. la gestion d'un accès à des contenus conditionnés par un abonnement mensuel ou annuel. Substack prenant une commission sur chacun des abonnements. C'est un site relativement méconnu en France, hormis quelques niches adjacentes à la culture américaine où Substack est un peu plus populaire dues à la présence importante de la culture californienne parmi les élites. Depuis quelques jours, le site se retrouve très justement critiqué pour son soutien à des auteurs d'extrême droite et pour certains ouvertement et littéralement nazis.

https://www.theatlantic.com/ideas/archive/2023/11/substack-extremism-nazi-white-supremacy-newsletters/676156/

Quelques semaines auparavant, un article de The Atlantic revenait sur la présence de nazis sur la plateforme Substack. La défense des fondateurs de l'entreprise repose sur une vision néo-libérale de la liberté d'expression. Un laissez-faire maximaliste où tout se vaut et le marché des idées fera le tri. On est en 2023 et ce n'est pas plus une prophétie que de dire que cette idée d'autorégulation des idées est tout bonnement une fable avec des conséquences importantes.

https://substack.com/@hamish/note/c-45811343

Deux lettres ouvertes plus tard, la direction de Substack répond enfin à la controverse. Ils réitèrent sur une critique de la censure. C'est un point assez hypocrite. Leurs conditions d'utilisations comportent des critères assez clairs (). De plus, ils ont déjà choisi d'exclure certains contenus. Être ouvertement nazi et tenir des propos racistes est ok tant que c'est poli et pas “haineux”. En ne cherchant pas très vigoureusement, il est facile de trouver un substack avec la charte graphique du parti nazi (rouge, blanc, noir, Fraktur, croix gammées, drapeaux, etc.).

Une des conditions est par exemple de ne pas accepter de productions qui sont par ailleurs bannies de leur solution de micropaiement, Stripe. Or, il se trouve que certains auteurs sont bannis de Stripe pour leurs propos racistes, mais se retrouvent accueillis chez Substack avec une solution de contournement et une autre prestataire de transaction que Stripe.

La question de la microtransaction est le cœur de la plateforme. L'entreprise fait la promesse d'une rencontre d’une activité d'écriture, d’un lectorat et d’une rémunération plus ou moins conséquente. Ainsi au-delà de la simple tolérance, en contribuant à l'exposition d'auteurs fascistes, Substack leur donne une audience décuplée par l'effet de réseau, les personnes qui viennent sur substack pour d'autres raisons, mais surtout par la mise en avant de ces auteurs en les invitant à des moments éditoriaux privilégiés comme au principal podcast dédié au site, The Active Voice, sans aucune prévention ni contre-mesure.

Dans une certaine mesure, Substack est dans les pas de Medium. Ces deux entreprises ont longtemps cherché à séduire des auteurs provenant du monde journalistique et leur fournissant salaire et travail de support (éditeur, producteur de podcast). Medium cherche encore son modèle économique après de nombreuses tentatives et de changements, “l'entreprise pivote” dans le jargon de l'économie numérique, en laissant de côté des journalistes qu'elle a embauchés pour voir avant de changer d'avis. Leur modèle est actuellement un abonnement unique et une vague redistribution en fonction de l'audience. Les contenus produits le sont souvent gratuitement et se retrouvent derrière une page d'abonnement obligatoire, un paywall. Substack fait le pari d'une rémunération individualisée en fonction du nombre d'abonnements et une taxe de 10% générant un bel effet de longue traine. C'est le degré zéro dû capitalisme de plateforme. C'est aussi une logique individualiste qui met les en compétition les auteurs entre eux, le budget des lecteurs n'étant pas infini, il faut bien choisir quels contenus privilégiés, on va avoir accès. Chacun paie aussi pour sa newsletter et pour chaque auteur. C'est souvent entre 5 et 15 euros par mois, ce qui est assez voisin du tarif des médias traditionnels pour un journal entier. Il n'y a pas de partage économique et au mieux un partage d'audience à travers un système de connivence. C'est aussi une atomisation des pratiques éditoriales, tout est attaché à un nom propre, singulier et rares sont les productions collectives. En l'absence d'une quelconque forme de redistribution équitable, c'est un appauvrissement général, la concentration des revenus économiques dans une très petite fraction des producteurs de contenus, et une belle rente pour Substack. Le modèle économique est déjà bien éprouvé sauf qu'ici, on parle d'être alimenté par de l'argent sale et de financer des personnes exécrables.

Au départ, Substack est une plateforme pour faire des newsletters, c.-à-d. des textes qui seront lus dans une boite email. La tendance générale étant à transformer ces lieux de correspondance en poubelle à publicité, à notifications et artefacts de démarches administratives, trop de newsletters amènent à une saturation de l'attention qui est déjà bien malmené. En plus, on mesure beaucoup de choses dans une newsletter que sur un site ou une application. C'est pour cela que le site est moins en moins à propos de newsletters et de plus en plus à propos de discours très vagues (“The subscription network for independent writers and creators”). Le problème est que c'est, à nouveau, une entreprise qui éloigne les publics d'un web ouvert, celui où la page HTML est la finalité et non pas juste une coquille vide transportant tout un tas de technologies non interopérables, looking at you Single Page Application. D'ailleurs, même s'il s'agissait d'email, il est impossible de rentrer facilement en contact avec les auteurs qu'on aimerait soutenir dans leur démarche de changement d'espace de publication. Il y a bien les commentaires mais cela revient à peu près à attraper quelqu'un par le col de la chemise alors qu'on aimerait juste avoir une discussion cordiale avec quelqu'un à qui on donne déjà de l'argent.

Le protocole Web Monetization est la réponse ouverte à la problématique de la rémunération du travail de production culturelle. Avant tout une solution technique, elle ne touche pas du tout à la problématique sociale. D'abord c'est une solution avec une forte connotation crypto, il faut attacher un portefeuille électronique, un wallet, pour faire et recevoir des donations. Ensuite, elle suit un modèle idéologique basé sur l'individu et l'identité. Par exemple write.as est la version cloud de writefreely, un logiciel permettant à tout un chacun d'héberger une ferme de blog, pour parler comme dans le web des années 2000, et propulsant ce site. Write.as implémente justement web monetization mais sans effet de réseau ou de collectif, c'est une drôle de décoration qui ne nourrira personne et ne soutiendra aucune production.

En fait rien ne remplacera le travail collectif. Les premiers à l'avoir compris sont les médias dont le cœur est une rédaction composée de journalistes. La production est mutualisée et la rémunération est partagée sous forme de salaires. C'est une vision idéalisée et schématique. Il y a souvent quelque part des actionnaires, de la publicité, mais aussi l'État comme perfusion économique sous forme des aides à la presse. Est-ce qu'on peut imaginer d'autres formes d'organisation sociotechnique pour la production et la diffusion d'objets écrits ? À commencer par la fiction, la poésie, des écritures plus personnelles, et non pas individualistes, et pourquoi pas, en fait, du journalisme pour sortir des contraintes économiques et de la pression de l'actualité. Faire des collectifs et des communautés autonomes, et arrêter une nouvelle plateformisation d'une pratique qui pourrait quand même être sympathique. De façon connexe, on peut penser au collectif de créateurs de jeux vidéos Sokpop qui fait un jeu par mois contre un abonnement de 3 euros. Cela leur permet de s'affranchir des codes de productions du milieu et d'explorer créativement de nouveaux imaginaires. Substack n'est pas la première plateforme a exploiter l'espace séparant une écriture et sa lecture, elle ne sera pas la dernière non plus. Mais est-ce que cela ne serait pas le moment de commencer à chercher de nouveaux modèles ? Notre époque en a besoin.

type : #analyse sujets : #moderation #substack #plateforme #politique

 
Lire la suite...

from chemins invisibles

Vous avez aimé SBF pour son look ? Vous avez aimé Elon Musk pour ses fusées ? Vous avez aimé Peter Thiel pour sa vision politique ? Vous allez aimer Palmer Luckey et sa startup, Anduril.

lien original youtube

  • ✅ figure de l'entrepreneur clivant
  • ✅ californie
  • libertarien et trumpiste
  • ✅ devenir milliardaire avec une vieille lubie technologique que tout le monde essaie d'oublier à part Apple
  • lien avec Palantir
  • ✅ r&d sponsorisée par le ministère de la défense
  • ✅ startup avec des investisseurs
  • ✅ “disruption”
  • ✅ “ai-powered unmanned products”
  • ✅ un fusil longue portée avec des hélices
  • Moneyball pour justifier tout et n'importe quoi parce que les chiffres
  • ✅ vidéo provenant d'un média mais qui pourrait aussi être une infomerciale
 
Lire la suite...

from chemins invisibles

Cela fait déjà quelques jours que Sam Altman a retrouvé son fauteuil de patron d'OpenAI. Pourtant, cette histoire est encore présente dans les médias. Après une nouvelle tentative de marketing avec la rumeur du projet Q-* dont personne, en dehors d'OpenAi, n’a encore vu la couleur, on assiste maintenant à un défilé d'avis et d'opinions qui ont la particularité de mobiliser une opposition factice au niveau idéologique pour expliquer le conflit managérial et commercial de l'entreprise. À l'instar des paniques technologiques fournies par les acteurs de l'IA, cette création de nouvelles catégories est le produit direct de ces mêmes acteurs. Rappelons d'abord que dans les faits la majorité des employés ont soutenu Sam Altman, on ne peut donc pas vraiment parler d'une véritable division au sein de l'entreprise. Les tenants des deux positions sont des détenteurs de capital économique important alors que le pays vit dans un moment de pauvreté chronique. San Francisco, et la Californie, a également un énorme problème d'inégalité.

Commençons par le meilleur. Dans un long et riche article Molly White explique très clairement les subtiles nuances dans la pseudo-philosophie habitant entrepreneurs et technophiles de la Silicon Valley. Il s'agit avant tout de justifications pour des comportements égoïstes et cupides.

Cory Doctorow, quant à lui et dans la poursuite des propos de White, rappelle à juste titre que ces débats mélangeant mauvaise science-fiction et panique technologique détournent l'attention des risques immédiats posés par l'application de ces technologies. Il souligne au passage que ces mêmes technologies pourraient être utilisées à bon escient. C'est le propre de la technocritique ou du luddisme de ne pas rejeter en bloc la technologie, mais d'en souligner les fondements capitalistes et au service de formes d'exploitation et de domination. C'est un point important, car on ne parle pas ici d'universitaires ou de chercheur•se•s au sens classique du terme, mais d'individus jonglant entre science et entrepreneuriat tout en étant plongé dans le contexte très localisé de la Silicon Valley.

quelques exemples de dichotomies en carton

Passons donc maintenant à cette criti-hype mollassonne et inoffensive que nous inflige l'opportunisme éditorial de récupérer des miettes de capital culturel sans pour autant éffleurer les statuquo capitalistes et sexistes/racistes.

https://www.nytimes.com/2023/11/22/technology/openai-board-capitalists.html

In one vision, A.I. is a transformative new tool, the latest in a line of world-changing innovations that includes the steam engine, electricity and the personal computer, and that, if put to the right uses, could usher in a new era of prosperity and make gobs of money for the businesses that harness its potential.

In another vision, A.I. is something closer to an alien life form — a leviathan being summoned from the mathematical depths of neural networks — that must be restrained and deployed with extreme caution in order to prevent it from taking over and killing us all.

Le problème avec les idiots savants et utiles comme Ilya Sutskever, c'est qu'ils sont dans une dissonance cognitive totale entre leurs névroses littéraires et leur engagement quotidien. On retrouve là, le côté complètement opportuniste des pseudo-philosophies technophiles qui peuvent justifier tout et son contraire, mais servent surtout à avoir bonne conscience malgré l'enrichissement personnel. Notons que Sutskever comme Mira Murati, ex-CEO pendant 48h d'OpenAI, sont dans des formes de déterminismes technologiques, c'est-à-dire un discours dont une prémisse est l'inévitabilité du “progrès” technique.

https://www.lemonde.fr/idees/article/2023/11/27/l-ia-generative-est-une-affaire-trop-serieuse-pour-la-laisser-dans-les-seules-mains-du-capital_6202603_3232.html

Deux camps s’opposaient au sein d’OpenAI. Celui qui tentait de maintenir des garde-fous au développement d’une technologie appelée à bouleverser la marche du monde, quitte à rater des opportunités commerciales. En face, ceux qui pensent que la dimension éthique de la recherche n’a rien d’incompatible avec la poursuite du profit. Ils sont les grands vainqueurs de la séquence.

Ici, l'opposition d'Altman est presque qualifiée d'anti-capitaliste par effet de distinction, ce qui est tout bonnement risible. Rappelons aussi que le lancement initial d'OpenAI sous forme de non-profit était orchestré par Elon Musk, Peter Thiel et Amazon, parmi d'autres, des individus et une entreprise très connus pour leur altruisme et leur bienveillance. Il y a une sorte mise en égalité du statut de non-profit, philanthropie et bienfaisance qui n'est pas vraiment évident.

https://www.lemonde.fr/idees/article/2023/11/27/intelligence-artificielle-le-fait-de-s-eloigner-de-l-idealisme-academique-et-de-se-tourner-vers-le-pragmatisme-commercial-a-du-creer-le-conflit-chez-openai_6202630_3232.html

Passons sur la formulation “a dû” du titre qui annonce tout de suite l'indigence de l'article.

Ce techno-utopisme pragmatique s’accompagne de mouvements culturels exotiques, comme le libertarianisme, et s’appuie sur des personnalités marginales favorisées par le star-système de la région, il est soutenu par les acteurs du capital-risque.

Plus loin :

la recherche altruiste désintéressée dans le domaine de l’intelligence artificielle (IA) pour le bien et la protection de l’humanité, et la création d’une structure capable d’attirer les meilleurs talents et des moyens financiers importants

La recherche altruiste, c'est ici des salariés sur-payés dans des startups ou dans des entreprises qui exercent un monopole ou duopole sur les différents secteurs de la technologie.

pêle-mêle bibliographique pour poursuivre la réflexion

Barbrook, Richard, and Andy Cameron. “The Californian Ideology.” Mute, 1995.

Texte passionnant datant de 1995 qui revient sur l'émergence de la culture qui s'est développée en Californie avec la concentration de milieux alternatifs et d'explosion économique du secteur électronique/numérique. On y retrouve une description très instructive sur les imaginaires racistes qui irriguent à la fois la pensée entrepreneuriale individualiste, le mouvement libertarien, mais aussi l'écho dans la science-fiction dystopique. À mon avis, il serait également intéressant d'élargir l'analyse à la mythologie des États-Unis qui a mobilisé dès sa naissance une imagerie coloniale et impérialiste. Les différentes révolutions qui traversent le pays sont des grands moments de ré-écriture mythologique qui invisibilité les problèmes existants. Par exemple, si la Guerre de Sécession a l'abolition de l'esclavage comme thème majeur, il ne faut pas oublier que le racisme endémique du pays est encore d'actualité. La relation universalisante dominant/dominé est profondément ancré dans l'histoire et les tensions idéologiques du pays.

Turner, Fred. From Counterculture to Cyberculture: Stewart Brand, the Whole Earth Network, and the Rise of Digital Utopianism. Chicago, Ill: University of Chicago Press, 2008.

Plongée sociologique passionnante dans l'émergence de la culture technophile autour du boom économique et technique profitant de la guerre, mais aussi des milieux contestataires et libertaires. On y retrouve également le virage à droite du milieu sous l'influence d'une vision entrepreneuriale et individualisante matérialisée par une élite économique et intellectuelle maximisant l'exploitation de l'innovation et d'un futurisme productiviste.

Miller, Chris. Chip War: The Fight for the World’s Most Critical Technology. First Scribner hardcover edition. New York: Scribner, an imprint of Simon & Schuster, 2022.

La matérialité de l'intelligence artificielle est brièvement évoquée. Parfois pour souligner que le grand profiteur est NVIDIA et parfois aussi pour rappeler la consommation excessive de ressources naturelles que nécessite l'exploitation des algorithmes d'intelligence artificielle. Ce livre est un tour d'horizon assez complet sur la dynamique industrielle et d'innovation des microprocesseurs. De la genèse au conflit géopolitique d'aujourd'hui entre la Chine et les USA. L'accès a des grandes quantités de GPU est aujourd'hui un argument de recrutement des ingénieurs et chercheurs travaillant dans le domaine et une condition sine qua non pour prétendre au succès par l'innovation.

Chafkin, Max. The Contrarian: Peter Thiel and Silicon Valley’s Pursuit of Power. New York: Penguin Press, an imprint of Penguin Random House LLC, 2021.

Autre pas de côté, c'est une biographie de Peter Thiel qui est un personnage ambivalent qui apparaît épisodiquement dans les différents moments de la Silicon Valley contemporaine. Il est souvent mentionné comme mentor de Sam Altman. Si la trajectoire n'est pas la même, il y a une manière de faire qui est dans la filiation. C'est aussi une piste importante pour mesurer le décalage entre vision d'une culture californienne libertaire et la capacité qu'à cette région à produire de façon régulière des acteurs à l'idéologie d’extrême droite dans des positions de pouvoir politique et économique.

#analyse #openai

 
Lire la suite...