ratures

Reader

Read the latest posts from ratures.

from weeknotes

Avant-dernière semaine de congés avant de se jeter dans le grand bain. La pression monte calmement.

qu'est-ce qui s'est passé ?

Open Terms Archive

Mes premiers mémos ont été publiés :

J'aime bien ce format qui est pour moi un ouvroir. Je réfléchis à ce qui aiderait des journalistes à construire un récit permettant d'expliciter les problématiques politiques liées aux plateformes numériques et ça vient ensuite de façon limpide.

Cette mission est également pour moi l'occasion de travailler à nouveau en anglais. J'apprécie beaucoup cette langue. À l'oral, je patine encore pas mal, mais quand même moins que pendant le data sprint sur le DSA du début d'année.

protopie.studio

Je fais rentrer mon travail autour d'Après la nuit dans le cadre de ma nouvelle activité. Le projet de départ, avec un camarade, était de fournir des services à des communautés militantes. Depuis, il y a eu les chatons, bien d'autres choses et je me suis retrouvé tout seul aux manettes.

Quelques services sont encore debout et ont besoin de maintenance. Je ne fais pas tout d'un coup, mais j'avance quand même. Cette semaine, j'ai donc mis à jour notre instance WriteFreely vers la version 0.16.0.

Cela ne m'a pas pris trop de temps et c'était le bon premier pas. Je suis maintenant chaud pour passeur deux breaking versions de mastodon ; social.apreslanu.it étant encore en 4.2.x.

nsppolls

cf. NSPPolls – semaine 41

last.fm

last.fm est un service web qui permet d'avoir un historique des musiques que j'ai écouté et d'avoir ensuite des recommandations. Il y a aussi un réseau social permettant de voir ce qu'écoutent les autres pour s'en inspirer. J'y avais fait des rencontres amicales sympathiques, notamment après un concert de Grimes, une des ex d'Elon Musk, à la Flèche d'Or.

Le seul logiciel qui l'intègre est le vieux Rhythmbox de Gnome, alors que j'utilise plutôt Music pour son interface qui reprend moins les codes de l'iTunes des années 2000. J'ai rebranché ce qu'il fallait et clôturé un hiatus de 8 ans. Pour me retrouver et m'ajouter, mon compte avec le pseudo habituel : taniki.

des joies

  • J'ai pu visiter le RetroFutur Museum grâce à Omer Pesquer. C'était à la fois convivial, stimulant et enrichissant.
  • En 2017, j'ai eu besoin d'un statut d'autoentrepreneur pour encaisser une facture. J'avais fait les démarches pour le clôturer, mais il y a du y avoir une erreur quelque part, car 8 ans plus tard, je me suis rendu compte qu'il était toujours là. Ça a été tout un parcours du combattant qui m'a mis face à mes démons administratifs, mais j'en suis vendu à bout.

des peines

  • J'ai donc à nouveau un smartphone actif dans mes poches. Je veux voir ce qui me déplaît avec, mais je sens bien tout ce qui fait que l'objet est attractif et pratique. Il faut que je le lâche à nouveau.
  • Darktable ignore à nouveau mes clics ce qui le rend inutilisable.
  • Nouvel épisode dans la saga familliale des poux.

lu, vu, joué

  • 📖 Dandadan ch212
  • 📺 Sousou no Frieren s01e??-??
  • 📺 Slow Horses s01e02-06
  • 📕 Le nouvel équilibre d'Amélie Géal
  • 📕 Sam cartographe de Joyce Hesselberth
  • 📕 Le livre est-il écologique ? de l'Association pour l'écologie du livre
  • 📖 Queen Demon de Martha Wells
  • 🎥 A Big Bold Beautiful Journey
  • 🕹️ Railbound

les bons liens

publications et apparitions

chez les autres

 
Lire la suite...

from offload

Depuis la rentrée, j’ai repris le flambeau de NSPPolls, auparavant détenu par Alexandre Léchenet. Pour l'instant, c'est plutôt calme, mais il y a beaucoup à faire pour être prêt aux moments opportuns à venir : la possibilité d'une dissolution, les élections municipales de 2026 et la présidentielle de 2027.

codeberg

https://codeberg.org/nsppolls

C'est mon avis personnel, mais il serait préférable de s'éloigner le plus possible de GitHub. Cette plateforme de partage de code a connu une dérive importante ces derniers temps, en particulier en ce qui concerne les produits Copilot de Microsoft.

J'utilise principalement Codeberg, mais j'ai activé un miroir automatique sur GitHub tout en désactivant toutes ses fonctionnalités de côté.

Je sens que ce sera difficile d’attirer les personnes intéressées vers ici, mais il faut bien s'y coller.

readme

https://codeberg.org/nsppolls/sondages-commission-index

L'arrivée sur le dépôt de code des travaux sur la commission des sondages était assez aride. J'ai entamé une petite page d'introduction qui pointe vers les différentes ressources.

automatisation de la récupération des sondages

https://codeberg.org/nsppolls/sondages-commission-index/pulls/1

J'avais déjà ajouté les notebooks permettant une récupération des derniers sondages ainsi que les fichiers qui vont avec. Ces notebooks sont maintenant exécutés de manière répétée. Cela permet au passage d'utiliser le RSS des commits en attendant d'avoir un flux propre.

C'était aussi l'occasion de voir comment fonctionne les Forgejo Actions. C'est plus ou moins comme sur GitHub, sauf que la documentation est un peu plus clairsemée et qu'il y a moins de code à mater pour l'inspiration. Ça m'a pris un peu moins de temps que ce j'avais prévu.

extraction de la date de création et de la date de publication

https://codeberg.org/nsppolls/sondages-commission-index/commit/340c35f7969f306fbd26f5ca6cb3ce769ffe185e

Les données concernant les fichiers contiennent maintenant :

  • la date de dernière modification sur le serveur web ;
  • la date de création du PDF.

Les métadonnées sont presque inexistantes sur le site de la Commission. Cela permet d'avoir une bonne approximation de la date exacte de publication.

les derniers sondages

#nsppolls #changelog

 
Lire la suite...

from offload

https://www.niemanlab.org/2025/10/impact-editor-is-a-relatively-new-job-and-its-already-changing/

The work, they said, is a mixture of audience strategy, community engagement, product management, and coordination across departments to make sure stories reach the people who need them the most.

***

Simply publishing a story is not the same thing as accountability, Lighthouse’s Pang stressed. An impact editor is “someone who can understand the role of the investigation in the context of the wider issue in the world, who’s able to go out and speak to policymakers and civil society organizations and ask, ‘What are you working on? Where could our findings be useful and how can we get them to you in a way that can be most useful to you?'”

Du grain à moudre concernant la continuité entre des activités de terrain, les réseaux (au sein d'avant les “réseaux sociaux”), et l'insertion dans les chemins de productions journalistiques.

 
Read more...

from weeknotes

Toujours en congé, mais c’était bien mouvementé. Je mets en place de nouvelles habitudes qui me plaisent beaucoup.

qu’est-ce qui s’est passé ?

Open Terms Archive

Les problématiques d’analyse et de rédaction commencent à former une continuité avec mes idées d’articles ou de collaborations autour de pièces à bouger.

Avec le TTPA qui rentre en application le 10 octobre, j’ai beaucoup de matière autour du sujet de la publicité (politique) et du ciblage. Ça me tient à cœur et ça me stimule d’autant plus pour sortir de ma zone de confort.

J’ai aussi pu croiser 2 autres contributeurs du projet au hackathon Hack the DSA organisé par la Chaire de Modération du CNAM.

protopie.studio

Avec une connaissance, on a soumis une proposition pour la refonte d’un site web. Même si c’est du développement, j’aime bien l’idée de la collaboration.

J’ai aussi fait un premier rendez-vous avec Coopaname pour voir si je peux y faire couver mon activité. Ce n’était pas mon intention, mais en discutant avec une connaissance qui y est, cela m’a au final semblé plus logique, cohérent, prometteur et pérenne.

nsppolls

J’ai fait mes premiers pas avec Grist en annotant quelques sondages sur l’élection présidentielle qui aura lieu en 2027. Je tâtonne encore pas mal et je fais certainement des erreurs de débutant en complexifiant inutilement mon travail.

Cela faisait plusieurs semaines que je procrastinais en me mettant comme premier pas d’installer ma propre instance Grist. On verra d’abord comment l’outil répond à mes usages.

des joies

  • effervescence d’un hackathon. J’avais complètement oublié qu’il y avait une tendance à la compétition ; je suis parti avant la remise des prix, n’étant vraiment pas venu pour cela. J’ai appris le lendemain qu’on avait eu un bout de papier pour dire qu’on était troisième. Petit boost d’ego, mais surtout confirmation que la publicité (politique) en ligne est une bonne piste de sujets.
  • rencontrer une partie de l’équipe Open Terms Archive en personne
  • cuisiner un curry de légumes
  • assez peu de dépenses comparé aux semaines précédentes. La première semaine de congés était une catastrophe, j’avais passé mon temps dans les librairies et papèteries.

des peines

  • j’ai assez peu écrit pour moi-même.
  • j’ai complètement procrastiné la fermeture de l’autoentreprise de 2017 en me reposant sur la procrastination d’autres personnes. Il me reste tout un tas d’autres boulets administratifs à régler.
  • J’ai été assez léger sur les tâches ménagères, mais peut-être que je m’étais donné un rythme un peu trop intense la semaine précédente.
  • les articles continuent aussi de s’empiler dans readeck. J’avais dans l’ambition de lire et trier un peu chaque jour, mais je n’arrive pas du tout à l’intégrer dans mes routines, contrairement à passer du temps à regarder des vidéos sur internet. Sur ce dernier point, j’ai essayé de ne pas les regarder sur les plateformes ou dans pipewire mais dans logseq pour les annoter et voir rapidement si je dilapide mon temps ou non. Ça ne fonctionne qu’à moitié jusque là.

lu, vu, joué

  • 🎥 KPop Demon Hunters et sa bande son
  • 🎥 Un simple accident
  • 📺 Slow Horses s01e01
  • 📖 Dandadan ch211
  • 📖 Sousou no Frieren ch146
  • 📕 Voyages sans bagages de Tove Jansson
  • 📕 Server Manifesto de Niklas Maak
  • 📕 Un taylorisme augmenté de Juan Sebastián Carbonell

les bons liens

chez les autres

publications et apparitions

 
Read more...

from offload

  • Microsoft et OpenAI sont dans un système pour gonfler leurs revenues et valeurs boursières dans une boucle financière fermée.
  • Oracle, Nvidia et OpenAI sont dans un autre système pour gonfler leurs comptes
  • Oracle profite des proximités de Larry Ellison avec Trump pour récupérer TikTok et faire grimper sa valeur boursière
  • Oklo profite du surinvestissement dans les data centers.
  • Nvidia gonfle ses propres chiffres en fournissant des capitaux à des entreprises qui vont ensuite dépenser de l'argent dans des services et entreprises qui vont finalement acheter des produits nvidia.

https://www.youtube.com/watch?v=NNOkgSZgk14

https://www.youtube.com/watch?v=V64TdrkhTqo

https://pluralistic.net/2025/09/27/econopocalypse/#subprime-intelligence

 
Read more...

from weeknotes

Seconde semaine de congés. Je m'aventure prudemment sur le nouveau sentier qui s'ouvre devant moi.

qu'est-ce qui s'est passé ?

  • Open Terms Archive
    • Mes premiers pas et mes premiers moments de travail me confirment que j'ai bien fait d'emprunter ce nouveau chemin.
    • Je vais également à nouveau pouvoir travailler en anglais et, pour l'instant, ce n'est pas sans douleur.
  • Profiter du passage de Loïc Marleix (@MoritzBrouhaha@typo.social) à Paris Web pour récupérer un magnifique poster Lovers Communication System et échanger autour d'une boisson chaude.

des joies

  • du temps pour lire et réfléchir.
  • continuer à m'organiser comme je l'entends. La possibilité de laisser plus de place à des cahiers papier et leur absence de linéarité. Tout devient perso.
  • Je suis allé faire des courses de daron chez Tang Frères. Nostalgie.
  • darktable, un logiciel libre de gestion de bibliothèque photographique, m'empêchait de faire autre chose que d'importer des photos. J'ai fait des manipulations plus ou moins aléatoires jusqu'à faire fonctionner à nouveau le logiciel. Je peux donc enfin éditer mes photos et me remettre à publier sur mon compte pixelfed.

des peines

  • J'ai bataillé avec France Connect+ dont j'ai besoin pour clôturer un statut autoentrepreneur qui aurait dû l'être en 2017. Rien à y faire. Same player shoot again, je retente la semaine suivante.
  • Pas vraiment atteint mes ambitions d'écriture et de publication. Niveau lecture, je m'en suis aussi rendu compte assez tard dans la semaine que c'était le bon moment non pas pour lire plus, mais lire mieux. Cette légère bifurcation est un travail au long court.
  • En allant au ciné à vélo, j'ai croisé le chemin d'un bonhomme avec un perroquet. Tous les deux étaient perchés sur un pont. Je regrette de ne pas avoir pris le temps de m'être arrêté pour en tirer un cliché.

lu, vu, joué

  • 🎥 Une bataille après l'autre.
  • 📺 terminé 7 Days Out – Leagues of Legends.
    • J'avais commencé cette série pour l'épisode sur la réouverture du restaurant Eleven Madison Park.
  • 📺 maté Sousou no Frieren s01e03-04
    • La série m'occupe pendant certains déjeuners, mais c'est franchement redondant par rapport à la lecture du manga qui est encore un peu fraîche de mon côté.
  • 📖 continué Dandadan avec le ch. 210.
  • 📖 entamé Voyages sans bagages de Tove Jansson.
  • 📖 commencé Server Manifesto de Niklas Maak.
  • 📕 No One Will Come Back For Us and other stories de Premee Mohamed.
    • Pas vraiment mon genre littéraire, je finis assez péniblement, même si les nouvelles sont appréciables et bien ficelées.
  • 📕 Sous le feu du numérique de Fanny Lopez et Cécile Diguet.

les bons liens

chez les autres

 
Lire la suite...

from weeknotes

Une semaine de congés en attendant un nouveau chemin.

des joies

  • Passage chez le barbier que j'attendais depuis 2 petits mois. La fraîcheur capillaire, ça me fait toujours un petit quelque chose.
  • Période d'entre deux où je touche un salaire plein tout en faisant exactement ce que je veux de mes journées sans l'horizon d'un nouveau tunnel. C'est encore mieux que des vacances.
  • Une après-midi oisive à retrouver un vieil ami pour bavarder et sillonner le quartier comme à la belle époque.

des peines

  • Frustration de perdre des choses dans la maison, alors que j'ai passé du temps cette semaine à faire du rangement et de la réorganisation. C'était un petit livre que j'ai finalement retrouvé et terminé, mais je pense que j'ai passé plus de temps à le chercher qu'à le lire.

lu, vu, joué

  • 📺 Star Trek: Strange New Worlds s03e04-10
  • 📺 Dandadan s02e10
  • 📕 Dandadan ch. 209
  • 📕 Sousou no Frieren ch. 145
  • 📖 commencé No One Will Come Back For Us and other stories de Premee Mohamed
  • 📕 Gaïagraphie d'Alexandra Arènes
  • 📕 Sur le chemin des glaces de Werner Herzog
  • 📕 Oiseaux à reconnaître d'Emmanuelle Kecir-Lepetit et Léa Maupetit
  • 🎥 Left-Handed Girl de Shih-Ching Tsou

les bons liens

mes publications

 
Read more...

from offload

À la fin de l'été, j'avais dans l'intention de reprendre la publication de weeknotes. Pour cela, je me suis échauffé en préparant des drafts dans logseq qui sont devenus les weeknotes en tant que tel. Je ne sais pas trop ce qui me manque en termes de pratiques pour en dériver un produit publiable mais en attendant, ça reste une bonne manière d'évacuer certaines pensées récurrentes.

Le modèle

Chaque début de semaine, je crée une nouvelle page dans logseq au format weeknotes/YYYY/W. Le système de hiérarchie permet de séparer les weeknotes des autres pages mais aussi de pouvoir les retrouver plus rapidement en allant sur la page weeknotes/YYYY par exemple.

Ensuite j'y applique le template ci-dessous avec la commande /Templates → weeknote/prompts.

La seule maneuvre répétitive est de faire un lien vers les futures pages journalières. Ce n'est pas très laborieux grâce à la commande /date picker. En fait, c'est même devenu un petit rituel relativement apaisant comme de préparer la nouvelle page d'un cahier.

- ## template
	-
	  template:: weeknote/prompts
	  template-including-parent:: false
	  collapsed:: true
		-
		  exclude-from-graph-view:: true
		  previous::
		- ## jours
			-
			  | jour | page |
			  |---|---|
			  | lundi | |
			  | mardi | |
			  | mercredi | |
			  | jeudi | |
			  | vendredi | |
			  | samedi | |
			  | dimanche | |
		- ## qu'est-ce qui s'est passé ?
		- ## des joies
		- ## des peines
		- ## lu, vu, joué
			- ## iconographie
			  id:: 68a3b184-0da6-462c-8955-be25b5819550
				- jeux
					- 🕹️ joué à
					- 🎲 joué à
				- livres
					- 📖 commencé
					- 📕 fini
				- 📺 regardé
				- 🎥 cinéma
				- 🎧 écouté musique
				- 🎙️ écouté podcast
		- ## les bons liens
		- ## chez les autres
		- ## dépenses

#weeknotes

 
Read more...

from le numérique est un champ de bataille

Je développe quelques informations glanées sur le web concernant le Project Nimbus. C’est une synthèse centrée sur le projet plutôt que les licenciements et sa controverse en tant que séquence. J’ai mis à la fin quelques pistes pour continuer à creuser les histoires qui pourraient être racontées et qui me sembleraient intéressantes.

Avec ce genre de billet, je cherche à savoir si j'arrive à formuler par écrit un sujet. N'hésitez donc pas à me signaler s'il y a des choses qui vous semble être de l'ordre de l'égarement ou s'il y a des informations complémentaires qui pourraient être pertinente pour mieux comprendre les choses.

ce qu’on sait du Project Nimbus

  • Le projet a été officialisé en 2021. Il s’agit d’un accord entre Israël et 2 entreprises US, Google et Amazon.
  • La valeur est de 1.22 USD.
  • La durée est de 7 ans.
  • C’est une prestation très large du service cloud.
  • Une partie concerne la mise en place d’un data center sur le territoire israélien ce qui permettrait à cet état de faire valoir une forme de souveraineté et d’échapper à un éventuel regard de l’Union européenne et de sa réglementation avancée sur la protection des données.
  • Une autre partie est la mise à disponibilité de services de consulting pour la connexion avec les services de Google déjà existant.
  • Le contrat stipule bien que l’armée sera aussi usagère de cette infrastructure.
  • L’infrastructure est ainsi faite pour que Google n’ait pas accès aux données et ne dispose pas d’un droit de regard sur les usages des technologies.
  • Cependant, les conditions d’utilisation empêchent théoriquement un usage à des fins de guerre ou de coercition.
  • Une clause amenée par le gouvernement israélien est l’impossibilité pour Google et Amazon d’annuler le contrat sous l’effet d’un boycott.

la réaction en interne

  • L’existence du projet suscite en interne des réactions vives, mais qui semblent autant minoritaires qu’isolées. Elles sont parfois médiatisées en donnant lieu à des articles. Cela entraine une réaction de l’entreprise autre qu’un durcissement rapide de la gestion des voix discordantes.
  • En 2022, Ariel Koren a été poussée dehors avec des pratiques vraiment douteuses. Elle revenait de congés maladie et avait été mutée au Brésil alors qu’elle vivait alors à San Francisco. Elle avait le choix entre démissionner et déménager dans les 3 semaines. La procédure, sous le regard de Google et d’un service tiers, a jugé que ce n’était pas des représailles à l’encontre de son activisme.
  • En 2022 également, Jack Poulson, qui était employé depuis 14 ans, démissionne à son tour en protestation du contrat.
  • En mars 2024, Eddie Hatfield avait fait une interpellation verbale pendant une conférence tech sponsorisée par une entreprise israélienne. Il a été licencié. Dans la foulée, Vidana Abdel Khalek, une employée du Trust and Safety, démissionne pour protester contre les pratiques de l’entreprise.
  • En avril 2024, une dizaine d’employé-e-s organisent un sit-in dans les locaux de New York City et Sunnyvale (CA). Ils iront jusqu’à occuper le bureau du CEO de Google Cloud. En tout 28 employé-e-s seront licencié-e-s sans que la participation aux manifestations soit nécessairement avérée.
  • Un élément difficile à appréhender est la place de la culture américaine. Il y a des différences notables en termes de : culture d’entreprise, attitude vis-à-vis de la colonisation du territoire palestinien, du sionisme et de l’antisémitisme. Sans parler également de la place de Google dans le mythe américain et du capitalisme numérique. Les États-Unis ont leur propre histoire faite de racisme et de ségrégation, mais également d’immigration et colonisation qui fait tout un gloubiboulga assez différent de la soupe mentale européenne.
  • Il faut également prendre en compte le climat économique actuel du marché de l’emploi dans le secteur numérique. Après une forte période d’embauches suite à l’exploitation de l’explosion des besoins en services permettant un travail massif à distance, l’ambiance est maintenant à un dégraissage (big layoff) pour atteindre les objectifs financiers de croissance économique et de rendements pour les actionnaires. Il faut également faire de la place pour de nouveaux investissements dans la bulle IA. Les employé-e-s du numérique, spécialement aux USA, voient une régression du rapport de force entre travail et capital. Les employé-e-s qui préfèrent se faire virer ou démissionner ont d’autant plus de courage bien que cela permette à peu de frais l’entreprise de s’éloigner discrètement d’une image d’entreprise à la pointe du progrès social et de continuer à rogner sur les marges.

cloud

  • Air du temps oblige, il est beaucoup question d’intelligence artificielle, mais il me semble que les problématiques de privacy, big data et cloud computing sont déjà bien assez importantes.
  • Le montant s’explique par la masse de données et le lieu de leur stockage pour éviter des transferts depuis des zones avec des régimes de protection plus strictes comme l’Europe.
  • Avoir des données personnelles ou individuelles en grande quantité est ce qui permet de faire du ciblage.
  • C’est aussi un prérequis pour une politique technocratique où les populations sont gouvernées du dessus comme dans de vastes simulations se rapprochant d’un jeu vidéo. Les citoyen-ne-s sont réduits en diverses lignes d’informations et si possible de chiffres, ce qui permettra des calculs et des simplifications. C’est toute l’ambition des techniques de machine learning ou d’intelligence artificielle. Dans ce contexte, les deux termes sont équivalents : réduire les individus à un petit nombre de valeurs utilisables. Par exemple, une probabilité d’être un membre de l’armée adverse et un autre indiquant l’importance dans la hiérarchie à partir des comportements sur les messageries sociales du type WhatsApp ou les données géographiques.
  • Le cloud computing est souvent ironiquement résumé par le déplacement de la propriété d’une ressource informatique. Là où habituellement, on achète un ordinateur ou un serveur, la fiction du cloud est celle d’une évaporation de cette ressource alors qu’elle se retrouve simplement déplacée dans un lieu éloigné. Sous couvert d’optimisation des ressources, cette mise à distance permet de cacher les coûts écologiques tout en concentrant le pouvoir.
  • Le cloud est également un modèle d’architecture très profitable. Il est difficile d’imaginer le contrat prendre fin en 2028 et tout l’enjeu stratégique pour les entreprises est de créer une situation de rente. Tout ce montage est largement thématisé dans la littérature sur le capitalisme de plateforme.
  • Enfin, le cloud permet à Israël d’utiliser des services grand public à des fins militaires et de surveillance. Par exemple, les employé-e-s de Google eux-mêmes soulignent que Google Photos permet de faire de la reconnaissance faciale sans créer directement une nouvelle brèche de privacy, mais en exploitant celle déjà énorme de l’accumulation de données personnelles par Google. Il n’y a pas vraiment de transfert de données ou de technologies seulement la location d’un service tiers. C’est aussi cela la magie du cloud.
  • Autant les big data que les technologies étiquetées « intelligence artificielle » sont tributaires de racines racistes et eugénistes (la phrénologie, Galton, Pearson, et Fischer) d’une part et de contrôle étatique d’autre part (la démographie comme contrôle politique et économique des populations). Un présupposé des dérivées de la reconnaissance faciale est la réduction des individus à des traits physiques lus par une machine. C’est une forme de déterminisme qui donne lieu à der formes d’oppression ainsi qu’une introduction invisible de biais idéologique dans une promesse de neutralité par effet de machine washing.
  • Ces technologies sont également gourmandes en ressources informatiques. Ce qui n’est pas sans rappeler les origines militaires de la Silicon Valley. Ce petit coin de Californie ne doit son existence et ses profits que par un besoin constant de l’appareil militaire US en technologie. Notamment pour assurer une forme de supériorité technologique d’une armée de métier amenant souvent une infériorité numérique sur le terrain.

Israël et Gaza

  • Actuellement, on ne sait pas grand-chose du contrat en lui-même. Il y a donc beaucoup de spéculation. Mais on peut le remettre dans le contexte dans la mise à disposition de technologies et de services à un État en conflit avec un autre. Ce conflit donne aujourd’hui lieu à un génocide qu’il est difficile de contester.
  • Gaza est un terrain d’expérimentation des technologies de surveillance et de guerre, de maintien de l’ordre et de propagande. C’était le cas avant l’escalade suite au 7 octobre.

interview des employé-e-s licencié-e-s

https://www.youtube.com/watch?v=rz8Y2NSPpXo

Cette vidéo est super pour mettre des visages et des voix sur les personnes qui luttent.

poursuivre ce chemin

  • Je ne vois pas trop quel intérêt à faire de nouveaux entretiens avec les employé-e-s qui ont quitté l’entreprise. Leurs propos sont déjà clairs et articulés. Dans un contexte francophone, j’aimerais bien savoir ce qu’il en est des employé-e-s qui travaillent sur le territoire européen ou qui en viennent.
  • Comment s’organisent ou non des employé-e-s d’autres entreprises fournissant des services et du matériel contribuant directement à une politique de surveillance et par extension à la mise en application d’une politique amenant à un génocide ?
  • Quels sont les modes d’action pour casser l’appareillage oppressif en tant que travailleur-euse du numérique ? Est-ce que visibiliser la continuité entre le quotidien des entreprises de services numériques à un paradigme technologique de gouvernementalité où tout tend vers le numérique et à une déshumanisation est suffisant ?
  • Quelles seraient les conséquences d’une rupture du contrat entre Google, Amazon et l’administration israélienne ? La somme doit être conséquente, mais de quel ordre sachant au regard de la richesse des deux entreprises au pinacle d’un oligopole.

références bibliographiques

Ce sont quelques références qui ont traversé mon esprit lors de la compilation de ces quelques notes.

  • Acemoglu, Daron, and Simon Johnson. 2023. Power and Progress: Our Thousand-Year Struggle over Technology and Prosperity. First edition. New York: PublicAffairs.
  • Crawford, Kate. 2021. Atlas of AI: Power, Politics, and the Planetary Costs of Artificial Intelligence. New Haven: Yale University Press.
  • Doctorow, Cory. 2020. How to Destroy Surveillance Capitalism. First edition. New York, NY: Stonesong Digital.
  • Hu, Tung-Hui. 2015. A Prehistory of the Cloud. Cambridge, Massachusetts: The MIT Press.
  • Martin, Olivier. 2023. Chiffre. Collection Le Mot Est Faible. Paris: Anamosa.
  • McQuillan, Dan. 2022. Resisting AI: An Anti-Fascist Approach to Artificial Intelligence. Bristol, UK: Bristol University Press.
  • Raji, Inioluwa Deborah, I. Elizabeth Kumar, Aaron Horowitz, and Andrew D. Selbst. 2022. “The Fallacy of AI Functionality.” In 2022 ACM Conference on Fairness, Accountability, and Transparency, 959–72. https://doi.org/10.1145/3531146.3533158.
  • Scott, James C. 2020. Seeing like a State: How Certain Schemes to Improve the Human Condition Have Failed. Veritas paperbacks edition. New Haven: Yale University Press.
  • Tréguer, Félix. 2023. Contre-Histoire d’Internet, Du XVe Siècle À Nos Jours. Marseille: Agone éditeur.
  • Zuboff, Shoshana. 2019. The Age of Surveillance Capitalism: The Fight for a Human Future at the New Frontier of Power. First edition. New York: PublicAffairs.

  • type : #veille
 
Lire la suite...

from le numérique est un champ de bataille

J’avais besoin de me faire une petite synthèse concernant le licenciement de 28 employé-e-s de Google car ce que je lisais partait dans tous les sens à grands coups de paniques autour de l’intelligence artificielle. Mon intention était de manifester quelques chemins que j’aimerais voir apparaître et de réfléchir en faisant des phrases. Cela peut toujours dépanner celleux qui regardent la chose de loin pour éviter quelques confusions.

ce qu’il s’est passé

  • Mardi 16 avril 2024, des employé-e-s de la grande entreprise Google, et membres du collectif No Tech For Apartheid, ont organisé une manifestation à l’intérieur des locaux.
  • L’intention était de sensibiliser leurs collègues à propos d’un contrat commercial entre Google et l’État israélien. C’est le fameux Project Nimbus. Selon elleux, c’est une ligne rouge éthique qui est vécue comme la participation de l’entreprise au génocide à Gaza.
  • 28 employé-e-s se font alors licencier après des arrestations et de la garde à vue pour certain-e-s alors que d'autres ne semblent qu'avoir adressé-e-s la parole aux protestataires.

les notes en vrac

sur le projet

  • Le Project Nimbus est un accord commercial de 1,3 milliard de dollars US entre l’état israélien et des entreprises américaines, Google et Amazon, pour une prestation d’infrastructure cloud ainsi que du conseil en modernisation. L’accord date de 2021 et a une durée de 7 ans. Depuis son commencement, il suscite des inquiétudes et des mobilisations au sein de l’entreprise.
  • Pas de lien avéré pour le moment avec Lavender, le système permettant à l’armée israélienne d’établir une large liste d’individus à abattre en faisant fi des victimes civiles. À ne pas confondre avec The Gospel qui est le système qui détermine les bâtiments à détruire. Les deux systèmes optimisent, entre autres, l’étalement des bombardements dans le temps pour éviter des effets de creux et d’entonnoirs.
  • Il faut certainement inscrire le contrat dans le triptyque infernal : big data, cloud computing, et intelligence artificielle.
  • D’ailleurs même si on trouve des mentions de technologies commercialisées comme étant de l’IA, la problématique du paradigme de contrôle et de gouvernance introduite par l’informatisation et la quantification reste d’actualité. Looking at you la CNAF.
  • On peut retrouver la thématique de l’alignement entre le capitalisme de plateforme et les visions technocratiques des États modernes. Notamment l’importance du cloud computing dans les infrastructures de surveillance.
  • À mon avis, il y a une piste sur le rôle des grandes entreprises comme prolongement de la diplomatie. Confier une infrastructure critique à une organisation étrangère, plus particulièrement états-unienne, après les révélations de Snowden ainsi que les différentes mesures prises, par exemple par l’Europe, sur la protection des données, laisse songeur. Cohérence avec la politique du gouvernement US.
  • On y retrouve les nuances sémantiques concerne la vente d’armes au gouvernement et non à l’armée.
  • Contrairement à Maven qui impliquait le Pentagone, il n’y a pas encore eu de vague de protestation massive et médiatisée notamment avec des relais dans l’opinion publique. Le projet a alors disparu des radars et sa principale porteuse, Fei-Fei Li est retournée au monde académique. Cela dit quand même quelque chose sur les lignes de démarcation au sein de l’entreprise. La surveillance de masse, c’est non, mais un génocide, c’est emoji shrug.

sur les licenciements

  • Le licenciement expéditif de 28 employés ainsi que le ton autoritaire de l’email montrent une évolution du contrôle au sein de l’entreprise.
  • Cet entretien téléphonique de Marisa Kabas avec Hasan Ibraheem, un des employé-e-s licencié-e-s, est une lecture très intéressante et plus riche que la plupart des articles de presse qui font un travail touristique de synthèse.
  • On pourrait mettre cela en contraste avec :
    • démission de Ariel Koren en 2022 après une série de protestations écrites et des mobilisations sur les canaux de communications internes concernant le même Project Nimbus.
    • démission de Meredith Whittaker en 2019 suite aux Google Walkouts visant un manque d’actions concrètes contre les discriminations sexistes au sein de l’entreprise.
    • démission de Timnit Gebru en 2020 suite à la publication du célèbre article signé avec 3 autres co-autrices On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? dénoncant l’exagération de la pertinence et les dérives éthiques de l’IA notamment les Large Language Models sur le plan de la consommation de ressources naturelles par exemple.
  • L’importance géographique du lieu de travail et retour de bâton du work from home. virulence de la sanction. Visibilisation de la dimension politique du télétravail au regard d’un esprit de contrôle.
  • La sociologie des employé-e-s qui semblent à la fois jeunes, à la fois en âge, mais aussi en ancienneté, et racisé-e-s.
  • Est-ce qu’on va voir enfin revenir la question du syndicalisme des travailleuses et travailleurs du numérique ?

email de licenciement

Serious consequences for disruptive behavior

Googlers,

You may have seen reports of protests at some of our offices yesterday. Unfortunately, a number of employees brought the event into our buildings in New York and Sunnyvale. They took over office spaces, defaced our property, and physically impeded the work of other Googlers. Their behavior was unacceptable, extremely disruptive, and made coworkers feel threatened. We placed employees involved under investigation and cut their access to our systems. Those who refused to leave were arrested by law enforcement and removed from our offices.

Following investigation, today we terminated the employment of twenty-eight employees found to be involved. We will continue to investigate and take action as needed.

Behavior like this has no place in our workplace and we will not tolerate it. It clearly violates multiple policies that all employees must adhere to — including our Code of Conduct and Policy on Harassment, Discrimination, Retaliation, Standards of Conduct, and Workplace Concerns.

We are a place of business and every Googler is expected to read our policies and apply them to how they conduct themselves and communicate in our workplace. The overwhelming majority of our employees do the right thing. If you’re one of the few who are tempted to think we’re going to overlook conduct that violates our policies, think again. The company takes this extremely seriously, and we will continue to apply our longstanding policies to take action against disruptive behavior — up to and including termination.

You should expect to hear more from leaders about standards of behavior and discourse in the workplace.

Source : The Verge

 
Lire la suite...

from weeknotes

Une semaine de vacances, de vadrouille et de rage sur internet.

qu’est-ce qui s’est passé ?

  • 3 jours en vadrouille
  • 36 h en solo
  • le sondage Wikipédia
  • j’ai finalement publié une note synthétique sur le sujet

des joies

  • Avoir une journée à soi, c’était vraiment bien même si je n’en ai pas fait grand-chose. Ce n’est pas si rare, mais c’est toujours appréciable. Dans la suite, j’étais aussi content de retrouver ma petite famille qui m’a rejoint une grosse journée plus tard.

des peines

  • Le sentiment d’injustice et d’être témoin d’une violence par certains wikipédien·ne·s est toujours là et je ne sai pas trop quoi en faire alors que j’ai quand même quelques cartes entre les mains.

lu, vu, joué

  • 📕 lu d’une traite Paris 2024. Une ville face à la violence des jeux de Jade Lindgaard.
    • Très bel ouvrage fort d’un travail de terrain qui concerne plus le département de la Seine–Saint-Denis que Paris. Il y a une écriture journalistique qui rend les choses plus vivantes que les écrits plus théoriques et universitaires que d’autres livres critiques sur le sujet.
  • 📕 terminé la lecture de Power and Progress de Daron Acemoglu.
    • Premier livre de l’auteur que je termine. C’est beaucoup plus historique et politique que mon attente et c’est une bonne chose. Je pensais que ça allait être une digression contre l’intelligence artificielle de ses thèmes habituels qui sont tout de même adjacents. Il y a beaucoup de profondeur et donne à voir ce que donnne une lecture économique précise des effets de l’automatisation et de l’informatisation.
  • 📕 lu la fin de Le scarabée dans la fourmillière, L’arc-en-ciel lointain, et Les vagues éteignent le vent.
    • Tout cela m’a permis de terminer l’énorme intégral du Cycle du midi des [frères Strougatski]. C’était pas une mince affaire. J’ai dû m’y reprendre à plusieurs fois avant de rentrer véritablement dedans. Je ne sais pas trop si cela vient d’un souci de traduction ou juste de l’évolution du style des auteurs.
  • 📺️ regardé les 2 premiers épisodes d’Avatar, l’adaptation de la série animée.
    • C’était étonnamment chouette d’autant plus que j’ai encore des visions de la première et dernière adaptation cinématographique. Je me demande par contre comment ils vont gérer la croissance réelle de l’acteur incarnant Aang.

chez les autres

avant

 
Read more...

from le numérique est un champ de bataille

Petit récapitulatif pour moi-même de la controverse qui agite la version francophone de Wikipédia et ses communautés. Bien que j’aimerai écrire plus longuement sur le sujet, je n’ai pas la bande passante nocturne pour le faire encore moins diurne. Je travaille de façon ouverte en espérant que les esprits refroidis retrouveront un brin de lucidité. Wikipédia est un projet important, chacun y contribue à sa manière, j’essaie de poser quelques bases pour éventuellement développer plus en détails certains points à l’avenir. Une note de synthèse en quelques sortes.

iels sont pertinent·e·s et écrivement mieux que moi

le sondage

Le 12 février 2024 des contributeur.ice.s de la version francophone de Wikipédia ouvrent un sondage titré « Mention du nom de naissance pour les personnes trans » pour prendre la température concernant les conventions éditoriales concernant la mention du dead-name des personnes transexuelles. La problématique est principalement les personnes dont la transition aurait eu lieu après une phase de notoriété. Cela fait suite à une tribune datant de 2022 dans l’Obs réunissant un nombre considérable de personnalités du monde culturel dénonçant le manque d’égard généralisé du site pour le respect de personnes.

Le sondage en question nécessite une lecture attentive d’une longue page et les modalités de participation ne sont pas simples à comprendre tant au niveau intellectuel qu’ergonomique. Il y a 6 questions et il faut aller éditer plusieurs champs textes dans un slalom d’avis plus ou moins digeste avec parfois une forme de violence écrite. La seule condition explicite est d’avoir au moins 50 contributions sur les pages d’article de Wikipédia et donc en ne comptant pas les pages de discussion ou les pages d’utilisateur·ice·s.

On peut aussi remarquer que la préparation du sondage n’a pas été vraiment fluide et que la question de sa publicité était déjà problématique. Une tentative précédente de sondage avait déjà eu lieu et mobilisé une discussion qui dura plus d’un an et demi pour finalement avorter.

Dans la terminologie de Wikipédia, les contributeur·ice·s distinguent un sondage qui est informatif et une prise de décision.

la controverse

La question intéressante pourrait être comment trouver des conventions techniques et rédactionnelles pour sortir concilier respect des personnes et encyclopédisme sans sacrifier aucun des deux ? Cette dernière notion est loin d’être figée et le degré zéro serait de se contenter d’être une succursale de l’état civil. C’est un moment important, car cela nécessite un vrai travail de concertation et de créativité. Cependant le débat n’est pas vraiment posé dans ce cadre, mais dans une attitude indélicate et feignante.

Sinkra: “Si vous avez un compte Wikipédia avec au moins 50…” – Eldritch Café

La controverse n’a d’ailleurs pas du tout lieu sur ces questions, mais sur la diffusion du sondage sur des réseaux sociaux, notamment le fediverse dans sa variante mastodon. Cela va créer un afflux, à vue de nez, d’une trentaine de votes alors qu’on peut compter plus de 300 participants au total.

Discussion Wikipédia:Sondage/Mention du nom de naissance pour les personnes trans — Wikipédia

Des personnes concerné.e.s par le sujet vont souligner dans la page de discussion du sondage leur malaise ainsi que la violence par maladresse de la démarche et des formulations. On peut considérer qu’il y a une forme de transphobie à ne pas inclure, comme dans « inclusif », proactivement des personnes sensibles à ces questions ou bien même à se sensibiliser soi-même ou collectivement avant d’entreprendre un sondage public. Demander de l’aide, c’est un savoir-être. À partir de ce moment, la page de discussion part dans tous les sens. On assiste surtout à une chambre d’écho d’un petit nombre de contributeur·ice·s que l’on pourrait qualifier de piliers de comptoir qui vont s’autoconvaincre qu’un signal d’alerte est une forme de déstabilisation frisant la cyberattaque par une puissance étrangère. Il y a ce genre de choses sur les Wikipedia, c’est un sujet sérieux, mais dans l’instant, c’est proprement surréaliste. La page discussion contient tous les éléments de langage permettant de s’autopersuader que le problème n’est pas le sondage, mais ceux qui le critiquent. C’est tout un florilège de mantras et de formules vide de sens comme « Wikipédia n’est pas un projet politique » ; il y a bien une page wikipedia sur le sujet mais elle est loin d’être aussi simpliste que cette formulation. Le but ici n’est pas non plus de faire un inventaire des biais de la communauté ayant le monopole de la parole.

Wikipédia:Bulletin des administrateurs/2024/Semaine 7 — Wikipédia

Le 19 février, 7 jours plus tard donc, une procédure de blocage est ouverte en ciblant plusieurs personnes ayant partagé le lien vers le sondage ou ayant participé aux discussions dans le « bulletin des administrateurs », la page de travail des administrateurs. Les administrateurs sont des contributeur·ice·s reconnu·e·s par les autres comme méritant des droits d’instances pour fluidifier la collaboration autour du projet. Cela, c’est la théorie. Dans les faits, il y a une visible dérive de certain·e·s vers un rôle judiciaire entre juge et flic.

Le 23 février, plusieurs personnes sont ainsi bannies bloquées de façon indéfinie. Parmi celles-ci se retrouve @Pandora@eldritch.cafe pour avoir fait valoir sa voix de concernée et chercher à défendre une meilleure inclusivité dans la consultation. @MarcBrillault@eldritch.cafe est également bloquée de façon indéfinie pour avoir alerté avec beaucoup de patience. Sur fond de rancune de longue date contre le projet Les sans pagEs, @Sinkra@eldritch.cafe se fera bloquer 3 jours. Un blocage signifie l’impossibilité d’écrire sur une page quelconque mettant ainsi fin de façon brutale à la discussion. Les votes comptent au maximum 23 participations. S'il y a un article journalistique à écrire, cela sera un très bon début d'aller recueillir leur témoignage.

Wikipédia:Sondage/Mention du nom de naissance pour les personnes trans/Tableau vote et nombre de contributions — Wikipédia

La situation est telle que des contributeur.ice.s ont eu la bonne idée (sarcasme) de faire liste des participant·e·s du sondage ayant moins de 1 000 votes et moins de 50 votes. La page de discussion du sondage s’étale également en palabre pour savoir si ces contributions doivent être depuis leur inscription, les deux dernières années ou en 2024. À un moment donné, les noms des comptes étaient indiqués avant un rétropédalage de bon sens. De la bonne surveillance.

quelques lectures intéressantes

  • Wikipédia:Règles et recommandations — Wikipédia. L’état d’esprit de contribution est largement plus flexible que ce que laisseraient penser les comportements d’une poignée d’individus. En parcourant les pages « méta » de Wikipedia sur Wikipedia, on retrouve un discours beaucoup plus nuancé et ouvert.
  • Wikipédia n’est pas : une bureaucratie. Tout cela me laissait avec une impression d’articulation entre une hiérarchie formalisée et informelle (le prestige du nombre de contributions par exemple). Encore une fois, je suis content de voir que le but est avant tout la collaboration, le travail ensemble, plutôt qu’une vision rigoriste de règles gravées dans le marbre. Bien entendu, il y a le texte et la réalité des pratiques.

les articles que je n’écrirai pas

  • Un état de l’art actualisé de la littérature académique sur le sujet ou au moins un feed des articles concernant les projets Wikipédia. Il y a par exemple, une section « recent research » dans The Signpost, le bulletin sur l’actualité du projet anglophone.
  • La manifestation du pouvoir et de l'autorité dans les partiques communautaires en ligne.
  • La majorité silencieuse des administrateur·ice·s de Wikipedia.
  • Wikipedia français ou francophone ? Dans les faits, il y a tout un travail d’élargir le contenu pour échapper à l’inertie de la masse française du réseau francophone. C’est loin d’être une évidence et cela apparaît dans [le bistrot], le principal espace de bavardage interne.
  • Bénévolat, travail gratuit et comportements dans les communautés web.
  • La notion d’espace public au regard des projets Wikipédia.
  • Est-ce que Wikipédia doit bénéficier d’une forme d’exception ?
  • Sagesse des foules, intelligence collective, auto-organisation, ces concepts qui traversent et motivent les communautés de Wikipedia.
  • Des outils communautaires pour mieux se comprendre. Réactiver mes travaux sur les analyses de textes et de réseaux autour de Wikipedia. Il y a des personnes comme @pac2@wikis.world qui fait déjà un travail considérable sur observable.
 
Lire la suite...

from le numérique est un champ de bataille

À la suite de deux articles de The Markup sur le scraping, j’en profite pour revenir sur ce morceau important du web et articuler quelques clés de lecture. Qu’est-ce c’est ? Pourquoi est-ce important ? Et quelques contextes d’usage avec leurs enjeux.

Il y a quelques approximations par esprit de concision. Pardon par avance.

Qu’est-ce que c’est ?

Le scraping est l’opération consistant à extraire systématiquement de l’information d’un ensemble de pages web (un site en particulier, une pelote de liens, etc.) pour constituer un jeu de données (les données, les changements dans ces données, etc.) qui pourra éventuellement servir à produire une nouvelle information (comparaison, vue macro, etc.). Une fois automatisée, cela permet de changer, l’échelle en quantité et en temporalité, des informations provenant du web. Cela en fait un élément important de l’écologie de la connaissance dans notre univers hypermédiatique.

Le scraping mobilise les tâches suivantes :

  • naviguer sur des pages web, c.-à-d. au format HTML,
  • extraire l’information de ces pages,
  • et de l’organiser sous la forme d’une base de données, un fichier ou des fichiers, bref, restructurer l’information différement.

Le degré zéro est de le faire soit même à la main. Il y a longtemps, il y avait même des extensions pour navigateurs, par exemple navicrawler du Medialab de Sciences Po, pour aider à cela. La plupart du temps, c’est un script dans un langage comme python qui permet d’automatiser la partie répétitive.

Pour abstraire et généraliser l’extraction d’information, il faut souvent une compétence de compréhension de la structure d’une page web, c.-à-d. savoir lire du HTML, et en comprendre la syntaxe. Bien heureusement, le web est une technologie fondamentalement ouverte et tous les navigateurs permettent d’afficher le code source d’une page en deux clics (clic droit, voir le code source, clic gauche). Si vous entendez parler d’« inspecter le code source », c’est cela, une manipulation qui permet de relier un élément visuel avec un morceau de langage technique décrivant cet élément. Le jeu est alors de trouver le motif permettant de rassembler tous les éléments semblables.

Certains éditeurs de site web cherchent à empêcher ce genre d’opération, il n’est alors pas rare d’utiliser à nouveau un script qui va simuler des séries d’actions humaines dans un navigateur web. Redonnant ainsi un sens au terme de user agent qui permettait d’identifier un navigateur comme un instrument d’agissement (ou d’agentivité) d’un utilisateur.

Pourquoi est-ce important ?

Le scraping et sa continuité de pratiques sont importants, car dans le paradigme marketing actuel de l’intelligence artificielle, ce qui est automatisable a une bonne probabilité d’être recyclé comme un service payant avec un travail qui est surtout de la conception d’interface utilisateur, mais comme le design ne paie plus on parle de « robot » et d’« intelligence artificielle ». Browse.ai est un exemple de ce genre de maquillage. D’ailleurs, tout cela pourrait être fait avec du travail humain en exploitant un service comme Mechanical Turk d’Amazon et cela resterait du scraping. La différence notable est la responsabilité de l’usage de technologie et la volonté de fermer les yeux, ou non, sur les conditions d’extraction et d’exploitation du travail. Dans ce contexte, la notion de compétence est également importante, car, bien que technique, savoir lire du HTML est une connaissance nécessaire et normalement relativement facile d’accès. On n’est pas dans des affres de complexité et un minimum de pédagogie fait l’affaire. La promesse du no-code de l’intelligence artificielle est une barrière à cela et empêche la résolution du moindre problème ainsi que l’identification d’erreurs. C’est une dépendance directe au bon vouloir d’une entreprise/d’un service en fonction des orientations managériales et du marché. Dit autrement, le scraping est un bon cas pour ouvrir les différentes problématiques sociales invisibilisées dans le paradigme dans lequel nous sommes plongés depuis quelques années et accélérer par le succès commercial de OpenAI.

L’autre point important est la complexification des technologies web. La professionnalisation des métiers du web et l’économie numérique alimentant un besoin de produire de plus en plus de pages amènent à un amoncellement de nouvelles solutions pour résoudre des problèmes sauf que chaque solution vient avec ses propres problèmes. Pour mettre une page web en ligne, on est bien loin du glisser-déposer d’un fichier vers le FTP fourni gratuitement avec son accès à Internet. Souvent, pas toujours, un site web est plus une surcouche sur une API, un point d’accès programmatique, qui permet de générer des pages et d’avoir une gestion plus dynamique de son contenu que le modèle standard de la page web. Par exemple, plutôt que de faire une page différente par personne côté serveur, on va demander au navigateur d’aller récupérer des informations en parallèle et le laisser modifier la page à un endroit qui sera indiqué par avance. Schématiquement. Une solution de repli pour l’extraction d’information est alors d’aller la chercher dans l’API. On s’éloigne alors petit à petit du scraping et de ce que percoit normalement un navigateur et donc du contexte de lecture ainsi que les différentes transformations possibles. L’information récupérée de cette façon est souvent déjà structurée et ainsi plus propre.

Quels sont les enjeux ?

commerciaux

Commençons par les choses qui fâchent. Le scraping a une fonction importante dans l’économie numérique. Les premiers comparateurs de prix utilisaient du scraping pour alimenter leurs contenus avant l’avènement du hangar global. Marc Zuckerberg a scrapé les trombinoscopes, les facebooks, de sa fac pour en faire une compétition assez malsaine et à la mode à l’époque. Les startups sont friandes de données personnelles laissées à l’air libre pour alimenter des bases de données prospectives. Laisser son email en clair sur une page web, c’est s’assurer de retrouver sa boite inondée de publicités. Avoir un profil public github, la plateforme de Microsoft pour publier du code, c’est aussi la garantie de se faire prospecter de façon régulière à propos de nouveaux projets crypto.

À ce titre, la CNIL est sur le coup et rappelle que c’est interdit. Par contre, aller piller les autres boîtes, c’est une autre histoire. Cousin proche du scraping, il y a un crawling qui indexe le contenu des pages pour les indexer dans un moteur de recherche. La différence, c’est peut-être que le crawling est anticipé, et optimisé, par les éditeurs de site web. Ça s’appelle du SEO, ce n’est pas beau à voir et c’est une tout autre histoire.

Dans une autre mesure, la possibilité de scraper le web est un dommage collatéral de la volonté des acteurs du web commercial à extraire une valeur économique de l’attention des internautes. Afin de pouvoir assurer l’exposition à des publicités, Google cherche ainsi à contrôler la lecture d’une page web avec tout un tas de complications dont l’excuse est l’intégrité de ce qui est déclenché. C’est assez fallacieux et c’est un problème qui se mord la queue dans la mesure où le principal risque est les programmes malveillants qui se propagent par l’intermédiaire du réseau des bannières publicitaires. C’est une bataille du web en cours et le soutien, par l’usage, de Firefox est vital.

recherche

Côté recherche, il y a diverses problématiques allant de la conservation à l’analyse du langage naturel ou bien l’analyse des réseaux sociaux.

La plus importante est l’archivage du web et sa conservation. De la même façon que les crawlers commerciaux, l’enjeu est de conserver de façon intacte le maximum de choses possibles. Cela concerne des projets comme l’emblématique archive.org et l’archivage du web de la BnF et de l’INA.

Une autre problématique est l’analyse des controverses et le champ précédent des digital methods qui utilisent les matériaux comme un matériau pour construire des cartographies. C’est beaucoup plus que cela, mais il y a des livres très bien sur le sujet comme Controversy Mapping de Venturini et Munk.

journalisme

https://themarkup.org/hello-world/2023/12/16/how-elon-musk-is-trying-to-make-web-scraping-dangerous-again

https://themarkup.org/news/2020/12/03/why-web-scraping-is-vital-to-democracy

The Markup est un média US dont la thématique est la technologie. N’en faisant pas seulement un sujet, les journalistes de cette rédaction mobilisent régulièrement des méthodologies d’extraction d’information qu’il serait laborieux de faire manuellement. À ce titre, ils soulignent que le scraping du web est important d’un point de vue démocratique et central dans certaines de leurs enquêtes. Cela dérange assez les gros acteurs pour que cela se termine devant la justice avec de gros enjeux de régulation.

La question que je me pose alors est le lien entre pratique du scraping dans les rédactions françaises et la faiblesse du journalisme de données, en tant que champ, en France. Si vous êtes journaliste et que vous scrapez le web pour vos articles, cela m’intéresse d’en discuter dans le cadre d’une étude au long cours sur vos pratiques.

société civile

La transparence et l’accès de l’information sont également importants pour la société civile et l’existence d’un écosystème citoyen qui ne soient pas dans une confrontation constante avec la sphère marchande et la sphère administrative.

Laisser la possibilité de construire de l’information publique et de nouveaux services, comme vite ma dose, est un signe de santé démocratique, car il est alors possible de construire des communs et, enfin, orienter des technologies vers plus d’inclusion, de solidarité et de compréhension des collectifs.

L’association UFC-Que Choisir construit ainsi une cartographie des drives à partir d’un scraping des sites des différentes enseignes. À partir de là, il fournit un indicateur de coût du panier moyen selon les profils de ménage. Avec un peu de travail, il est possible de scraper à nouveau ces pages pour les transformer en données tabulaires permettant des analyses alternatives et de nouvelles mises en récit.

conclusion

Le scraping est symbolique de la possibilité de prendre du recul, d’avoir une vue d’ensemble, à propos du web et de ce qui y circule. Certainement pas une pratique quotidienne pour l’internaute moyen, c’est un indicateur de la frontière entre ce qui est ouvert ou ne l’est pas sur le web. À ce titre, sa pratique permet de mesurer la surface du web comme espace public. Une trajectoire vers moins de contenus qui seraient disponibles au regard des internautes par cet intermédiaire est indicateur d’une opacité de l’information. Les grandes entreprises technologiques, et les gouvernements, en parallèle, bénéficient d’une grande transparence sur nos données individuelles. Comme dirait Cory Doctorow à propos de l’interopérabilité, le scraping est une condition nécessaire, mais pas suffisante pour un futur désirable où Internet reste omniprésent. Autrement dit, Internet ne peut pas être une technologie sociale si le web ne reste pas ouvert et s’il n’y a pas la possibilité de construire une écologie de la connaissance où le contrôle technique ne serait pas du côté des citoyens.

Du côté de la production de contenus, de pages et de sites web, il est ainsi important d’avoir cette intention du web comme commun et espace public. La prolifération des applications pour smartphones (à 99,9 % réservées aux jardins/enclos d’Apple et de Google) est ainsi un grand pas vers la clôture du web et par extension de l’information comme moteur de la démocratie.

type : #analyse sujets : #openweb #scraping

 
Lire la suite...

from le numérique est un champ de bataille

Substack est une plateforme mettant en relation des auteurs et des publics. L'intérêt du site est la mise à disposition d'un paywall, c.-à-d. la gestion d'un accès à des contenus conditionnés par un abonnement mensuel ou annuel. Substack prenant une commission sur chacun des abonnements. C'est un site relativement méconnu en France, hormis quelques niches adjacentes à la culture américaine où Substack est un peu plus populaire dues à la présence importante de la culture californienne parmi les élites. Depuis quelques jours, le site se retrouve très justement critiqué pour son soutien à des auteurs d'extrême droite et pour certains ouvertement et littéralement nazis.

https://www.theatlantic.com/ideas/archive/2023/11/substack-extremism-nazi-white-supremacy-newsletters/676156/

Quelques semaines auparavant, un article de The Atlantic revenait sur la présence de nazis sur la plateforme Substack. La défense des fondateurs de l'entreprise repose sur une vision néo-libérale de la liberté d'expression. Un laissez-faire maximaliste où tout se vaut et le marché des idées fera le tri. On est en 2023 et ce n'est pas plus une prophétie que de dire que cette idée d'autorégulation des idées est tout bonnement une fable avec des conséquences importantes.

https://substack.com/@hamish/note/c-45811343

Deux lettres ouvertes plus tard, la direction de Substack répond enfin à la controverse. Ils réitèrent sur une critique de la censure. C'est un point assez hypocrite. Leurs conditions d'utilisations comportent des critères assez clairs (). De plus, ils ont déjà choisi d'exclure certains contenus. Être ouvertement nazi et tenir des propos racistes est ok tant que c'est poli et pas “haineux”. En ne cherchant pas très vigoureusement, il est facile de trouver un substack avec la charte graphique du parti nazi (rouge, blanc, noir, Fraktur, croix gammées, drapeaux, etc.).

Une des conditions est par exemple de ne pas accepter de productions qui sont par ailleurs bannies de leur solution de micropaiement, Stripe. Or, il se trouve que certains auteurs sont bannis de Stripe pour leurs propos racistes, mais se retrouvent accueillis chez Substack avec une solution de contournement et une autre prestataire de transaction que Stripe.

La question de la microtransaction est le cœur de la plateforme. L'entreprise fait la promesse d'une rencontre d’une activité d'écriture, d’un lectorat et d’une rémunération plus ou moins conséquente. Ainsi au-delà de la simple tolérance, en contribuant à l'exposition d'auteurs fascistes, Substack leur donne une audience décuplée par l'effet de réseau, les personnes qui viennent sur substack pour d'autres raisons, mais surtout par la mise en avant de ces auteurs en les invitant à des moments éditoriaux privilégiés comme au principal podcast dédié au site, The Active Voice, sans aucune prévention ni contre-mesure.

Dans une certaine mesure, Substack est dans les pas de Medium. Ces deux entreprises ont longtemps cherché à séduire des auteurs provenant du monde journalistique et leur fournissant salaire et travail de support (éditeur, producteur de podcast). Medium cherche encore son modèle économique après de nombreuses tentatives et de changements, “l'entreprise pivote” dans le jargon de l'économie numérique, en laissant de côté des journalistes qu'elle a embauchés pour voir avant de changer d'avis. Leur modèle est actuellement un abonnement unique et une vague redistribution en fonction de l'audience. Les contenus produits le sont souvent gratuitement et se retrouvent derrière une page d'abonnement obligatoire, un paywall. Substack fait le pari d'une rémunération individualisée en fonction du nombre d'abonnements et une taxe de 10% générant un bel effet de longue traine. C'est le degré zéro dû capitalisme de plateforme. C'est aussi une logique individualiste qui met les en compétition les auteurs entre eux, le budget des lecteurs n'étant pas infini, il faut bien choisir quels contenus privilégiés, on va avoir accès. Chacun paie aussi pour sa newsletter et pour chaque auteur. C'est souvent entre 5 et 15 euros par mois, ce qui est assez voisin du tarif des médias traditionnels pour un journal entier. Il n'y a pas de partage économique et au mieux un partage d'audience à travers un système de connivence. C'est aussi une atomisation des pratiques éditoriales, tout est attaché à un nom propre, singulier et rares sont les productions collectives. En l'absence d'une quelconque forme de redistribution équitable, c'est un appauvrissement général, la concentration des revenus économiques dans une très petite fraction des producteurs de contenus, et une belle rente pour Substack. Le modèle économique est déjà bien éprouvé sauf qu'ici, on parle d'être alimenté par de l'argent sale et de financer des personnes exécrables.

Au départ, Substack est une plateforme pour faire des newsletters, c.-à-d. des textes qui seront lus dans une boite email. La tendance générale étant à transformer ces lieux de correspondance en poubelle à publicité, à notifications et artefacts de démarches administratives, trop de newsletters amènent à une saturation de l'attention qui est déjà bien malmené. En plus, on mesure beaucoup de choses dans une newsletter que sur un site ou une application. C'est pour cela que le site est moins en moins à propos de newsletters et de plus en plus à propos de discours très vagues (“The subscription network for independent writers and creators”). Le problème est que c'est, à nouveau, une entreprise qui éloigne les publics d'un web ouvert, celui où la page HTML est la finalité et non pas juste une coquille vide transportant tout un tas de technologies non interopérables, looking at you Single Page Application. D'ailleurs, même s'il s'agissait d'email, il est impossible de rentrer facilement en contact avec les auteurs qu'on aimerait soutenir dans leur démarche de changement d'espace de publication. Il y a bien les commentaires mais cela revient à peu près à attraper quelqu'un par le col de la chemise alors qu'on aimerait juste avoir une discussion cordiale avec quelqu'un à qui on donne déjà de l'argent.

Le protocole Web Monetization est la réponse ouverte à la problématique de la rémunération du travail de production culturelle. Avant tout une solution technique, elle ne touche pas du tout à la problématique sociale. D'abord c'est une solution avec une forte connotation crypto, il faut attacher un portefeuille électronique, un wallet, pour faire et recevoir des donations. Ensuite, elle suit un modèle idéologique basé sur l'individu et l'identité. Par exemple write.as est la version cloud de writefreely, un logiciel permettant à tout un chacun d'héberger une ferme de blog, pour parler comme dans le web des années 2000, et propulsant ce site. Write.as implémente justement web monetization mais sans effet de réseau ou de collectif, c'est une drôle de décoration qui ne nourrira personne et ne soutiendra aucune production.

En fait rien ne remplacera le travail collectif. Les premiers à l'avoir compris sont les médias dont le cœur est une rédaction composée de journalistes. La production est mutualisée et la rémunération est partagée sous forme de salaires. C'est une vision idéalisée et schématique. Il y a souvent quelque part des actionnaires, de la publicité, mais aussi l'État comme perfusion économique sous forme des aides à la presse. Est-ce qu'on peut imaginer d'autres formes d'organisation sociotechnique pour la production et la diffusion d'objets écrits ? À commencer par la fiction, la poésie, des écritures plus personnelles, et non pas individualistes, et pourquoi pas, en fait, du journalisme pour sortir des contraintes économiques et de la pression de l'actualité. Faire des collectifs et des communautés autonomes, et arrêter une nouvelle plateformisation d'une pratique qui pourrait quand même être sympathique. De façon connexe, on peut penser au collectif de créateurs de jeux vidéos Sokpop qui fait un jeu par mois contre un abonnement de 3 euros. Cela leur permet de s'affranchir des codes de productions du milieu et d'explorer créativement de nouveaux imaginaires. Substack n'est pas la première plateforme a exploiter l'espace séparant une écriture et sa lecture, elle ne sera pas la dernière non plus. Mais est-ce que cela ne serait pas le moment de commencer à chercher de nouveaux modèles ? Notre époque en a besoin.

type : #analyse sujets : #moderation #substack #plateforme #politique

 
Lire la suite...