Repousser les atteintes à la vie privée sur le Web
Publié: 2022-03-10À l'âge mûr de 25 ans, nytimes.com est maintenant plus âgé que certaines des personnes qui travaillent à sa construction. Wikipédia a eu 20 ans cette année et le premier navigateur a été lancé il y a 30 ans. Le Web compte plus de 4 milliards d'internautes et approche les 2 milliards de sites Web. À ce stade, il est raisonnable de s'attendre à avoir des réponses à la plupart des grandes questions fondamentales sur la façon dont les gens et la technologie numérique fonctionnent les uns avec les autres.
Cependant, comme vous le savez sans doute, ce n'est pas le cas. Ce n'est vraiment pas le cas. Au contraire, les questions de technologie et de société semblent s'accumuler plus vite que nous ne pouvons les résoudre . J'ai commencé à travailler pour le Times il y a quatre ans. Avant cela, j'avais effectué une gamme de travaux techniques : développement de sites dans de petites boutiques en ligne, travail sur les produits avec des startups, conseil pour des entreprises technologiques de renom et forte implication dans une gamme de travaux du W3C. L'une des choses qui m'a attiré vers le New York Times a été l'opportunité de travailler sur certaines de ces grandes questions sans réponse en collaboration avec d'excellentes équipes et avec un mandat éthique fort.
Parmi ces questions, peut-être la plus surprenante à trouver encore non résolue est la confidentialité . En dehors du domaine numérique, nous prenons plusieurs décisions en matière de confidentialité par jour et les trouvons généralement suffisamment évidentes pour que nous remarquions à peine qu'elles sont là. Est-il acceptable de lire les DM de cet étranger par-dessus son épaule ? Puis-je raconter ce détail intime qu'un ami m'a partagé ? Mon médecin répétera-t-il ce que je lui dis de mes symptômes à mon patron ?
Évaluer si nous - ou quelqu'un avec qui nous parlons - pouvons prendre des informations personnelles d'un contexte et les partager dans un autre est quelque chose que nous faisons presque instinctivement. Si nous avions besoin d'un avis d'expert pour chacune de ces décisions, l'éthicien serait une profession à revenu élevé. Alors pourquoi ne pouvons-nous pas également mettre celui-ci en ligne?
Le contexte numérique
Plusieurs facteurs s'opposent à nous. La première est que la vie privée est contextuelle. Nous comprenons ce qui peut être partagé avec qui et comment en utilisant différents cadres pour le travail, la maison, le métro, le cabinet d'un médecin ou la plongée du quartier local. Mais dans nos vies numériques, tout est une légère variation sur une dalle de plastique brillante. Nous discutons avec des amis sur le même gadget sur lequel nous travaillons, parlons en public et recherchons des symptômes avec. Il est difficile de développer des indices pour ce qui compte comme approprié au milieu d'une telle homogénéité.
Un deuxième facteur est l' utilité des tiers . Le développement moderne de produits numériques complexes nécessite souvent de s'appuyer sur des tiers d'une manière ou d'une autre. Ce n'est pas nécessairement mauvais. Une entreprise spécialisée dans un service clair peut avoir une meilleure protection des données qu'un équivalent local, et tous les tiers ne portent pas atteinte à la vie privée. Certains tiers ne travaillent que pour le site propriétaire et ne réutiliseront pas les données des utilisateurs ailleurs. Pour des raisons de confidentialité, ils sont indiscernables de ce que fait la première partie. Un exemple de cela pourrait être Fathom : il s'agit d'analyses tierces, mais ils ont ouvertement publié la méthode qu'ils utilisent pour garantir la confidentialité des utilisateurs.
À l'inverse, d'autres tiers insistent pour être les contrôleurs des données qu'ils prennent des utilisateurs de votre site et les réutilisent indépendamment à des fins entièrement différentes. Ces derniers sont des violations évidentes de la vie privée, mais la technologie Web ne permet pas aux navigateurs - et donc aux utilisateurs - de les distinguer. Craquer l'extension de votre bloqueur de publicités et compter les "trackers" peut être facile, mais cela vous en dit peu sur le degré d'atteinte à la vie privée d'un site. Il est difficile d'automatiser la protection au niveau du navigateur sans pouvoir distinguer les tiers.
Un dernier facteur dont nous ne serons pas timides est qu'il y a de l' argent à tirer de cette confusion . Bon nombre des plus grands noms de la technologie (et une foule de plus petits également) fonctionnent avec des modèles commerciaux qui ne font rien d'autre que convertir les violations de la vie privée en argent . Ils brouillent souvent les cartes avec des positions largement lues qui vantent une image déroutante de la vie privée souvent confondue avec la sécurité, la transparence, les paramètres de confidentialité complexes et les contrôles, ou avec le consentement. Il peut être difficile de progresser sur des améliorations éclairées en matière de confidentialité lorsqu'une grande partie de la conversation sur le sujet provient d'un lieu de confusion.
Cela peut sembler être beaucoup à régler d'un coup, mais ne vous inquiétez pas : nous pouvons tous améliorer le Web, un site Web à la fois. Il est facile de devenir paralysé en pensant que toute collecte de données est une question de confidentialité. Ce n'est pas le cas. Vous pouvez parcourir ce chemin progressivement . La façon dont j'aborde la vie privée pour un site donné est d'abord d'essayer de trouver un contexte quotidien familier qui, selon moi, s'en rapproche. Raisonner à partir de contextes quotidiens connus permet de puiser dans des normes établies pour lesquelles nous avons tendance à avoir de bonnes intuitions. Parce que le monde numérique fonctionne différemment, il y a rarement une correspondance parfaite, mais commencer par une situation concrète peut aider à structurer votre réflexion.
Entrez dans ma librairie
Examinons une librairie et voyons comment nous pouvons modifier progressivement ses propriétés de confidentialité en ajoutant plus de détails qui la rendent de plus en plus semblable à un site Web commercial moderne. J'espère qu'il y a un point où vous voudrez tracer une ligne - et ce point devrait vous dire quelque chose sur ce qui est approprié dans un contexte comparable sur le Web.
Une librairie constitue un point de comparaison décent dans le monde réel pour une publication en ligne. Vous y allez à la recherche de choses à lire. Les personnes qui y travaillent peuvent vous voir entrer et peuvent même vous reconnaître lors de visites précédentes. Si vous vous êtes identifié, ils peuvent connaître votre nom, ou au moins avoir un surnom pour vous.
Lorsque vous parcourez la boutique, le personnel peut avoir une idée de ce que vous regardez. Ils ne l'espionneront peut-être pas dans les moindres détails, mais ils sauront dans quelle section vous vous trouvez et pourront facilement remarquer quel livre vous venez de sortir. Ils peuvent l'utiliser et vous poser des questions pour vous proposer des recommandations.
C'est un environnement commercial , et si vous achetez quelque chose là-bas, selon la façon dont vous payez, ils pourraient en apprendre un peu plus sur vous et partager certaines de ces données avec une société de traitement des paiements quelconque.
En y regardant de plus près, vous remarquez que le magasin a quelques caméras de vidéosurveillance en marche. Cela vous met un peu mal à l'aise, mais après une rapide discussion avec le propriétaire, ils vous rassurent que ceux-ci fonctionnent en circuit fermé local de sorte que la vidéo ne quitte jamais le magasin, est automatiquement conservée pendant 24 heures maximum et n'est jamais surveillé dans le seul but d'identifier le vol. Ces propriétés - accès très restreint, conservation courte, objectif clair et limité - offrent de fortes garanties (en supposant que vous faites confiance à l'entreprise) et limitent le caractère invasif du processus.
Mais, en faisant plus attention, vous remarquez un certain nombre d'autres caméras plus petites et plus discrètes. Ils sont dispersés dans tout le magasin d'une manière qui leur permet d'analyser les livres que vous regardez, que vous sortez pour lire le texte de présentation, que vous décidez d'acheter.
La conversation avec le libraire est un peu plus tendue cette fois. Ces flux vidéo vont à un certain nombre d'entreprises en échange desquelles ils aident à payer une partie des coûts du magasin ou à répertorier le magasin sur des cartes de quartier. Vous avez accepté cela en poussant la porte et en entrant.
Le propriétaire est catégorique sur le fait que c'est sûr, que le processus est entièrement "anonyme", que ces sociétés de surveillance n'utilisent "que" un hachage de votre biométrie faciale pour vous reconnaître d'un magasin à l'autre. Qu'avez-vous à cacher de toute façon ? C'est un élément important pour s'assurer que les livres restent bon marché. Sans cela, seuls les riches auraient des livres. Tout le reste serait mauvais pour les petites entreprises et les pauvres.
En parcourant la liste des entreprises prenant des flux vidéo de cette boutique, vous ne trouvez pas de nom que vous reconnaissez. À l'exception de ces deux-là qui semblent également prendre des flux vidéo de tous les autres magasins.
En poussant un peu plus le propriétaire de la librairie, vous vous rendez compte qu'il n'est pas très content de ces entreprises. Ils utilisent les données qu'ils collectent dans la boutique à la fois pour concurrencer la librairie en vendant directement des livres et pour recommander d'autres librairies. Ils utilisent également leur position, informée par ces données, pour promouvoir un modèle dans lequel ils gèrent l'infrastructure de tous les magasins - pourquoi un propriétaire de librairie se soucierait-il des murs, des étagères, de l'éclairage, est-ce que leur valeur n'est pas seulement dans la sélection de livres ? – et un nombre croissant d'autres magasins sont passés à ce modèle mondial de centre commercial linéaire. Le propriétaire n'est pas trop optimiste à propos de tout cela. "Mais quand vous ne vous conformez pas, ils vous retirent de la carte et envoient des gens chez vos concurrents", disent-ils.
Comme promis, trouver un équivalent non numérique exact à l'état de la vie privée sur le Web est imparfait et comporte quelques recoins légèrement artificiels. Pourtant, ce qui précède est très proche de ce que c'est que d'exploiter un éditeur commercial ou une boutique en ligne sur le Web aujourd'hui.
En lisant ce qui précède, différentes personnes traceront la ligne à différents endroits . Certains sont entièrement convaincus par la mort de la vie privée et attendent avec impatience le brillant avenir promis de la bureaucratie des grandes technologies. À l'autre extrémité du spectre, d'autres préféreront une librairie sans personnel où ils pourront choisir leur prochaine lecture sans qu'un humain ne voie jamais ce que cela peut être.
Si vous êtes comme moi, vous tracerez la ligne quelque part autour de l'ajout du système de vidéosurveillance. Je ne suis pas excité à ce sujet, mais si son traitement des données est correctement limité et s'il aide ma source de livres préférée à rester en vie, je peux vivre avec. Je ne suis cependant pas enclin à accepter la surveillance omniprésente de mon comportement - dont l'effet principal est qu'une poignée de grandes entreprises absorbent de petits magasins ou les chassent de l'existence.

Aucune de ces positions n'est intrinsèquement bonne ou mauvaise, mais nous aidons nos utilisateurs si nous convenons d'une valeur par défaut et définissons des attentes pour y correspondre. Je crois qu'un bon point de départ pour une valeur par défaut qui fonctionne pour la plupart des sites qui exécutent un ensemble relativement restreint de services connexes est la règle de Vegas : ce qui se passe sur le site reste sur le site . (Y compris les parties qui travaillent pour le site, et uniquement pour le site.)
Comment pouvons-nous construire pour la confidentialité ?
Qu'est-ce que cela signifie pour ceux d'entre nous qui construisent des sites sur le Web que d'autres visitent ? Il n'y a pas de réponse unique à cela. L'année dernière, j'ai écrit sur la façon dont le Times le voit, mais la façon dont vous abordez votre propre situation dépendra des spécificités auxquelles vous faites face.
Je recommande de travailler sur la confidentialité de manière itérative , avec un plan d'amélioration par étapes progressives au fil du temps. Dans la plupart des cas, il est peu probable que vous puissiez déployer un nettoyage Big Bang fourre-tout.
La première étape pour rendre un site plus digne de confiance dans sa vie privée est de comprendre ce qui se passe et pourquoi . Si vous travaillez du côté de la technologie ou du produit, vous vous êtes peut-être habitué à grogner de consternation alors que l'équipe marketing ajoute un autre tracker, auquel ils se réfèrent sous des euphémismes inoffensifs et mignons comme "pixel", qui ralentiront votre site. Mais vous n'avez peut-être qu'une compréhension limitée de la raison pour laquelle ils font cela en premier lieu.
Ces chevauchements sont d'excellentes opportunités pour établir des relations réelles avec d'autres équipes. Ils essaient de réaliser quelque chose, et ce quelque chose couvre probablement au moins une partie de votre chèque de paie. Mais ils ont aussi parfois du mal à distinguer les vendeurs honnêtes des canulars et ils peuvent bénéficier d'une meilleure compréhension de la technologie qui sous-tend ce qu'ils achètent - ce que vous pouvez probablement aider. Si vous êtes de leur côté au lieu de vous plaindre d'eux, vous ne pourrez peut-être pas supprimer tous les trackers, mais vous serez en mesure de progresser.
Une fois que vous avez cette relation (ou si vous êtes la personne qui prend ces décisions), la prochaine étape consiste à vous assurer que chaque tiers est tenu responsable. La réalité du commerce en ligne aujourd'hui est telle que vous devrez peut-être conserver certains traceurs, mais ceux qui restent devraient être efficaces de manière prouvée . En travaillant en étroite collaboration avec notre équipe marketing, nous avons pu réduire de plus de 90 % la quantité de données partagées par le Times avec des contrôleurs de données tiers. Non seulement cela a amélioré la confidentialité, mais cela a également amélioré les performances. La deuxième étape consiste à développer une habitude de scepticisme sain.
Lisez les petits caractères pour que vos utilisateurs n'aient pas à le faire - cela fait partie intégrante de la création d'un site qui ne trahira pas la confiance de vos utilisateurs.
"
Ce widget gratuit pour faciliter le partage de pages sur les réseaux sociaux ? C'est probablement un courtier en données. Ce système de commentaires que vous pouvez déposer en bas de votre blog ? Vous voudrez peut-être vérifier qu'il ne vend pas les données de vos utilisateurs. Il n'est pas rare qu'un tiers conclue des accords avec d'autres tiers afin que, lorsque vous en ajoutez un à votre site, il injecte également les autres, une pratique connue sous le nom de ferroutage. C'est une bonne idée d'exécuter votre site via un outil comme Blacklight de temps en temps pour vous assurer qu'il ne se passe rien de surprenant (bien que si vous diffusez des publicités, vous ne pourrez malheureusement pas faire grand-chose).

Enfin, vous voulez bien sûr penser à vos utilisateurs, mais vous devez aussi penser à vous-même ! Les implications commerciales de l'envoi de vos données d'audience à des tiers sont souvent mal comprises et trop rarement prises en compte. Comprendre vos utilisateurs, vos lecteurs, vos clients est un atout commercial clé. Lorsque vous partagez vos données d'audience avec des tiers, ils en bénéficient également - et ils peuvent utiliser ces données pour vous concurrencer.
Si vous gérez un magasin de chaussures et laissez un réseau social suivre vos utilisateurs afin que vous puissiez y cibler des publicités plus tard, sachez que ces données, qui révèlent qui est intéressé par les chaussures, seront également utilisées pour leur montrer des publicités de chaussures pour vos concurrents.
Si vous hébergez vos pages de commerce électronique sur un centre commercial virtuel appartenant à une entreprise qui gère également sa propre entreprise de magasinage en ligne, combien de temps faudra-t-il avant qu'ils utilisent ce qu'ils apprennent de vos clients pour vous surpasser ?
La confidentialité n'est pas seulement une question d'éthique et de gagner la confiance de vos lecteurs : c'est aussi une bonne stratégie commerciale lorsque, volontairement ou non, vous participez à l'économie des données.
"
Et si on réparait aussi le Web ?
En tant que communauté, nous pouvons chacun travailler pour améliorer nos propres petits coins du Web. Mais, collectivement, nous pouvons faire mieux. Nous pouvons améliorer le Web et en faire une meilleure plate-forme pour la confidentialité.
La confiance est peut-être la propriété la plus importante du Web. Vous pouvez naviguer librement d'un site à l'autre parce que vous pouvez être sûr que votre navigateur protégera votre sécurité et que, même si ces sites exécutent du code sur votre ordinateur, ils ne le mettront pas en danger. C'est une promesse forte, bien plus forte que ce que vous pouvez attendre des plates-formes natives, mais en ce qui concerne la confidentialité, c'est une promesse que nous avons rompue. Comme vous naviguez librement d'un site à l'autre, votre vie privée n'est pas entre des mains dignes de confiance.
Pourtant, les choses s'améliorent. La plupart des navigateurs ont fourni un excellent travail pour empêcher le suivi sur le Web, et le plus gros obstacle, Chrome, a promis un changement en 2023. Des projets comme le Global Privacy Control progressent. Alors que les cookies tiers disparaissent lentement , les acteurs de l'industrie travaillent ensemble pour proposer des normes de protection de la vie privée qui permettent aux entreprises de fonctionner sur le Web sans porter atteinte à la vie privée des personnes.
Détailler toutes les propositions sur la table nécessiterait un tout autre article, mais Private Click Measurement d'Apple, FLEDGE de Google, PARAKEET de Microsoft ou, si vous me permettez cette prise éhontée, Garuda du New York Times valent tous la peine d'être examinés, car est le travail qui se déroule dans le Privacy CG. Certaines des propositions discutées là-bas, comme l'apprentissage fédéré des cohortes (FLoC), ont rencontré des problèmes, mais cela ne fait que souligner la valeur de la construction d'une solide compréhension de la vie privée dans la communauté Web afin de développer ces nouvelles solutions.
Même si nous aimerions tous résoudre ces problèmes complexes, c'est rarement possible. Les solutions nécessiteront une coopération entre les technologues et les décideurs . En tant que technologues, nous pouvons vous aider de plusieurs façons. Nous pouvons agir en tant que citoyens et participer aux débats politiques. Nous pouvons décrire nos systèmes en termes compréhensibles et expliquer ce qu'ils impliquent. (Vous seriez surpris du nombre de mauvaises descriptions de cookies.) Nous pouvons utiliser notre compréhension de la technologie pour essayer d'explorer comment ce que nous construisons peut créer des problèmes lorsqu'il est déployé à grande échelle.
Plus important encore, lorsque la technologie fait défaut à la société, nous pouvons nous charger d'imaginer d'autres façons dont elle pourrait fonctionner, même si elles semblent hors de portée immédiate. La technologie est souvent présentée comme inévitable comme si sa conception actuelle était la seule option rationnelle plutôt que l'accumulation de décisions arbitraires qu'elle est. Nous détenons un pouvoir important, souvent inexploité, dans notre capacité à simplement dire que « cela n'a pas à être comme ça » et à montrer quelles autres voies existent.
Nous construisons pour les utilisateurs , pas pour les traire de leurs données. Le Web a rendu difficile pour eux de se défendre - c'est à nous de le faire pour eux. Peu d'entre nous qui travaillent sur des sites commerciaux seront en mesure de produire immédiatement des résultats parfaits en matière de confidentialité, mais cela ne devrait pas nous empêcher de faire mieux. Le vent a tourné et un Web respectueux de la vie privée semble désormais possible. Nous pourrions encore vérifier l'une de ces grandes questions de base de la liste.
Lectures complémentaires
- Un excellent livre à lire pour comprendre le fonctionnement de la vie privée est Privacy in Context d'Helen Nissenbaum. Un aperçu plus court est disponible dans Bit by Bit de Matt Salganik que vous pouvez lire en ligne.
- Privacy is Power de Carissa Veliz offre un aperçu efficace et bien documenté des raisons pour lesquelles la confidentialité est importante.
- Le classique de James C. Scott, Seeing Like A State, présente un aperçu désastreux de la façon dont l'ingénierie au niveau de la société peut échouer, souvent de manière catastrophique, qui comprend une description détaillée des problèmes provoqués par la « lisibilité », ce à quoi conduit la violation collective de la vie privée. pour.
- This Is Your Phone On Feminism de Maria Farrell est une description remarquable de la façon dont nous aimons nos appareils mais ne leur faisons pas confiance, et de la façon dont l'amour sans confiance est la définition d'une relation abusive.
- Le groupe d'architecture technique (TAG) du W3C travaille sur un ensemble de définitions de confidentialité pour aider à soutenir les discussions dans la communauté Web. Le résultat n'est pas encore cuit, mais il est construit sur la base d'un mélange des principes de confidentialité des utilisateurs (PUP) et du modèle de menace cible pour la confidentialité.
- Dans cet article, je n'ai pu couvrir que certaines des bases, mais une préoccupation importante en matière de confidentialité est la façon dont la collecte de données nous affecte au niveau collectif plutôt qu'au niveau individuel sur lequel nous nous concentrons trop souvent. Democratic Data de Salome Viljoen couvre très bien cette question.
- Woodrow Hartzog et Neil Richards ont écrit tellement d'excellents articles sur la vie privée qu'il est difficile de choisir un favori, mais je suggérerais de prendre la confiance au sérieux dans le droit de la vie privée comme un excellent point de départ. Ne soyez pas intimidé par la partie « loi », c'est vraiment une question de confiance.
- En regardant une question plus large, Re-Engineering Humanity, par Brett Frischmann et Evan Selinger, est une excellente description de la façon dont nous pouvons abuser de la technologie pour façonner les gens contre leurs intérêts.
- Plus du côté de la publicité, Subprime Attention Crisis de Tim Hwang explique pourquoi nous devrions nous préoccuper de la publicité en ligne et des entreprises qu'elle soutient.