2024 | 2023 | 2022 | 2021 | 2020 | 2019 | 2018 | |||
2017 | 2016 | 2015 | 2014 | 2013 | 2012 | 2011 | |||
2010 | 2009 | 2008 | 2007 | 2006 | + 100 ans d'archives ! | ||||
Rechercher un seul mot dans les articles :
|
L'informatisation croissante de notre société occidentale est un vaste sujet. Même en se restreignant à parler du seul internet, ce forum de l'Essor ne suffira pas à en faire le tour. à peine allons-nous ici en toucher la surface du doigt, sans la prétention d'y imprimer une onde quelconque.
Plongeons-y pourtant... mais avant tout une précision. Au moment où j'écris ces lignes, je pressens que mes lecteurs font partie, pour la majorité, de cette génération qui – contrairement à Obélix et sa potion – n'est pas tombée dans l'internet étant petite. Comment dois-je alors accompagner votre plongée? Difficile de contenter tout le monde, si les uns doivent porter des brassards quand les autres veulent endosser tout de suite des bouteilles! J'essaierai donc de vous éviter la noyade en ne recourant qu'à un minimum de termes techniques.
L'internet est donc un immense réseau d'ordinateurs interconnectés. Il compterait 1'633'000'000 utilisateurs réguliers ou occasionnels et ce chiffre est en augmentation. Le nombre d'ordinateurs produits depuis le début de l'année serait d'environ 180'000'000, selon la même source ( World-o-meters ).
Avec un tel nombre d'usagers, pas étonnant que l'internet soit devenu un océan profond. Pour ceux qui ont déjà mis un orteil dans cette eau, vous vous êtes peut-être contentés de «surfer», ou bien vous êtes allés voir sous la surface. Certains y pêchent des poissons merveilleux, d'autres découvrent des coraux sulfureux, mais aucun internaute – AUCUN – ne peut se targuer d'avoir tout visité de cet insaisissable océan.
D'autant qu'il est multidimensionnel. Ses seules dimensions géographiques et temporelles – les plus faciles à appréhender – sont déjà gigantesques. Commençons par celles-là avant d'aborder des dimensions plus subtiles.
L'internet donne accès à des trillions et des zillions de pages de texte, de vidéos ou de contenus sonores en provenance de toute la planète. ça, vous le saviez déjà. L'origine de ces contenus reflète toutefois le déséquilibre qui règne aussi dans le monde réel. Les hommes ont créé l'internet à leur image. Les contributions sont de provenances tout aussi inégales que ne l'est la répartition de la nourriture ou des autres ressources, à la surface du globe. Néanmoins, restons positifs. Vous pouvez consulter un livre qui se trouve à la bibliothèque de Buenos-Aires, ou plus modestement de Perpignan, comme si vous y étiez (voir le témoignage de Romain, en page 13). Vous pouvez obtenir un itinéraire routier assemblé spécifiquement pour votre trajet, en fournissant uniquement les points de départ et d'arrivée. Le site de Michelin vous fournira en quelques secondes un itinéraire très précis pour traverser toute l'Europe, avec distances détaillées, coûts et numéros de sortie.
Vous rechignez à rouler en voiture? Les horaires des trains de toute la Suisse ou encore de l'Angleterre et du Japon, sont aussi consultables «en ligne», c'est-à-dire en accédant au contenu actuel de l'horaire, tel qu'il est exploité par la compagnie. Les compagnies aériennes ne sont pas en reste côté informations sur les vols, mais je les snoberai ici, pour abus de pétrole et pollution éhontée. Et s'il vous prenait l'envie d'aller à Compostelle à pied, vous trouverez aussi tous les détails sur internet. Vous allez à Paris? Vous pouvez voir «en photo panoramique à 360°» la rue et l'entrée de l'immeuble ou de l'hôtel où vous serez hébergés, pour vous repérer d'avance dans le quartier... Après la publication de toute la géographie de la planète à partir d'images satellites, on dispose maintenant d'une vue à hauteur d'homme. Une sorte d'ersatz d'ubi-location, en quelque sorte. Cette fonction appelée Google street view n'est pas encore disponible pour Coppet (GE), Grattavache (VD) ou Champoz (JU), mais ça l'est déjà pour quasiment tout Paris et pour 200 villes de France. Ce sera bientôt le tour de Genève, Zurich, Bâle ou Berne.
Quand un résultat de recherche à partir du mot clé «Mozart» renvoie 29'600'000 résultats, on ne peut que perdre pied et se rendre compte qu'il vaut mieux savoir nager. Sur le web, cela signifie s'entraîner à utiliser des fonctionnalités de recherche avancée, pour trier le bon grain de l'ivraie, exclure les résultats insignifiants, se rapprocher souvent du but cherché par cercles concentriques plus qu'en ligne droite. Celui qui cherche sur internet des renseignements actuels sur un problème spécifique se verra d'abord noyé parmi toutes les pages un jour publiées sur ce thème. Sans critères affinés, les recherches sont alors plutôt chronophages.
C'est pourquoi les services de type «moteurs de recherches» (qui sont nombreux, même si on ne parle toujours que de Google) offrent la possibilité de ne rechercher que les pages contenant tels ou tels mots-clés, combinés de telle ou telle manière, en filtrant par date de création, par langue, par région, par types de fichiers, par emplacement du texte recherché dans la page, par domaines, et j'en passe. Contrairement à ce que l'on croit généralement, il existe aussi des répertoires de sites indexés et classés de manière plus traditionnelle par des humains. Dans l'ensemble, ces moteurs de recherches sont au web ce que les tiroirs en bois des fiches bibliographiques étaient aux bibliothèques d'antan… ils permettent de trouver l'information. Améliorer l'indexation de cette gigantesque bibliothèque est un domaine en plein développement. Il s'agit de rendre plus sémantique l'information concernant les contenus, pour faciliter les recherches.
Aimez-vous les pages d'histoire des dictionnaires et des encyclopédies ? Ou les éphémérides publiées dans votre journal local ? Ou les échelles chronologiques des temps géologiques? écoutez-vous «Histoire vivante» à la RSR ? Si vous répondez oui à l'une de ces questions, un centième de la masse d'information chronologique qui est à votre portée sur internet risquerait fort de vous occuper durant de nombreuses années, si vous vous mettiez en tête de la parcourir en entier. Dans ce domaine, l'encyclopédie communautaire Wikipédia fait assez fort, en proposant des centaines de chronologies thématiques ( que l'on appelle timelines en anglais ).
L'espace et le temps, voilà déjà les deux dimensions les plus évidentes de cet océan où notre société occidentale s'ébroue depuis un peu plus d'une décennie maintenant. A elles seules, elles sont déjà vertigineuses. Mais il existe d'autres dimensions. Et je m'en voudrais de ne pas les évoquer ici.
Si vous pensez que « l'internet » et « le web » sont une seule et même chose, préparez-vous à un petit choc. Le web déjà immense n'est qu'une partie, qu'un aspect de ce qui est constitutif de l'internet. Par exemple, bien avant le succès actuel du web, beaucoup d'utilisateurs participaient à des conversations à plusieurs, en différé, relayées par le réseau internet. Ces espaces de discussions appelés IRC (pour Internet Relay Chat) fonctionnent toujours, et sont très fréquentés. On y trouve de tout, depuis les discussions sur le végétarisme ou l'élevage des chats angoras, en passant par les fétichismes de toutes sortes et les débats sociologiques de tous acabits.
Le web que l'on connaît aujourd'hui n'est donc que la partie visible de l'iceberg. Il est devenu populaire au milieu des années 90. Il est constitué de ces millions de pages offertes afin que vous puissiez les consulter à l'aide de votre «navigateur web», précisément. Outre le web, le réseau internet compte de nombreux dépôts de fichiers, qui sont disponibles pour téléchargement par toutes sortes de publics, qu'ils soient composés de médecins, d'ingénieurs ou de fans de rock, etc.). Ces fichiers ne sont pas des pages web. Pour les publics cités par exemple, ce sont des notices d'emballages de médicaments, des plans ou des fichiers de musique. Les utilisateurs autorisés y accèdent à l'aide d'un protocle de communication pour le transfert des fichiers, sans nécessairement utiliser un navigateur web.
En plus de ces dépôts de fichiers (protocole ftp:, mais j'avais promis d'éviter les termes techniques), Internet recèle encore des communautés, des tribus, des aficionados qui s'y ébattent en toute tranquillité, hors de vue du grand public. Alors que des centaines de milliers d'internautes s'inscrivent à Facebook pour partager leur vie privée avec le monde entier, d'autres appliquent le principe: « pour vivre heureux, vivons cachés ».
Internet permet aussi le partage d'information «à l'interne» au sein d'entreprise multi-localisées. Quand un garagiste genevois commande une voiture hybride à Volvo, munie d'une liste spécifique d'accessoires exigés par son client, et que Volvo répercute le détail de sa commande à une myriade de sous-traitants, c'est aussi l'internet, mais vous comprenez que ce n'est pas « sur le web ».
Ajoutez-y tous les sites qui sont effectivement accessibles « par le web », sans y être en libre accès pour tout le monde. C'est-à-dire les sites qui exigent un nom et un mot de passe avant de vous donner accès à leurs contenus. Là encore, il y en a des milliers. Que ce soit un site web de rencontres, ou un site web d'apprentissage à distance (e-learning) pour des vétérinaires, il ne s'agit pas de contenus destinés au grand public. Ils restent donc inconnus de vous comme des moteurs de recherche, à moins de grossières négligences de la part de ses concepteurs qui arrivent plus souvent qu'on ne le voudrait.
Je vous fais grâce d'autres formes de cloisonnement qui sont encore plus ésotériques; l'internet est déjà bien plus vaste qu'on ne le croyait.
Comme si ce n'était déjà pas suffisant d'avoir une telle quantité d'information au bout des doigts, il se trouve des techniciens et des bibliothécaires pour se poser la question de l'archivage et de la pérennité des contenus de ce web en perpétuel mouvement. Comme on l'imagine, la quantité d'information accessible sur le web va croissante. Mais dans le même temps de nombreuses pages disparaissent et d'autres sont modifiées. C'est ce kaléidoscope incessant que d'aucuns ont entrepris d'archiver régulièrement, afin d'y capter même ce qui est éphémère. Un exemple sera ici pertinent.
Supposons que Marie publie sur son site personnel l'intégralité de son mémoire de maîtrise universitaire sur la reproduction des champignons. Après avoir fini d'y bosser longuement, elle en est légitimement fière; elle veut le montrer à ses copines et à son cousin qui habite Zurich. Elle publie donc le document de 300 pages sur son site web. Puis, rapidement embauchée par une entreprise de biochimie, Marie comprend que certains aspects de sa recherche sont susceptibles d'avoir des conséquences économiques dont son employeur et elle-même pourraient tirer profit. Elle s'empresse d'effacer le pavé de son site web; il n'aura été en ligne somme toute que durant trois semaines. Si personne n'est venu lire son document pendant ces trois semaines, Marie peut-elle être rassurée ? Malheureusement pas! Des organismes se consacrent exclusivement à parcourir le web et à stocker (recopier) sur leurs propres ordinateurs l'intégralité ou presque de son contenu à un moment donné, à des fins d'archives. Et ce travail est même fait par des Bibliothèques publiques, avec de l'argent qui l'est tout autant, comme l'expliquait lors d'une conférence de professionnels de l'informatique à Berne le directeur de la Bibliothèque de France, conférencier invité. Il a tout simplement lancé un service « archiveur » de la plus grande partie des sites en langue française (incluant pas mal de conneries) dans le cadre de sa mission publique de « conservation ».
Si le site de Marie a été ainsi « aspiré » par un archiveur durant les trois semaines critiques, les moteurs de recherches spécialisés de ce service continueront d'avoir accès à son mémoire, même après qu'elle l'aura effacé. Ils en livreront les 300 pages à quiconque recherchera plus tard des mots-clés qui s'y trouvent. Même trois ans après que le document a été effacé. Ce qui a été publié une fois ne disparaît plus. On sait même que certains de ces services d'archives écument à un intervalle beaucoup plus serré tout ce qui est publié (mis en ligne) par des internautes chinois, de Corée du Nord ou d'autres pays spécifiques, et reproduisent ces contenus pour la postérité, afin de contrer la fâcheuse propension de certains gouvernements à vouloir museler leurs citoyens.
Dans une moindre mesure, Google offre déjà une version amoindrie de ce service. Quand vous cliquez sur un lien parmi les résultats d'une recherche, il arrive que la page référencée n'existe plus et qu'on vous serve à la place un joli message « Erreur 404 » du plus bel effet, qui signifie seulement que la page est introuvable. Dans cette situation il vous suffit de cliquer le lien marqué «en cache» qui se trouve sous le résultat de recherche pour voir néanmoins cette page, mais telle qu'elle se présentait lorsque Google l'a indexée. Contrairement aux organismes dédiés à l'archivage, Google n'offre pas les nombreuses versions successives d'une même page. Mais c'est le même principe. Ce qui a été… est encore !
Il découle de ce qui précède que rien de ce qui s'est un jour ou l'autre trouvé publiquement sur le web ne peut être considéré comme oublié. Comme tout, ça a ses côtés pratiques, mais c'est aussi dangereux. De 2005 à 2007, Jean (un ami de notre Marie biologiste?) apparaissait sur le site web d'un de ses copains, sur des photos de beuverie où on le voyait – un peu glauque – tirer une bouffée d'un joint de marijuana. Le problème, c'est que la page en question affichait aussi les noms et prénoms des amis présents ce soir-là. Certes, cette page compromettante a été effacée depuis longtemps déjà. Mais Google et les services d'archivage avaient fait leur boulot. La page est encore visible «en cache». Sur une autre page, le nom de Jean apparaît comme signataire d'un communiqué de presse d'une organisation militante de gauche. Vous devinez la suite? Quand Jean a postulé pour travailler chez une grosse multinationale veveysane, il n'a pas compris pourquoi sa candidature a été écartée malgré des qualités certaines. Et on ne le lui dira jamais.
Cet exemple ne relève pas d'une élucubration fictionnelle. Le phénomène consistant à rechercher et extraire du web des informations passées ou actuelles sur quelqu'un est si courant et si largement pratiqué qu'il a même donné lieu à un néologisme. On parle de «google-iser» quelqu'un. Et c'est un sport à la mode. Des fournisseurs googuelisent leurs clients. Des employeurs googuelisent un candidat ou un futur apprenti. Les jeunes filles leur futur petit copain. Les politiciens leurs concurrents, etc. Dans ce contexte, on a tout intérêt à rester discret et à ne pas afficher tous ses excès sur la toile. Ce problème se pose particulièrement pour les jeunes, qui vivent leur folle jeunesse dans le moment présent, ont envie de s'afficher pour s'affirmer, et n'ont pas envie de réfléchir à la protection de leur vie privée ni à ce qu'ils feront demain.
Et il faut aussi parler maintenant de l'autre côté du miroir. Même si vous ne publiez jamais le moindre mot ni la moindre photo sur un site perso, sur votre blog ou sur une quelconque page web, et que votre nom n'apparaît nulle part dans les résultats de Google, vous ne surfez quand même pas incognito. Enfin, pas souvent…
Tous les sites web que vous consultez ont automatiquement accès à diverses informations vous concernant. Quel système d'exploitation est installé sur votre ordinateur, avec quel navigateur et en quelle langue vous surfez, ce sont-là des renseignements plutôt triviaux. Mais les entreprises connaissent aussi votre adresse I.P. (sorte de numéro de téléphone propre à votre ordinateur). Elles examinent comment s'est déroulée votre visite sur leur site. Par quelle page vous y êtes arrivé, sur quel site se trouvait le lien qui vous y a conduit, puis quel enchaînement de liens vous cliquez pour naviguer d'une page à l'autre sur leur site, combien de temps vous avez passé sur chaque page, et laquelle vous a fait quitter le site. Les entreprises emmagasinent aussi tous les renseignements personnels que vous leur avez fourni: nom, adresse de facturation ou de livraison, voire numéro de carte de crédit, si vous avez eu l'heur (ou le malheur) de commander quelque chose chez eux.
Il y a les entreprises indélicates, qui exploitent toutes ces données concernant votre surf pour leur propre usage. Au mieux de façon non nominative, uniquement à des fins d'analyse globale en marketing. Au pire en vous désignant personnellement comme cible publicitaire ou en vous catégorisant à toutes sortes de fins. Un exemple probant est celui de cette compagnie d'assurances qui offrait la possibilité de contracter des assurances accidents ou maladie à des taux attractifs, à condition de remplir votre demande «en ligne». Ailleurs sur leur site vous pouviez aussi répondre à un sondage, anonyme et sans frais, pour calculer votre espérance de vie. Vous répondiez à des questions concernant votre pratique sportive, votre consommation de tabac, vos maladies, vos habitudes en voiture, âge, sexe, catégorie salariale, etc. Tout ça SANS donner votre nom, évidemment; seulement une adresse de courriel, qui vous est demandée à la fin du sondage pour vous envoyer vos résultats. Mais même sans la fournir, dans les deux cas (sondage ou contrat d'assurance) votre adresse IP vous désigne et suffit à l'entreprise pour rapprocher vos informations. Je vous laisse deviner les avantages sonnants et trébuchants qu'elle a pu tirer de cette pêche aux «bons risques».
Et il y a les entreprises honnêtes, mais imprudentes. Elles n'exploitent pas vos données personnelles de manière agressive. Elles se contentent de ne pas les protéger suffisamment, et se les font piquer par les mafias du web. Voir à ce sujet l'entretien publié ici.
En matière d'indiscrétion assumée, l'exemple le plus évident est celui des services de messagerie «en ligne». Au lieu de faire venir vos messages électroniques chez vous, dans votre propre programme de messagerie, supposons que vous vous êtes contenté d'ouvrir une «boîte e-mail» gratuite chez un fournisseur comme Yahoo, Hotmail ou Google (gmail). Là, c'est carrément toute votre correspondance électronique que vous confiez à de purs étrangers.
Au mieux, les mots que vous utilisez dans votre correspondance privée sont analysés par des programmes informatiques qui affichent systématiquement des publicités en relation avec vos conversations. Depuis votre adresse gmail, écrivez à Marie pour lui dire que vous êtes rentrés d'Allemagne avec une fièvre carabinée. Et observez ensuite les publicités qui tenteront de vous vendre des cours d'allemand ou du Tylenol. C'est parfois agaçant, souvent cocasse, mais vous avez en principe accepté ce système lors de l'ouverture de votre compte de courriel chez eux. Les uns appellent ça de l'ingérence, mais pour d'autres, ce n'est que de la publicité pertinente à haute valeur ajoutée. Google jure ses grands dieux que seuls des programmes informatiques automatiques s'occupent de passer votre courrier personnel au crible pour choisir les publicités qui vous seront présentées, sans intervention humaine. On veut bien les croire. Mais ne devrait-on pas se méfier d'une ingérence du publicitaire si loin au cœur de la sphère privée?
Au pire, d'autres fournisseurs n'auront aucun scrupule à lire les e-mails de leurs clients, même s'ils ne l'avoueront jamais. Mais pourquoi s'en inquiéter? Même en ayant votre compte de courriel chez votre propre fournisseur d'accès à internet (Bluewin, Sunrise, Télé2, Orange, le Câble) plutôt que sur un compte gratuit, vos mesages non cryptés ne seront jamais à l'abri des regards indiscrets puisqu'ils transitent en clair sur le réseau internet. Pour les lire, il faut juste faire monter d'un cran les enjeux. Ce sont alors des opérateurs plus «illégaux» qui mettent leur nez dans votre courrier pendant que celui-ci transite par chez eux (à l'aide de programmes pertinemment appelés «sniffeurs»), ou même – pourquoi pas – l'État duquel vous êtes citoyen (ou l'État voisin!) qui emmagasine ainsi des renseignements sur vous. Quelques citoyens, pas forcément criminels, ont donc systématiquement recours au cryptage pour l'ensemble de leur courrier privé qui transite sur le web. On serait peut-être bien avisés de s'abstenir de les traiter de paranoïaques.
L'analyse de votre courrier déposé sur les sites de webmail (afin de vous proposer des publicités ciblées) c'est déjà «limite» comme procédé... Et on n'a pas encore parlé des vrais salopards, des «pirates» qui envoient vers votre ordinateur des programmes informatiques malicieux pour vraiment vous nuire ou vous piquer des informations.
On n'est plus alors dans la métaphore océanique mais carrément dans une mythologie animale terrestre. Et tous ces «virus» qu'on appelle des «vers», des «chevaux de Troie» et autres vrais méchants savent tous nager en apnée. Ils viennent s'écrire sur le disque dur de votre ordinateur quand vous ouvrez sans précaution les pièces jointes aux messages que vous recevez ou quand vous cliquez à tort et à travers pour installer tout ce qui vous est proposé sur le web. Sous leurs noms exotiques, ce sont simplement de petits programmes informatiques écrits pour faire sur votre ordinateur des choses que vous ne voudriez pas qu'ils y fassent, s'ils vous en demandaient la permission préalable. Et souvent, c'est vous qui avez cliqué dessus pour les faire s'exécuter, sans vous en douter. Une fois qu'ils sont installés, les ennuis commencent. Derrière tout ça, il y a vraiment des requins.
A côté d'eux, quelques Africains ont l'air d'inoffensives sardines. Ils vous envoient des messages en anglais plein de fautes d'orthographe, en espérant vous convaincre qu'ils sont des dignitaires importants qui ont besoin de votre aide (et de votre numéro de compte en banque) pour faire sortir 730'000'000 de dollars US de leurs pays. évidemment, ils promettent de vous en donner 10%. Ces tentatives d'arnaque sont tellement grossières qu'elles en sont ridicules. Pourtant, des dizaines d'internautes ordinaires mordent à l'hameçon et perdent quelques centaines ou milliers de francs avant de s'apercevoir que la sardine leur reste en travers de la gorge.
Ailleurs, c'est votre numéro de carte de crédit qu'on essaie de vous piquer… où l'hameçon qui veut vous ferrer se donne trait pour trait l'apparence du site web de PostFinance ou de votre banque, en espérant que vous mordrez et fournirez aveuglément votre identifiant et votre mot de passe. Cette technique frauduleuse (qui a encore de beaux jours devant elle) s'appelle justement le hameçonnage (phising [sic]). Sur le web, ne surfez pas à l'aveuglette et retenez-vous de vouloir mordiller tout ce qui brille un tant soit peu.
Un article qui commençait bien est devenu plutôt sombre? Eh oui. Plus on plonge profondément plus on s'éloigne de la lumière de la surface. L'internet au fond, c'est un peu le miroir du monde. On y trouvera donc le pire comme le meilleur.
Remontons à la surface avant de sombrer complètement. Au cours de cette immersion, je n'ai pas voulu porter trop de jugements sur les phénomènes et les services que je décrivais, à part les arnaques avérées. Je fais métier de développer des services web et des bases de données pour gagner ma vie. J'estime donc important d'avoir une réflexion éthique sur tout ça, et d'en contrer les dérives. Mais comme plusieurs d'entre vous j'utilise aussi fréquemment divers services de Google, et bien sûr… j'ai déjà google-isé quelqu'un. Alors je ne vais pas jeter la pierre à mon voisin.
Mais j'ai tenté de faire œuvre de vulgarisation à l'égard de ce qu'on trouve sous la surface. À vous de porter vos propres jugements. Pour discuter de principes moraux ou débattre des articles de lois qui tentent tant bien que mal de poser des digues autour de cet univers, il vous faudra recharger vos bouteilles et y retourner voir de plus près. La plongée d'aujourd'hui est terminée.
Pour l'instant, reprenez pied sur la terre ferme – sur la plage ou dans votre jardin – et admirez la forme des nuages ou humez l'arôme des fleurs. C'est une des choses qui nous fait cruellement défaut dans les profondeurs de l'informatique: l'immersion dans le monde réel !