Monthly Archives: février 2020

L’héritage de Larry Tesler au-delà du copier-coller

Clavier auxiliaire utilisé par Tesler pour tester la fonction de couper-coller, avec des étiquettes notées "cut" et "paste".
Clavier auxi­liaire utilisé par Tesler pour tester la fonc­tion de couper-coller, avec des étiquettes notées « cut » et « paste ».

Larry Tesler, décédé récem­ment, est associé à l’in­ven­tion du copier-coller. De même qu’Engelbart a inventé bien plus que la souris, son influence est vaste : les premières inter­faces graphique chez Xerox Parc et Apple, SmallTalk, le PDA Newton… Vice a fait un bon portrait de son parcours.

Comme avec Engelbart, ce qui est inté­res­sant au-delà du cata­logue de ses accom­plis­se­ments, c’est de comprendre la vision qui les a motivé. En plus et comme souvent, Tesler est moins un inven­teur soli­taire que le synthé­ti­seur d’une effer­ves­cence collec­tive. Dans l’ar­ticle je m’ef­force de citer ses inspi­ra­tions.

Mais commen­çons pas du concret.

Le génie du copier-coller

Les actions de couper, copier et coller font partie de ces idées omni­pré­sentes qui ont pour­tant été créées un jour. Les barres de défi­le­ment, l’auto-complétion… j’ai continué ici une liste d’in­ven­tions commencée par Dan Saffer.

Tesler a inventé en fait plusieurs choses.

1. Une sélection intuitive du texte

A l’époque, la crur­seur était placé sous le carac­tère (ou derrière, en couleur inversée), ce qui intro­dui­sait de l’ambiguïté : si j’in­sère une lettre, va-t-elle être placée avant ou après le carac­tère sélec­tionné ?

NLS, le système d’Engelbart était plus avancé et utili­sait une souris comme poin­teur, mais n’avait pas de curseur perma­nent. La souris servait litté­ra­le­ment de poin­teur, pour indi­quer par exemple le début et à la fin d’une sélec­tion de texte.

Larry Tesler (avec Peter Deutsch) inventa alors le curseur placé entre les carac­tères que l’on connait aujourd’hui.

curseur en poutre en I

2. Le remplacement des modes par le presse-papier et les menus

Se débar­rasser des modes était le grand combat de Tesler. Qu’est-ce qu’un mode ? C’est un état global du système que l’uti­li­sa­teur enclenche et qui permet ou interdit d’autres actions. Par exemple appuyer sur la touche VERR MAJ permet de taper des lettres capi­tales mais interdit les minus­cules. Appuyer sur MAJ serait un quasi-mode (selon la termi­no­logie de Jef Raskin) qui oblige à main­tenir la touche pour rester actif.

Les éditeurs de texte étaient massi­ve­ment modaux, c’est-à-dire qu’il y avait un mode pour navi­guer, un pour insérer, un pour supprimer… La présence de modes complexifie les inter­ac­tions (dans quel mode suis-je ? Comment en sortir ?) mais élargit la palette d’ac­tions. Par exemple en mode Naviguer, chaque touche du clavier peut être un raccourci, ce qui permet des actions fines du genre « avancer de trois para­graphes ». L’éditeur Vim, encore popu­laire aujourd’hui, fonc­tionne essen­tiel­le­ment ainsi.

C’est aussi l’hé­ri­tage d’une époque où les éditeurs de texte étaient conçus pour un télé­type (c’est-à-dire concrè­te­ment une impri­mante), pas pour un écran. On dési­gnait une ligne, on faisait une modi­fi­ca­tion et on impri­mait le résultat en croi­sant les doigts pour ne avoir fait d’er­reur. Dans un contexte aussi peu inter­actif, des modes étaient néces­saires.

Les créateurs d'Unix utilisant un PDP-11 avec un terminal télétype
Les créa­teurs d’Unix devant un PDP-11

Même NLS, le système d’Engelbart avec clavier et souris n’était pas plus simple. Voici la procé­dure pour déplacer du texte :

  1. Touche M (pour Move)
  2. Touche T (pour Text)
  3. Pointer le début puis la fin du texte souhaité
  4. Pointer la desti­na­tion
  5. Valider

Inspiré par Pentti Kanerva, Tesler abolit ces modes en inver­sant le modèle d’in­te­rac­tion : au lieu de dési­gner d’abord l’ac­tion (effacer) puis son objet (tel groupe de mot), on sélec­tion­nait du texte puis on agis­sait dessus. Le clavier ne servait plus qu’à une chose, taper du texte. Les commandes ont d’abord été attri­buées à des touches spéciales puis au menu dérou­lant « éditer », inventé juste après.

La complexité a été ainsi déplacée des modes au presse-papier : celui-ci stocke de l’in­for­ma­tion sans l’af­fi­cher à l’uti­li­sa­teur, ce qui occa­sionne parfois des surprises. Mais globa­le­ment, copier et coller étant souvent conco­mi­tants, on a beau­coup gagné au change.

Capture d'écran de Mac OS 9, avec un éditeur de texte ouvert dans lequel il est écrit "Larry Tesler 1945-2020")
Réalisé avec cet émula­teur

3. La métaphore de couper et coller

La dernière pièce du puzzle a été de rassem­bler le dépla­ce­ment et la dupli­ca­tion. Suivant l’ac­tion précé­dente, coller peut couper ou bien copier. Cela n’al­lait pas de soit : encore aujourd’hui Mac OS permet de copier un fichier mais pas de le couper, car le dépla­ce­ment est vu comme une action bien distincte. On a fina­le­ment trois actions réunies par une même méta­phore, celle du papier.

La méthode Tesler

Quelle approche a suivi Tesler pour faire tout ça ?

1. Tester, tester et tester

Malgré ses fortes convic­tions (qui allaient jusqu’à avoir une plaque d’im­ma­tri­cu­la­tion anti-modale), Tesler n’a jamais succombé à l’illu­sion de connaitre les utili­sa­teurs et a donc très tôt mené des tests.

My obser­va­tions of secre­ta­ries lear­ning to use the text editors of that era soon convinced me that my beloved compu­ters were, in fact, unfriendly mons­ters, and that their shar­pest fangs were the ever-present modes. The most common ques­tion asked by new users, at least as often as « How do I do this?, » was « How do I get out of this mode ? »

The Smalltalk Environment, 1981

Before doing it he decided that he wanted to observe a user, and used a tech­nique similar to his“guided fantasy.” He describes working with a secre­tary who had just started at PARC and was not yet influenced by the programs that were being used:I sat her down in front of a screen, and did what’s now called a“blank screen expe­riment.”

“Imagine that there is a page on the screen, and all you’ve got is this device that you can use to move a cursor around, and you can type,” I said. “You’ve got to make some changes to this docu­ment. How would you do it?”I gave her a paper docu­ment with lots of markups on it for refe­rence, and asked her to imagine that is was on the screen. She just desi­gned it right there!“I would point there, and then I would hit a delete key,” she said.To insert, she would point first and then start typing. She’d never been conta­mi­nated by any computer programs before, so I wrote all this down, and I thought, “That sounds like a pretty good way to do it!”

p. 62, Bill Moggridge, Designing inter­ac­tions. MIT press, 2007. Tout le chapitre est dispo­nible ici

2. Prendre les problèmes à la racine

Ce qui m’im­pres­sionne, c’est sa capa­cité très tôt dans sa carrière à argu­menter et théo­riser ses choix. Dès 1981, son disours contre les modes est solide et construit. En 2010 il réalise ce schéma pour montrer qu’il faut moins d’étapes pour corriger une erreur avec une inter­face amodale. Voir ces enjeux néces­si­tait de s’abs­traire du fonc­tionnel et de modé­liser des inter­ac­tions. Cela va plus loin que compter le nombre de clics et relève de la séman­tique : les opéra­tions de l’uti­li­sa­teur sont compo­sées de verbes et de noms, l’ordre nom-verbe est-il supé­rieur à l’ordre inverse, pour­tant plus proche de l’an­glais ? Les tests lui ont montré que oui.

A Personal History of Modeless Text Editing

3. La démocratisation contre l’avant-garde

L’opposition de Tesler à Engelbart fut parfois fron­tale et révèle une diffé­rence fonda­men­tale dans leurs visions. Pour sché­ma­tiser, le premier visait le grand public et le second des experts.

Engelbart déve­lop­pait un système ambi­tieux et complet pour inventer de nouvelles manières de travailler colla­bo­ra­ti­ve­ment et même de raisonner. Plusieurs ordi­na­teurs étaient connectés entre eux et équipés d’un clavier, d’une souris à trois boutons et d’un clavier-accord. Ce dernier, à gauche sur la photo, résume bien la complexité de l’en­semble, puisque chaque combi­naison de touches exécu­tait une action diffé­rente.

Douglas Engelbart démontrant son système
Douglas Engelbart démon­trant son système

Il se préoc­cu­pait plus d’uti­lité que d’uti­li­sa­bi­lité. Mettre des mois à apprendre à maitriser le système n’était pas vrai­ment un problème si ça valait le coup. A la fin l’uti­li­sa­teur pouvait mani­puler de grandes quan­tités d’in­for­ma­tions, raisonner sur des problèmes complexes ou résoudre des défis scien­ti­fiques. Engelbart avait cette vision de l’or­di­na­teur comme nouveau medium cognitif capable « d’ac­croitre notre intel­lect ».

Le problème est qu’il voulait créer un instru­ment merveilleux comme le violon alors que pas grand monde ne prendra le temps d’ap­prendre à jouer du violon, pour reprendre une formule d’Alan Kay cité par Bardini, p. 215)

Tesler, à l’in­verse, voulait créer des logi­ciels simples à comprendre par le plus grand nombre :

[Avec un collègue] ils rédi­gèrent une note interne à Xerox décri­vant ce qu’ils appe­lèrent IT, pour « Intuitive Typewriter » [machine à écrire intui­tive]. Ils déci­dèrent que la faci­lité d’uti­li­sa­tion était impor­tante, en réali­sant que ce serait un « désac­cord majeur avec Engelbart ».

p. 157, Bardini, Thierry (2000). Bootstrapping : Douglas Engelbart, Coevolution, and the Origins of Personal Computing. Stanford University Press.

Pour Engelbart, un nouveau medium appe­lait de nouvelles conven­tions, tant pis si cela rompait avec les habi­tudes. Pour Tesler c’était l’in­verse :

Il fallait adapter l’in­ter­face à la manière dont les gens travaillent et pas utiliser l’in­ter­face pour les forcer à apprendre à travailler mieux et diffé­rem­ment.

Idem

Dès le début des années 70 est donc née cette oppo­si­tion entre deux philo­so­phies. Elle reste prégnante dans la concep­tion de logi­ciels : élitisme ou démo­cra­ti­sa­tion, puis­sance ou faci­lité, respect des habi­tudes ou nouveauté. Présentée ainsi, l’op­po­si­tion tend à la cari­ca­ture et il y a sans doute de la place pour tous les types de logi­ciel. D’aucuns ont cepen­dant argué qu’une vision a écrasé l’autre et a tué dans l’œuf tout un champ d’ou­tils exigeants et avancés.

Quoiqu’il en soit, voici quelques personnes qui chacun à leur manière tentent de combler ce fossé et de faire avancer le medium.

Références complémentaires

Computer History Museum, Oral History of Lawrence G. “Larry” Tesler

Une démons­tra­tion par Tesler de son éditeur de texte phare

Larry Tesler face à un Xerox Alto

Post-scriptum : où l’on retrouve Don Norman

J’évoque dans cet article les éditeurs de texte des années 70. Il s’avère que l’un d’entre eux fut long­temps l’édi­teur par défaut d’Unix et fut dure­ment critiqué dans un article de Don Norman : The truth about Unix : The user inter­face is horrid (PDF).

L’article date de 1981 et fut appa­rem­ment très popu­laire. C’est le premier d’un longue série de textes qu’il consacre à l’in­for­ma­tique.

Le Chant du loup : sous-marin, PQ et cognition

Le Chant du loup suit l’épopée de l’équipage d’un sous-marin et de son “oreille d’or”, un analyste acous­tique. Ce film est une mine d’or sur l’es­prit humain et ses inter­ac­tions avec la machine. Voici pêle-mêle ce que j’ai trouvé inté­res­sant.

On y trouve beau­coup d’exemples des approches appe­lées facteur humain, c’est-à-dire en gros de la manière dont humains, tech­nique et orga­ni­sa­tions sont intri­qués dans des gros machins impé­né­trables appelés systèmes socio-techniques complexes.

C’est aussi une parfaite illus­tra­tion de la cogni­tion incarnée1J’utilise le terme le plus large mais comme le montre la section « Voir aussi » de Wikipedia, il y a d’autres approches, globa­le­ment conver­gentes : cogni­tion étendue, située, distri­buée, énac­ti­visme, phéno­mé­no­logie, exter­na­lisme, psycho­logie écolo­gique, etc., une nébu­leuse de programmes de recherche qui postule, pour sché­ma­tiser :

  • Que l’es­prit est insé­pa­rable du corps.
  • Que nos repré­sen­ta­tions existent par et pour l’ac­tion. Notre vision ne doit pas être pensée comme la construc­tion d’une image mais comme une acti­vité d’ex­plo­ra­tion du monde par boucles inces­santes entre gestes et percep­tion.2Deux réfé­rences : un livre d’Alva Noe (PDF de résumé et un de Kevin O’Regan Même nos capa­cités plus abstraites peuvent être pensées comme orien­tées vers certaines pratiques comme la commu­ni­ca­tion et l’ar­gu­men­ta­tion.
  • Qu’il n’y a pas de limite précise entre l’es­prit, le corps et son envi­ron­ne­ment immé­diat. Par exemple si je dessine des schémas pour m’aider et struc­turer ma pensée et que j’y reviens fréquem­ment dans un carnet de notes, c’est une manière d’exter­na­liser ma mémoire et on peut même dire que ce carnet fait partie de mon esprit, de manière étendue.
XKCD 903. Légende : "When Wikipedia has a server outage, my apparent IQ drops by 30 points."
XKCD – The Extend Mind

Un équipage, plusieurs cerveaux, un seul esprit ?

Le Chant du loup m’a fait notam­ment penser aux travaux d’Edwin Hutchins. Ce cher­cheur a passé du temps sur des ponts de frégates et dans des cock­pits d’avion pour étudier leur orga­ni­sa­tion. Son livre Cognition in the wild s’ouvre sur une longue descrip­tion d’un navire ayant échappé de justesse à une grave colli­sion.

Il explique que l’in­tel­li­gence doit être vue comme un phéno­mène intrin­sè­que­ment collectif, surtout dans ces cas d’équi­pages travaillant dans un envi­ron­ne­ment codifié et soudés autour d’un objectif commun. Les infor­ma­tions circulent à toute vitesse, chacun a un rôle précis pour analyser une infor­ma­tion ou effec­tuer une action, si bien que l’équipe fonc­tionne presque comme une seule entité. Ou disons au moins qu’il y a un conti­nuum entre indi­vidu et collectif.

Outils cognitifs

Dans un envi­ron­ne­ment aussi avancé et précaire qu’un sous-marin, l’usage de l’écrit peut étonner, alors qu’il est partout.

Il y a d’abord la table de navi­ga­tion, utilisée avec feutre effa­çable, rappor­teur et compas. Le navi­ga­teur y calcule des modi­fi­ca­tions de trajec­toire pour les proposer au comman­dant, qui peut voir le résultat direc­te­ment. Quelques exemples, tirés du Chant du loup et d’autres films.

Ce genre de réflexion effec­tuée direc­te­ment sur papier a été quali­fiée « d’ac­tion épis­té­mique » (PDF) par Kirsch et Maglio, qui ont étudié le compor­te­ment de joueurs face à Tetris. Ces actions n’ont pas d’autre but que d’aider à la réso­lu­tion de problème, par exemple pour véri­fier si une pièce va s’adapter aux autres il est plus simple de la pivote à l’écran que dans sa tête

Des zoids tout à fait mignons dessinés à la main en 1994

Admirez aussi le tableau lumi­neux, les feuillets suspendus et le rouleau de scotch pré-dévidé.

Cet usage du papier est aussi docu­menté dans les cock­pits d’avion, voir ce papier (PDF) écrit par Nomura, Hutchins (encore lui) et Holder.

Papier… et papier-toilette

Dans À la pour­suite d’Octobre rouge, on voit ce qui ressemble fort à un rouleau de papier-toilette à droite de l’écran. Pourquoi ?

À la poursuite d'Octobre rouge : ordinateur surplombé d'un rouleau de papier toilette pour nettoyer un écran

Réponse : un analyste utilise un sonar passif, c’est-à-dire pas un sonar clas­sique qui émet des sons pour détecter leur réver­bé­ra­tion sur l’en­vi­ron­ne­ment. Il écoute, tout simple­ment. Et il regarde : le spectre sonore ci-dessous repré­sente le temps en ordon­nées et la direc­tion en abscisses (parfois il s’agit de la fréquence). A l’époque, pour suivre une trace sonore il devait le faire à la main. Ou plutôt au feutre. D’où le rouleau qui permet­tait d’es­suyer ces marques. Ma source.

Oreille d’or

La tâche prin­ci­pale d’une oreille d’or : moins écouter que classer. Comparer à une base de données de signaux connus. Ce bruit est-il biolo­gique ? Marin, sous-marin ? Ami, ennemi ? Si le bruit ne rentre pas dans une case, il est bien embêté. Dans le film : c’est trop silen­cieux pour venir d’un bateau mais en même temps aucun sous-marin en acti­vité n’a d’hé­lices à quatre pales. Il faut forcé­ment une réponse, tu as litté­ra­le­ment cinq personnes sur le dos qui doivent décider d’une trajec­toire.

L’oreille d’or a le track­ball dans une main, le casque sur une seule oreille pendant les phases de veille et sur les deux pendant les phases d’analyse intense. Une seule oreille car il doit rester attentif à ce qu’il se passe sur le pont. Parole de spécia­liste :

Pour la veille, on n’uti­lise effec­ti­ve­ment qu’une seule oreille. En effet, un veilleur sonar ne doit pas être devant son écran pour unique­ment tourner la boule de son curseur audio : il doit savoir ce qui se passe dans le CO, pour­quoi on change de route par rapport à une force, savoir ce qu’on cherche en prio­rité, le secteur de la menace. Il n’y a pas vrai­ment d’oreille préférée : le veilleur sonar de coque écou­tera plutôt avec l’oreille gauche, car la table traçante (là où sont prises les déci­sions par le pacha ou le chef de quart) est à sa droite, alors que le veilleur ALR, qui est de l’autre côté, lais­sera plutôt son oreille gauche libre. Après, par exemple pendant un transit, c’est à dire lors­qu’il n’y a pas vrai­ment d’ac­ti­vités, on choisit l’oreille suivant le confort. Ensuite, on mettra les deux écou­teurs quand on veut se concen­trer sur un contact qui nous pose par exemple des soucis de classif ou de comp­tage.

Source

Système socio-technique

Voici quelques inter­faces montrées dans le film (proba­ble­ment non-contractuelles). Mais c’est la partie émergée de l’ice­berg. D’une certaine manière dans un sous-marin tout est inter­face entre l’être humain et des fonc­tions critiques. Tout est pensé pour aider les sous-mariniers à écouter et exécuter des ordres, à marcher, se tenir, ou respirer. Par exemple quand l’at­mo­sphère est compro­mise, ils peuvent se bran­cher à inter­valle régu­lier à des arri­vées d’air.

Dans cet écosys­tème entiè­re­ment arti­fi­ciel, tout a été conçu. L’équipage aussi : comment s’or­ga­niser, qui doit faire quoi à quel moment, le language codifié, tout a été réfléchi. Plutôt que l’his­toire d’un humain réduit à un rouage dans la machine, le film nous montre un monde où l’op­po­si­tion entre humain et système n’a pas de sens.

En bonus

Un jeu vidéo de carto­gra­phie sous-marine

Le canal Youtube d’un spécia­liste, avec cette play­list sur d’ana­lyse accous­tique

Il poste aussi ce genre de chose :

Un repor­tage de Libération : Vingt-quatre heures dans un sous-marin

Panneau de contrôle à bord du sous-marin Casabianca
Photo : Olivier Monge pour Libération, à bord du sous marin nucléaire Casabianca à quai à Toulon. Toulon, le 9 aout 2018