Interaction

X. ANNEXES

X.1. Les ordinateurs à stylo

X.1.1. Les matériels

Nous donnons ici une liste d'ordinateurs à stylo. Leur avantage est de proposer une surface de digitalisation au dessus du visuel, sans éliminer toutefois complètement les problèmes de parallaxe

X.1.2. Les systèmes d'exploitation

Il faut distinguer les systèmes créés pour les P.C. de ceux crées pour les machines à base de 68000. Pour le monde P.C., nous avons:

PenOS ou PenDOS de CIC ou NCR, un DOS possédant une surcouche qui gère le stylo. En fonction de la version, on peut directement écrire une sur l'écran, la commande reconnue s'affichera près du prompt, faire apparaître une fenêtre de reconnaissance où l'on écrit les commandes et où l'on peut corriger les erreurs de reconnaissance ou encore faire apparaître un clavier virtuel pour taper la commande. Ces différents modes sont accessibles grâce à des gestes de commandes spécifiques.

Windows for Pen de Microsoft. Cette version de Windows est spécialement élaborée pour utiliser un stylo dans ce célèbre système d'exploitation. Des gestes permettant des raccourcis claviers et de corriger les entrées au stylo ont été ajoutés (Figure 70).

PenPoint de Go. Ce système satisfait à la métaphore du carnet. On atteint une application en sélectionnant l'onglet adéquate. Il y a là aussi une batterie de gestes de commandes, PenPoint est le seul système qui a été spécifiquement créé pour les ordinateurs à stylo.

En ce qui concerne le monde des 68000 comme le Newton ou le Motorola nous avons rencontré:

X.2. Les matériels pour la multimodalité

Nous présentons ici les matériels que nous avons été amenés à utiliser, à tester ou à côtoyer. Quelque soit la plate-forme matérielle sur laquelle ils tournent, tous ceux que nous avons utilisés ont été adaptés (liens séries ou ethernet) pour fonctionner sur un P.C.

X.2.1. La reconnaissance et la synthèse de parole

Des matériels:

Des logiciels associés:

Certains constructeurs nous permettent, en fournissant avec le produit un environnement de développement, d'intégrer leurs fonctions au code. Ainsi Monologue est fourni avec une librairie dynamique pour Windows: fb_spch.dll qui contient les fonctions principales permettant la synthèse vocale: OpenSpeech, Say et CloseSpeech.

X.2.2. La reconnaissance de l'écriture

X.2.3. Les périphériques de vision

Nous avons rencontré ce type de matériel lorsque nous cherchions à construire des interfaces plus immergées dans la réalité virtuelle. Malheureusement, qu'il s'agisse des lunettes ou des casques, ces dispositifs sont encore trop contraignants pour pouvoir être utilisés ailleurs que dans des simulateurs sous forme de jeux ou par des personnes spécialement entraînées (militaires, etc...):

X.2.4. Les périphériques exotiques

X.3. Les détails de l'évaluation

Nous donnons dans les sept pages qui viennent les résultats bruts des grilles d'observation obtenues lors de l'évaluation de TAPAGE décrite au chapitre VI.2.1.1. Evaluations de TAPAGE.

Il ressort de ces observations que 46 tableaux ont été créés en 2633 secondes, soit 57" par tableau. Sur les 2633s, 898s sont consacrées à la correction, soit 34% du temps. Et le module de correction a été utilisé 31% des fois (14 fois sur 46).

X.4. Glossaire

ACL. Agent Communication Language. Langage de communication entre agents.

Adaptabilité. L'utilisateur peut adapter l'interface à son style de travail.

Adaptativité. L'interface s'adapte automatiquement au style de travail de l'utilisateur.

ARCH. Modèle d'architecture en forme d'arche composé de cinq éléments.

Blackboard. Voir Tableau noir.

CHM. Communication Homme-Machine. A pour objectif la conception et la réalisation de machines adaptées aux besoins, servant si possible d'extension aux facultés sensori-motrices et intellectuelles de l'homme.

COOL. COOrdinatination Langage. Langage de communication entre agents, orienté vers leur coordination.

Conception incrémentale.

DERAPAGE. Dessins RApide par la PArole et le GEste. Une application multimodale présentée.

Emblème. Geste capable d'être transformé en mots.

GPS. Global Positioning System. Système qui permet de donner à tout moment la position d'objets grâce aux satellites.

HCI. Human Computer Interaction. Voir CHM.

HTML. HyperText Markup Language. Langage standard du Web permettant de créer des présentations hypermedia, dérivé du standard SGML.

Hypermédia. Système de manipulation et de navigation interactive dans des documents multimédia.

IA. Intelligence Artificielle.

ICL. Interagent Communication Language. Langage de communication entre les agents dans une architecture de type Blackboard.

Illustration. Geste de désignation ou d'emphase.

Incrémental. Voir conception incrémentale.

Internet. Réseau de plus de 46000 ordinateurs connectés dans le monde entier parmi lesquels on trouve des services commerciaux ou des universités. Des programmes comme Netscape ou Mosaic permettent de retrouver les informations désirées sur Internet.

KIF. Knowledge Interchange Formalism. Langage de communication entre agents au niveau du contenu de l'information.

KQML. Knowledge Query and Manipulation Language. Langage de communication entre agents au niveau intentionnel.

Look and Feel. Présentation et comportement d'une interface.

Macro Agent. Agent communicant à capacité computationelle.

Magicien d'Oz. Technique d'évaluation d'applications par simulation.

Manipulation directe. Manipulation gestuelle d'objets à l'écran.

Media. Dispositifs physiques de réception ou diffusion d'informations, pouvant supporter plusieurs modalités.

Métaphore. Transposition analogique d'un domaine sur un autre.

Micro Agent. Agent unidirectionnel en charge de signaux spécifiques.

MMAAR. Micro Macro Agent ARchitecture. Modèle proposé pour l'architecture des interfaces multimodales distribuées ou non.

Modalité. Canal associé à un medium véhiculant une information typée. Le graphisme est une modalité du mode visuel véhiculée par le medium écran.

Mode. Ce terme définit la nature des informations servant à la communication tel que le mode gestuel ou visuel.

Mosaic. Un des plus populaires visualiseurs HTML d'Internet permettant de naviguer et d'explorer le Web juste en pointant et cliquant.

Multimédia. Système manipulant différents media.

Multimodal. Système pouvant traiter différents media.

MVC. Model View Controler. Modèle de gestion des interfaces dans Smalltalk.

Netscape. Voir Mosaic.

OAA. Open Agent Architecture. Architecture de type tableau noir pour des applications distribuées.

OCR. Optic Character Recognition. Terme regroupant la reconnaissance, souvant logicielle, des caractères imprimés.

PAC. Présentation Abstraction Contrôle. Modèle d'architecture de systèmes interactifs.

PAC-Amodeus. Modèle logiciel hybride reprenant ARCH et PAC.

PARC. Palo Alto Research Center. Centre mythique de recherche de Xerox.

PAVE. Pen And Voice Environment. Look and feel proposé pour des applications multimodales basées sur MMAAR.

PC. Personal Computer. IBM et compatibles.

PDA. Personal Digital Assistant. Ordinateur de poche à stylo.

Pen Computer. Ordinateur à stylo.

Plug and play. Traduit par «Branchez, ça marche!», il s'agit d'une architecture matérielle ou logicielle permettant de remplacer aisément un élément de la chaîne informatique à n'importe quel niveau sans engendrer de modifications ou affecter la cohérence globale du système.

PPP. Point to Point Protocol. Protocole de communication permettant d'obtenir une liaison ethernet sur une ligne téléphonique via un modem.

RDF. Reconnaissance Des Formes.

Réalité augmentée ou améliorée. Consiste à superposer des objets virtuels aux objets réels afin d'ajouter une information supplémentaire utile pour la tâche considérée.

Réalité virtuelle. Applications qui simulent des situations plausibles ou de la vie réelle.

Seheim. Modèle d'architecture de système interactif fondé sur les couches de la grammaire du langage d'interaction.

SGML. Standard Generalized Markup Language. Langage standard de description de documents hypertexts.

Synergie. Traitement en parallèle avec possibilité de fusion de différentes sources d'information.

Tableau noir. Modèle d'architecture issu de l'IA.

TAPAGE. Editeur de TAbleaux par la PArole et le GEste. Une application multimodale présentée.

TCP/IP. Transmission Control Protocol/Internet Protocol. Norme devenue standardqui permet de connecter des micro-ordinateurs à Internet.

TTS. Text To Speech. Dispositif permettant de générer un fichier sonore à partir d'un fichier texte.

UI. Unité d'Information. Signal reçu ou émis par un canal de transmission.

UI. User Interface. Interface utilisateur.

URL. Universal Resourse Locator. Adresse d'un site Web.

Web. Voir WWW.

WIMP. Windows, Icons, Menus and Pointer. Terme générique regroupant les interfaces graphiques utilisant fenêtres, icônes, menus et souris.

WWW. World Wide Web. Système organisant les informations sur Internet utilisant des liens hypermedia entre les URL.

X.500. Standard adopté pour des bases de données.

X.5. Table des figures

Figure 1: Média et modalités

Figure 2: Configuration matérielle NCR/DATAVOX

Figure 3: Configuration DAUPHIN/CORONA

Figure 4: Kohounix, détermination du niveau de l'utilisateur de Munix

Figure 5: Capacité informante des modalités

Figure 6a: De la métaphore du bureau à la représentation du Monde

Figure 6b: De la métaphore du bureau à la représentation du Monde

Figure 6c: De la métaphore du bureau à la représentation du Monde

Figure 6d: De la métaphore du bureau à la représentation du Monde

Figure 7a: Exemple de l'évolution d'une interface

Figure 7b: Exemple de l'évolution d'une interface

Figure 7c: Exemple de l'évolution d'une interface

Figure 7d: Exemple de l'évolution d'une interface

Figure 8: Un environnement virtuel proposé par la NASA

Figure 9: La réalité augmentée dans des applications 2D

Figure 10: Le modèle langage de Seheim

Figure 11: Le modèle MVC

Figure 12: Une architecture PAC

Figure 13: Les composants du modèle ARCH

Figure 14: Le modèle PAC-Amodeus

Figure 15: Le parallélisme des piranhas

Figure 16: Open Agent Architecture

Figure 17: Architecture de TAPAGE

Figure 18: Détail de l'Agent d'Interprétation

Figure 19: Architecture MMAAR

Figure 20: Dessin original et numérotation des tracés dans l'ordre de production

Figure 21: Recherche des segments localement verticaux ou horizontaux

Figure 22: Deuxième étape

Figure 23: Troisième étape

Figure 24: Les zones d'aimantation ne sont pas uniformes

Figure 25: Reconstruction des jonctions par le calcul des références

Figure 26: Le tableau est "redressé"

Figure 27: Les objets pris en charge par la reconnaissance tardive

Figure 28: Les zones d'aimantation autour d'un segment

Figure 29: Exemples de courbes fermées, leurs englobants et les coins sensibles

Figure 30: Exemple de reconnaissance à la volée

Figure 31: Processus général et détection des liens

Figure 32: Des gestes de nos applications: rature, flèche et cercle englobant

Figure 33: Représentation des données brutes issues du stylo

Figure 34: (X2,Y2)(X3,Y3)&X1X4 Segment [(X1,Y1),(X4,Y4)]

Figure 35: Représentation des H et V grâce à des tables de références

Figure 36: Une représentation des H et V optimisée

Figure 37: La structure de données pour les segments quelconques

Figure 38: Le mot OUTLINE n'est pas la première interprétation de ce dessin...

Figure 39: ... et toutes ces lignes sont parfaitement parallèles

Figure 40: Recherche de motifs

Figure 41: Droite et espaces de recherche

Figure 42: Héritage de la taille des motifs

Figure 43a: Interprétation sémantique du tableau

Figure 43b: Interprétation sémantique du tableau

Figure 44: Les étapes de la mise à jour des structures

Figure 45: Un processus récursif

Figure 46: Diagramme en réseau dans DERAPAGE

Figure 47: Entraînement des segments 2 et 3 par déplacement du 1

Figure 48: Elimination de l'extrémité libre après effacement du segment 1

Figure 49: Marques de corrections (en gris) pour l'élargissement du serif

Figure 50: TAPAGE pour MS-DOS

Figure 51: TAPAGE pour Windows

Figure 52: DERAPAGE pour Windows

Figure 53: Interface du secrétaire électronique

Figure 54a: Application immobilière de PAVE

Figure 54b: Application immobilière de PAVE

Figure 55: PAVE version militaire

Figure 56: Multimedia Travel Agency de CGS

Figure 57: Une version touristique de PAVE

Figure 58: PAVE Collaboratif

Figure 59: Le cycle du prototypage [MEIN91]

Figure 60: Une installation de Magicien d'Oz

Figure 61: Ananlyse d'une tranche de dialogue

Figure 62a: Un tableau recopié

Figure 62b: Un tableau recopié

Figure 63a: Un tableau créé

Figure 63b: Un tableau créé

Figure 64: Ecran du logiciel d'évaluation dédié à DERAPAGE

Figure 65: Les résultats fournis par EVAL

Figure 66: GRID de Tandy

Figure 67: Vue éclatée d'un NotePad de NCR

Figure 68: Un Pilgrim

Figure 69: Envoy de Motorola

Figure 70: Les gestes de Windows for Pen

Figure 71: Magic Cap de General Magic

Figure 72: Environnement eWorld d'Apple

Figure 73: Apprentissage sous DATAVOX

Figure 74: Un casque pour la réalité virtuelle

Figure 75: DataGlove de VPL 175


  page précédente