edbrowse documentation

Documentation edbrowse

Table des matières

Chapitre 1, préface

Chapitre 2, guide de référence rapide Guide

Chapitre 3, l'éditeur

Chapitre 4, navigateur web

Chapitre 5, Javascript

Chapitre 6, scripts d'Edbrowse et le fichier de configuration

Chapitre 7, client de courrier

Chapitre 8, Accéder aux bases de données

Auteur

Karl Dahlke eklhad@gmail.com

Copyright

Ce programme est copyright (c) (c) Karl Dahlke, 2000-2008. Il est mis à disposition par l'auteur sous la licence publique générale GNU (GPL), définie par la Free Software Fondation. Il peut être utilisé dans n'importe quel but, et redistribué, à condition d'y adjoindre le présent copyright.

Par exception, je permets ici de lier le code de ce programme avec la bibliothèque d'OpenSSL (ou avec les versions modifiées d'OpenSSL sous même licence qu'OpenSSL), et distribuer les combinaisons liées comprenant les deux. Vous devez respecter la licence publique générale de GNU en tous points pour tous les codes utilisés autres qu'OpenSSL. Si vous modifiez ce programme, vous pouvez étendre cette exception à votre version du programme, mais vous n'y êtes pas tenu. Si vous ne souhaitez pas faire ainsi, supprimez ce rapport d'exception de votre version..

Remerciements

Ce programme emprunte du code et des concepts de construction au projet Links, lequel est également librement disponible sous les termes de la GPL. Merci aux auteurs pour tout leur travail difficile.

Leur écriture technique est bien meilleure que la mienne. Regardez svp certaines de ces pages Web ; vous ne le regretterez pas.

Écrire en HTML
Un tutoriel de code HTML
Ainsi vous voulez écrire un peu d'HTML…
Javascript pour Webmasters
Javascript, le guide définitif

Ce paquet exige le Spider Monkey Javascript, licencié par Mozilla sous MPL.  Disponible ici.  Les programmeurs et les mainteneurs de ce paquet devraient tirer profit de la documentation en ligne.

Philosophie

Edbrowse fait partie d'un ensemble, d'une philosophie, plus vaste, dans lequel éditeurs, navigateurs, clients mail, tableurs et autres applications importantes sont réécrites, depuis le début si nécessaire, pour prendre compte différentes formes de handicap.  Cela fait, d'autres applications peuvent s'appuyer sur ces outils, et devenir immédiatement accessibles à de nombreux utilisateurs de l'informatique.  Vous pouvez en savoir davantage sur cette philosophie ici.

Courbe d'apprentissage

Voici ce que William McEwan, du forum de discussion de Puppy Linux, dit au sujet de edbrowse. (Reproduit ici avec sa permission.)

"Les premiers jours où j'ai tenté d'utiliser ce programme (basé en partie sur l'ancien ed d'UNIX) j'ai cru vivre un cauchemar. Mais le soleil a commencé à briller, et j'ai commencé à m'interroger : ce programme apparemment simple pourrait-il être l'un des meilleurs programmes disponibles ? Tout dépend évidemment de la définition de meilleur. Pas de graphiques ici, pas davantage d'obèses comme Gnome / KDE / Microsoft. Pas de X requis. Mais il couvre tant de besoins quotidiens : l'édition de texte, la navigation sur le Web, le courrier électronique, l'accès aux bases de données, la gestion de fichiers, le ftp. Bien sûr, il a ses limites, support de javascript limité entre autres, mais il vient aussi avec beaucoup de potentiel. La courbe d'apprentissage, bien sûr, m'a demandé deux jours entiers, et je suis toujours en train d'apprendre, Mais c'est tellement facile maintenant. Littéralement, je peux le faire avec les yeux fermés. Préparez-vous à souffrir. Survivez, et profitez de ses plaisirs. "

Vue d'ensemble

Ce programme est, à première vue, un ré-implémentation de /bin/ed.  En fait vous pourriez utiliser quelques commandes d'Ed sans vous rendre compte que vous exécutez réellement mon programme.  Mais à mesure que vous l'utiliserez, vous découvrirez quelques différences, secteurs où mon programme diffère de Ed. (Ceux-ci sont discutés ci-dessous.)

La réécriture de l'Ed semble être une perte de temps, jusqu'à ce que vous vous rendiez compte que ce programme fonctionne également comme un navigateur - un navigateur inclus dans Ed.  Vous pouvez éditer une URL aussi facilement qu'un fichier local, et activer le mode navigation pour afficher les étiquettes HTML d'une façon appropriée pour un programme en ligne de commande ce type.  En d'autres termes, nous rejetons la majeure partie des informations de formatage, maintenons les liens et remplissons les formulaires.  Ceci permet aux utilisateurs aveugles d'accéder à l'Internet par l'intermédiaire d'une application qui est entièrement compatible avec la nature linéaire de la parole ou du braille. 

Je trouve cette approche supérieure au procédé de collage d'un adaptateur sur un navigateur de type écran (lynx) ou un navigateur graphique (Netscape). Naturellement, ce n'est que mon avis.  Pour être juste, beaucoup d'utilisateurs aveugles, même totalement aveugles, sont satisfaits de leurs balayeurs d'écran.  Je suis heureux que cela fonctionne pour eux, mais cette approche est pour moi une perpétuelle source de frustration.  Si vous aussi, vous préférez des applications linéaires, essayez ce navigateur. 

Cette documentation suppose que vous connaissez Ed.  En fait, elle aide si vous êtes à l'aise dans Ed.  Une expérience des navigateurs d'Internet et de la terminologie associée est également utile. 

Autres langues

D'abord, quelques mots sur les jeux de caractères. L'anglais est facilement géré par un flot d'octets, une lettre par octet. De plus, chaque lettre tient sur 7 bits; le huitième bit, non utilisé, est mis à 0. Cependant, les langages indo-européens comportent plus de caractères, comme ñ (espagnol), è (français), et ö (allemand). Ceux-ci peuvent tenir sur un octet, en mettant le 8ème bit à 1, selon le standard ISO8859-1. Néanmoins, un autre standard arrive, au moins dans le monde Unix/Linux. Ce jeu de caractères, connu sous le nom de UTF-8, code les caractères européens en séquences de deux octets. Ainsi, dans votre ordinateur, ñ est représenté par un ou deux octets. C'est transparent pour vous; vous voyez la même lettre sur l'écran, et vous entendez le même son (si votre lecteur d'écran envoie ces lettres à votre synthétiseur). Une façon simple de savoir sur quel système vous êtes est de faire "echo $LANG". Si la réponse contient la chaîne utf8, ou utf-8, en minuscules ou majuscules, votre console utilise utf8, et attend des séquences de 2 octets. Vos fichiers contiendront ces séquences, sans que vous en soyez (probablement) informé.

Il y aurait beaucoup plus à dire sur les jeux de caractères : ceci est juste une brève introduction au sujet. Je n'ai pas besoin d'aller plus loin, parce que Edbrowse ne supporte actuellement que ces deux systèmes . Le chinois, par exemple, requiert des séquences de 3 ou 4 octets, intégrées dans unicode. Edbrowse, pour l'heure, ne peut gérer ce niveau de complexité.

Les sorties et messages d'erreur ont été "internationalisés", afin que Edbrowse accepte la plupart des langues européennes.  Positionnez la variable d'environnement LANG pour interagir avec Edbrowse dans une autre langue.  Les langues acceptées sont listées ci-dessous.  Pour l'instant, nous nous sommes limités aux caractères ISO8859-1, c'est-à-dire les langues indo européennes.  Si vous pouvez participer à cet effort, prière de me le faire savoir.

Anglais: LANG=en (c'est la langue par défaut)

Français: LANG=fr par Erwin Bliesenick avec la documentation

Portuguais brésilien: LANG=pt_br par Cleverson

Quand un message d'erreur est affiché, les lettres accentuées sont affichées comme des octets de 8 bits, c'est-à-dire en ISO8859-1, à moins que la chaîne utf8 ou utf-8 soit présente dans $LANG, auquel cas les caractères non-ascii sont générés en utf8. LANG=fr_FR.UTF-8 est un réglage commun en France. Seuls ces jeux de caractères sont actuellement supportés. De même, le contenu d'un tampon, qu'il soit un fichier local ou un site internet, est affiché en séquences de 8 bits ou en séquences de 2 octets, conformément à votre environnement local. Si Edbrowse lit un fichier, c'est-à-dire qu'il le charge dans un tampon vide, et qu'il soit codé dans "l'autre" jeu de caractères, il est converti à la volée, bien avant que vous vous en aperceviez. Ainsi, il aura l'air normal. Si j'ai tout fait correctement, vous ne verrez aucune différence. (Utilisez la commande iu pour désactiver cette fonctionnalité.

Quand vous sauvegardez vos données dans le même fichier, c'est-à-dire si vous fait quelques ajouts ou modifications, je reconvertis le fichier dans son jeu de caractères original. Ainsi, vous pouvez renvoyer le fichier modifié à votre correspondant, et ce fichier sera dans son jeu de caractères, comme il l'escompte. Cependant, si vous sauvegardez vos données, ou une partie de vos donnés, sous un nouveau nom de fichier, je resterais dans le jeu de carctères utilisé par votre ordinateur.

Ces conversions ne devraient jamais intervenir sur des fichiers zip, ou des exécutables, ou d'autres types de données binaires. Si vous voyez les mots "conversion en iso8859" ou "conversion en utf8", il y a un problème. N'essayez pas de lancer l'exécutable converti; cela ne marchera pas.

Si votre environnement est en utf8, la fonction de recherche peut amener à quelques confusions. Considérons le mot espagnol niño (petit garçon). Si vous recherchez ni.o, vous ne trouverez pas la ligne contenant ce texte. Le point remplace un caractère, et devrait correspondre à ñ, mais cette lettre accentuée tient sur deux octets. Ironiquement, vous devrez chercher ni..o, et vous trouverez ce que vous cherchez. Nul besoin de dire que ceci est vraiment déroutant.

La recherche/remplacement est effectuée par la librairie pcre et, heureusement pour nous, la dernière version supporte l'utf8. En d'autres termes, je peux passer à pcre l'option qui lui dira de rechercher certaine séquence sur deux octets comme un caractère unique, et pcre se comportera comme attendu. Malheureusement, quelques anciens packages pcre ne possèdent pas cette fonctionnalité. Si vous êtes dans ce cas, vous recevrez un message d'avertissement, et pcre reviendra à son comportement original une lettre par octet. Pour désactiver cette possibilité, et supprimer ce message d'avertissement, mettez la variable d'environement PCREUTF8=off.

Guide de référence rapide

Liste de toutes les commandes d'ed et d'edbrowse.  C'est un guide de référence rapide.  La plupart de ces commandes n'auront pas de sens si vous ne lisez pas le reste de la documentation. 

q : stopper la session courante 
qt : stopper le programme complètement, que vous ayez sauvegardé vos fichiers ou non 
!commande : commande système 
p : afficher la ligne courante 
4,7p : afficher les lignes 4 à 7 
'a,'bp : afficher les lignes repérées par les étiquettes a et b 
kb : marquer la ligne courante avec l'étiquette b 
l : lister la ligne courante, montrant les caractères non ASCII en hexadécimal
n : afficher la ligne courante avec son numéro de ligne 
= : afficher le nombre de lignes du fichier en cours
 z22 : afficher les 22 prochaines lignes 
X : faire de cette ligne la ligne courante 
s/x/y/ : remplacer x par y dans la ligne courante 
s/x/y/2 : remplacer la deuxième occurrence de x par y sdans la ligne courante 
4,7s/x/y/g : remplacer toutes les occurrences de x par y, dans la ligne courante
/x/ : rechercher la ligne contenant x 
/x/i : rechercher la ligne contenant x ou X
ci : les recherches et les substitutions sont insensibles à la casse
cs : les recherches et les substitutions sont sensibles à la casse
sg : les chaînes de substitution sont globales pour toutes les sessions 
sl : les chaînes de substitution sont locales à leurs sessions 
lc : conversion de la ligne courante en minuscules
uc : conversion de la ligne courante en majuscules 
h : aide, expliquant le dernier point d'interrogation 
f : afficher le nom du fichier courant 
f foo : renommer le fichier courant en 'foo' 
f/ : ne conserveur que la dernière partie du nom de fichier courant 
e : afficher le numéro de la session courante 
e3 : aller à la session numéro 3 
e foo : éditer le fichier 'foo' 
r foo : lire le contenu du fichier 'foo' dans le tampon courant 
w : sauvegarder le tampon courant sous le nom 'foo'
w+ foo : ajouter au fichier 'foo' le contenu du tampon courant
w/ : sauvegarder sous le nom de la dernière partie du nom de fichier courant 
d : supprimer la ligne courante 
1, $d : supprimer toutes les lignes, de 1 à la fin du fichier 
u : annuler la dernière commande 
i : insérer le texte, suivi d'une virgule, avant la ligne courante
c : remplacer la ligne courante par un nouveau bloc du texte, terminé par une virgule 
a : ajouter le texte après la ligne courante, terminé par une virgule 
a+ : inclure la ligne que vous vous venez de taper, si vous pensiez être en mode ajout
4,7m11 : déplacer les lignes 4 à 7 à la ligne 11 
4,7t11 : copier les lignes 4 à 7 à la ligne 11 
3,4j : fusionner les lignes 3 et 4
3,4J : fusionner les lignes 3 et 4, séparées par un espace
g/x/ p : afficher les lignes contenant 'x' 
v/x/ p : afficher les lignes qne contenant pas 'x' 
B : trouver la ligne contenant la parenthèse correspondante 
b : naviguer dans le fichier courant courant, si c'est du HTML 
b foo.html : éditer et naviguer dans le fichier foo.html
b URL : se connecter à URL et naviguer
ub : quitte le mode navigation du fichier courant 
g : suivre le lien sur la ligne courante 
g2 : suivre le deuxième lien sur la ligne courante 
^ : retourner à la page à la page Web précédente
i=xyz : remplir le formulaire sur ligne courante avec 'xyz'
i2=xyz : placer le deuxième formulaire de la ligne courante avec 'xyz' 
i2* : appuyer sur le deuxième bouton de la ligne courante, habituellement envoyer ou remettre à zéro
i3 ? : afficher la description du troisième formulaire de la ligne courante 
db : niveau de déboguage (de 0 à 7)
cd : changer de répertoire 
bl : découper la ligne courante en phrases
dr : le répertoire est en lecture seule 
dw : on peut écrire dans le répertoire, et d déplace les fichiers dans la corbeille
dx : on peut écrire dans le répertoire, et d supprime le fichier
hf : basculer entre montrer/cacher les fichiers cachés du répertoire
bd : basculer entre détection/non détection des fichiers binaires du répertoire
eo : supprimer les marqueurs de fin
el : afficher les marqueurs de fin comme '^$' à l'affichage d'une ligne
ep : afficher les marqueurs de fin comme '^$' à l'affichage ou à l'impression d'une ligne
pb : joue le tampon 
ft : afficher le titre de la page Web courante 
fd : afficher la description de la page Web courante
fk : afficher les mots-clés de la page Web courante
hr : redirection HTTP
js : bascule : autoriser/interdire avascript
sr : envoyer le référent 
tn : activer/désactiver fins de ligne type MSDOS dans les formulaires de saisie
fma : mode FTP actif
fmp : mode FTP passif
fmd : mode FTPO par défaut, passif puis actif
rf : rafarichir la page WEB ou la liste des fichiers
et : éditer cette page Web en mode texte pur 
vs : vérifier les connexions SSL (sécurisées)
ip : montrer les numéros IP, habituellement pour les messages électroniques sauvegardés
sc : montrer les colonnes 
sm : envoyer le courrier [le numéro de compte] 

Trucs pour éviter les numéros de ligne

Si vous découvrez Ed, vous pouvez trouver ce programme maladroit.  Je reçois souvent des plaintes au sujet des numéros de ligne.  Les gens haïssent les numéros de ligne.  Ils ne veulent pas lire la page ligne par ligne par ligne, en tapant 1p 2p 3p 4p 5p etc.  Pour tout dire, je hais également les numéros de ligne, et ne les utilise jamais.  Pas depuis des années. 

Pour lire le document entier, tapez 'p'.  Ceci fonctionne, si vous utilisez un synthétiseur de parole.  Le document entier est dans le tampon et vous pouvez le lire en employant les touches de fonction de votre synthétiseur. Comme la plupart des personnes utilisent toutefois des lecteurs d'écran, ceci ne fonctionnera pas.  Cependant, il y a une manière facile de sauter d'écran en écran.  Commencer par z20 pour obtenir les 20 premières lignes.  Ensuite, la commande 'z' donnera les 20 prochaines, et les 20 prochaines, et ainsi de suite.  Vous pouvez employer 22, 24, ou ce qui semble approprié à votre écran. 

Une autre approche est de simplement taper la touche entrée, à plusieurs reprises, pour aller de ligne en ligne.  Il faudra peut-être taper une touche de fonction pour « lire » chaque ligne, après avoir tapé la touche entrée, ou peut-être pas, si votre synthétiseur possède un dispositif de lecture automatique. 

Une fois habitué aux expressions régulières, vous pouvez sauter à n'importe quelle partie du document, même un grand document, dans un temps record, simplement en recherchant un fragment unique de texte.  Ceci vient avec la pratique.  Parfois je devine mal, et ma chaîne de recherche ne donne pas un résultat unique.  Je reviens quelque part au début du document et je dois recommencer la recherche.  Ceci ne se produit pas très souvent.  J'arrive habituellement au bon endroit en un ou deux essais. 

Pour marquer certaines lignes de texte, n'essayez pas de vous rappeler les numéros de ligne.  Employez la commande 'k' pour les marquer.  J'emploie habituellement 'ka' et 'kb' pour marquer le début et la fin d'un bloc de texte, alors que 'kc' marque cette zone.  La commande pour aller à cette zone est alors 'a,'bm'c – sans numéro de ligne.  (C'est le standard de ed, bien que la plupart des personnes n'en tirent jamais profit)

Pour rechercher des liens sur une page Web, rechercher l'accolade droite.  Oui, vous pouvez être arrêté sur une accolade littérale dans le texte, mais ceci ne se produit pas très souvent.  Vous pouvez accéder à un lien particulier en tapant « /{Next}/g ».  De même, vous pouvez rechercher des champs de saisie en recherchant le signe plus grand que (« > ».  (Ceci s'expliquera si vous connaissez le codage particulier des pages web.) et naturellement, les opérations multiples peuvent être mises dans un script, un dispositif unique à ce navigateur. 

Ce sont juste quelques trucs qui vous rendront aussi rapide et efficace que quiconque employant un éditeur ou un navigateur écran, à condition de connaître la page sur laquelle vous travaillez.  (Vous ne serez jamais plus rapide que votre collègue voyant en naviguant dans un territoire peu familier, quel que soit le système employé).  Mon épouse est toujours stupéfaite de la rapidité avec laquelle je dialogue avec des sites Web, ou quand je travaille sur des documents communs à nous deux. 

Liste de discussion

Il y a une liste de diffusion pour des utilisateurs d'edbrowse et d'autres utilitaires en ligne de commande.  Vous pouvez vous y abonner en envoyant un courrier à commandline-subscribe@yahoogroups.com.

Différences importantes par rapport à /bin/ed

Certaines recherches/commandes de remplacement se comportent différemment sous cet éditeur.  C'est parce que les expressions régulières sont interprétées par la bibliothèque régulière compatible d'expression de Perl (pcre), plutôt que la bibliothèque traditionnelle de regexp.  Par conséquent les expressions régulières ont plus de possibilités, et plus de puissance, que les expressions régulières utilisées par /bin/ed.  La syntaxe est également quelque peu différente.  Par exemple, Perl emploie des parenthèses nues là où Ed emploie des accolades échappées - pour délimiter les sections de texte satisfaisant aux conditions.  Et Perl utilise $1… $9 pour référencer les sous-chaînes trouvées, tandis que Ed utilise \1… \9.  En outre, le Perl soutient le suffixe « i » pour la recherche insensible à la casse, avec le suffixe traditionnel « g » pour indiquer le remplacement global sur tout le texte.  Il n'y a aucune raison de décrire toutes les nuances ici.  Veuillez lire la page de manuel de perlre « man perlre  » pour une description complète des expressions régulières sous Perl.  Une fois accoutumés à leur puissance et flexibilité, vous ne reviendrez jamais à Ed. 

Super ! Vous avez lu la page du manuel de perlre, et vous voilà de retour.  Voici quelques changements que j'ai fait aux expressions régulières de Perl.  J'ai constaté que « (and) » est presque toujours considéré comme un littéral, comme en recherchant maFunction (), aussi j'ai inversé la signification des parenthèses échappées dans Perl.  C'est-à-dire, « (and) » maintenant matche les caractères littéraux, et « \ (and \) marque les sous-chaînes correspondant à l'expression.  Ces sous-chaînes sont alors référencées, dans le texte de remplacement, de $1 à $9.  De même, « | signifie le littéral |, » alors que « \| » signifie l'alternative.  Je change également la signification de « & » du côté droit, pour reprendre ce qu'il signifie dans Ed.  Je garde ^ $ .[] + * ? et {m, n} comme interprété par Perl, suivant la description de la page du manuel de perlre.  Cependant, si * est le premier caractère, il est traité comme le caractère étoile.  Ceci s'explique, par le fait qu'il n'y a aucun caractère précédent à modifier.  Certaines versions de Ed font ainsi, mais pas toutes.  Mais je le trouve commode ; quand je veux remplacer * + ou ? , je n'ai pas besoin de les échapper, juste parce que ce sont des modificateurs.  De même, un couple de parenthèses est traité comme un littéral.  Ces changements à regexp, pour ressembler à Ed, peuvent vous gêner si vous êtes expert de Perl.  Désolé à ce sujet, mais je pense que ces changements facilitent l'utilisation de l'éditeur, surtout pour les utilisateurs d'Ed expérimentés.  Ci-dessous quelques différences additionnelles entre ce programme et /bin/ed. 

Les sections suivantes décrivent de nouveaux dispositifs, totalement étrangers à Ed.  Ceux-ci incluent l'édition simultanée de fichiers comme dans emacs et vi, la navigation dans un document HTML et « l'édition» des formulaires de saisie.  C'est la raison pour laquelle j'ai développé ce programme. 

Equilibrage des parenthèses

La commande B majuscule intéresse les programmeurs, et ne sera pas probablement pas employée par les autres utilisateurs.  Elle localise la ligne avec une parenthèse, une accolade, ou un crochet.  Exemple:

  if(x == 3 &&
  y == 7) {
    printf("bonjour\n");
  } else {
    printf("monde\n");
    exit(1);
  }

La commande B majuscule, sur la deuxième ou dernière ligne, se déplace à la ligne du milieu « } else { », laquelle équilibre l'accolade ouvrante de la ligne 2 ou l'accolade fermante de la dernière ligne.  Sur la première ligne, B se déplace à la deuxième ligne, équilibre la parenthèse ouverte.  La deuxième ligne équilibres {, plutôt que ), parce que les accolades ont la priorité sur les parenthèses, qui ont la priorité sur les crochets.  Vous pouvez forcer un match de parenthèses par « B) ». 

La commande B sur la ligne du milieu est ambiguë - je ne sais pas s'il faut regarder en arrière ou vers l'avant.  Tapez plutôt « B{« ou « B} ». 

Vous pouvez explicitement équilibrer le <>, pour les tags multilignes de HTML, ou «`», utilisé dans des certains préprocesseurs tels que m4. 

Changement de contexte

Ce programme permet d'éditer des fichiers multiples en même temps, et autorise le transfert de texte entre eux.  C'est semblable aux terminaux virtuels (Linux), où vous changez de session par l'intermédiaire d'alt-f1, alt-f2, jusqu'à alt-f6.  Ici, vous basculez sur une session d'édition différente par l'intermédiaire des commandes « e1 », « e2 », jusqu'à « e6 ».  Notez que « e 2 » (avec un espace entre e et 2) édite le fichier dont le nom est « 2 », tandis que « e2 » (sans espace) bascule sur la session 2.  De même, vous pouvez lire le contenu de la session 3 dans le tampon courant en tapant « r3 », et vous pouvez sauvegarder le tampon courant dans la session 5 par l'intermédiaire de « w5 ».  La dernière commande vous avertira si la session 5 existe déjà, et vous avez modifié son contenu sans l'avoir sauvegardé.  En d'autres termes, vous êtes sur le point de perdre votre travail en session 5.  Taper « h » vous expliquera : « 'w' attendu sur la session 5 ». 

Si vous quittez une session, vous allez à la prochaine session d'édition valide, revenant à la session 1 si besoin.  La sortie du programme s'effectue lorsqu'on quitte la dernière session. 

Attention, le programme contient un bogue concernant la commande « undo » (annuler).  Si vous changez de session, puis revenez en arrière, vous ne pourrez pas annuler vos derniers changements.  On peut penser qu'il est facile de corriger cette bogue, mais c'est plus subtil qu'il y paraît, je n'y ai donc pas touché.  J'ai simplement voulu vous en avertir.  Assurez-vous que tout est correct avant de changer de session. 

Voyons un exemple de copier/coller.  Vous éditez le fichier « essai » en session 1, et vous vous rendez compte qu'un paragraphe du fichier « toto » s'adapterait parfaitement bien ici.  Voici comment cela pourrait se présenter.  Les lignes commençant par « < » sont l'entrée de l'utilisateur, et des lignes commençant par « > » sont les réponses du programme.  Le signe « # » représente mes commentaires. 


< e2 # bascule sur la session 2
> new session # nouvelle session
# la commande « r » ne crée pas un nouveau fichier, même si le tampon est vide. 
# ainsi, « r toto» est plus sûr que « e toto ». 
# après tout, nous ne voulons pas modifier toto, nous voulons juste y voler quelque chose. 
< r toto
> 28719 
< /start/ 
> ceci est le début du joli paragraphe que vous voulez copier. 
< 1,-d # on n'a pas besoin de ce qu'il y a avant 
< /end/ 
> ceci est la fin du joli paragraphe que vous voulez copier. 
< +,$d # on n'a pas besoin de ce qu'il y a après 
< e1 
> essai 
< r2 
> 3279 # taille du texte lu de la session 2 
< q2 #, on fait le ménage, en se débarrassant de la session 2 
< W # sauvegarde de essai, avec le nouveau paragraphe inclus 
> 62121 

Ci-dessous, comment transférer une portion de texte d'un fichier à un autre


< e2 
> new session # nouvelle session
< e toto # cette fois je vais modifier le fichier
> 28719 
< /start/ 
> c'est le début du joli paragraphe frais que vous voulez déplacer. 
< ka # marque le paragraphe 
< /end/ > ceci est la fin du joli paragraphe que vous voulez déplacer 
< kb 
< 'a,'bw3 
> 3279 
< 'a, 'bd 
< W # sauvegarde toto sans le joli paragraphe
> 25440 
< q 
> no file # aucun fichier, on est maintenant en session 3 
< e1 
> essai # de nouveau à la session 1 
< r3 
> 3279 
< q3 on arrête la session 3, bien qu'étant toujours en session 3 
< W # sauvegarde de essai, avec le nouveau paragraphe inclus 
> 62121 

La commande « e », indique la session courante, au cas où vous l'oublieriez.  Comme la commande « f, » , qui indique le fichier courant. 

Utilisation

Tapez « edbrowse -h » pour lire les conseils d'utilisation.  Vous verrez l'option « -m », utilisée de différentes manières.  Ignorez-la pour l'instant.  L'option « -m » lance edbrowse en tant que client interactif de courrier, plutôt qu'un éditeur.  Nous y reviendrons. 

L'option « -dx » place le niveau de déboguage à x, où x est entre 0 et 9.  Le défaut est « -d1 », qui affiche les tailles des fichiers lorsqu'ils sont lus ou sauvegardés.  Certains préfèrent « -d2 », qui affiche l'URL lorsque vous allez à de nouvelles pages Web ou remplissez des formulaires en ligne.  À moins que vous vouliez déboguer le programme, vous n'irez probablement pas plus haut que « -d3 ».  A de rares occasions, vous pourriez employer « -d4 », pour afficher les en-têtes HTTP dedans et dehors.  Rappelez-vous, le niveau de déboguage peut être modifié en cours en employant la commande « dbx » (x entre 0 et 9). 

L'option « -e » force edbrowse à quitter en cas d'erreur.  Ceci est habituellement employé par des scripts de traitements par lots.  S'il y a un problème, vous ne voudriez pas continuer ainsi en exécutant le reste des commandes de edbrowse. 

Utilisez « -c » pour désactiver et éditer, le fichier de configuration « .ebrc ».  (Ce fichier de config sera décrit plus tard).  Pourquoi le faire? Supposez que vous avez modifié ce fichier, avec une erreur de syntaxe, de telle sorte que edbrowse ne puisse même pas démarrer.  Vous ne pourriez plus employer edbrowse pour fixer votre fichier de configuration.  Naturellement vous pourriez renommer le fichier de configuration, fixer l'erreur, et revenir en arrière ; mais alors vous pourriez découvrir une autre erreur de syntaxe, et ainsi de suite.  Au lieu de cela, l'option « -c » permet d'éditer le fichier de configuration directement.  Il est automatiquement chargé dans le tampon 1.  Noter que « -c » doit être la première option. 

Les arguments sont les fichiers à éditer.  Edbrowse lit ces fichiers dans les sessions correspondantes, et vous commencerez en session 1.  S'il n'y a aucun argument, vous commencez en session 1, mais il n'y a aucun texte et aucun fichier associé. 

Si vous aimez ce programme, et vous voulez qu'il soit votre éditeur principal, vous pouvez placer l'alias Unix suivant :

alias e= " /usr/bin/edbrowse "

Si vous le faites, vous pouvez employer «e nom_de_fichier», pour éditer un nouveau fichier, que vous soyez dans edbrowse ou dans le shell Unix.  Très commode. 

Caractères binaires

À tout moment, même lorsqu'on tape un nom de fichier, le programme balaye l'entrée à la recherche de codes binaires.  Désolé, mais je préfère l'hexadécimal à l'octal.  Je sais que ce n'est pas standard, mais c'est comme çà.  Employez la séquence triple « ~bd » pour écrire le caractère non-ASCII 0xbd, code de « 1/2 ».  De même, si vous listez une ligne, avec la commande « l », le caractère « 1/2 » est affiché « ~bd ».  Tout ce qui non ASCCI et la plupart des caractères de contrôle sont tapés et affichés de cette manière.  La tabulation et le retour-chariot doivent être tapés directement au clavier.  Tabulation et retour arrière sont affichés respectivement « > » et « < ».  Si la ligne suivante est tapée,

« Hello~07 ~x is ~bd of y »

Et ensuite listée, vous verrez ce texte, mais il y a un bip sonore et « 1/2 » à l'intérieur.  Le ~x n'est pas codé , parce que x n'est pas un caractère hexadécimal.  Si vous voulez forcer un ~, même s'il y a des caractères hexadécimaux qui suivent, employez deux tildes, « ~~ ». 

Quand vous tapez une expression régulière, vous avez le choix, hexadécimal ou octal.  Ce programme convertit « ~xx » en hexadécimal, et la machinerie regexp de Perl convertit « \nnn » en octal.  Ainsi, les commandes qui suivent annuleront les fins de lignes DOS d'un fichier.  La première est traduite par mon programme, la deuxième et troisième par le regexp de Perl. 


,s/~0d$//
,s/\15$//
,s/\r$//

Les caractères échappés sont toujours affichés en hexadécimal, que la ligne soit listée ou non.  La plupart des terminaux et des émulateurs de terminal, y compris la console Linux et mon adaptateur de parole, interprètent les séquences d'échappement comme des commandes .  Ainsi une séquence d'échappement présente dans un fichier binaire peut mettre votre terminal ou votre adaptateur de la parole dans un état inattendu, rendant le rétablissement difficile.  Il semble prudent d'afficher en permanence les caractères échappés comme caractères visibles.  Si vous n'avez aucune idée d'où ce « ~1b » est venu, c'est probablement un caractère littéral échappé. 

Les retours-chariots et les caractères nuls sont également convertis en hexadécimal.  Ainsi une ligne contenant un retour-chariot n'apparaîtra pas comme deux lignes.  Vous le verrez en important un fichier texte de DOS.  Chaque ligne finit par « ~0d ».  Tapez une des trois commandes ci-dessus pour effacer ces fins de lignes DOS. 

fichiers binaires

Un fichier est considéré comme binaire s'il dépasse 50 octets et s'il contient une proportion significative de caractères non-ASCII ou nuls (plus de 25%).  Les fichiers texte internationaux peuvent contenir des codes binaires dispersés, pour les lettres accentuées etc., mais la plupart des caractères devraient être en ASCII.  Par conséquent les fichiers binaires ne sont pas des fichiers texte internationaux.  En fait vous ne pourrez pas probablement afficher ou éditer des données binaires efficacement, au moins par ce programme.  Mais ne vous laissez pas arrêter.  A titre d'exercice, créer un programme exécutable affichant « bonjour monde», puis éditez l'exécutable en utilisant ce éditeur.  Rechercher la chaîne « bonjour » et remplacer « monde » par « tonte ».  Sauvegardez le fichier et relancez l'exécutable.  Vous devriez maintenant voir « bonjour tonte ». 

Quand des données binaires sont lues dans le tampon, vous verrez les mots « données binaires ».  Le tampon reste « binaire », même si vous supprimez toutes les données pour les remplacer par de l'ASCII.  Vous devez employer la commande « e » pour obtenir un nouveau tampon ASCII. 

Pour la plupart d'entre nous, il n'importe pas vraiment si les données sont considérées binaires ou ASCII.  Dans l'un ou l'autre cas, vous pouvez afficher et éditer les données, et les sauvegarder dans un fichier. 

Ce programme essaie « de se comporter correctement » sous DOS/Windows.  C'est-à-dire, il convertit les crlf et retours-chariots s'il pense que le fichier est un fichier texte ; et il laisse des données binaires intactes.  Ces distinctions sont sans objet sur Unix/Linux. 

Bien que cette approche soit satisfaisante pour l'anglais et la plupart des langues européennes, elle échoue misérablement pour les langues asiatiques, très semblables aux données binaires.  Vous pouvez neutraliser la détection binaire en tapant la commande « bd ».  Si vous parlez une langue asiatique, mettez cette commande dans votre script d'init, ainsi edbrowse est lancé de la manière que vous voulez - traiter vos fichiers internationaux comme fichiers des textes. 

Si vous parlez une langue asiatique, et employez Windows, et si la détection binaire est désactivée, n'employez pas ce programme pour travailler sur des fichiers binaires, car ils seront corrompus! Il est certainement préférable de dire au revoir à Windows et commencer à employer un vrai système d'exploitation. 

Listing de répertoire, gestionnaire de fichiers

Si vous parcourez un répertoire, vous verrez une liste de tous les fichiers non cachés de ce répertoire, dans l'ordre alphabétique.  (Employer l'option «hf» si vous voulez également voir les fichiers cachés).  Tapez « g » pour aller à un de ces fichiers ou sous-répertoires.  Tapez « ^ » pour revenir au répertoire parent.  (Notez, g est la commande «go», et « ^ « est la touche retour arrière ; nous y reviendrons).  Vous pouvez traverser ainsi un arbre entier de répertoire comme si vous étiez à l'intérieur d'un gestionnaire de fichiers. 

Comme « ls -F », un sous-répertoire est indiqué par un slash de fin.  Ce slash ne fait pas partie du nom de fichier.  De même, le caractère appelé pipe est indiqué par « | », le lien symbolique par « @ », fichier bloc par « * », le caractère spécial par « < », et un socket par « ^ ».  Si le nom d'un fichier finit par un de ces caractères, il peut vous induire en erreur, mais pas le programme.  Edbrowse sait si « | » fait partie du nom de fichier ou si c'est un indicateur de pipe.  Puisque chaque fichier est représenté par une seule ligne du texte, edbrowse ne peut accéder à des fichiers contenant des caractères retour-chariot dans leur nom. 

Si vous lisez un répertoire dans un fichier préexistant, c'est juste du texte.  Vous ne pouvez pas visiter ces fichiers, parce que ce sont juste des mots.  Vous devez afficher un répertoire dans une session propre ou lire un répertoire dans une session vide si vous voulez accéder aux fichiers.  Noter que vous pouvez sauvegarder le tampon dans une autre session d'édition, et de ce fait, dans cette session les mots seront juste des mots.  Cette distinction est importante dès que l'on commence à éditer du texte. 

Par défaut, les répertoires sont en lecture seule.  Si vous essayez de supprimer une ligne, et par conséquent le fichier associé, on vous indiquera que vous êtes toujours en mode lecture de répertoire.  J'essaye de vous sauver de vous-même ! Tapez « dw » pour permettre l'écriture dans un répertoire, et « dr » pour rendre le répertoire à nouveau en lecture seule. 

Quand un répertoire est en lecture/écriture, on peut supprimer des fichiers en utilisant la commande « d ».  Par exemple, « g/\.  o$/d » supprime tous les fichiers objets.  Puisque ces manipulations ont des effets en dehors de ce programme, il n'est pas possible de revenir en arrière.  Quand vous faites un changement, c'est fait.  Ayant cela à l'esprit, j'ai emprunté une bonne idée à Microsoft qui, comme vous le soupçonnez, vient d'Apple.  Le fichier supprimé n'est pas supprimé réellement ; il est déplacé dans votre corbeille, située dans « $home/.Trash ».   (Ceci est consistant avec le Mac et beaucoup de versions de Linux.)  Ainsi si vous tapez accidentellement « ,d » et enlevez tous vos fichiers, vous pourrez les récupérer dans la corbeille.  Il est possible de programmer « cron » pour supprimer tous les fichiers de la corbeille une fois par semaine.  Ce répertoire est créé avec le mode 700, ainsi personne d'autre que vous ne peut regarder ce qu'il contient.  Si vous créez ce répertoire vous-même, mettez-le en mode 700.  Après tout, certains de vos fichiers peuvent être privés. 

Puisque cette opération est un mouvement, plutôt qu'un effacement vrai, il y a quelques restrictions provenant de votre système d'exploitation.  Si votre OS peut déplacer des répertoires, ce programme pourra supprimer un sous-répertoire aussi facilement qu'un fichier.  Le sous-arbre entier est déplacé dans la corbeille.  Assurez-vous que le cron de nettoyage est capable d'enlever des répertoires, et pas seulement des fichiers. 

Si la corbeille est sur un autre système de fichiers, le fichier est copié, plutôt que déplacé. Pratiquement, c'est la même chose; ainsi, le fichier aura les mêmes permissions, et l'heure courante de création. Les répertoires ne peuvent être copiés par ce moyen. Vous devrez copier un répertoire par vous-même, puis le supprimer, en utlisatnt cp -r et rm - r.

Notez que la commande dx, qui supprime réellement des fichiers, est le seul moyen de faire de la place sur le disque. Les liens symboliques et les fichiers spéciaux sont toujours supprimés : il n'y a pas beaucoup de sens à déplacer un lien symbolique dans la corbeille. 

« Pourquoi tout ceci ? » pourriez-vous demander.  « Qu'est-ce qui ne va pas avec le shell? »

Rien, tant que les noms de fichier sont petits et familiers.  Mais parfois les noms de fichier sont longs et incompréhensibles, et il est presque impossible de taper ces noms dans le shell, caractère par caractère, majuscule et minuscule, sans erreurs.  Les méta-caractères tels que * peuvent aider, mais seulement quand le fichier qui vous intéresse a un nom radicalement différent des autres fichiers du répertoire.  Ce n'est pas toujours le cas.  Supposez qu'une application produit des fichiers de log comme suit :

ProgramFooBar.-04-04-1998.06:31:59.log
ProgramFooBar.-04-11-1998.11:37:14.log
ProgramFooBar.-04-18-1998.16:22:51.log

Comment supprimer les vieux fichiers pour ne garder que le plus récent, ou les renommer sous un nom plus explicite ? Le caractère « * » est un peu risqué ; vous risquez de modifier tous sans le réaliser.  Et ne parlons pas de ces fichiers embêtants avec les espaces ou qui ont des caractères de contrôle invisibles dans leurs noms.  Notre ami voyant appelle son gestionnaire de fichiers et clique simplement sur le fichier qu'il veut regarder ou éditer ou supprimer.  Parfois je veux/j'ai besoin de ce genre de puissance. 

Quand la commande de remplacement modifie le contenu, elle renomme le fichier original.  Ce dernier ne sera donc pas écrasé.  Vous ne perdrez aucune donnée.  Encore une fois, je vous protège de vous-même. 

Les commandes de recherche et de remplacement ignorent le caractère « / » de fin.  Si vous voulez renommer le répertoire « mont/ » en « montagne/ », tapez « s/$/agne/ ».  « agne » sera ajouté à « mont » parce que le caractère « / » n'est pas vraiment là. 

Supposons maintenant que vous voulez exécuter un programme quelconque sur certains de ces fichiers.  Ceci pourrait être un utilitaire d'impression, un compilateur, etc.  Parfois vous voulez renommer les fichiers à votre convenance, pour travailler dans le shell.  Mais parfois vous n'êtes pas propriétaire de ces fichiers, et parfois ils doivent garder leurs noms originaux.  Par exemple, plusieurs documents de HTML reliés entre par des hyperliens, en utilisant leurs noms de fichier existants.  Ici, vous ne pouvez pas renommer les fichiers, pourtant vous voulez toujours exécuter votre programme sur un ou deux d'entre eux. 

Vous pouvez exécuter n'importe quel programme sur n'importe quel fichier sans retaper ce nom de fichier en appelant un shell.  Utilisez « kx » pour affecter l'étiquette X au fichier qui vous intéresse.  (c'est la syntaxe Ed standard).  Lancez ensuite « !programme 'x » pour appeler ce programme sur ce fichier.  Ceci semble compliqué, mais c'est en fait une simple macro de substitution, programmée en quelques lignes de code.  Si 'x est présent dans une commande shell, et n'est pas suivi ou précédé de chiffres ou lettres, il est remplacé par le texte présent sur la ligne étiquetée x.  Si votre nom de fichier contient les espaces, tapez '!programme « 'x », pour s'assurer le nom de fichier entier est l'argument du programme appelé. 

Le token « '. » est remplacé par le contenu de la ligne courante, et le token « '_ » est remplacé par le nom de fichier courant.  Si vous essayez de sauvegarder un fichier en lecture seule, vous pouvez autoriser l'écriture en tapant « !chmod +w '_ », puis sauvegarder votre texte. 

Vous pouvez expanser des tokens multiples dans une commande shell.  Employez « kx » et « ky » pour étiqueter deux fichiers que vous voulez comparer, et lancez alors « !diff 'x 'y ». 

Ce dispositif n'est pas limité aux parcours de répertoire.  Vous pouvez éditer un fichier simple, mais vous pouvez encore coller le contenu d'une ligne dans votre commande shell.  Je ne sais pas pourquoi vous voudriez faire ceci, mais c'est possible. 

Majuscules et minuscules

La commande « lc » convertit une ligne en minuscules, et « uc » en majuscules.  Les utilisateurs de Perl reconnaîtront ces commandes.  Par extension, « mc » convertit en casse mélangée, mettant en majuscule la première lettre de chaque mot, et le « d » de « mcdonald. 

C'est particulièrement utile dans un parcours de répertoire.  La dernière chose qui doit préoccuper une personne aveugle est de se demander si certaines des lettres dans un nom de fichier sont majuscules.  Si on peut écrire dans le répertoire, taper « lc » convertira tous les noms de fichier en minuscules.  C'est simple. 

Si vous voulez mettre en majuscules un mot particulier, tapez « s/mot/uc/ ».  Ceci convertit le mot en majuscules.  Tous les autres suffixes de substitution s'appliquent.  Pour changer foo, Foo, FOo, FOO en FOO, partout, tapez « ,s/\ bfoo\b/uc/ig ». 

Fin de ligne

La commande « bl » découpe la ligne courante en phrases et expressions, chacune d'environ 70 caractères de long.  Elle comprime les espaces et supprime les espaces en fin de ligne.  Si la ligne contient les caractères retour-chariot, ceux-ci sont transformés en séparateurs de ligne - endroits où la ligne sera certainement coupée.  Les seuls espaces préservés sont les étiquettes ou les espaces en début de ligne, ou après chaque caractère retour-chariot.  C'est une modeste tentative pour maintenir le texte indenté, à supposer que ce soit raisonnable.

J'utilise ce dispositif de deux manières différentes.  Si je connais bien le document, (je l'ai probablement écrit), je peux employer la commande bl sur une ligne du texte qui semble plutôt longue.  Je l'ai tapée rapidement, sans m'interrompre, et maintenant je veux la découper.  Mais je ne veux pas compter les signes de ponctuation et me dire, « j'ai besoin d'une coupure après la troisième virgule et le point suivant 'cela' et puis à la prochaine virgule », utilisant sans cesse la commande de ponctuation « s ».  Oh j'aime bien la commande « s » - qui me donne le contrôle complet - mais il est plus facile de taper « bl » - et « bl » fait habituellement la bonne chose.  En outre, le bl comprime les doubles espaces accidentels, un faute de typographie que je n'entendrai jamais si je lis simplement la ligne dans l'ensemble. 

Quand le document est importé, habituellement d'un traitement de texte tel que Word, « bl » remplit une fonction complètement différente.  Les paragraphes sont souvent stockés sur une ligne physique simple.  Parfois le document entier ne comporte qu'une seule ligne, avec le caractère de retour « \r » séparant les paragraphes.  Les traitements de textes « wysiwyg » ne s'occupent pas de séparer les phrases et expressions - le retour automatique à la ligne s'en chargeant.  Bien, « bl » est notre version de retour automatique à la ligne.  Il n'essaie pas de se conformer à un écran ; il coupe simplement le texte en morceaux maniables, chaque morceau étant une unité sémantique séparée.  Quand « bl » est lancé, les lignes physiques contiendront des phrases ou des expressions, délimitées par la ponctuation, ou par le caractère retour-ligne/retour-chariot. 

Si l'une des lignes originales, délimité par un retour-ligne ou chariot, est longue, c'est-à-dire plus de 120 caractères, on suppose que c'est un paragraphe d'un seul tenant, et on ajoute un interligne avant et après.  Ainsi un paragraphe découpé contenant 20 phrases n'est pas fusionné au prochain paragraphe démonté contenant 18 phrases supplémentaires.  Une ligne vide sépare les deux paragraphes.  Ceci est seulement applicable si « bl » est appliqué à un ensemble de lignes, ou le document entier. 

Ne pas appliquer la commande « bl » à une section préformatée, telle qu'une table ou de l'ASCII art.  Si vous n'êtes pas sûr du résultat, ne sauvegardez pas le fichier, parcourez-le, et appliquez « bl » aux seules lignes de texte.  Souvent c'est le document entier (,bl).  Les commandes suivantes font un très bon travail de nettoyage d'un document typique de Microsoft Word. 

e fichier.doc ou fichier.wps
# changez le nom de fichier, pour ne pas écraser l'original
f _
,s[~80-~ff~00-~0c~0e-~1f]//g # supprime les codes de formatage ou de contrôle
g/^\s*$/d # lignes vides contenant habituellement des codes non ASCII
bl, séparer les lignes et paragraphes
1,20p # souvent des lignes inutiles, mais ensuite le texte commence. 

Naturellement le programme « catdoc » fait un meilleur travail de conversion des documents Word.  Il est souvent couplé avec « xls2cvs ».  Ces programmes sont un must pour les personnes qui veulent un environnement en ligne de commande. 

Comportement

Supposez que vous sauvegardiez un fichier, edbrowse tronque le fichier existant, puis l'ordinateur plante avant que edbrowse puisse écrire les nouvelles données.  Quand vous rallumez l'ordinateur, votre fichier est vide, zéro octets, et tout votre travail est perdu. 

C'est une fenêtre étroite : l'ordinateur plante précisément à la milliseconde où il ne faut pas.  Pour se garder de cette improbable calamité, quelques éditeurs écrivent vos données dans un fichier temporaire, effacent l'original, et renomment le fichier temporaire sous son vrai nom.  De cette façon vos données ne peuvent être perdues.  Le nouveau ou l'ancien fichier survivra. 

Alors les liens sont apparus, les liens durs, et puis les liens symboliques.  Les auteurs de Ed, et d'autres éditeurs, ont dû se débrouiller.  Vous ne pouvez pas enlever le lien, écrire un fichier temporaire, et remplacer le lien par le fichier temporaire.  Ce n'est plus un lien, c'est un fichier régulier, et votre système de fichiers n'est pas prévu pour cela.  Le vrai fichier, pointé par le lien (symbolique), n'a pas été modifié du tout.  Ce n'est pas ce ce que vous vouliez ! Ainsi on a récrit ces éditeurs pour neutraliser ce dispositif si le fichier appelé est un lien vers un autre fichier.  Ils ont dû retourner de nouveau au vieux paradigme troncature/réécriture, espérant que rien de mauvais ne se produira dans l'intervalle.  Et ça marche, le mauvais n'arrive jamais.  La fenêtre est trop étroite, tout simplement. 

Dans cette optique, edbrowse ne s'encombre pas avec des fichiers temporaires.  Simplement, je ne me tracasse pas.  Je tronque le fichier et écris les données, et je ne m'attends à ce que rien ne tourne mal pendant la milliseconde critique. 

Un autre comportement est plus subtil.  Supposer que vous éditez un fichier et votre ami, ou un programme système, édite le même fichier.  Vous avez réellement modifié votre fichier.  Quand vous allez sauvegarder vos changements, ils écraseront tous les changements faits par votre ami, ou l'utilitaire système.  La plupart des éditeurs de texte se gardent de ceci en observant l'heure. Quand vous commencez à éditer le fichier « foo », l'éditeur mémorise l'heure.  puis, quand vous êtes prêt à sauvegarder vos changements, il vérifie l'heure, et si « foo » a été mis à jour dans l'intervalle, il vous avertit.  Le « fichier a été mis à jour par quelqu'un d'autre – voulez-vous l'enregistrer ? »

C'est un bon dispositif, mais edbrowse ne l'a pas, simplement parce que je n'ai pas jugé bon de l'implémenter.  Je suis le seul utilisateur sur mon PC, et vous êtes probablement le seul utilisateur sur votre PC, aussi ce dispositif n'est pas très demandé.  Mais il est possible que je l'implémente un jour prochain. 

Accès à une URL

Au lieu de lancer « e nom de fichier », vous pouvez lancer « e http://this.that.com/file.html », et l'éditeur recherchera le fichier appelé en utilisant le protocole HTTP.  Le source (c'est-à-dire l'HTML brut) est disponible pour édition.  Vous pouvez le modifier et le sauver sur votre machine locale.  Puisque le texte est importé d'une autre machine, il ne peut pas être sauvegardé sur cette machine, par conséquent la commande « w » ne fonctionnera pas.  Vous devrez indiquer un fichier local « w monfichier.html », ou une session d'édition différente « w3 ». 

Noter que ceci n'est pas de la navigation Internet, nous recherchons simplement le texte sur une autre machine et l'éditons localement.  Le texte n'a pas besoin d'être du HTML, il pourrait être (par exemple) un document ASCII.  Beaucoup de gens, moi-même inclus, ont mis divers types de fichiers, même exécutables, sur leurs sites Web pour téléchargement.  Naturellement vous ne pourrez pas éditer un fichier binaire, mais vous pouvez encore employer edbrowse pour rechercher le fichier et le sauvegarder localement, mettant en application un téléchargement HTTP. 

A l'intérieur de l'éditeur, vous pouvez taper « e URL», abandonner le tampon courant et rechercher le texte d'une machine distante.  Ou vous pouvez taper « r URL » pour rechercher le texte à distance et l'ajouter à le tampon courant.  Il n'y a aucune commande « w URL », parce que le protocole de HTTP ne vous permet pas « d'écrire» du HTML sur une machine distante. 

Pour simplifier, n'importe quel nom de fichier avec deux ou plusieurs points incorporés et un suffixe standard (tel que .com ou .net) est traité comme une URL.  Vous pouvez habituellement omettre le préfixe de http://.  Par exemple, essayez d'appeler « e www.space.com ».  Mais encore une fois, vous regardez le source HTML, ce qui n'est probablement pas ce que vous voulez.  La navigation sera examinée plus loin. 

Chaque fois que vous récupérez des données d'une URL, l'éditeur, contrôlé par le protocole HTTP, peut changer le nom du fichier appelé.  C'est parce que la ressource s'est déplacée, et l'ordinateur original était assez aimable pour donner la nouvelle adresse.  Si le niveau de déboguage est placé à 2 ou plus, vous pourriez voir une série de trois ou de quatre URLs différentes pendant que l'éditeur est réorienté à travers l'Internet.  Enfin il récupère votre document, et le nom de fichier courant contient l'URL correct (le dernier).  Vous pouvez mettre à jour votre fichier de signets en conséquence.  D'un autre côté, vous ne devriez pas.  Parfois l'URL initial est l'endroit « public » de la page Web, et les redirections suivantes se produisent à l'intérieur de la compagnie.  Dans ce cas, il faudra garder l'URL public original, qui fonctionnera toujours, même si la compagnie déplace son serveur Internet.  Jugez-en par vous-même. 

Mode navigation

Si l'éditeur contient du HTML, de n'importe quelle origine, vous pouvez taper « b » pour activer le mode navigation.  La commande sera refusée s'il n'y a pas dans le tampon les tags communs HTML, ou si l'éditeur est déjà dans le mode navigation.  Vous pouvez forcer la navigation en ajoutant <html> au début du tampon, ou n'importe quelle autre tag identifiable – edbrowse essayera toujours de convertir un tel fichier.  Maintenant le texte transformé est lisible, sans tags HTML.  En d'autres termes, le <P> a été transformé en coupure de paragraphe, <OL> est devenu une liste numérotée, et ainsi de suite.  Le nom de fichier est également modifié ; le suffixe « .browse » a été ajouté.  Si vous sauvegardez les données transformées, délibérément ou accidentellement, le texte restructuré sera archivé dans un nouveau fichier, quelquechose.html.browse, sans toucher au fichier HTML original.  Ceci vous protège si vous développez vos propres pages Web.  Je crois que les personnes aveugles devraient écrire du HTML brut, plutôt que d'utiliser un outil de développement « wysiwig » Web tel que Front Page.  En fait j'écris tous mes documents en HTML, même les lettres commerciales courtes.  Je peux créer les titres, listes, tables, etc.  , sans employer un éditeur d'impression conforme à la visualisation ou un lecteur d'écran.  Cet excellent tutoriel vous aidera à démarrer.

Durant la conversion vers le mode de navigation, le système vérifie les erreurs communes de syntaxe, telles qu'une liste numérotée non fermée.  Si le nom de fichier est une URL, ces erreurs de syntaxe ne sont pas affichées.  Après tout, ce n'est pas votre page Web, et il n'y a rien que vous pouvez faire à son sujet.  Cependant, si la page Web est à vous, comme indiqué par un nom de fichier local, la première erreur de syntaxe est affichée, d'où vous pouvez retourner à la source HTML et la corriger.  Tapez « ub » pour désactiver le mode navigation.  Vous revenez au texte brut HTML sous son nom de fichier original.  Maintenant vous pouvez corriger l'erreur et de nouveau essayer la commande « b » Pour vous faciliter la tâche, l'étiquette « 'e » est placée à la ligne contenant l'erreur.  Répétez ce processus jusqu'à ce que « b » fonctionne sans erreurs. 

Si vous essayez de quitter, et que l'éditeur vous dit « w attendu », rappelez-vous que vous devez revenir dans l'éditeur HTML brut avant de lancer la commande de sauvegarde.  Vous pourriez modifier le texte dans lequel vous naviguez sous le nom fichier.browse, pour satisfaire au critère de sauvegarde, mais ce n'est pas vraiment ce que vous voulez.  Vous avez corrigé des erreurs dans le source HTML, et c'est ce source que vous devez sauver, aussi souvenez-vous de sortir du mode navigation avant de sauvegarder le fichier. 

Notez que vous pouvez sortir du mode navigation même s'il n'y a pas d'erreur.  Si, par exemple, vous consultez une page correctement construite sur un autre site Web, et voulez lire ou sauvegarder le HTML brut, tapez simplement « ub ».  A titre d'exercice, appelez « e www.space.com », et employez les commandes « b » et « ub » pour commuter entre le HTML brut et la page navigable. 

La mise en page dans le mode navigation est relativement simple, parce qu'une personne aveugle ne veut pas la complexité.  Nous ignorons les polices, les italiques etc. , et si jamais ce type d'information nous intéresse, la meilleure façon de l'obtenir est de lire le code HTML brut.  Ainsi la plupart des tags sont ignorés, à l'exception des en-têtes, paragraphes, et listes. 

Je n'indente pas les sous-sections ou les items de liste.  Nous perdons l'effet visuel, et parfois les espaces supplémentaires disparaissent. 

Puisque la ligne physique est, pour nous, l'unité de base, c'est-à-dire la construction atomique modifiable, déplaçable ou copiable, les lignes sont tronquées à environ 80 caractères, habituellement en fin de phrase ou d'expression.  Ainsi la lecture ligne par ligne se fait souvent selon l'ordre des phrases.  Pour moi, c'est la manière optimale de regarder ou éditer un document -- tout document.  Si vous lisez la version brute de ce manuel, sans naviguer dans le fichier, vous verrez ce que je veux dire.  Revoyez la commande de coupure de ligne ci-dessus. 

La disposition d'une section préformatée, <pre>, est conservée, bien que des ordres des interlignes soient comprimés vers le bas à un interligne, et le whitespace à la fin des lignes est dépouillé.  Ceci préserve la structure des adresses de rue, et d'autres blocs préformatés. 

Les tables sont formatées comme une exportation ASCII d'un tableur ou d'une base de données SQL.  Le caractère « pipe » (barre verticale) sépare les champs sur chaque ligne.  Il n'y a pas d'espaces autour des pipes, et les champs d'une ligne donnée ne seront probablement pas alignés avec les champs de la ligne suivante.  Ce n'est pas joli, mais un utilisateur aveugle ne peut pas vraiment parcourir en une colonne de bas en haut de toute façon, particulièrement en utilisant un éditeur ligne de ce type.  Il vaut mieux sauvegarder la table dans un fichier local et utiliser les instructions d'extraction, de tri, de fusion etc.  Voici un exemple de table. 

numéro de pièce|quantité|prix
2635|2|34.80
1398|1|67.50
8118|5|125.00

Les champs vides en fin de ligne sont ignorés.  Ce sont presque toujours des images -- parfois une ligne entière d'images -- parfois une table entière d'images.  L'utilisateur aveugle n'a pas besoin de lire les champs vides. 

Notez que le fichier navigable est en lecture seule.  Après tout, ce n'est pas le « source » -- pourquoi devriez-vous l'éditer ? Il y a des moyens de remplir et éditer les zones de saisie d'un formulaire, qui seront vus plus tard.  En attendant, considérez le texte comme non modifiable.  Le lancement d'une commande de copie, d'insertion ou de remplacement, générera une erreur. 

Si vous voulez éditer le texte, comme texte brut, tapez « et » (éditer comme texte).  Vous ne pourrez plus revenir à la page HTML d'origine.  Ni suivre un lien hypertexte ou remplir un formulaire.  Le texte navigable est devenu un texte plat, sans la sémantique d'Internet. 

La commande « b fichier.html » est un raccourci pour « e fichier.html », suivi de « b ».  Se rappeler que la commande « ub » sort du mode navigation, et revient au texte original HTML, comme si vous seul aviez tapé « e file.html ». 

Si une URL est appelée à partir de la ligne de commande, comme dans « e www.google.com », on passe automatiquement en mode navigation.  Tapez « ub » pour revenir au code HTML brut. 

Technique, maths

La plupart des personnes ne lisent jamais les pages Web techniques, mais si cela vous arrive…

Un indice inférieur, repéré par un tag HTML, est mis entre crochets.  Ainsi x<sub>n</sub> devient x[n].  Ainsi x indice 1 est affiché, comme votre professeur le dirait.  Ce n'est pas ambigu, comme vous pourriez d'abord penser ; seuls les programmeurs emploient x1 comme nom de variable, pas les mathématiciens.  Si vous voyez x1 dans une formule, elle signifie l'indice 1 de x.  Même 17a3b3 n'est pas ambigu ; c'est une traduction de 17 fois a[3] fois b[3]. 

Les indices supérieurs sont mis entre parenthèses, précédés d'une flèche.  Les parenthèses sont ignorées si l'indice supérieur est un nombre.  Ainsi x au cube donne x^3, alors que x à la puissance n-1 donne x^ (n-1). 

Il y a, c'est triste à dire, trois manières différentes de coder des symboles mathématiques en HTML.  Actuellement edbrowse n'en connaît qu'une seule, la plus commune, et la plus portable parmi tous les navigateurs.  C'est le système Unicode, où la lettre grecque thêta est affichée &#952;.  Internet Explorer transforme cette expression en θ, un caractère sur l'écran, alors que edbrowse le transforme en mot « thêta ».  Nous mettons également les espaces autour du mot si ses voisins sont également des mots.  Ceci est illustré par le circonférence d'un cercle, qui est 2 fois pi fois r.  Ces trois termes sont habituellement accolés, sans confusion possible pour un voyant, où pi est une lettre grecque séparée.  Mais si pi est prononcé, avec les termes restant accolés, le résultat est 2pir.  Maintenant, « pir » ressemble à un mot de trois lettres.  Pour éviter ceci, edbrowse insère des espaces, ce qui donne 2 pi R. 

Ces traductions sont conçues pour fonctionner avec les pages du Math Reference Project, des archives de mathématiques avancées qui essaient simultanément d'être accessibles aux aveugles et voyants.  C'est peut-être impossible, mais c'est à essayer. 

Titre, description, mots-clés

En mode navigation, les commandes « ft », « fd » et « fk » affichent respectivement le titre, la description, et les mots-clés de la page Web courante.  Normalement, ces données sont cachées à l'utilisateur.  Le titre décrit la page Web en 80 caractères ou moins.  La description est une explication plus complète, affichée par un moteur de recherche tel que yahoo ou altavista.  L'utilisateur lit la description affichée par le moteur de recherche et décide alors de lire cette page Web.  Les mots-clés sont employés par des moteurs de recherche pour faciliter des recherches par mot-clé.  Comme le reste de la page, ces trois attributs sont non modifiables.  Si c'est votre page Web, vous pouvez les modifier en revenant au mode HTML brut.  Les concepteurs Web devraient prêter une attention particulière à la description et les mots-clés, qui rendent les pages accessibles par l'intermédiaire des moteurs de recherche standard. 

Notez que « ft » affiche le titre de la page Web, tandis que « f t » (avec un espace) renomme le fichier courant en « t », ce qui n'est probablement pas ce que vous souhaitez. 

La commande de réaffichage

Tapez « rf » pour réafficher la page courante.  Ceci relit le fichier ou l'URL dans le tampon courant.  Il ne provoque pas de nouvelle session d'édition sur la pile.  C'est analogue au bouton de réaffichage sur Netscape et Internet Explorer. 

Si une page Web est mise à jour chaque minute, par exemple avec les derniers cours des actions de vos compagnies préférées, vous pouvez taper « rf » pour récupérer la dernière version de cette page Web.  Ceci suppose que les serveurs Internet ne mettent pas en cache la page Web et ne vous redonnent pas la même copie démodée à plusieurs reprises. 

Sur votre machine locale, vous pouvez employer ce dispositif pour lire la dernière version d'un fichier dynamique, tel qu'un fichier de de log.  Ou vous pouvez relire un répertoire, pour lister les nouveaux fichiers qui ont été placés dans ce répertoire.  Par exemple, vous pourriez lancer un shell pour exécuter « cat x y >z », z n'apparaîtra pas dans votre listing du répertoire tant que vous n'aurez pas tapé « rf ». 

Hyperliens

Un lien vers une autre page Web est mis entre accolades, comme ceci :

{Des rapports récents} suggèrent un lien entre l'autisme et les bactéries intestinales. 

En coulisses, « Des rapports récents » est lié à www.pecanbread.com/BTVCautismchapter.html, mais vous ne le voyez pas, à moins d'activer le lien ou d'afficher le code HTML. 

Naturellement le texte navigable pourrait également contenir des mots entre accolades, particulièrement si la page Web est de nature technique.  Par conséquent, il y a une certaine ambiguïté.  Cependant, je crois que le contexte lève l'ambiguïté.  {Plus d'information} est probablement un lien, tandis que ${HOME}/.profile ne l'est probablement pas. 

Certaines pages Web présentent une série d'icônes qui sont des liens vers d'autres pages.  C'est-à-dire, vous cliquez sur une icône, plutôt que sur une expression, pour aller ailleurs.  Ces icônes sont supposées être intuitives.  Parfois elles le sont -- parfois non.  De toute façon, elles sont inutilisables pour un aveugle.  Parfois le concepteur Web est assez aimable pour fournir un texte décrivant l'image.  Dans ce cas, l'expression est employée comme lien.  Elle est affichée entre accolades, comme s'il n'y avait pas d'image.  S'il n'y a pas d'expression alternative, on utilise le nom de la cible de l'hyperlien.  Ce nom peut être étonnamment utile, ou tout à fait inutile, comme dans « index.html ».  Si on ne peut déterminer un nom, le lien générique {image} est employé.  Dans ce cas, vous devrez aller à la page Web pour découvrir ce qu'il contient. 

Pour suivre un lien, tapez la commande « g » (go).  Oui, « g » lance également une commande globale, telle qu'une recherche/remplacement globale, mais seulement s'il est suivi d'une expression régulière.  De lui-même, « g » suit le lien sur la ligne courante, « g2 » suit le deuxième lien sur la ligne courante, et « 4g » suit le lien sur la ligne 4.  Si un lien s'affiche sur plusieurs lignes, vous devez être sur la première ligne, celle qui contient l'accolade gauche. 

La commande g peut également agir sur un lien affiché en mode texte brut, s'il « semble » être une URL valide.  Si un ami vous envoie une URL intéressante par mail, et que vous ayez sauvegardé ce mail, vous pouvez « aller » à ce lien, même si le fichier n'est pas en HTML, et même si vous n'avez pas activé le mode navigation. 

Liens internes

Bien que la plupart des liens mènent à d'autres pages Web, quelques liens pointent sur d'autres sections dans le document courant.  Cette fois encore, le contexte peut vous aider.  Les liens dans une table des matières sont habituellement des renvois aux chapitres dans le document courant.  Même chose pour les liens qui ressemblent à : « voir {annexe I} », ou « voir la section configuration de matériel} ». 

La commande « g » suit un lien interne ou un lien externe.  Dans l'un et l'autre cas, vous vous trouverez dans un endroit différent.  Cependant, si le lien est interne, vous êtes toujours dans le même fichier.  En fait, la seule chose qui a changé est la ligne courante.  La nouvelle ligne est affichée, et devrait correspondre au lien que vous avez activé.  Souvent les mots sont identiques.  « Activer {annexe I} », et vous verrez probablement le titre « annexe I » de la section.  Tapez z10 pour lire les premières lignes de l'annexe. 

La touche retour arrière

Si vous éditez un nouveau fichier par l'intermédiaire des commandes « e », « b », ou « g », et que vous avez déjà du texte dans le tampon, ce texte est empilé sur une pile interne.  Vous pouvez « dépiler » le texte en par la commande « ^ ».  C'est supposé être intuitif -- la flèche haute se dirigeant à la page précédemment affichée à l'écran. 

Ce dispositif semble plutôt idiot lorsqu'on est en mode édition, mais il se comprend en surfant sur l'internet.  Souvent nous descendons en suivant deux ou trois liens, pour finir par nous trouver à la fin.  « Je n'ai pas voulu aller ici.» En tapant la touche retour arrière à plusieurs reprises, nous reviendrons en territoire familier.  Nous pouvons maintenant partir dans une nouvelle direction.  La commande « ^3 » ou le « ^^^ » revient trois pages en arrière.  Ne pas employer ce dispositif itératif à moins que vous sachiez exactement où vous voulez revenir. 

Notez que l'état entier d'une session d'édition est mémorisé et reproduit, y compris le nom de fichier, la dernière recherche/remplacement, les chaînes de substitution, les hyperliens et des formulaires le javascript compilé, tout !

À la différence de lynx, je ne mémorise pas l'historique des pages Web visitées.  Je n'ai jamais vraiment eu besoin de ce dispositif.  Dans 99% des cas, je veux simplement revenir en arrière d'une ou deux pages, voilà tout.  Malheureusement cette opération de haute voltige exige deux sauts périlleux et un flip arrière sous lynx.  Dans mon navigateur, il suffit de taper une touche. 

La pile ne doit pas être confondue avec l'édition simultanée de plusieurs fichiers, décrite dans la première section.  En fait chaque session d'édition, e1 e2 e3…, a sa propre pile interne.  Les sessions simultanées sont appropriées quand vous devez se déplacer dans les deux sens entre deux fichiers, ou copier/coller entre eux.  Cependant, une session, avec sa pile interne, est habituellement suffisante pour surfer sur l'internet. 

Si une commande de navigation échoue, vous donnant un tampon vide sans intérêt, on dépile automatiquement, en réaffichant la page Web précédente.  Maintenant vous pouvez réessayer le lien par « g », ou suivre un lien différent .  Noter qu'une commande de navigation peut échouer, et donner la cause de l'échec, si le serveur à distance est bien conçu.  Dans ce cas, vous pouvez avoir le message d'erreur « fichier non trouvé » et vous trouver sur une nouvelle page Web, laquelle explique le problème.  Après avoir lu l'explication, suivre ses indications, ou tapez « ^ » pour revenir et essayer de nouveau. 

Si un nombre est affiché, même égal à 0, le texte précédent a été mis sur la pile, et vous êtes dans un nouveau fichier.  Le nombre affiché est la taille du nouveau fichier.  Employer la commande « ^ » pour revenir en arrière.  S'il n'y a pas de nombre, simplement un message d'erreur, alors edbrowse n'a pas créé de nouveau tampon.  Il n'a pas obtenu le texte recherché.  Taper «.» remettra la ligne affichée auparavant. 

Suivre un lien interne à une autre section dans le document courant ne pousse rien sur la pile.  En d'autres termes, « ^ » ne vous renverra pas où vous étiez.  En fait, il vous renverra à la page Web précédente, ce qui n'est pas ce que vous vouliez.  Si vous voulez jeter un coup d'oeil à l'annexe I, puis revenir, marquer la position actuelle avec « kr ».  Après avoir visité l'annexe, employer l'étiquette « 'r » pour revenir où vous étiez dans le fichier. 

La commande M

Si vous voulez lire et/ou agir simultanément sur plusieurs pages Web en parallèle, lesquelles sont normalement placées sur la pile, vous pouvez les déplacer une à une dans une autre session en utilisant la commande « M » majuscule.  Les étiquettes et les liens sont transférés également.  Une fois que la page Web a été transférée sur une autre session, edbrowse lance automatiquement la commande « ^ ».  Vous êtes de nouveau à la page précédente. 

Il est généralement peu sûr de faire une copie d'une page Web courante, avec ses objets Javascript etc.  , aussi la commande M déplace la page et la met à l'écart, puis vous renvoie la page précédente.  Notez, cette commande fonctionne aussi bien avec des fichiers. 

Supposons qu'une page Web affiche

{avions}
{trains}
{automobiles}

Si les trois rubriques vous intéressent, tapez ces commandes dans l'ordre :

1g
M2
2g
M3
3g
M4

Maintenant les sessions 2 3 et 4 sont les sous-pages traitant respectivement des avions, trains et automobiles.  Vous pouvez remplir des formulaires ou suivre des hyperliens dans n'importe laquelle d'entre elles, ou rester en session 1 et faire autre chose. 

Musique de fond

Si vous essayez d'écouter un synthétiseur de parole, la dernière chose dont vous avez besoin est une musique de fond.  Au lieu de jouer la chanson, je la rends disponible par un hyperlien. 

{Background Music}

Ce lien apparaît toujours en début de page ou près du début.  Cliquez sur ce lien et téléchargez le fichier wav ou mp3, pour le jouer à votre convenance.  Employez la commande « pb ».  Normalement, « pb » prend le nom du fichier pour reconnaître le format audio.  Si le nom de fichier finit par .wav, c'est un fichier son.  Si le nom de fichier n'est pas particulièrement parlant, et que vous connaissez son format audio, vous pouvez le spécifier en tapant « pb.wav » pour un fichier de wav, « pb.mp3 » pour un fichier mp3, et ainsi de suite. 

Le fichier de configuration (décrit ci-dessous) inclut le type des descripteurs de fichiers, qui indique à edbrowse comment jouer les fichiers wav, mp3, etc.  Ceux-ci doivent être renseignés, sans quoi la commande « pb » ne fonctionnera pas.  Elle affichera quelque chose comme « je ne sais pas traiter un fichier mp3 ».  C'est conforme à d'autres navigateurs, qui emploient des extensions pour jouer les fichiers son. 

Zones de saisie

Les zones de saisie d'un formulaire sont habituellement indiqués par les signes « < » et « > ».  Par exemple, un moteur de recherche pourrait présenter le formulaire suivant :
Mots-clés : <>
Recherche avançée : <->
Langue : <en>
Rechercher maintenant : <GO>
Effacer : <RESET>

La première ligne de cet exemple de formulaire est une zone de texte, initialement vide.  Vous y entrez les mots-clés recherchés.  Écrire et éditer des zones de saisie sera discuté plus tard. 

La deuxième ligne est un bouton radio.  Ce champ indique au moteur de recherche qu'il faut employer des dispositifs booléens avancés, comme ce mot-clé et ceci, ou cela, mais pas ceci, etc.  Le bouton est inactif, indiqué par -.  (La plupart des personnes ne savent pas employer la recherche avancée de toute façon).  Un + signifie que le bouton est activé. 

La troisième ligne détermine la langue des mots-clés, anglaise par défaut.  Ce n'est pas une zone de texte à remplir, vous ne pouvez y entrer n'importe quoi.  Nous décrirons comment regarder les options plus tard. 

La quatrième ligne est le bouton de soumission, qui envoie le formulaire au moteur de recherche et renvoie les résultats.  Ce « champ » ne peut pas être édité ; c'est simplement un bouton à pousser. 

La cinquième ligne est également un bouton à pousser.  Il efface toutes les données que vous avez saisies, pour recommencer une recherche.  Les valeurs par défaut seront reconstituées.  Ainsi la troisième ligne va de nouveau à <en>, plutôt qu'à <>. 

Saisie de données

Compléter un formulaire est relativement facile, une fois que vous connaissez la commande (surchargée) « i ».  Oui, « i » par lui-même est la commande d'insertion de texte, mais dans le mode navigation, « i » se rapporte aux zones de saisie. 

S'il y a une seule zone de saisie sur la ligne courante, « i? » donne des informations sur cette zone de saisie.  Si la ligne contient plusieurs zones de saisie, vous devrez employer un nombre, comme « i3? » pour le troisième champ.  Le type de zone de saisie est affiché, puis sa taille, puis le nom de la zone.  Si la zone de saisie est un choix multiple, la liste des choix possibles est affichée, avec leur numéro d'ordre au début.  Pour choisir une option, vous pouvez soit taper les premières lettres comme « mich » pour le Michigan, soit taper son numéro.  Inutile de le dire, la deuxième solution est souvent plus facile.  Rappelez-vous le formulaire exemple dans la section précédente.  Si vous tapez « i? » au troisième champ, vous pourriez voir ce qui suit

choisir[7] la langue
1: anglais
2: français
3: allemand
4: italien
5: espagnol

Si une liste contient des centaines d'options, tapez « i?chaîne » pour voir les options qui contiennent la chaîne indiquée.  Tapez « i?ma » dans une zone de saisie des départements et vous obtiendrez la Marne, la Manche, la Mayenne etc.  Alors vous pourrez choisir l'option que vous voulez par son nom ou son numéro. 

Maintenant un peu de saisie de données.  Tapez « i=xyz » pour entrer « xyz » dans la zone de saisie.  Rappelez-vous, vous devez taper « i3=xyz » pour mettre l'information dans la troisième zone de saisie sur la ligne courante.  Si vous obtenez une erreur, c'est probablement parce que le champ a un ensemble fixe d'options, et vous n'avez pas sélectionné une de ces options.  Vous pouvez saisir une des options ou son numéro.  Vous pouvez également saisir un fragment du texte de l'option désirée, et edbrowse complétera le reste.  C'est possible à chaque fois qu'une et seulement une option contient une copie (insensible à la casse) de la chaîne que vous avez tapée.  Ainsi vous pourriez dans l'exemple ci-dessus taper « tali » et obtenir l'italien, puisque c'est la seule option contenant ces quatre lettres.  C'est utile quand on vous demande votre adresse, et votre pays.  Saisir suffisamment de lettres de votre pays, et vous tomberez probablement sur l'option correcte dans la liste.  Noter le paradigme ici : les personnes aveugles ne veulent pas patauger dans un menu à moins d'y être absolument obligées !

Il y a une certaine ambiguïté quand l'option est elle-même un nombre.  Dans ce cas-ci j'exécute trois comparaisons.  Si vous saisissez le nombre exact, cette option est choisie.  Si le nombre que vous avez tapé n'est pas une des options, il est traité comme numéro d'une entrée de menu.  Si ce n'est pas un numéro valide du menu (par exemple hors de la gamme), je fais une comparaison partielle avec les options, recherchant ces chiffres comme sous-chaîne.  Ceci peut sembler confus, mais c'est habituellement ce que vous voulez obtenir. 

Vous pouvez employer i<7 pour amener le contenu de la session 7 dans la zone de saisie courante.  La session 7 doit avoir une ligne de texte.  De même, « i<nom de fichier » lit le contenu du fichier dans la zone de saisie courante.  Ici aussi, le fichier doit contenir une ligne de texte.  Le nom de fichier est expansé de la manière habituelle.  Ceci inclut l'expansion de caractères « joker », tant que l'expansion mène à un et seulement à un fichier.  Mettre suffisamment de caractères autour du « * » pour indiquer un fichier unique. 

Supposez maintenant que vous tapiez votre numéro de carte bancaire, chacun des 16 chiffres, dans la zone de saisie de texte.  Si vous avez fait une erreur, vous ne voulez pas recommencer à taper la chaîne entière.  Aucun problème -- employez la commande remplacement.  Vous pouvez le faire en tapant « i/x/y/ » ou « s/x/y/ » -- comme vous préférez.  Rappelez-vous, il vous faudra peut-être indiquer la zone de saisie, comme « s3/x/y/ ».  La syntaxe habituelle de substitution fonctionne.  Ne croyez pas à une excessive généralisation du suffixe « g » .  « s3/x/y/g » remplace chaque « x » par « y » dans la troisième zone de saisie, mais n'affecte pas les autres champs de la ligne courante. 

Si le bouton de soumission est le troisième champ sur la ligne courante, vous pouvez l'activer par « i3* ».  Cependant, « i* » est suffisant lorsqu'il y a un bouton sur la ligne.  De même, vous pouvez remplir une zone de texte en tapant « i=kangourou », plutôt que « i1=kangourou », si le deuxième champ sur la ligne courante est un bouton de soumission.  Vous devez seulement indiquer un numéro de zone de saisie ou de champ quand il y a plusieurs zones de saisie de texte, ou plusieurs boutons, sur la ligne courante. 

Zones de texte

Quelques formulaires Internet vous permettent de taper quelque chose librement, du genre « écrivez svp vos commentaires ici ».  Ceci se fait dans une fenêtre à l'écran, ayant un nombre fixe de lignes et de colonnes, bien que ce soit habituellement une contrainte artificielle.  L'utilisateur voyant peut généralement taper plus de lignes que la fenêtre peut contenir, et le texte défilera dans la fenêtre.  Par chance, l'utilisateur aveugle peut ignorer cette fenêtre artificielle et taper en toute liberté.  Comme d'habitude, la commande « i? » indique la taille qu'aurait cette fenêtre dans un navigateur visuel.  Vous verrez quelque chose comme « area [7x40] », qui indique une fenêtre de 7 lignes par 40 colonnes. 

L'implémentation dans lynx des zones de texte est particulièrement hideuse.  Ce qui n'est pas étonnant, puisque lynx n'est pas un éditeur.  Vous pouvez corriger les fautes de frappe, mais vous ne pouvez pas réellement « éditer » le texte en cours.  Une fois tapée la touche entrée, cette ligne est terminée, et vous êtes sur la prochaine zone.  Vous ne pouvez pas déplacer des lignes ou insérer les lignes etc.  Vous ne pouvez pas non plus préparer vos commentaires à l'avance et les insérer dans la zone de texte à partir d'un fichier. 

Dans edbrowse, la zone de texte est contrôlée à partir d'une autre session d'édition.  Ceci permet d'utiliser toutes les ressources de l'éditeur.  Vous pouvez déplacer du texte, faire des substitutions globales, ou insérer des commentaires à partir d'un fichier.  La session d'édition est choisie pour vous, et apparaît dans la zone de saisie.  Considérez le formulaire suivant :

Donnez votre adresse email: <>
Tapez vos commentaires: <buffer 2>

Dans cet exemple, la session 2 n'était pas active quand la navigation a commencé.  Le navigateur a assigné la session 2 spécifiquement pour ce champ d'entrée.  Tapez « e2 » pour aller à la session 2, préparer vos commentaires, et tapez « e1 » pour revenir au formulaire.  Sur la plupart des pages Web, les zones de texte sont initialement vides, donc le tampon 2 sera vide, mais ce n'est pas toujours le cas.  Vérifiez la présence d'un texte pré-existant avant de commencer à taper.  Un site web particulièrement arrogant pourrait pré-remplir la zone de texte avec : « J'aime votre site Web parce que :  ». 

Quand vous enverrez le formulaire, comme on va le voir dans la prochaine section, le tampon 2 de texte, dans la deuxième session d'édition, remplacera les mots « bufffer 2 » dans la zone de saisie.  Ainsi vos commentaires soigneusement travaillés sont partis.  (Ceci ne signifie pas que quelqu'un vous écoutera).

Pousser le bouton

Si la troisième zone de saisie sur la ligne courante est un bouton de validation ou d'annulation, vous pouvez l'enfoncer en tapant « i3* ».  Le bouton d'annulation réinitialise toutes les zones du formulaire, telles qu'elles étaient au premier chargement de la page web. 

Le bouton de soumission envoie le formulaire au serveur à distance et attend une réponse.  C'est comme suivre un lien Internet, mais ici vous envoyez quelques données avec la demande.  Tapez « kangourou » dans un moteur de recherche et vous lirez bientôt une page Web au sujet des kangourous.  Comme avec n'importe quel autre lien, vous pouvez employer la touche retour arrière « ^ » pour revenir.  Dans ce cas, vous reviendrez au formulaire en ligne.  Vous pouvez modifier les données et soumettre de nouveau le formulaire, avec des questions sur un autre animal. 

J'ai implémenté les méthodes «GET» et «POST», protocoles HTTP les plus communs, et elles semblent fonctionner pour la plupart des sites web. 

Une fois que vous avez soumis votre formulaire, et vous regardez les résultats, vous pouvez remarquer quelques caractères étranges à la fin du nom de fichier.  Si vous avez recherché l'information sur des kangourous, le nom de fichier pourrait ressembler à : www.recherche.com?keywords=kangourou.  Le texte qui suit le point d'interrogation est une version codée des données du formulaire.  Qui devient une partie de l'URL virtuelle.  C'est réellement une bonne chose, comme nous le verrons dans la prochaine section. 

Adresses Web et Email

La commande « A » majuscule montre les adresses Web sous les liens sur la ligne courante.  Chaque adresse sera entourée par les tags et , prête à être collée dans un fichier de signets, si c'est ce que vous souhaitez.  Ces adresses existent dans une nouvelle session ; la session précédente a été poussée sur la pile.  Ajoutez ces dernières à votre fichier de signets par « w+ $bookmarks », si vous avez renseigné la variable d'environnement $bookmarks.  Ils seront placés à la fin ; vous pouvez les déplacer dans le fichier plus tard, une fois « hors ligne ».  Pour les connectés en RTC, le temps de connexion est précieux, et ne devrait pas être perdu à réarranger des fichiers de signets.  En conclusion, employer la commande ^ pour retourner à la page Web que vous regardiez.  Voici à quoi elle pourrait ressembler :
< b this.that.com/whatever # navigation dans une page Web
> 16834 # taille du code HTML brut
> 7855 # taille du texte navigable
< /kangourou/i # recherche de kangourou dans la page
> cliquez ici pour {plus d'informations sur des kangourous}, ou {nous écrire}. 
< A # capture des URLs
> 144 # taille des URLs
< ,p # affichons-les
> <A HREF=www.kangaroo-info.com>
> plus d'informations sur des kangourous
> </A>
> nous écrire:info@kangaroo.org
< 4d # nous n'avons pas besoin de l'adresse mail
< w+ $bookmarks # ajoute cette URL au fichier de signets
> 336
< ^ # retour à la navigation
> cliquer ici pour {plus d'informations sur des kangourous}, ou {nous écrire}. 

Je suppose que je pourrais interroger la variable d'environnement $bookmarks moi-même, et ajouter l'URL à ce fichier automatiquement, mais comme cet exemple le montre, vous pourriez ne pas vouloir ajouter tous les liens.  En fait l'adresse électronique n'a rien à faire dans un fichier de signets.  En outre, vous pouvez vouloir changer la description du lien, bien que dans cet exemple la description soit assez raisonnable. 

Alternativement, vous pourriez ignorer l'URL et conserver l'adresse électronique, pour l'ajouter à votre carnet d'adresses.  Là encore, vous voudrez changer l'expression générique « nous écrire » pour quelque chose de plus parlant, comme adresse-kangourou.  C'est un surnom, qu'il est possible d'utiliser pour envoyer du courrier à ce destinataire.  (Les sections suivantes décrivent l'utilisation de edbrowse en tant que client de courrier). 

S'il n'y a aucun lien sur la ligne courante, ou si vous n'êtes pas dans le mode navigation, le nom de fichier courant est employé.  C'est utile quand vous voulez ajouter à votre fichier de signets l'adresse URL de la page courante, plutôt qu'un autre page pointée par un lien. 

Si la page courante est le résultat d'un envoi de formulaire, le nom de fichier peut inclure vos zones de saisie après le point d'interrogation.  S'il le fait, c'est une fonctionnalité, pas une bogue.  Cette URL exacte, avec les données à la fin, peut être stockée comme signet et être activée à plusieurs reprises, comme si vous aviez complété le formulaire à chaque fois.  Chaque semaine, vous pouvez appeler cette URL virtuelle pour voir s'il y a de nouvelles informations sur des kangourous.  Un exemple plus pratique pourrait être un formulaire qui consulte la météo pour une certaine ville ou le cours des actions d'actions de compagnies.  Vous pouvez également écrire des scripts concis qui « rempliront » le formulaire virtuel, simplement en modifiant les données après le point d'interrogation.  Ceci fournit une commande simple pour consulter la météo de n'importe quelle ville ou le cours actuel de n'importe quelle action. 

Si le formulaire emploie le POST, plutôt que la méthode GET, les mêmes données apparaîtront, mais le point d'interrogation est remplacé avec le caractère « contrôle a ».  Malheureusement ce caractère est invisible, et ceci est source de confusion.  Dans le doute, lister la ligne. 

Un dernier avertissement au sujet des ajouts à votre fichier de signets.  Disons que vous avez lancé votre commande « A », et avez modifié un peu la description.  Maintenant le lien est correctement écrit, et vous voulez le sauvegarder.  Vous tapez accidentellement «w $bookmarks », oubliant le signe plus.  Au lieu d'ajouter le lien en fin de fichier, vous avez enregistré à la place de votre fichier de signets.  Des années des liens accumulés sont parties en fumée.  Pour éviter cet accident désastreux, créez une macro pour l'ajout à votre fichier de signets.  Je sais, nous n'avons pas encore parlé des macros définies par l'utilisateur, mais nous le ferons.  Et quand nous le ferons, vous devrez écrire une macro « ajout signet » le macro semblable à ceci :.

function+bma {
 w+ $bookmarks
}

Maintenant vous pouvez tapez <bma pour ajouter un lien à vos favoris, sans vous soucier des fautes de frappe.  C'est plus court que « w+ $bookmarks » de toute façon.  Nous reviendrons sur ce sujet quand nous présenterons des macros, réellement des fonctions, qui sont définies dans votre fichier de configuration. 

Cookies

Certains sites Web servent des «cookies», qu'on s'attend à ce que votre navigateur sauvegarde et récupère ensuite pour des échanges futurs.  En fait beaucoup de sites Web simplement ne fonctionnent pas sans support des cookies.  Par conséquent edbrowse accepte toujours les cookies. 

Notez que seuls les cookies de modèle Netscape sont supportés.  Cependant, c'est la saveur la plus commune de cookies.  Elle satisfera probablement vos besoins. 

Des cookies persistants sont stockés dans un fichier, habituellement $HOME/.cookies, et sont ainsi disponibles pour des sessions suivantes d'edbrowse.  Ces cookies sont employés pour stocker des informations à long terme sur vous, tel que votre nom d'utilisateur et mot de passe dans amazon.com.  Par conséquent votre fichier de cookies devrait être en mode 0600.  En fait le fichier est créé en mode 0600, pour votre propre protection. 

Vous n'aurez pas probablement jamais besoin de regarder votre fichier de cookies, mais si c'est le cas, c'est du texte directement éditable. 

Connexions sécurisées

Edbrowse emploie la méthode la plus commune de chiffrement du trafic Web, HTTP SSL/TLS, plus connu sous le nom de HTTP sécurisé.  Les sites Web sous HTTP sécurisé ont une URL de la forme : https://secure.server.com.  Noter que le protocole est https:// plutôt que http://.  Le « s » supplémentaire représente «sécurisé».  Le trafic est chiffré, c'est-à-dire mathématiquement brouillé, et ne peut pas être intercepté par un tiers scélérat. 

Edbrowse vérifiera les connexions SSL, si vous fournissez un fichier de certificats SSL.  C'est une mesure antispoofing (anti usurpation d'identité), de s'assurer qu'un intrus ne se fait pas passer pour votre banque, essayant de voler vos numéros et mots de passe de compte.  Vous pouvez télécharger un fichier de certificat ici, mais je ne le maintiens pas toujours à jour.  Sur quelques distributions de Linux, vous pouvez lancer la commande `cd /etc/ssl/certs ; cat * >../edbrowse-certs' pour capturer les certificats SSL déjà enregistrés dans votre système linux.  Si vous n'avez pas ce fichier, ou si vous ne l'avez pas créé, ou si vous n'indiquez pas son emplacement dans votre fichier de configuration, vous ne pourrez pas vérifier les connexions sécurisées, et vous serez avertis en conséquence.  Quelques navigateurs n'ont pas ce dispositif, ce n'est donc pas la fin du monde, mais en général c'est une bonne idée de vérifier vos connexions sécurisées, à moins que le vérificateur vous empêche d'accéder à un site Web dont l'authenticité vous paraît certaine.  Dans ce cas vous pouvez taper « vs » pour stopper le dispositif.  C'est une commande à bascule ; tapez « vs » encore pour redémarrer le dispositif. 

Ne jamais envoyer d'information sensible, telle que le numéro de sécurité sociale ou des numéros de carte bancaire, sur un canal peu sûr.  S'assurer que le formulaire utilise SSL.  Comment le savoir ? Le bouton de soumission aura le mot «secure» ajouté à son intitulé. 

<envoyez votre commande secure>

C'est semblable au cadenas qu'Internet Explorer emploie pour dire que votre connexion est sécurisée, bien que mon système ne soit pas totalement infaillible.  Un site Web peut vous abuser en mettant le mot « secure » dans le texte de soumission. 

Noter que les boutons génériques (sans compter le bouton de soumission) peuvent également soumettre votre formulaire, par Javascript.  Je ne sais pas si ce bouton envoie le formulaire ou non, et je ne veux donc pas mettre le mot «secure» sur chaque bouton de la page.  Je l'ajoute seulement au bouton de soumission, mais si ce bouton est sécurisé, ils le sont tous.  Tous emploient la même formulaire, et ont la même URL. 

En théorie, Javascript peut changer l'URL à la dernière minute, sans vous avertir, de https://ceci_est_securise.com à http://ceci_nest_pas_securise.com.  Je ne sais pas si d'autres navigateurs surveillent ce genre de piège, mais edbrowse le fait.  Si l'URL originale était sécurisée, et vous le savez par l'intermédiaire du « secure » dans le bouton de soumission, et si Javascript la change en connexion non sécurisée, edbrowse ne soumettra pas le formulaire.  C'est vraiment paranoïaque, parce que le premier site Web, celui qui a demandé votre numéro de carte bancaire, fournit également le Javascript, et n'a aucun intérêt à désactiver la sécurité, puisque vous allez leur remettre votre numéro de carte bancaire de toute façon. 

Si vous avez des comptes sur des serveurs sécurisés, tels que PayPal.  com, vous devez avoir un mot de passe absolument sûr.  Ne jamais envoyer ce mot de passe sur une connexion peu sûre.  Il a la même valeur que vos numéros de cartes bancaires.  J'ai un mot de passe spécial que j'emploie pour mes connexions sécurisées, et seulement pour ces connexions.  Et des mots de passe jetables quand la connexion n'est pas sécurisée. 

S'il vous plaît, ne tombez pas dans le piège du « phishing » d'emails qui vous indiquent que votre compte a expiré, mais qui vous ouvre pour cette fois encore une session en utilisant ce formulaire commode.  Le courrier semble légitime, et le formulaire envoie réellement votre mot de passe secret à un voleur, qui aura accès à votre compte.  Une compagnie réputée ne demandera jamais, jamais, jamais de vous connecter par une formulaire email.  Elle vous indiquera toujours de revenir à son site Web et de vous y connecter. 

La sécurité d'Internet est complexe, c'est le moins qu'on puisse dire, et dépasse la portée de ce document.  Si vous avez des questions à son sujet, svp me les envoyer directement.  En règle générale, le HTTP sécurisé est vraiment tout à fait sûr, et vous pouvez l'utiliser pour envoyer des informations sensibles à travers l'internet.  Il est probablement plus sûr que de donner votre numéro de carte bancaire par téléphone, pratique courante avant l'e-commerce.  Ainsi il faut rester un peu paranoïnaque, en fait c'est probablement une bonne idée, mais que cela ne vous empêche pas d'effectuer vos achats en ligne. 

Téléchargements FTP

Ce navigateur supporte la récupération des fichiers et des répertoires en ftp.  Vous pouvez fournir un URL ftp comme : ftp://ftp.random.com/tarball.tar.gz et le fichier sera récupéré.  Que vous saisissiez l'URL vous-même, ou par un hyperlien sur une page Web, n'a pas d'importance.  Le fichier est récupéré, et sauvegardé dans un fichier local du même nom.  Vous verrez les mots :

ftp download
quelques chiffres sur la taille du fichier et les bits par seconde
success

Naturellement le téléchargement peut échouer, dans ce cas vous recevrez un message d'erreur.  S'il est simplement interrompu, pour quelque raison due à l'internet, vous pouvez relancer la commande, et edbrowse reprendra le téléchargement à l'endroit où il a été interrompu.  Ceci peut faire gagner du temps quand on télécharge un très gros fichier. 

Par défaut, edbrowse emploie le nom d'utilisateur « anonymous » et le mot de passe « some-user@edbrowse.net » pour des connexions ftp.  Cependant, vous pouvez modifier ceci dans l'URL, et quelques pages Web tirent profit de ce dispositif.  Par exemple, disons que vous voulez accéder au fichier /etc/passwd sur une machine appelée quelque.part. Ce fichier n'est pas lisible par les utilisateurs anonymes.  Vous devez ouvrir une session en tant qu'utilisateur reconnu par la machine quelque.part.  Dans edbrowse, utilisez la commande :

e ftp://chris:xxx@quelque.part/etc/passwd

La connexion ftp sera établie sous le nom d'utilisateur « Chris », et avec le mot de passe « xxx ». 

Certaines URLs ftp pointent sur des répertoires, pas des fichiers.  Si vous visitez une de ces URLs, et si c'est un serveur type Unix, vous recevrez la liste des fichiers du répertoire sous forme de page HTML avec des hyperliens.  Vous pourrez visiter les membres de ce répertoire comme si vous exploriez un site Web.  Si le serveur n'est pas de type Unix, vous recevrez le listing de répertoire en texte plat. 

Le mode ftp, c'est-à-dire le modèle de connexion, peut être actif ou passif.  L'un fonctionne bien quand le client est derrière un routeur, et l'autre quand le serveur est derrière un routeur.  Vous pouvez indiquer le mode de ftp actif par la commande « fma », ou passif par « fmp ».  La commande « fmd » place le mode ftp par défaut, lequel essaie d'établir une connexion en mode passif d'abord, et puis en mode actif si besoin.  Ce comportement par défaut étant raisonnable, vous devriez probablement le laisser ainsi. 

Edbrowse n'établit pas réellement les connexions ftp, il appelle en fait le programme « ncftpget » mme pour récupérer un fichier, et le programme « ncftpls » pour lister le répertoire.  Ces programmes sont distribués avec la plupart des systèmes Unix.  Si vous n'avez pas ces programmes, visitez svp ncftp.com.

Une fois encore, passons en revue les différences.  HTTP met un fichier dans un tampon en mémoire, c'est-à-dire une session d'edbrowse, alors que ftp copie le fichier directement sur disque.  En outre, ftp n'affiche pas un point tous les 100K pour indiquer la progression du téléchargement, ainsi vous devez attendre qu'il ait terminé.  (Selon votre système d'exploitation, vous pouvez basculer sur une console virtuelle différente et vérifier la longueur du fichier local).

Serveurs proxy

Un serveur proxy est un serveur web intercalé entre votre navigateur et les sites Web distants.  Il intercepte vos demandes de pages Web et les transmet au système distant.  Des serveurs proxy sont utilisés pour beaucoup de raisons.  Voici justes quelques-unes d'entre elles :

  1. Efficacité.  Le serveur proxy peut pouvoir stocker des pages Web précédemment appelées (système connu sous le nom de cache).  Si votre connexion au proxy est plus rapide que votre connexion au reste du réseau, le cache vous envoie alors les pages Web précédemment appelées plus rapidement. 

  2. Politiques.  Quelques administrateurs de pare-feu exigent d'employer un serveur proxy . 

  3. Anonymat.  Il existe des serveurs appelés serveurs proxy d'anonymat qui cachent votre adresse IP aux sites Web que vous passez en revue. 

Si vous souhaitez employer un serveur proxy pour le trafic HTTP, activez simplement l'option proxy dans votre fichier de configuration.  Fournir le nom d'hôte et le port, séparés par des deux points.  Par exemple :

proxy = proxy.campus.edu:3128

Notez que les proxy écoutent souvent sur des ports autres que le port 80.  « Squid » est un serveur proxy fourni avec quelques distributions Linux, et il emploie le port 3128 par défaut. 

Actuellement, edbrowse supporte seulement le proxying HTTP standard.  HTTP et ftp sécurisés peuvent être « proxiés », mais cette fonctionnalité n'est pas mise en application. 

Cadres

Les cadres sont un mécanisme par lequel une page Web puisse récupérer et afficher plusieurs autres pages Web sur l'écran simultanément.  Chaque sous-page s'appelle un cadre, et vit dans son propre espace sur l'écran.  Parfois les cadres sont en haut, au milieu et en bas ; parfois ils sont à gauche, au milieu et à droite.  Edbrowse présente ces cadres comme des hyperliens, que vous pouvez appeler alternativement, ou sauter directement à un cadre spécifique si vous connaissez le site Web.  Habituellement le cadre supérieur est un cadre de navigation, et le cadre inférieur contient des informations légales de déni/copyright : vous pouvez ainsi sauter ces derniers et poursuivre.  A de rares occasions, je l'ai vu une seule fois, vous devez ouvrir le cadre supérieur, que vous soyez intéressé ou pas, parce que le code HTML de cette page particulière place quelques cookies indispensables à la visite du site Web. 

Une page de cadres pourrait ressembler à ceci.  Je pense que vous pouvez deviner sur lequel cliquer. 

Frame {navigation}
Frame {principal}
Frame {pied}

J'ai pensé à un dispositif de récupération de cadres qui chercherait tous les cadres et les présenterait en seul jet, tout comme elles sont affichées simultanément sur l'écran pour un utilisateur voyant, mais il est très difficile d'implémenter ce dispositif, et jusqu'ici, personne ne semble le vouloir.  Comme vous pouvez l'imaginer, il est tout en bas de la liste des choses à faire. 

PDF

PDF est un format portable de documents développé par adobe.com.  Un document de ce format, désigné par le suffixe .pdf, sera toujours imprimé de la même façon sur n'importe quelle imprimante.  C'est son principal avantage.  Cependant, les documents pdf sont totalement illisibles par un non-voyant..  Heureusement, il existe un utilitaire, pdftohtml, qui convertit le pdf en html.  Parfois, il fonctionne très bien, et parfois les lignes sont coupées d'étrange façon; mais c'est mieux que rien.  Si vous installez ce paquet, edbrowse convertira autmatiquement les fichiers pdf en fichiers html,  qu'il affichera ensuite comme du texte.

Notez qu'il existe également un convertisseur pdf en texte qui évite l'étape intermédiaire (html),  mais j'ai voulu garder les fonctionnalités des liens hypertextes parfois présents dans le pdf.  J'ai donc pensé qu'il vaut mieux passer par le html, malgré quelques complications suppléméntaires.

Introduction à Javascript

Javascript est un logiciel, inclus dans la page Web, qui fonctionne sur votre ordinateur.  Ces fonctions ne sont pas lancées sur le serveur web, elles tournent sur votre ordinateur.  Par conséquent on l'appelle parfois Javascript côté client.  Et Javascript peut faire presque n'importe quoi.  Vous pourriez, par exemple, télécharger une page Web qui inclut une fonction de Javascript pour calculer les décimales de pi, directement sur votre ordinateur, bien que ce soit plutôt idiot.  La majeure partie de Javascript est employée pour valider et/ou modifier des formulaires, ou créer des effets visuels de fantaisie. 

La première version de edbrowse, écrite en Perl, ignorait Javascript complètement, et cela a fonctionné un temps, mais de plus en plus sites internet emploient Javascript, et ces sites Web étaient simplement inaccessibles.  La plupart des emplacements d'e-commerce entrent dans cette catégorie.  Si vous voulez faire des achats, ou contrôler votre compte bancaire en ligne, vous aurez besoin d'un navigateur autorisant Javascript. 

La deuxième version de edbrowse, écrite en C, et portant un numéro de version commençant par 2, incluait un compilateur et un moteur Javascript écrits par moi-même.  Cela fonctionnait plutôt bien, pour un projet réalisé pendant mon temps libre, mais Javascript évolue, comme n'importe quelle autre langue ou standard, et je ne pouvais plus suivre. 

La troisième version, la « plus tardive et la plus grande », utilise un moteur Javascript de Mozilla.com, qui est Open Source sous la Licence Publique de Mozilla.  Ceci me permet de m'appuyer, plutôt que de réinventer, sur environ 70.000 lignes de code - et quelqu'un d'autre maintient ce code à mesure que Javascript évolue.  Ceci illustre la puissance de la communauté open source. 

Edbrowse n'offre pas toutes les fonctionnalités de Javascript côté client (DOM), et ne les offrira jamais.  Par exemple, beaucoup de sites Web utilisent Javascript pour changer des images à la volée au passage de la souris sur l'écran.  Ceci n'a aucune signification dans edbrowse.  D'autres sites Web affichent de multiples fenêtres multiples, et vous laissent agir sur ces sous-fenêtres en utilisant des icônes dans la fenêtre principale.  Il serait très difficile simuler ce comportement dans un environnement en ligne de commande - ainsi nous n'essayons pas. 

Approximativement, je compte implémenter environ la moitié de Javascript, la moitié qui satisfera 95% des sites Web qui nous intéressent.  Ainsi vous pourrez voir des messages d'avertissement sur telle ou telle fonctionnalité non supportée.  Si vous êtes fatigué de patauger dans ces messages, ou si un bogue dans mon interpréteur Javascript fait planter edbrowse complètement, vous pouvez désactiver Javascript par l'intermédiaire de la commande « js ».  C'est utile quand vous sur