Maths, Informatique, Jeux
Site Web réalisé par Frédéric et François WANG
Répertoire principalInformatiqueTIPE 2006-2007Commentaires de transparents

Transparent 1

Introduction

Les connaissances scientifiques devenant de plus en plus nombreuses, Internet se révèle indispensable pour échanger rapidement l'information.

Les ordinateurs manipulent aujourd'hui difficilement les formules, puisque l'option retenue est de laisser à l'utilisateur le soin de rentrer le code source TeX pour produire des documents destinés à une impression papier.

Pour résoudre ce problème, l'organisme international fixant les normes de langages Web a inventé le langage MathML, qui transporte plus d'informations et est par conséquent plus facile à manipuler par un logiciel.

Plan

Dans une première partie, nous allons voir si ce surplus d'informations ne risque pas d'augmenter le temps de production d'un document par rapport à une édition classique en TeX.

Dans une deuxième partie, nous allons nous intéresser aux bénéfices de ce nouveau codage des formules mathématiques en observant le gain de temps apporté par de nouveaux outils informatiques.

Transparent 2

Une comparaison qualitative des syntaxes montrent que le code source MathML est plus lourd à cause de la longueur du nom des balises [premier tableau].

De plus, MathML contient des informations supplémentaires comme le typage des éléments ou la précision d'opérateurs invisibles.

Transparent 3

J'ai mesuré la taille des fichiers sources pour divers ensembles de formules : le fichier MathML occupe en moyenne 12 fois [11,92] plus de place qu'un fichier TeX.

En retirant tous les sauts de lignes et espaces, il en occupe encore 7 [7,28] fois plus.

Transparent 4

A cause de la lourdeur de sa syntaxe, le MathML doit être édité à l'aide d'une interface graphique, dite encore Wysiwyg. Je me suis donc intéressé au logiciel libre Amaya développé par des chercheurs de l'INRIA, qui possède un support du MathML, et y ai ajouté la possibilité d'insérer des constructions mathématiques via un système de boutons.

Une édition source permet de créer des constructions sans passer par des menus, mais requiert la connaissance de la syntaxe. A l'inverse, une édition Wysiwyg est plus accessible et offre un aperçu immédiat.

Transparent 5

Je me suis ensuite chronométré lors de l'édition des formules du transparent précédent, en utilisant Amaya et en éditant directement le code source TeX.

Un volontaire familier avec la syntaxe TeX en a fait autant, mais en utilisant un éditeur Wysiwyg qu'il connaissait bien.

En analysant les résultats, on voit que quelqu'un qui n'est pas habitué à l'édition de formules mathématiques met beaucoup plus de temps avec TeX [ici 3 fois plus], alors qu'on obtient des temps équivalents dans le cas contraire [rapport de 1].

Transparent 6

Cette première partie nous a montré que malgré la lourdeur de sa syntaxe, le MathML pouvait être utilisé pour l'édition de documents scientifiques, nous allons maintenant voir comment on pourrait se servir de l'informations supplémentaires qu'il transporte pour gagner du temps.

Le codage classique des formules mathématiques est la représentation graphique, qui laisse au lecteur le soin d'interpréter son sens selon le contexte. Ce principe a été repris pour TeX qui ne code que la disposition de la formule.

Par contre MathML dispose de deux balisages : le MathML de présentation supporté par Amaya et le MathML de contenu qui permet un codage sémantique, c'est-à-dire du sens mathématique, ce qui le rend encore plus facilement manipulable par un ordinateur.

Transparent 7

Dans le cas de l'édition, le logiciel "comprend" les formules et peut ainsi proposer des menus à l'utilisateur pour effectuer des transformations mathématiques classiques.

J'ai rédigé une démonstration du cours de Spé avec Amaya et me suis chronométré : j'ai mis 18 min 37.

En faisant l'hypothèse que les fragments de formules bleus auraient pu être générées par une transformation offerte par le codage sémantique et que chacune de ces manipulations durent 10 secondes, on obtient un temps hypothétique de 14 min 18, soit 77% du temps initial.

Transparent 8

D'une façon plus globale, l'informatique et Internet se révèle de plus en plus important pour la communauté scientifique.

Un langage transportant beaucoup d'informations est donc nécessaire pour créer, manipuler et échanger les formules mathématiques entre les divers logiciels aussi facilement que du texte ou des images.

De même, Internet est un moyen de communication très efficace mais pour qu'il puisse offrir un véritable gain de temps aux scientifiques, il faudrait que ses outils de base comme le courrier électronique, les pages Web ou encore les moteurs de recherche puisse traiter les formules.

Transparent 9

Pour ce dernier point j'ai contacté un chercheur allemand qui a mis au point un moteur de recherche de formules mathématiques.

On constate alors l'importance du codage sémantique, puisque des notations mathématiques différentes peuvent parfois représenter le même objet et qu'inversement une même notation peut possèder des interprétations distinctes.

De plus, l'arbre de requête peut contenir des termes génériques [en bleu] que le moteur de recherche est capable d'interpréter par comparaison avec les pages indexées.

Par exemple la requête "l'intégrale sur un domaine d'une fonction au carré" a été interprété comme "intégrale de 0 à T de s de t au carré".

Conclusion

Nous avons vu que malgré la lourdeur de sa syntaxe, MathML pouvait être utilisé pour produire des documents scientifiques sans perte de temps par rapport à une édition TeX, à condition d'utiliser une interface Wysiwyg.

Nous avons ensuite vu que l'information supplémentaire offerte par MathML pouvait être utilisée par les logiciels et ainsi gagner du temps aussi bien dans l'édition de documents que dans les échanges scientifiques.

Cette page est conforme aux normes du W3C - Auteur : Frédéric WANG - Dernière mise à jour : samedi 7 juillet 2007
Valid XHTML 1.1 Valid MathML 2.0 Valid SVG Valid CSS Amaya, the W3C browser/editor Déclaration qualité Opquast Firefox