Formats ouverts : pourquoi et comment les utiliser ?

Thomas Petazzoni, thomas.petazzoni@utbm.fr

Dans la société industrielle d'aujourd'hui, communiquer est devenu une nécessite. De plus en plus, cette communication a lieu de manière électronique, mais celà ne change pas le problème de la communication : tous les interlocuteurs doivent parler une langue commune, de manière à pouvoir se comprendre.

La communication électronique a lieu en envoyant des fichiers, c'est à dire une suite de 0 et de 1. L'interprétation de ces fichiers binaires par un logiciel adéquat permet la représentation d'un document, d'un tableur, d'une image ou d'une vidéo. Pour que les logiciels puissent comprendre cette suite de 0 et de 1, des formats de fichiers sont définis. Ils sont en quelque sorte la structure interne du fichier et permettent au logiciel d'interprêter cette suite de chiffres.

La connaissance par tous de ces formats de fichiers est primordiale, sans quoi les différents interlocuteurs d'une communication ne peuvent plus se comprendre : ils parlent une langue différente.

Définitions

Ce document se limitera aux problèmes des formats de fichiers informatiques. Après avoir explicité la différence entre format ouvert et format fermé, nous exposerons les raisons pour lesquelles l'utilisation de formats de fichiers ouverts est fortement recommandée. Enfin nous donnerons des exemples concrets de formats ouverts, accompagnés de considérations techniques.

Un format est dit ouvert lorsque toutes les spécifications concernant ce format sont accessibles librement et en totalité. L'ouverture et la gratuité des spécifications d'un format de fichier garantit la possibilité pour tous de créér un outil logiciel capable de lire et écrire dans le format de fichier donné.

Un format est dit fermé lorsqu'au contraire les spécifications du format ne sont pas disponibles, car conservées secrètes par le constructeur. Si l'accès aux spécifications est possible, mais payant, le format est aussi considéré comme fermé.

1. Pourquoi utiliser des formats de fichiers ouverts ?

Les fichiers informatiques utilisant des formats fermés ne peuvent être lus qu'avec le logiciel ayant permi leur création. Le récepteur du document est obligé d'utiliser le même logiciel que l'émetteur du document, et cela pose un problème notamment lorsque le dit logiciel est propriétaire, payant et disponible sur un nombre restreint de plateformes.

L'utilisation de formats de fichiers fermés viole donc deux principes :

L'utilisation de formats de fichiers fermés au sein d'une entreprise privée n'est pas un problème car celle-ci met à disposition de ses employés les outils permettant de communiquer. En revanche, dans le cadre d'une administration publique, l'accès aux informations doit être garanti pour tous les usagers, et la liberté de ces usagers doit être respectée. Celà implique donc l'utilisation de formats de fichiers ouverts pour la communication électronique.

Un exemple flagrant connu de tous est celui de l'utilisation du format de fichier Microsoft Word. Ce format de fichier fermé est régulièrement utilisé pour l'envoi de documents par mail. Il n'est pas possible, ou très difficile, de lire ces documents lorsqu'on ne possède pas le logiciel propriétaire et payant Microsoft Word. Dans le cadre d'une utilisation publique, la liberté des usagers n'est pas respectée, et l'accès pour tous à l'information n'est pas garanti. Dans ce cas, l'administration publique se positionne au mieux en prescriptrice d'achat pour des produits d'entreprises privées, réalisant ainsi de la publicité indirecte, ou au pire en incitatrice indirecte à la copie illégale de logiciels (punie par les articles L122-4 et L122-5 [1] du code pénal).

La demande d'utilisation de formats ouverts n'est pas le fait de quelques personnes, mais une volonté de l'État de garantir l'accès à l'information pour tous, comme le préconise la circulaire du 21 janvier 2002 [2] relative à la mise en oeuvre d'un cadre commun d'interopérabilité pour les échanges et la compatibilité des systèmes d'information des administrations. L'ATICA [3] (Agence pour les technologies de l'information et de la communication dans l'administration, récemment renommée en Adaé, Agence pour le développement de l'administration électronique) publie des recommandations quant à l'utilisation de formats de fichiers informatiques, que nous allons étudier maintenant.

2. Comment utiliser des formats de fichiers ouverts ?

Cette section donne une liste de formats de fichiers permettant l'échange d'informations de type textuel. L'ATICA recommande en premier lieu l'utilisation du format XML. Toutefois les outils permettant d'utiliser ce format ne sont pas encore suffisamment répandus pour être utilisé convenablement.

L'ATICA recommande ensuite d'autres formats de fichiers ouverts :

2.1. Le format texte brut

Informations

Le format texte brut est sans aucun doute le format le plus universel et le plus ouvert qui soit. Aucun mécanisme de présentation du document n'est prévu (pas de gras, italique, pas de polices différentes, etc...). Toutefois, nous recommandons ce format qui pourra remplacer le format Microsoft Word dans les trop nombreux cas où la présentation est inutile, voire dérangeante pour le lecteur.

Utilisation

On notera que le format texte brut est donc aussi simple à lire qu'à écrire.

2.2. Le format PDF

Informations :

Le format PDF est un format développé par la société Adobe. Il est difficilement modifiable, mais a l'avantage de conserver avec exactitude la présentation du document. Il est donc hautement recommandé dans les cas où le document n'est pas un document à compléter, ce qui est très souvent le cas.

Utilisation

2.3. Le format HTML

Informations

Le format HTML (HyperText Markup Language) est le format utilisé pour réaliser des pages Web. Il permet de conserver la présentation générale d'un document. Il est recommandé notamment lorsque l'information vise à être mise en ligne dans le cadre d'un site Web.

Le format HTML est en fait un langage simple composé de balises permettant de mettre en forme un document. On peut donc produire un document HTML avec n'importe quel éditeur de texte brut, à condition de connaître le langage.

Utilisation

Le format HTML est donc très simplement lisible, et très pratique lorsque le document va être publié en ligne. Toutefois les outils automatisés pour produire un tel document, même s'ils sont utilisables, ne sont pas tout à fait au point, et il faut essayer d'utiliser dans la mesure du possible les outils qui respectent le mieux les standards définis par le W3C [38].

2.4. Le format RTF

Informations

Le format RTF (Rich Text Format), est comme son nom l'indique un format de fichier texte enrichi. Il permet en effet de conserver une certaine présentation du document, notamment les mises en gras et italique, les changements de polices, de taille et de couleur. Il est donc recommandé dans le cas de documents plus complexes, dans lesquels l'absence de présentation pose problème. Toutefois, il semblerait que les logiciels producteurs de documents RTF ne respectent pas tous la norme, créant des incompatibilités, même entre des logiciels Microsoft

Utilisation

Le format RTF est aussi simple à lire qu'à écrire, au même titre que le format texte brut. Cependant, à cause des incompabilités que nous avons évoqué plus haut, nous recommandons, lorsque cela est possible d'utiliser le format texte brut, amplement suffisant la plupart du temps.


Réferences :
  1. http://www.legifrance.gouv.fr/WAspad/VisuArticleCode?commun=CPROIN&code=&h0=CPROINTL.rcv&h1=1&h3=8
  2. http://www.legifrance.gouv.fr/WAspad/UnTexteDeJorf?numjo=PRMX0205357C
  3. http://www.atica.pm.gouv.fr
  4. http://www.gnu.org/software/textutils/textutils.html
  5. http://www.gnu.org/software/less/less.html
  6. http://www.nedit.org
  7. http://gedit.sourceforge.net
  8. http://kate.kde.org
  9. http://www.kde.org
  10. http://www.gnu.org/software/emacs
  11. http://www.vim.org
  12. http://www.gnu.org/directory/text/editors
  13. http://www.freshmeat.net
  14. http://www.apple.com/macosx/jaguar/morefeatures.html
  15. http://emacs-on-aqua.sourceforge.net/
  16. http://www.jext.org/
  17. http://osx.hyperjeff.net/Apps/apps.php?sub=5
  18. http://www.foolabs.com/xpdf/download.html
  19. http://wwwthep.physik.uni-mainz.de/~plass/gv/
  20. http://www.adobe.fr/products/acrobat/readstep2.html
  21. http://www.cs.wisc.edu/~ghost/macos/index.htm
  22. http://www.cs.wisc.edu/~ghost/gsview/index.htm
  23. http://www.cs.wisc.edu/~ghost/doc/gnu/index.htm
  24. http://www.latex-project.org/
  25. http://www.ptc.spbu.ru/~uwe/lout/lout.html
  26. http://www.cs.wisc.edu/~ghost/doc/AFPL/get800.htm
  27. http://www.adobe.fr/products/acrobatstd/main.html
  28. http://sebsauvage.net/pdf/pdfgratuit.pdf
  29. http://lolut.utbm.info
  30. http://www.mozilla.org
  31. http://www.konqueror.org
  32. http://www.mozilla.org/projects/firebird/
  33. http://www.opera.com
  34. http://www.mozilla.org/projects/camino
  35. http://www.microsoft.com/windows/ie
  36. http://bluefish.openoffice.nl
  37. http://www.w3.org/Amaya
  38. http://www.w3c.org
  39. http://www.gnu.org/software/unrtf/unrtf.html
  40. http://www.openoffice.org
  41. http://www.koffice.org/kword
  42. http://www.nllgg.nl/Ted

Copyright (c) 2003 Thomas Petazzoni
Remerciements à David Anderson, Eric Bachard, Mélanie Bats, Christophe Bliard, Nicolas Bouillon et Victor Vuillard pour les relectures et les suggestions.
Permission vous est donnée de distribuer des copies exactes de ce document tant que cette note de permission et le copyright apparaissent clairement.
Permission vous est donnée de distribuer des versions modifiées de ce document tant que la totalité du travail dérivé est distribué sous les mêmes termes que celui-ci.

Valide XHTML 1.0