Dans la société industrielle d'aujourd'hui, communiquer est devenu une nécessite. De plus en plus, cette communication a lieu de manière électronique, mais celà ne change pas le problème de la communication : tous les interlocuteurs doivent parler une langue commune, de manière à pouvoir se comprendre.
La communication électronique a lieu en envoyant des fichiers, c'est à dire une suite de 0 et de 1. L'interprétation de ces fichiers binaires par un logiciel adéquat permet la représentation d'un document, d'un tableur, d'une image ou d'une vidéo. Pour que les logiciels puissent comprendre cette suite de 0 et de 1, des formats de fichiers sont définis. Ils sont en quelque sorte la structure interne du fichier et permettent au logiciel d'interprêter cette suite de chiffres.
La connaissance par tous de ces formats de fichiers est primordiale, sans quoi les différents interlocuteurs d'une communication ne peuvent plus se comprendre : ils parlent une langue différente.
Ce document se limitera aux problèmes des formats de fichiers informatiques. Après avoir explicité la différence entre format ouvert et format fermé, nous exposerons les raisons pour lesquelles l'utilisation de formats de fichiers ouverts est fortement recommandée. Enfin nous donnerons des exemples concrets de formats ouverts, accompagnés de considérations techniques.
Un format est dit ouvert lorsque toutes les spécifications concernant ce format sont accessibles librement et en totalité. L'ouverture et la gratuité des spécifications d'un format de fichier garantit la possibilité pour tous de créér un outil logiciel capable de lire et écrire dans le format de fichier donné.
Un format est dit fermé lorsqu'au contraire les spécifications du format ne sont pas disponibles, car conservées secrètes par le constructeur. Si l'accès aux spécifications est possible, mais payant, le format est aussi considéré comme fermé.
Les fichiers informatiques utilisant des formats fermés ne peuvent être lus qu'avec le logiciel ayant permi leur création. Le récepteur du document est obligé d'utiliser le même logiciel que l'émetteur du document, et cela pose un problème notamment lorsque le dit logiciel est propriétaire, payant et disponible sur un nombre restreint de plateformes.
L'utilisation de formats de fichiers fermés viole donc deux principes :
L'utilisation de formats de fichiers fermés au sein d'une entreprise privée n'est pas un problème car celle-ci met à disposition de ses employés les outils permettant de communiquer. En revanche, dans le cadre d'une administration publique, l'accès aux informations doit être garanti pour tous les usagers, et la liberté de ces usagers doit être respectée. Celà implique donc l'utilisation de formats de fichiers ouverts pour la communication électronique.
Un exemple flagrant connu de tous est celui de l'utilisation du format de fichier Microsoft Word. Ce format de fichier fermé est régulièrement utilisé pour l'envoi de documents par mail. Il n'est pas possible, ou très difficile, de lire ces documents lorsqu'on ne possède pas le logiciel propriétaire et payant Microsoft Word. Dans le cadre d'une utilisation publique, la liberté des usagers n'est pas respectée, et l'accès pour tous à l'information n'est pas garanti. Dans ce cas, l'administration publique se positionne au mieux en prescriptrice d'achat pour des produits d'entreprises privées, réalisant ainsi de la publicité indirecte, ou au pire en incitatrice indirecte à la copie illégale de logiciels (punie par les articles L122-4 et L122-5 [1] du code pénal).
La demande d'utilisation de formats ouverts n'est pas le fait de quelques personnes, mais une volonté de l'État de garantir l'accès à l'information pour tous, comme le préconise la circulaire du 21 janvier 2002 [2] relative à la mise en oeuvre d'un cadre commun d'interopérabilité pour les échanges et la compatibilité des systèmes d'information des administrations. L'ATICA [3] (Agence pour les technologies de l'information et de la communication dans l'administration, récemment renommée en Adaé, Agence pour le développement de l'administration électronique) publie des recommandations quant à l'utilisation de formats de fichiers informatiques, que nous allons étudier maintenant.
Cette section donne une liste de formats de fichiers permettant l'échange d'informations de type textuel. L'ATICA recommande en premier lieu l'utilisation du format XML. Toutefois les outils permettant d'utiliser ce format ne sont pas encore suffisamment répandus pour être utilisé convenablement.
L'ATICA recommande ensuite d'autres formats de fichiers ouverts :
Le format texte brut est sans aucun doute le format le plus universel et le plus ouvert qui soit. Aucun mécanisme de présentation du document n'est prévu (pas de gras, italique, pas de polices différentes, etc...). Toutefois, nous recommandons ce format qui pourra remplacer le format Microsoft Word dans les trop nombreux cas où la présentation est inutile, voire dérangeante pour le lecteur.
Tous les logiciels permettant l'écriture de fichiers en texte brut, ainsi que tous les navigateurs Internet permettent de lire du texte brut.
On notera que le format texte brut est donc aussi simple à lire qu'à écrire.
Le format PDF est un format développé par la société Adobe. Il est difficilement modifiable, mais a l'avantage de conserver avec exactitude la présentation du document. Il est donc hautement recommandé dans les cas où le document n'est pas un document à compléter, ce qui est très souvent le cas.
Le format HTML (HyperText Markup Language) est le format utilisé pour réaliser des pages Web. Il permet de conserver la présentation générale d'un document. Il est recommandé notamment lorsque l'information vise à être mise en ligne dans le cadre d'un site Web.
Le format HTML est en fait un langage simple composé de balises permettant de mettre en forme un document. On peut donc produire un document HTML avec n'importe quel éditeur de texte brut, à condition de connaître le langage.
Le format HTML est donc très simplement lisible, et très pratique lorsque le document va être publié en ligne. Toutefois les outils automatisés pour produire un tel document, même s'ils sont utilisables, ne sont pas tout à fait au point, et il faut essayer d'utiliser dans la mesure du possible les outils qui respectent le mieux les standards définis par le W3C [38].
Le format RTF (Rich Text Format), est comme son nom l'indique un format de fichier texte enrichi. Il permet en effet de conserver une certaine présentation du document, notamment les mises en gras et italique, les changements de polices, de taille et de couleur. Il est donc recommandé dans le cas de documents plus complexes, dans lesquels l'absence de présentation pose problème. Toutefois, il semblerait que les logiciels producteurs de documents RTF ne respectent pas tous la norme, créant des incompatibilités, même entre des logiciels Microsoft
Le format RTF est aussi simple à lire qu'à écrire, au même titre que le format texte brut. Cependant, à cause des incompabilités que nous avons évoqué plus haut, nous recommandons, lorsque cela est possible d'utiliser le format texte brut, amplement suffisant la plupart du temps.
Copyright (c) 2003 Thomas Petazzoni
Remerciements à David Anderson, Eric Bachard, Mélanie Bats, Christophe
Bliard, Nicolas Bouillon et Victor Vuillard pour les relectures et les
suggestions.
Permission vous est donnée de distribuer des copies exactes de ce
document tant que cette note de permission et le copyright
apparaissent clairement.
Permission vous est donnée de distribuer des versions modifiées de ce
document tant que la totalité du travail dérivé est distribué sous les
mêmes termes que celui-ci.
Valide XHTML 1.0