s
19 708 Pages

Fichier texte
Un fichier texte ouvert gedit

un fichier texte est un fichier pour ordinateur qui contient seulement le texte brut, à-dire le texte immédiatement compréhensible pour un être humain.

Le terme peut être utilisé contrairement à fichier binaire, qui est à la place d'un fichier contenant des données, en premier lieu, ne sont pas directement liés à une forme textuelle compréhensible par un être humain. En fait, du point de vue des machines, il n'y a pas de distinction entre les deux types, puisque tous les fichiers ne sont plus que des séquences octet. La différence réside seulement dans ce que les octets représentent et comment ils sont utilisés.

Les octets de fichiers texte représentent donc des lettres, des chiffres, la ponctuation, les espaces et autres symboles imprimables normaux, mais ils peuvent aussi contenir plusieurs Les caractères de contrôle comment tabulateur, ligne de départ et retour chariot.

codage

à codage dans des fichiers texte fait référence à la correspondance entre la valeur de l'octet, qui est toujours un nombre entier de 0 à 255, et le caractère représenté. La correspondance est pas toujours de 1 à 1: dans de nombreux codages modernes un caractère est représenté par plusieurs octets, de manière à dépasser la limite de 256 caractères possibles, et de soutenir aussi la langue riche de symboles tels que l'est. Des exemples de codages 1 à 1 sont très fréquents ASCII, comme la norme ISO 8859 et EBCDIC. Des exemples de codages multi-octets sont les différents types de Unicode et l 'EUC.

utilisation

Il est évident que le but pour lequel ils sont nés les fichiers texte, et encore une utilisation très fréquente, est l'accès en lecture / écriture directe par les utilisateurs. L'absence de mise en forme les rend pauvres d'un point de vue esthétique, mais au moins en raison de cette simplicité aucun programme spécial à lire, et peut souvent être transféré directement d'un le système d'exploitation à un autre (à la condition d'avoir la même charset disponible).

Voilà pourquoi la quasi-totalité logiciel Ils sont accompagnés d'un fichier texte qui donne une brève description, souvent appelé readme (ou readme en anglais). même la code source des programmes, il est généralement écrit en texte brut. Si une source a été écrit dans ce format .Doc (avec Microsoft Word ou OpenOffice.org), Le format de fichier résultant contiendra également des informations binaires qui jetterait dans la crise compilateurs.

Il y a des limites à l'universalité du fichier texte:

  • la codage il est pas toujours évident, et quand le système ne reconnaît pas ou ne le supporte pas, le fichier peut devenir illisible;
  • les principaux systèmes utilisent différentes notations pour le caractère de tête: Mac OS utilise CR, UNIX utilise LF, windows utilise CR / LF.

L 'extension des fichiers texte pour la lecture, lorsqu'il est utilisé, il est généralement .txt. Dans le cas de fichier source l'extension dépend de la langage de programmation utilisé, par exemple .c pour C et .htm/.html pour 'HTML.

Utilisation par le logiciel

Les fichiers texte ne sont pas nécessairement liés à un traitement humain. Très souvent simplement utilisé par le logiciel, la lecture et l'écriture, pour stocker des données. Ils sont moins compactes que fichiers binaires, ce qui peut signifier une perte d'espace disque: par exemple, un certain nombre 32 bits, il est des milliards de dollars, toujours occupe 4 octet en binaire, mais le format dans le texte occupe jusqu'à 11 (comme dans le cas de -1222333444) ainsi que tous les caractères de délimitation. Toutefois, si l'utilisation du disque n'est pas critique, le format de texte présente des avantages:

  • Les données peuvent être facilement utilisés par d'autres programmes et systèmes, avec un minimum de connaissances de leur structure: elle est moins liée à la taille champs et tout 'octet ordre. Par exemple, bien que chaque tableur a son propre format binaire pour stocker, tout le monde peut travailler avec des fichiers texte où la matrice de données est simplement une liste de valeurs séparées par des caractères standard (CSV, TSV ...)
  • Toute corruption de données provoque généralement moins de dégâts et que localement. Perdre un octet dans un fichier texte signifie généralement perdre une donnée; perdre dans un fichier binaire peut signifier déphasage et ruiner le fichier entier
  • Si nécessaire ou en cas d'erreurs (débogage) Il peut être facilement contrôlée par un utilisateur. Par exemple, examiner et modifier un fichiers INI Il est très intuitif

Articles connexes

  • Traitement de texte
  • Le codage des caractères
  • texte pur
  • fichier binaire
  • art ASCII

D'autres projets

  • Il contribue à Wikimedia Commons Wikimedia Commons: Il contient des images ou d'autres fichiers fichier texte