Zeichensatz (Code Page)
Ein Computer basiert auf dem Binärsystem, das heißt alle Informationen werden durch „0“ und „1“ dargestellt. Acht dieser Werte entsprechen einem Byte. Acht Stellen mit je zwei Möglichkeiten sind demnach 28 Varianten. Ein Byte kann also 256 unterschiedliche Werte haben. Einer dieser Werte wird auch Codepunkt genannt.
Bei einem Zeichensatz wird nun vereinbart, welche Bedeutung ein solcher Codepunkt hat. Meist finden sich diese Zuordnungen in Form einer Tabelle. Hier ein Beispiel:

Häufig verwendete Zeichensätze:
ASCII
7-bit-Zeichensatz (128 Zeichen), besonders geeignet für englische Texte
RTF (rich text format) baut darauf auf, HTML kann mit diesem Zeichensatz geschrieben werden
Windows- 1252/WinLatin1
Wird von Windows-Betriebssystemen verwendet
ISO-8859
Gruppe von Zeichensätzen (z.B. ISO-8859-1 oder 8859-5), die für die europäischen Sprachen normiert wurden. Jeder einzelne Zeichensatz verwendet den ASCII-Zeichensatz in den ersten 128 Stellen. Die übrigen Zeichen werden für Steuerzeichen und die sprachspezifischen Buchstaben verwendet, wie z.B. „ä“, „ü“ oder „ö“.
Unicode
Dieses Projekt wurde gestartet, um die Zeichen sämtlicher Sprachen in nur einem Zeichensatz zusammenzufassen. Dieser ist systemunabhängig, programmunabhängig, sprachunabhängig.
Alle aktuellen Betriebssysteme unterstützen mittlerweile Unicode.




