Eine kleines Philosophikum zur Zeicheneingabe.

Unser Zeichensatz, der Unicode, enthält Zig-Tausende Zeichen. Unsere Tastatur vergleichsweise wenige. Wenn man sich in nur einer Sprache ausdrückt, hat man eine Tastatur, die so konfiguriert ist, dass man die benötigten Sonderzeichen mit einfachen Tastendrucken oder in Kombination mit der Taste AltGr (=Alternate Graphic) erreicht. Sollte es diese Taste AltGr nicht geben, kann man dafür alternativ auch die Tastenkombination Strg-Alt verwenden. (Gilt nicht für Strg-Alt-Del).

Um dem Titel des Beitrags „Das Kreuz mit den Zeichen“ gerecht zu werden, nehmen wir an, jemand erstellt einen Stammbaum. Dann benötigt er für ein Geburtsdatum den Stern * und für ein Sterbedatum das Kreuz (gestorben) †. Aber das Kreuz gibt es nicht auf der Tastatur.

Unsere Tastatur bietet für die Eingabe von Zeichen seit den Anfängen des IBM-PC eine universelle Tastenkombination an, mit der man jedes Zeichen (auch aus dem Unicode-Zeichenraum) „zu Papier“ bringen kann.

Man drückt die Alt-Taste und hält sie fest, gibt am nummerischen Ziffernblock den dezimalen Zeichenkode ein und lässt danach die Alt-Taste wieder los.

PCs ohne 10er-Tastatur

Viele der zeitgenössischen Benutzer besitzen einen Laptop und kennen daher diesen nummerischen Ziffernblock nur von Besuchen bei ihrer Bankfiliale.  Ihnen kann geholfen werden. Entweder gibt es bei ihrer Laptop-Tastatur die Möglichkeit, dass dieser nummerische Tastenblock als eine zusätzliche Belegungsvariante im Bereich der Alphazeichen aktivierbar ist oder man kann sich auf jedem PC eine Bildschirmtastatur einblenden lassen, die man mit der Maus bedient.

Windows -> Eingabe „Bilds…“ -> Bildschirmtastatur

Sollte die 10er-Tastatur nicht gezeigt werden, muss man sie über die besondere Taste „Optionen“ aktivieren. Bei häufigerem Gebrauch sollte man sich eine Kachel generieren mit „An Start anheften“ und in den Bereich „Werkzeuge“ verschieben.

Wie findet man nun den Kode zu diesem „gestorben“-Zeichen?

Mit Windows-Bordmitteln so:

Man öffnet die Zeichentabelle (Windows -> Eingabe „Zei“)

und sucht nach „kreuz“. Es werden einige Zeichen gefunden, in deren Zeichenname „kreuz“ vorkommt. Man wählt das gewünschte Zeichen und erfährt am unteren Rand des Fensters zwei Kodes: U+2020 und Alt+0134. (Der englische Name für dieses Zeichen ist übrigens „Dagger“. und das heißt laut Wörterbuch nicht nur „Kreuz“, sondern auch „Dolch“. Interessant!)

Das U+2020 bedeutet, dass es sich um ein Unicode-Zeichen mit dem Hex-Kode 2020und das ist in dezimaler Schreibweise 2*4096+0*256+2*16+0*1 = 8224.

Es gibt also zwei Möglichkeiten, dieses Zeichen einzugeben:

Alt 0134 und Alt 8224

Ob tatsächlich in beiden Versionen ein † entsteht wird, hängt vom gerade verwendeten Programm ab. In Word erscheint das Zeichen bei beiden Eingaben aber in WordPress nur die erste Variante. Das hat damit zu tun, dass WordPress ein Html-Editor ist und man für die Eingabe von höheren Unicode-Zeichen einen eigenen Html-Kode generieren muss. Eigentlich könnte der WordPress-Editor das übernehmen; er tut es aber nicht.

Word kann mehr

In Word muss man die obige Umrechnung nicht ausführen. Man kann an einer beliebigen Textstelle den Hexcode 2020 eingeben und unmittelbar danach auf Alt C – klicken: das Kreuz erscheint.

Warum 0134 und nicht 134?

Die Eingabe über die Alt-Taste ohne die vorangestellte Null gab es bereits zur Geburtsstunde des IBM-PC. Damals wie heute kann man damit den DOS-Zeichensatz eingeben. Die obere Hälfte des Zeichensatzes (127..255) war mit einem Sammelsurium von Zeichen ausgestattet; „von jedem Dorf ein Hund“, könnte man sagen. Der Bereich der Steuerzeichen 1…31 wurde am Bildschirm ebenfalls durch besondere Zeichen genutzt:

Und das ist auch heute noch so. Gibt man ein: Alt 1, erhält man den Smiley ☺.

Mit Windows kam ein neuer 8-Bit-Zeichensatz. Um auch diesen Zeichensatz vollständig über die Tastatur eingeben zu können, hat man die vorangestellte Null erfunden. Mit einer Zahl 128…255 mit der vorangestellten „0“ erreicht man das so genannte „Latin-1 Supplement“, mit dem man einen gewissen Teil der europäischer Sprachen darstellen konnte und ohne „0“ den klassischen DOS-Kode aus der Anfangszeit des PCs.

Wer kann mit folgendem Kode etwas anfangen?

Betrachtet man diesen Kode in der Hex-Darstellung, sieht man, dass es sich um die Zeichen 1 bis 32 handelt, die das Programm Notepad++ mit den Kürzel für die Steuercodes darstellt. Diese Zeichen wurden mit Alt 01… eingegeben.

Im Zeichenbereich 1..31 werden mit der vorangestellten Null keine Smileys mehr generiert, sondern die dort definierten Steuerzeichen. Man kann sich nun fragen, warum die Steuerzeichen an zwei Stellen umgebrochen sind. Nach BS kommt das Zeichen 9 TAB und das wird im Notepad++ ausgeführt, man sieht es daher nicht. Schaltet man allerdings die Anzeige der unsichtbaren Zeichen ein, ändert sich die Darstellung:

Der Tabulator wird sichtbar, ebenso der folgende Zeilenvorschub (LF Line Feed) und auch der Wagenrücklauf an der Position 13 (CR Carriage Return).

DOS und Latin-1

Links sieht man die Codetabelle für die „CodePage 850 DOS“ und rechts die „Codepage 1250 Windows Central Europe“. Von diesen Seiten gibt es viele weitere Varianten.

In dieser Darstellung sind im linken DOS-Teil für die Zeichen 1…31 die Steuerzeichen eingetragen. Hätte man diese Zeichen damals an den Bildschirm gesendet, hätte man diese Codes stattdessen folgende Zeichen gesehen: ☺☻♥♦♣♠•◘○◙♂♀♪♫☼►◄↕‼¶§▬↨↑↓→←∟↔▲▼

Diese Zeichen gibt es immer noch, allerdings nicht mehr an dieser Codestelle. Sie sind nunmehr über verschiedene Seiten des Unicode verteilt. Gibt man daher ein Alt 1 ein, sieht man wie zu Beginn des PC ein Smiley-Symbol ☺ aber im Dokument eingetragen wird das Zeichen U+263a = 9786 = ☺

Das große scharfe s

Dieser Buchstabe „großes scharfes s“ ist aus Gründen der korrekten Konvertierbarkeit groß geschriebener Wörter entstanden. Schreibt man zum Beispiel „Fußball“ und konvertiert es in Großbuchstaben, wurde es in der Vergangenheit in Ermangelung eines „großen scharfen s“ zu „FUSSBALL“. Aber Programme haben ihre Schwierigkeiten zu wissen, ob das große SS nach der Umwandlung in Kleinbuchstaben ein ss werden soll, oder ob es doch wieder zu einem ß umzuwandeln ist.

Dieser neue Buchstabe ist auf unserer Tastatur leicht zu finden:

Umschalt Strg Alt ß = ẞ

Daher schreibt man in Zukunft oder spätestens ab jetzt "Fußball" in Großbuchstaben als "FUẞBALL".

Natürlich kann man sowohl das ß als auch das neue über die Alt-Eingabe erreichen:

ß = Alt 0223 = Alt 225 = (Word) df Alt C
ẞ = Alt 7838 = (Word) 1e9e Alt C

Jetzt kann man noch rätseln, warum sowohl Alt 0223 als auch Alt 225 denselben Buchstaben ß ergibt. Der Grund ist, dass das ß bereits im DOS-Zeichensatz enthalten war und von dieser Stelle aus Kompatibilitätsgründen nicht verschwunden ist (Alt 225). Es ist aber auch im Windows-Zeichensatz vorhanden und dort an der Stelle Alt 0223. Dieses Privileg hat „das große scharfe s“ nicht.


Es gibt Programme zur dauerhaften Veränderung der Tastaturbelegung. Etwa ist der „Microsoft Layout Creator“ ein solches Programm. Es ist mir aber nicht gelungen, das Programm dazu zu bewegen, das zu tun, was es soll. Es verhält sich so, wie es die Anleitung vorgibt, aber der letzte Test ist negativ, die Tasten werden nicht wie gewünscht definiert. Vielleicht hat jemand Erfahrungen mit dem Programm. Schließlich gibt es auch die Möglichkeit, die Tasten direkt in der Registry neu zu belegen.

Links

Zur Werkzeugleiste springen