U
Unicode
Jeder, der ausgiebig im Internet unterwegs ist, kennt das: Suchmaschinen spucken Ergebnisse manchmal als Buchstabensuppe aus, Seiten aus Skandinavien sehen aus, als hätte man mit der Schrotflinte auf den Text geschossen, und auf russischen oder asiatischen Seiten herrscht typographischer Notzustand: !&%ü?. Ursache dafür sind unterschiedliche Zeichensätze in den jeweiligen Ländern:
1965 hatte das amerikanische Institut für Normung, ANSI, den amerikanischen Standard-Code für Informationsaustausch festgelegt, der erst einmal mit 7 Bit und 128 Zeichen auskam und auf Umlaute und andere Sonderzeichen verzichtete - siehe ASCII.
Anfang der 70er Jahre nutzten deutsche Informatiker die Codeplätze der eckigen Klammern, um Umlaute darzustellen. Auch in anderen Ländern entstanden eigene Zeichensätze. Mit der Einführung des PC verwendete IBM das 8. Bit eines kompletten Bytes für Sonderzeichen wie Umlaute. Der IBM-Zeichensatz enthielt zwar die 128 ASCII-Zeichen an den ursprünglichen Stellen, doch genauso viele Zeichen unterschieden sich. Die internationale Organisation für Normen, ISO, begegnete in den 80er Jahren dem Wildwuchs bei den 8-Bit-Codierungen recht erfolgreich mit der Serie von ISO-8859- Standards. Weitverbreitet ist ISO 8859-1, oft auch ISO Latin-1 genannt. In ihm sind die Zeichen der meisten europäischen Sprachen zusammengefaßt.
Im Chinesischen, Japanischen und Koreanischen bilden aber nicht Buchstaben die kleinsten Texteinheiten, sondern Schriftzeichen, von denen es Zehntausende gibt. Das sprengt das Fassungsvermögen einer 8-Bit-Codierung; man verwendet deshalb in Fernost eine 16-Bit-Codierung und spezielle Umschaltverfahren, die mit reservierten Steuerzeichen arbeiten.
Ein Über-Alphabet - Unicode - soll den Wirrwarr beenden.
Ende der 80er Jahre wurde der Ruf nach einem neuen internationalen Standard für die Zeichendarstellung laut. Er sollte ganz ohne Sonderfälle auskommen und möglichst alle Zeichen aller Sprachen des Planeten in einem Zahlenraum vereinigen. Unicode war geboren.
In Unicode hat jedes Zeichen einen 16-Bit-Code. Die ersten 256 Plätze entsprechen ISO Latin-1. Die Rückwärtskompatibilität ist jedoch nicht so einfach. Wenn nicht besondere Codierungen (UTF-8) verwendet werden, wird der Buchstabe A in Unicode zu 0041, der ASCII-Code wäre dagegen 41 (jeweils hexadezimal).
Der 16-Bit Code des Unicode Systems bietet einen Zahlenraum ("code space") für über 65 536 Zeichen. In der Unicode 2.0 Version sind knapp 30.000 vom Unicode-Konsortium offiziell vergeben. In der Version 3.0, sind bereits knapp 40.000 Zeichen vergeben. Diese Version enthält bereits die Zeichen für so alltägliche Bedürfnisse, wie das Schreiben mit altgermanischen Runen, oder das Kommunizieren mit den knapp 50.000 Cherokee-Indianer in Oklahoma. Der Rest ist in Reserve. Jedes Zeichen, welches neu aufgenommen werden soll muss beantragt und von der Organisation abgesegnet werden.
upload
Upload (manchmal auch als uploaden bezeichnet) ist der englischer Begriff für "hinaufladen". Im Netzwerken die Bezeichnung für das "hinaufladen" von Daten des lokalen Rechners auf einen entfernten. Gegensatz zu download.
URL
Abkürzung für "Uniform Resource Locators" (Universelle Ressourcenlokalisatoren).
Das URL-Schema ist ein Konzept der URI. Mit einem URL lässt sich jede Ressource im Internet adressieren (Internetadresse z.B. http://www.hilfe-vom-profi.de) und mit entsprechenden Protokollen abrufen bzw. starten.
|



|