[successivo] [precedente] [inizio] [fine] [indice generale] [violazione GPL] [translators] [docinfo] [indice analitico] [volume] [parte]
In questo capitolo si raccolgono le descrizioni di alcuni esempi di insiemi di caratteri codificati e di forme codificate del carattere tradizionali. È il caso di ricordare che nella sezione 342.1.1 viene descritto il funzionamento del programma di servizio recode, specializzato nella conversione dei file di testo.
L'ASCII è una codifica molto semplice, in cui ogni punto di codifica corrisponde direttamente a un gruppo di 7 bit, inteso come un intero senza segno, senza bisogno di trasformazioni. Sulla base di questa codifica si sono sviluppate molte varianti, soprattutto a 8 bit. Tuttavia, oggi, quando si parla di ASCII si tende a fare riferimento prevalentemente allo standard originale, in cui si utilizzavano valori compresi tra 0 e 127, per rappresentare i quali bastano solo 7 bit. Eventualmente, volendo essere precisi, per fare riferimento all'ASCII tradizionale si può utilizzare la denominazione «US-ASCII».
L'ASCII non si occupa solo di definire la codifica dei segni tipografici, ma include anche dei codici di controllo, ai quali abbina un nome, ma senza potervi attribuire un significato univoco valido in tutti i contesti. Si tratta dei punti di codifica da 0 a 31 e del 127 in decimale (il punto di codifica 32 rappresenta lo spazio normale).
La tabella 224.1 mostra nel dettaglio la codifica ASCII.
Tabella 224.1. US-ASCII (ISO 646).
Binario | Esadecimale | Ottale | Decimale | Carattere | |
000000002 | 0016 | 0008 | 00010 | <NUL> | \0 |
000000012 | 0116 | 0018 | 00110 | <SOH> | |
000000102 | 0216 | 0028 | 00210 | <STX> | |
000000112 | 0316 | 0038 | 00310 | <ETX> | |
000001002 | 0416 | 0048 | 00410 | <EOT> | |
000001012 | 0516 | 0058 | 00510 | <ENQ> | |
000001102 | 0616 | 0068 | 00610 | <ACK> | |
000001112 | 0716 | 0078 | 00710 | <BEL> | \a |
000010002 | 0816 | 0108 | 00810 | <BS> | \b |
000010012 | 0916 | 0118 | 00910 | <HT> | \t |
000010102 | 0A16 | 0128 | 01010 | <LF> | \n |
000010112 | 0B16 | 0138 | 01110 | <VT> | \v |
000011002 | 0C16 | 0148 | 01210 | <FF> | \f |
000011012 | 0D16 | 0158 | 01310 | <CR> | \r |
000011102 | 0E16 | 0168 | 01410 | <SO> | |
000011112 | 0F16 | 0178 | 01510 | <SI> | |
000100002 | 1016 | 0208 | 01610 | <DLE> | |
000100012 | 1116 | 0218 | 01710 | <DC1> | |
000100102 | 1216 | 0228 | 01810 | <DC2> | |
000100112 | 1316 | 0238 | 01910 | <DC3> | |
000101002 | 1416 | 0248 | 02010 | <DC4> | |
000101012 | 1516 | 0258 | 02110 | <NAK> | |
000101102 | 1616 | 0268 | 02210 | <SYN> | |
000101112 | 1716 | 0278 | 02310 | <ETB> | |
000110002 | 1816 | 0308 | 02410 | <CAN> | |
000110012 | 1916 | 0318 | 02510 | <EM> | |
000110102 | 1A16 | 0328 | 02610 | <SUB> | |
000110112 | 1B16 | 0338 | 02710 | <ESC> | |
000111002 | 1C16 | 0348 | 02810 | <FS> | |
000111012 | 1D16 | 0358 | 02910 | <GS> | |
000111102 | 1E16 | 0368 | 03010 | <RS> | |
000111112 | 1F16 | 0378 | 03110 | <US> | |
001000002 | 2016 | 0408 | 03210 | <SP> | |
001000012 | 2116 | 0418 | 03310 | ! | |
001000102 | 2216 | 0428 | 03410 | " | |
001000112 | 2316 | 0438 | 03510 | # | |
001001002 | 2416 | 0448 | 03610 | $ | |
001001012 | 2516 | 0458 | 03710 | % | |
001001102 | 2616 | 0468 | 03810 | & | |
001001112 | 2716 | 0478 | 03910 | ' | |
001010002 | 2816 | 0508 | 04010 | ( | |
001010012 | 2916 | 0518 | 04110 | ) | |
001010102 | 2A16 | 0528 | 04210 | * | |
001010112 | 2B16 | 0538 | 04310 | + | |
001011002 | 2C16 | 0548 | 04410 | , | |
001011012 | 2D16 | 0558 | 04510 | - | |
001011102 | 2E16 | 0568 | 04610 | . | |
001011112 | 2F16 | 0578 | 04710 | / | |
001100002 | 3016 | 0608 | 04810 | 0 | |
001100012 | 3116 | 0618 | 04910 | 1 | |
001100102 | 3216 | 0628 | 05010 | 2 | |
001100112 | 3316 | 0638 | 05110 | 3 | |
001101002 | 3416 | 0648 | 05210 | 4 | |
001101012 | 3516 | 0658 | 05310 | 5 | |
001101102 | 3616 | 0668 | 05410 | 6 | |
001101112 | 3716 | 0678 | 05510 | 7 | |
001110002 | 3816 | 0708 | 05610 | 8 | |
001110012 | 3916 | 0718 | 05710 | 9 | |
001110102 | 3A16 | 0728 | 05810 | : | |
001110112 | 3B16 | 0738 | 05910 | ; | |
001111002 | 3C16 | 0748 | 06010 | < | |
001111012 | 3D16 | 0758 | 06110 | = | |
001111102 | 3E16 | 0768 | 06210 | > | |
001111112 | 3F16 | 0778 | 06310 | ? | |
010000002 | 4016 | 1008 | 06410 | @ | |
010000012 | 4116 | 1018 | 06510 | A | |
010000102 | 4216 | 1028 | 06610 | B | |
010000112 | 4316 | 1038 | 06710 | C | |
010001002 | 4416 | 1048 | 06810 | D | |
010001012 | 4516 | 1058 | 06910 | E | |
010001102 | 4616 | 1068 | 07010 | F | |
010001112 | 4716 | 1078 | 07110 | G | |
010010002 | 4816 | 1108 | 07210 | H | |
010010012 | 4916 | 1118 | 07310 | I | |
010010102 | 4A16 | 1128 | 07410 | J | |
010010112 | 4B16 | 1138 | 07510 | K | |
010011002 | 4C16 | 1148 | 07610 | L | |
010011012 | 4D16 | 1158 | 07710 | M | |
010011102 | 4E16 | 1168 | 07810 | N | |
010011112 | 4F16 | 1178 | 07910 | O | |
010100002 | 5016 | 1208 | 08010 | P | |
010100012 | 5116 | 1218 | 08110 | S | |
010100102 | 5216 | 1228 | 08210 | R | |
010100112 | 5316 | 1238 | 08310 | S | |
010101002 | 5416 | 1248 | 08410 | T | |
010101012 | 5516 | 1258 | 08510 | U | |
010101102 | 5616 | 1268 | 08610 | V | |
010101112 | 5716 | 1278 | 08710 | W | |
010110002 | 5816 | 1308 | 08810 | X | |
010110012 | 5916 | 1318 | 08910 | Y | |
010110102 | 5A16 | 1328 | 09010 | Z | |
010110112 | 5B16 | 1338 | 09110 | [ | |
010111002 | 5C16 | 1348 | 09210 | \ | \\ |
010111012 | 5D16 | 1358 | 09310 | ] | |
010111102 | 5E16 | 1368 | 09410 | ^ | |
010111112 | 5F16 | 1378 | 09510 | _ | |
011000002 | 6016 | 1408 | 09610 | ` | |
011000012 | 6116 | 1418 | 09710 | a | |
011000102 | 6216 | 1428 | 09810 | b | |
011000112 | 6316 | 1438 | 09910 | c | |
011001002 | 6416 | 1448 | 10010 | d | |
011001012 | 6516 | 1458 | 10110 | e | |
011001102 | 6616 | 1468 | 10210 | f | |
011001112 | 6716 | 1478 | 10310 | g | |
011010002 | 6816 | 1508 | 10410 | h | |
011010012 | 6916 | 1518 | 10510 | i | |
011010102 | 6A16 | 1528 | 10610 | j | |
011010112 | 6B16 | 1538 | 10710 | k | |
011011002 | 6C16 | 1548 | 10810 | l | |
011011012 | 6D16 | 1558 | 10910 | m | |
011011102 | 6E16 | 1568 | 11010 | n | |
011011112 | 6F16 | 1578 | 11110 | o | |
011100002 | 7016 | 1608 | 11210 | p | |
011100012 | 7116 | 1618 | 11310 | q | |
011100102 | 7216 | 1628 | 11410 | r | |
011100112 | 7316 | 1638 | 11510 | s | |
011101002 | 7416 | 1648 | 11610 | t | |
011101012 | 7516 | 1658 | 11710 | u | |
011101102 | 7616 | 1668 | 11810 | v | |
011101112 | 7716 | 1678 | 11910 | w | |
011110002 | 7816 | 1708 | 12010 | x | |
011110012 | 7916 | 1718 | 12110 | y | |
011110102 | 7A16 | 1728 | 12210 | z | |
011110112 | 7B16 | 1738 | 12310 | { | |
011111002 | 7C16 | 1748 | 12410 | | | |
011111012 | 7D16 | 1758 | 12510 | } | |
011111102 | 7E16 | 1768 | 12610 | ~ | |
011111112 | 7F16 | 1778 | 12710 | <DEL> |
Le codifiche ISO 8859-n, dove n è un numero da 1 a 15, rappresentano per il passato l'evoluzione più coerente dell'ASCII, in quanto utilizzano tutte gli stessi punti di codifica iniziali da 0 a 127, corrispondenti esattamente all'ASCII originale.
Come nel caso dell'ASCII, non c'è distinzione tra punto di codifica e forma codificata del carattere; in questa situazione si usano valori fino a 255, attraverso un byte intero.
Le codifiche ISO 8859-n introducono altri codici di controllo, nell'intervallo di punti di codifica che va da 128 a 159.
Per quanto riguarda le lingue occidentali, la codifica ISO 8859 più comune è ISO 8859-1, conosciuta anche come ISO Latin 1, che comunque, nel prossimo futuro potrebbe essere sostituita da ISO 8859-15 (ISO Latin 9), in cui si inserisce il simbolo dell'Euro al posto del simbolo di valuta generico.
La tabella 224.2 mostra nel dettaglio la codifica ISO 8859-1. Si tenga presente che nel caso di ISO 8859-15, il punto di codifica 164 viene abbinato al simbolo dell'Euro.
Tabella 224.2. ISO 8859-1.
Ottale | Decimale | Esadecimale | Carattere | Denominazione in inglese |
2408 | 16010 | A016 | NO-BREAK SPACE | |
2418 | 16110 | A116 | ¡ | INVERTED EXCLAMATION MARK |
2428 | 16210 | A216 | ¢ | CENT SIGN |
2438 | 16310 | A316 | £ | POUND SIGN |
2448 | 16410 | A416 | ¤ | CURRENCY SIGN |
2458 | 16510 | A516 | ¥ | YEN SIGN |
2468 | 16610 | A616 | ¦ | BROKEN BAR |
2478 | 16710 | A716 | § | SECTION SIGN |
2508 | 16810 | A816 | ¨ | DIAERESIS |
2518 | 16910 | A916 | © | COPYRIGHT SIGN |
2528 | 17010 | AA16 | ª | FEMININE ORDINAL INDICATOR |
2538 | 17110 | AB16 | « | LEFT-POINTING DOUBLE ANGLE QUOTATION MARK |
2548 | 17210 | AC16 | ¬ | NOT SIGN |
2558 | 17310 | AD16 | | SOFT HYPHEN |
2568 | 17410 | AE16 | ® | REGISTERED SIGN |
2578 | 17510 | AF16 | ¯ | MACRON |
2608 | 17610 | B016 | ° | DEGREE SIGN |
2618 | 17710 | B116 | ± | PLUS-MINUS SIGN |
2628 | 17810 | B216 | ² | SUPERSCRIPT TWO |
2638 | 17910 | B316 | ³ | SUPERSCRIPT THREE |
2648 | 18010 | B416 | ´ | ACUTE ACCENT |
2658 | 18110 | B516 | µ | MICRO SIGN |
2668 | 18210 | B616 | ¶ | PILCROW SIGN |
2678 | 18310 | B716 | · | MIDDLE DOT |
2708 | 18410 | B816 | ¸ | CEDILLA |
2718 | 18510 | B916 | ¹ | SUPERSCRIPT ONE |
2728 | 18610 | BA16 | º | MASCULINE ORDINAL INDICATOR |
2738 | 18710 | BB16 | » | RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK |
2748 | 18810 | BC16 | ¼ | VULGAR FRACTION ONE QUARTER |
2758 | 18910 | BD16 | ½ | VULGAR FRACTION ONE HALF |
2768 | 19010 | BE16 | ¾ | VULGAR FRACTION THREE QUARTERS |
2778 | 19110 | BF16 | ¿ | INVERTED QUESTION MARK |
3008 | 19210 | C016 | À | LATIN CAPITAL LETTER A WITH GRAVE |
3018 | 19310 | C116 | Á | LATIN CAPITAL LETTER A WITH ACUTE |
3028 | 19410 | C216 | Â | LATIN CAPITAL LETTER A WITH CIRCUMFLEX |
3038 | 19510 | C316 | Ã | LATIN CAPITAL LETTER A WITH TILDE |
3048 | 19610 | C416 | Ä | LATIN CAPITAL LETTER A WITH DIAERESIS |
3058 | 19710 | C516 | Å | LATIN CAPITAL LETTER A WITH RING ABOVE |
3068 | 19810 | C616 | Æ | LATIN CAPITAL LETTER AE |
3078 | 19910 | C716 | Ç | LATIN CAPITAL LETTER C WITH CEDILLA |
3108 | 20010 | C816 | È | LATIN CAPITAL LETTER E WITH GRAVE |
3118 | 20110 | C916 | É | LATIN CAPITAL LETTER E WITH ACUTE |
3128 | 20210 | CA16 | Ê | LATIN CAPITAL LETTER E WITH CIRCUMFLEX |
3138 | 20310 | CB16 | Ë | LATIN CAPITAL LETTER E WITH DIAERESIS |
3148 | 20410 | CC16 | Ì | LATIN CAPITAL LETTER I WITH GRAVE |
3158 | 20510 | CD16 | Í | LATIN CAPITAL LETTER I WITH ACUTE |
3168 | 20610 | CE16 | Î | LATIN CAPITAL LETTER I WITH CIRCUMFLEX |
3178 | 20710 | CF16 | Ï | LATIN CAPITAL LETTER I WITH DIAERESIS |
3208 | 20810 | D016 | Ð | LATIN CAPITAL LETTER ETH |
3218 | 20910 | D116 | Ñ | LATIN CAPITAL LETTER N WITH TILDE |
3228 | 21010 | D216 | Ò | LATIN CAPITAL LETTER O WITH GRAVE |
3238 | 21110 | D316 | Ó | LATIN CAPITAL LETTER O WITH ACUTE |
3248 | 21210 | D416 | Ô | LATIN CAPITAL LETTER O WITH CIRCUMFLEX |
3258 | 21310 | D516 | Õ | LATIN CAPITAL LETTER O WITH TILDE |
3268 | 21410 | D616 | Ö | LATIN CAPITAL LETTER O WITH DIAERESIS |
3278 | 21510 | D716 | × | MULTIPLICATION SIGN |
3308 | 21610 | D816 | Ø | LATIN CAPITAL LETTER O WITH STROKE |
3318 | 21710 | D916 | Ù | LATIN CAPITAL LETTER U WITH GRAVE |
3328 | 21810 | DA16 | Ú | LATIN CAPITAL LETTER U WITH ACUTE |
3338 | 21910 | DB16 | Û | LATIN CAPITAL LETTER U WITH CIRCUMFLEX |
3348 | 22010 | DC16 | Ü | LATIN CAPITAL LETTER U WITH DIAERESIS |
3358 | 22110 | DD16 | Ý | LATIN CAPITAL LETTER Y WITH ACUTE |
3368 | 22210 | DE16 | Þ | LATIN CAPITAL LETTER THORN |
3378 | 22310 | DF16 | ß | LATIN SMALL LETTER SHARP S |
3408 | 22410 | E016 | à | LATIN SMALL LETTER A WITH GRAVE |
3418 | 22510 | E116 | á | LATIN SMALL LETTER A WITH ACUTE |
3428 | 22610 | E216 | â | LATIN SMALL LETTER A WITH CIRCUMFLEX |
3438 | 22710 | E316 | ã | LATIN SMALL LETTER A WITH TILDE |
3448 | 22810 | E416 | ä | LATIN SMALL LETTER A WITH DIAERESIS |
3458 | 22910 | E516 | å | LATIN SMALL LETTER A WITH RING ABOVE |
3468 | 23010 | E616 | æ | LATIN SMALL LETTER AE |
3478 | 23110 | E716 | ç | LATIN SMALL LETTER C WITH CEDILLA |
3508 | 23210 | E816 | è | LATIN SMALL LETTER E WITH GRAVE |
3518 | 23310 | E916 | é | LATIN SMALL LETTER E WITH ACUTE |
3528 | 23410 | EA16 | ê | LATIN SMALL LETTER E WITH CIRCUMFLEX |
3538 | 23510 | EB16 | ë | LATIN SMALL LETTER E WITH DIAERESIS |
3548 | 23610 | EC16 | ì | LATIN SMALL LETTER I WITH GRAVE |
3558 | 23710 | ED16 | í | LATIN SMALL LETTER I WITH ACUTE |
3568 | 23810 | EE16 | î | LATIN SMALL LETTER I WITH CIRCUMFLEX |
3578 | 23910 | EF16 | ï | LATIN SMALL LETTER I WITH DIAERESIS |
3608 | 24010 | F016 | ð | LATIN SMALL LETTER ETH |
3618 | 24110 | F116 | ñ | LATIN SMALL LETTER N WITH TILDE |
3628 | 24210 | F216 | ò | LATIN SMALL LETTER O WITH GRAVE |
3638 | 24310 | F316 | ó | LATIN SMALL LETTER O WITH ACUTE |
3648 | 24410 | F416 | ô | LATIN SMALL LETTER O WITH CIRCUMFLEX |
3658 | 24510 | F516 | õ | LATIN SMALL LETTER O WITH TILDE |
3668 | 24610 | F616 | ö | LATIN SMALL LETTER O WITH DIAERESIS |
3678 | 24710 | F716 | ÷ | DIVISION SIGN |
3708 | 24810 | F816 | ø | LATIN SMALL LETTER O WITH STROKE |
3718 | 24910 | F916 | ù | LATIN SMALL LETTER U WITH GRAVE |
3728 | 25010 | FA16 | ú | LATIN SMALL LETTER U WITH ACUTE |
3738 | 25110 | FB16 | û | LATIN SMALL LETTER U WITH CIRCUMFLEX |
3748 | 25210 | FC16 | ü | LATIN SMALL LETTER U WITH DIAERESIS |
3758 | 25310 | FD16 | ý | LATIN SMALL LETTER Y WITH ACUTE |
3768 | 25410 | FE16 | þ | LATIN SMALL LETTER THORN |
3778 | 25510 | FF16 | ÿ | LATIN SMALL LETTER Y WITH DIAERESIS |
Jukka Korpela, A tutorial on character code issue
Jukka Korpela, The ISO Latin 1 character repertoire - a description with usage and notes
Roman Czyborra, The ISO 8859 Alphabet Soup
Roman Czyborra, Codepages & Co.
daniele @ swlibero.org
Dovrebbe essere possibile fare riferimento a questa pagina anche con il nome esempi_di_codifica_dei_caratteri.html
[successivo] [precedente] [inizio] [fine] [indice generale] [violazione GPL] [translators] [docinfo] [indice analitico]