Next Previous Contents

2. Ελληνικές Κωδικοσελίδες (Πίνακες χαρακτήρων, character sets)

Ο Η/Υ για να παραστήσει τα γλωσσικά σύμβολα χρησιμοποιεί 1byte=8bit, δηλαδή έχουμε 2^8=256 διαφορετικά γράμματα. Ο κώδικας ASCII (American Standard Code for Information Interchange) ορίζει αυστηρά μόνο τα πρώτα 128 σύμβολα (7bit). Τα άλλα μισά σύμβολα χρησιμοποιούνται για απεικόνιση ειδικών συμβόλων άλλων γλωσσών αλλά και γραφικών συμβόλων. Αντίθετα, με άλλες ευρωπαϊκές γλώσσες τα ελληνικά είναι εξ' ολοκλήρου στα 8bit. Ο προφανής λόγος είναι τα πολλά διαφορετικά σύμβολα που έχει η ελληνική γλώσσα σε σχέση με τις υπόλοιπες.

Τα ελληνικά υπάρχουν σε πολλές διαφορετικές τυποποιήσεις. Οι πιο συνηθισμένες από αυτές, είναι τα 737 και τα 928. Αμφότερα είναι για μονοτονικά ελληνικά. Τα μεν 737 χρησιμοποιούνται από το DOS, τα δε 928 από τα UNIX και Windows συστήματα, αν και στα Windows υπάρχουν μικρές παραλλαγές. Το Linux έχει σαν κύρια κωδικοσελίδα τα 928. Το ότι έχουμε για Ελληνικά δύο και πλέον κωδικοσελίδες, φυσικά, είναι μεγάλο πρόβλημα, που ξεπερνιέται με ειδικούς μετατροπείς, για αλλαγή από το ένα σετ στο άλλο.

Πρόσθετες πληροφορίες για ελληνικές κωδικοσελίδες μπορείτε να βρείτε στο RFC 1947, "Greek Character Encoding for Electronic Mail Messages". Δείτε σχετικά http://andrew2.andrew.cmu.edu/rfc/rfc1947.html

2.1 737

Τα 737 είναι επίσης γνωστά και ως 437G (=437Greek), γιατί προέκυψαν από τροποποίηση των αμερικάνικων 437. Τα 737 πρωτοεμφανίστηκαν στις ελληνικές EPROM των MDA και Hercules καρτών γραφικών των πρώτων PC, όπου βρίσκονταν δηλαδή στο HARDWARE. Χρησιμοποιήθηκαν κατά κόρον στο DOS, και για αυτό όλα τα αρχεία που προέρχονται από DOS αναμένεται να είναι 737. Επειδή τα 737 θεωρούνται πλέον κατάλοιπο του DOS, είναι καλύτερα να μετατρέψετε τα αρχεία που είναι 737 σε 928. (βλ. convertgreek ). Στο Linux, η κωδικοσελίδα 737 υποστηρίζεται πλήρως μόνο στην κονσόλα (text-mode), και υπάρχουν και μερικές γραμματοσειρές για X-Windows.

Τροποποίηση πυρήνα για υποστήριξη 737

ΣΗΜΕΙΩΣΗ: Έχουν αναφερθεί περιπτώσεις, όπου το "δ" (ΔΕΛΤΑ μικρό) δεν πληκτρολογείται σε κάποιους πυρήνες και αυτό συμβαίνει γιατί συμπίπτει με το 128+ESC (128+27=155=asc("δ")). Πηγαίνετε στο /usr/src/linux/drivers/char/console.c, κάπου λέει:

              && (c != 127 || disp_ctrl)
              && (c != 128+27);
αλλάξτε σε 
              && (c != 127 || disp_ctrl)
              /*      && (c != 128+27)*/;
και κάνετε compile τον πυρήνα.

737 σε X-windows

Τα 737 υποστηρίζονται σε μερικές από τις fixed γραμματοσειρές που είναι στο ftp://dolphin.doc.ic.ac.uk/pub/greek/fonts/X11/greekXfonts-full-1.1.tgz .

    Names (from xlsfonts):
-misc-grfixed-medium-r-normal--0-0-75-75-c-0-grpc-737
-misc-grfixed-medium-r-normal--0-0-85-85-m-0-grpc-737
-misc-grfixed-medium-r-normal--14-110-75-75-c-75-grpc-737
-misc-grfixed-medium-r-normal--16-120-75-75-c-75-grpc-737
-misc-grfixed-medium-r-normal--23-179-85-85-m-120-grpc-737
-misc-grfixed-medium-r-semicondensed--0-0-75-75-c-0-grpc-737
-misc-grfixed-medium-r-semicondensed--10-100-75-75-c-60-grpc-737
-misc-grfixed-medium-r-semicondensed--13-120-75-75-c-60-grpc-737
-misc-grvga-medium-r-normal--0-0-75-75-c-0-grpc-737
-misc-grvga-medium-r-normal--13-120-75-75-c-60-grpc-737
  (nomizw kapoia exoyn bugs kai exw skopo na ta diorthwsw se next
release). [ah@computer.org]

 Shmeiwseis:
 * ta Type1 (k.a.) 928 fonts moy exoyn to A tonoymeno se 2 theseis wste na
   einai symbata me windows texts. Epishs exoyn kai ta symbola poy leipoyn.
 * to kbd support gia ellhnika sto rxvt (poy exw kanei contribute) exei
   yposthriksh gia anw teleia kai ellhnika omoiwmatika kathws epishs
   kai grammata me tono/dialytika. Ola ayta prepei na perasoyn
   se X11 xkb-style (ala grISOXKb).

2.2 928

Τα 928 είναι πιο σύγχρονη τυποποίηση και καθιερώθηκαν αρχικά από τον ΕΛΟΤ. Αργότερα έγιναν αποδεκτά και από τον ISO ως ISO-Latin-8859-7, ή απλά Latin7. Τα 928 χρησιμοποιούνται σε όλες τις εφαρμογές των UNIX, στο Internet και αποτελούν το σημερινό πρότυπο και για το Linux. Η κωδικοσελίδα 928 υποστηρίζεται, και στην κονσόλα (text-mode), και σε γραφικό περιβάλλον (X-Windows).

Windows-1253

Η κύρια απόκλιση των Windows ελληνικών (Windows-1253) από την τυποποίηση ELOT 928 ( ISO 8859-7), είναι ο χαρακτήρας "¶", (Α τονούμενο) του ΕΛΟΤ 928 ο οποίος στα Windows αντιστοιχεί στο Paragraph mark. Από τα Windows-1253 λείπουν επίσης η άνω τελεία, και τα ελληνικά ομοιωματικά << και >>. Επειδή μοιραία θα πρέπει να αποδεχτούμε τον περιορισμό αυτό που μας θέτουν τα MS-Windows, και επειδή αρκετοί χρήστες χρησιμοποιούν wintel πλατφόρμα εργασίας, καλό θα είναι να αποφεύγεται το < Α τονούμενο > κατά την αποστολή e-mails, postings, κλπ. Εναλλακτικά μπορείτε να χρησιμοποιείτε το 'Α ( ' = SHIFT+" ) Παρόμοια προβλήματα υπάρχουν και με τα 'Ε και 'Ο. Για έλεγχο, αυτά είναι όλα τα τονούμενα: ¶ΈΉΊΌΎΏ.

2.3 Unicode

Τα UNICODE (ISO 10646) είναι 16bit (=> 65536) και περιλαμβάνουν πολλές γλώσσες, μαζί με τα νέα ελληνικά, που έχουν offset #370 και τα αρχαία ελληνικά με offset #1F00. Υποστηρίζονται από τα νέα μέχρι τα αρχαία (πολυτονικά) ελληνικά και Γραμμική Β! Το Linux υποστηρίζει UNICODE, αλλά ακόμα η χρήση τους δεν είναι διαδεδομένη, γιατί εξαρτάται και από την υιοθέτησή τους από τις εφαρμογές.

Υπάρχει μία fixed γραμματοσειρά για Xwindows, δείτε σχετικά: http://www.cl.cam.ac.uk/~mgk25/ucs-fonts.html

Υπάρχει και ένας text editor για Unicode, με το όνομα Yudit, ftp://sunsite.unc.edu/pub/Linux/apps/editors/X/yudit-1.1.tar.gz

Το πρότυπο UTF-8 είναι πλέον standard στο Internet, δείτε το σχετικό RFC: http://andrew2.andrew.cmu.edu/rfc/rfc2279.html

Περισσότερα για τα νέα ελληνικά στα Unicode εδώ: http://charts.unicode.org/Unicode.charts/normal/U0370.html

2.4 ¶λλες ελληνικές κωδικοσελίδες

2.5 Μετατροπείς ελληνικών

gr2gr

Ο ¶γγελος Χαρίτσης < ah@computer.org> έχει γράψει τον μετατροπέα αυτόν: ftp://ftp.hri.org/pub/greek/programs/gr2gr.prl Τρέχει με perl (5 ή 4). Συνεπώς δουλεύει σε όποιο λειτουργικό σύστημα έχει εγκατασταθεί perl (unix, dos, win32, os2, mac, vms ...).

Υποστηρίζει πολλά διαφορετικά ελληνικά, όπως:

grfilter

Στο Ινστιτούτο Τεχνολογίας Υπολογιστών υπάρχει το grfilter: ftp://ftp.cti.gr/pub/src/grfilter.tar

greek2lat

Στο directory ftp://corfu.forthnet.gr/pub/greek2lat υπάρχει ένας μετατροπέας από 928 σε greeklish, κατάλληλος και για WEB sites.

trans120.tar.gz

Ο Κώστας Κωστής, < kosta@kostis.net > έχει γράψει επίσης αυτόν τον μετατροπέα, που υποστηρίζει και πολλά ελληνικά, αλλά και άλλες γλώσσες: http://www.kostis.net/freeware/trans120.tar.gz

gkconv

Υπάρχει και ένα προγραμμα του Γιώργου Σπηλιώτη, μετατρέπει 473 Win95, X win. Η διεύθυνσή του αγνοείται.

recode

Αυτό είναι ένα προγραμματάκι γενικής χρήσης από το GNU project, το οποίο υποστηρίζει μετατροπείς για πολλές διαφορετικές γλώσσες (και ελληνικά). Ισως θα έπρεπε όλα τα υπόλοιπα προγράμματα κάποια στιγμή να ενσωματωθούν σε αυτό. Δείτε στην διεύθυνση http://www.delorie.com/gnu/docs/recode/recode_toc.html


Next Previous Contents