Betűlezserség

Összefutottam egy World System Teletext nevű rendszerrel, amit egyébként kölökkoromban is ismertem már képújság néven, amennyire tudom, ma is üzemel. De érdekes dolgot figyeltem meg. Van a cikkben egy lista az 1981-ben használt változat jelkészleteiről. Tizenháromféle jelkészlet, összesen tizenkilenc megnevezett nyelv. Kicsit számolgattam. Hány betű is ez jelkészletenként?

	`12345678901234567890`
cseh	`áčďéěíňóřšťúůýž`
szlovák	`áäčďéíĺľňóôŕšťúýž`
angol
észt	`äöõšü`
francia	`àâçéèêëîïôœüûÿ`
német	`äößü`
olasz	`àéèìóòù`
lett	`āčēģķīļņšūž`
litván	`ąčėęįšūųž`
lengyel	`ąćęłńóśźż`
portugál	`áàâãçéêíóõú`
spanyol	`áéíñóúü`
román	`âăîşţ`
szerbhorvát¹	`ćčđšž`
szlovén	`čšž`
svéd²	`äåéö`
finn²	`äåöšž`
török³	`çğıöşü`

  ¹ A szerb nyelvet elsősorban cirill betűkkel írják, de mivel más cirill betűs nyelv nincs említve, nyilván a latin betűs szerbről van szó, amit akkoriban a horváttal egy nyelvnek tekintettek és szerbhorvátnak nevezték.
  ² A svédhez és a finnhez fölvettem az ábécében nem szereplő, de idegen nevekhez gyakran használt betűket is. Persze nem tudom, hogy a valóságos jelkészletben benne voltak-e.
  ³ A török ábécében a kis pontos i nagybetűvel is pontos: İ. Ugyanakkor van egy másik, ami kicsiben és nagyban is ponttalan: ı, I. Vagyis ugyanannyi nagybetű van, mint kicsi, csak a kis- és nagybetűk közötti gépi átváltásnál kell külön programrészt írni erre.

Egyes kódlapoknál több nyelv is szerepel, ezeket összesítve ezt kapjuk:

	`12345678901234567890`
cseh és szlovák	`áäčďéěíĺľňóôŕřšťúůýž`
lett és litván	`āąčēėęģķīįļņšūųž`
portugál és spanyol	`áàâãçéêíñóõúü`
szerb, horvát és szlovén	`ćčđšž`
svéd és finn	`äåéšöž`

A leghosszabb a cseh és szlovák, húsz darab. Legalább húsz (nagybetűkkel együtt negyven) ékezetes betűnek biztosan volt hely a kódlapokon. Akkor tessék mondani, miért kellett tizenháromféle, ráadásul így?
  Mert az észtet külön venni a svéd–finntől tiszta hülyeség, amikor az én kibővített változatomban is csak hat betűt tartalmaz, és észthez már csak egyetlen õ betű kell. Ebbe fölvehetjük a németet, sőt a törököt is, és még mindig csak ekkora betűsort kapunk: äåçéğıöšßüž, 11 darabot. És ennek is megvan az értelme, hiszen német nevek gyakran előfordulnak más európai nyelveken írt szövegekben, de török nevek pont a németben gyakoriak, a Németországban élő sok török miatt.
  Ha a franciát egyesítenénk az olasszal, az még mindig csak tizennyolc betű (àâçéèêëìîïóòôœùüûÿ), és ehhez akár hozzávehetjük a románt, már csak három további betűt ad (ă, ş, ţ), az huszonegy. Ennek a három nyelvnek is meglehetős kapcsolatai vannak egymással.
  Ha pedig a cseh–szlovákhoz hozzátesszük a szerbhorvát–szlovént, akkor huszonkét betűt kapunk, és már elég közel vagyunk egy latin betűs pánszláv kódlaphoz; még hat lengyel betű, és az is megvan.
  Én ugyanis nem hiszem, hogy pont húsz betűnek jutott volna hely a teletext rendszerében. Ennyi a legnagyobb ismert betűkészlet, de ahol jut hely húsz betűnek, juthat többnek is. Nézzük meg, hány betűt ad az összes eddig felsorolt nyelv.
  áàâäãåāăąćčçďđéèěêëēėęğģíìîïīıįķĺľłļńňñņóòôöõœŕřśšşßťţúùüûůūųýÿźžż
  Hatvanhat darab. Erről már elhiszem, hogy az egész együtt nem férne el, mert a nagybetűkkel együtt ez százharminckettőt tesz ki, és léteztek kezdeményezések, amikor a nyolcbites kódlap első felét a „normál” jelkészlet tette ki, és a második felébe tették az egzotikumokat, vagyis mindent, ami nem az angol nyelvhez kell. Az pedig csak 128. De semmi sem kötelez minket ennek betartására, 128 kódhely sokkal több, mint ami a sima számítástechnikai angolhoz kell, márpedig már csak néhány betűnk hiányzik egy komplett összeurópai készlethez: æ, ø (dán, norvég), az æ mellé még þ, ð (izlandi), ċ, ġ, ħ (máltai), no meg ő, ű (magyar). Ez hetvenötre emeli a készletet, nagybetűkkel együtt százötvenet kapunk; ezt is be lehet szorítani, ha fontos.
  De nem fontos. Miért is lenne fontos?
  A probléma nem egyedi. Ez a teletextrendszer ugyanabban a felfogásban készült, mint a legtöbb számítógépes jelkészlet a nyolcbites korszakban, sőt – más szempontból – a Unicode-korszakban is. Ez a felfogás körülbelül így önthető szavakba: „Tegyük be egy adott nyelv vagy nyelvcsoport betűit a jelkészletbe, és kész. (Nyelvcsoport az, amit mi ekként definiálunk.) További teendőnk nincs. Ha a kódlapot egy másik kódlap módosításával készítjük, amely már tartalmazza más nyelvek ékezetes betűit, akkor a sajátjainkat tehetjük az idegen ékezetes betűk helyére is.” Így például a magyarok fogták a DOS 437-es kódlapot, ami valaha a PC-k alapértelmezett kódlapja volt (sőt ma is az, csak nem látszik), és kicserélgettek benne betűket, az ô helyett lett az ő, û helyett az ű, Å helyett a nagy Á stb. Csak így persze az eredeti francia, svéd, olasz betűket nem lehetett használni. A többnyelvű számítógép nem volt cél, a legtöbben megelégedtek azzal, ha a gépük az ő nyelvüket tudta, és nem zavarta őket, hogy mennyi hely van még a jelkészletben, ahová más nyelvek ékezetes betűit lehetne tenni. Csakhogy ez azt okozta, hogy a gépek csak egy (esetleg két) nyelven tudtak szöveget kiírni. A példabeli teletext például, ha Prágában használták és ennek megfelelően cseh és szlovák kódlapra volt állítva, nem tudott helyes ékezetekkel közölni egy hírt arról, hogy a Nemzeti Színház műsorra tűzött egy Molière-darabot, mert az è betű ebből a kódlapból hiányzott. Lehet, hogy volt mód az elérésére, esetleg be lehetett rajzolni az ékezetet, de akkor az pluszmunkát jelentett, amit bizonyára nem végeztek el mindig. És hát sok rendszerben nem is volt mód a kódlapban nem szereplő betűket használni. (Például a DOS-os PC-ken csak akkor lehetett átrajzolni a betűket, ha már a szupermodern VGA kártyája volt az embernek.)
  Az én munkámhoz nem lett volna elég a képernyőn átrajzolni a jelkészletet, hiszen amit csináltam, abból nyomtatott könyv lett; valójában nem is számított, hogy én milyen jelet látok, azokat a nyomdagépen kellett definiálni. De ott is ugyanez volt a probléma. Ugyanaz a kettő, mint mindenütt. 1. A gépnek tudnia kell a szükséges jeleket, éspedig ha adott nap a szerkesztőségből érkezik egy cikk, amelyben idegen betűk, matematikai jelek, akármilyen egyéb cifraságok vannak, azokat aznap a gépnek már tudnia kell. 2. A szerző vagy a szedő gépének, vagyis annak, ahol az első digitális szövegváltozat létrejön, szintén tudnia kell ezeket, vagy valami helyettesítő jelet, és azt meg is kell nyomni.
  A nyolcbites jelkészletek idején a hangsúly az első részen volt; ha a példabeli teletext svédre volt állítva, és nem volt rajta á betű, akkor márpedig nem volt és kész. Évekig svéd åbécével jelent meg a képujsåg a magyar tévénézök képernyöjén, viccelödtünk vele, jokat vigyorogtunk a kerékbe tört anyanyelvünkön, aztån megszoktuk. Amikor néhány évvel késôbb a DOS-os nyomtatók kalapos betûket nyomtattak, és mindenféle sajtótermék így jelent meg, mert így olcsóbb volt (még néhány évvel késõbb a windowsos nyomtatók már tildét raktak a hosszú õ-re), akkor már nem is vigyorogtunk, legyintettünk. Megszokja az ember. Arany János még szívszélhűdést kapott volna tőle.
  Aztán később áttolódott a hangsúly a jelek elérésére, mert a jelkészletben már nagyrészt megvoltak – elterjedt a Unicode, szerintem kínkeserves lassúsággal. De ma már végre megvan. És most? Tudunk írni nyelvekül? Én tudok, mert megoldom magamnak, hogy tudjak, de a Facebook ma is tele van emberekkel, akiknek olyan egzotikus és számítástechnikailag nehezen feldolgozható anyanyelvük van, mint például a magyar, ès vagy telefonon ìrnak mindenfèle õsszevissza nyugat-euròpai êkezetes betũt, vagy semmilyet, akar PC-n, akar tablagepen, mert az angolul van es semmilyen ekezetet nem tud. Pontosabban ők nem tudnak róla, hogy tud. És nincs bennük motiváció, hogy hát talán ezt a problémát meg kellene oldani.
  Pedig anélkül már a teletext idejében se ment. A teletext tervezőiben feltehetően arra volt motiváció, ami általában lenni szokott, hogy hát most a Svensson és Társa rendelt tőlünk tízezer teletextet, ők Stockholmba és Helsinkibe szállítanak, akkor tudjon a gép svédül és finnül. Dánul már fölösleges, mert oda ezekből nem szállítanak, és miért akarná valaki leírni akár Svéd-, akár Finnországban, hogy François? Hívnak így egy-egy politikust vagy színészt, akiről hírek szólhatnak, és a teletext pont hírekhez való? Hívnak, többet is. És akkor mi van? Kit érdekel?
  Inkább legyen benne angol kódlap. Történetesen angolul az összes többi nyelv kódlapjával hiánytalanul lehet írni, mert az angolhoz csak az ékezet nélküli betűk kellenek, és teljesen mindegy, hogy azokon túl milyen betűk állnak rendelkezésre, nem kell őket használni. De kell egy külön angol kódlap, amiből eltávolítanak minden nem angol betűt, mert az angol customer bizonytalanul néz az ékezetes betűkre, mit keresnek efféle űrlények az ő számítógépében, ő ezeket nem akarja. Éppen úgy, ahogy a DOS 852-es kódlapját is harsány hahota fogadta Magyarországon, mit képzelnek Microsofték, hogy az ő szépséges magyar betűik majd cseh, szlovák, német, horvát, lengyel, román és albán betűkkel fognak egy levegőt szívni? Hiszen ezeknek a népeknek a felével utáljuk egymást!

»»»»»»