Upload failed. Maybe wrong permissions?

User Tools

Site Tools




Szövegszerkeszteni anyanyelvünkön

Yes, dear olvasó, a számítógép very-very remekül tud szöveget szerkeszteni az Ön anyanyelvén, bármi is legyen az – akár amerikai angol, akár brit angol. Más nyelvek? Hát persze hogy tud franciául és spanyolul is! Fi-i-inn? Izé… arrafelé Közép-Amerikában nem csak spanyolul beszélnek?

Innen indult a számítástechnika. Valaha csak a számítástechnikusok, mára az egész világ használ szövegszerkesztőket, és bajmolódik azzal, hogy megtanítsa a gépet anyanyelvére, pusztán azért, mert pechünkre olyan országban született meg a számítástechnika, ahol egyáltalán nem használnak ékezetes betűket. A művelt amerikai tudja, hogy mexikóiul az urat senornak írják és szenyornak ejtik. Mi az, hogy „ñ”? És minek? Rendes nö betűvel nem értik?
  Lehet persze, hogy az olvasó már abban a boldog korban kezdett számítógépeket használni, amikor azok magától értetődő természetességgel tudtak már magyarul. Talán az olvasó nem is emlékszik már arra a korra, amikor lépten-nyomon tele volt minden olyan feliratokkal, mint kötõtû, mert a nyomtatókon nem volt magyar ékezet. (A neten ma is gyakoriak, de nyomtatásban már kevésbé.) Arra talán jobban emlékszik az olvasó is – régebben volt, de nagyobb figyelmet kapott –, hogy a nyolcvanas években a tévé képújságja eleinte svéd betűkkel volt olvasható: „Åtadtåk Györben az uj vasuti hidat. Håromszåzan gyultek össze az unnepi rendezvényen, amin Såfår Årpåd mondott beszédet…” Aranyos, mi? Szegény ember vízzel főz. Akkor még a nagy Szovjetunióhoz közelebbi szálak fűztek minket, mint Svédországhoz, úgyhogy járhattunk volna rosszabbul is. (Атадтак Дёрбен аз уй вашути хидат…)

  De ha az olvasó már ebben a boldog korban ismerkedett meg a számítógépekkel, amikor igazi, szép magyar Ő és Ű betűket lát, sőt a programok magyarul írják a feliratokat, akkor is kerülhet cifra helyzetbe. Van például egy könyvem, amit 1974-ben adtak ki, másfél évtizeddel azelőtt, hogy megkezdődött hazánkban a számítógépes könyvkiadás.
    A könyvet a magyar Tankönyvkiadó adta ki, ebből következően a magyar ékezetek mind gond nélkül megjelennek. A vietnamiakkal viszont meg se próbálkoztak, a szerzők tollal rajzolták be a 126 oldalas könyvecske összes vietnami ékezetét.
  Ismétlem, ez 1974-ben volt. Harmincnégy évvel ezelőtt. És ma? Képzelje el az olvasó, hogy állásajánlatot kap: újra kiadják a könyvet, és az olvasó feladata számítógépre vinni a szöveget. Részlet az előszó vietnami szövegéből:
  
  Én egykor fényszedő voltam, és úgy működött a dolog, hogy ha mondjuk tizedikén kiadtak egy kötetnyi terjedelmű munkát, akkor tizenkettedikén már kiabáltak, hogy miért nincs még mindig kész, akármilyen nyelven volt. Hosszan sorolhatnám, miféle kalandokba keveredtem, de nem erről szól ez az írás. A lényeg az, hogy nem volt arra idő, hogy az ember megtanítsa a gépet például vietnamiul. Annak már eleve tudnia kellett. Volna.
  De nem tud! Tud és mégse tud. A fenti példában apró képek gyanánt mutattam a vietnami szöveget, mert van rá némi esély, hogy az olvasó számítógépén nem jelenne meg, de ma már a legtöbb gépen megjelenik. (Ellenőrzésképpen a vietnami betűk legproblémásabb hányada, nem képként: ơ ư ả ạ ẻ ẹ ẽ ỉ ị ĩ ỏ ọ ủ ụ ũ ấ ầ ẫ ẩ ậ ắ ằ ẵ ẳ ặ ế ề ễ ể ệ ố ồ ỗ ổ ộ ớ ờ ỡ ở ợ ứ ừ ữ ử ự.) Ha az olvasónak például Windowsa van, 98 vagy újabb, a gyári fontokkal és beállításokkal, akkor a vietnami betűknek meg kell jelenniük. De attól, hogy megjelennek, az olvasó még nem lesz képes vietnamiul írni. A betűk nincsenek rajta a billentyűzeten.

Ehhez a cikkhez részben az adott lökést, hogy nemrégiben kipróbáltam a MobiOffice-t, ami egyszer még akár remek szövegszerkesztővé is válhat, de most nem az. Többek között azért nem, mert nem tud nyelveken, noha tud nyelveken. De minden tiszteletem az olvasóé, ha van türelme leírni vele egy mondatot például oroszul, ami amúgy elég egyszerű eset. De nem kell ilyen kevéssé ismert szövegszerkesztőt hozni példaként: a jó öreg Word is tökéletesen megfelel.


  Íme egy képernyőfotó a Wordből, amint éppen oroszul írok benne. Utánam tudja csinálni az olvasó? Nagyon egyszerű dolog, tessék a Microsoft-féle hiperszuper módszer. Ha Mr. Jones mostanáig amerikaiul dolgozott a számítógépén, de most éppen levelet ír moszkvai ügyfelének, akkor belép a Control Panelbe és rákattint a Regional and Language Options ikonra. A Languages fülön megnyomja a Details gombot és megkapja a Text Services and Input Languages ablakot. Itt van egy Installed Services nevű lista, amibe a mellette levő Add gombbal (Add Input Language ablak) fölveszi a Russian nyelvet és keyboard layoutot, azaz billentyűzetkiosztást. Ha kéznél van a Windows lemeze, természetesen, mert ha valahova elpakolta az ember, akkor szenvedhet. Ha mindez kész, akkor Mr. Jones máris írhat oroszul. Rákattint a tálcán az EN ikonra és átváltoztatja RU-vá. Ilyen egyszerű, very nice!
  
  Csak az egyszerűség okán vettem a képet a Windows On-Screen Keyboardjából, természetesen a rendes billentyűzet is ilyen. Mi van, ha Mr. Jones, aki nem egy orosz nyelvi fenomén, inkább olyasfajta keyboard layoutot szeretne, ahol az orosz А betű az A billentyűn van, a Б a B-n és így tovább? Akkor vannak mindenféle nagyszerű keyboard layout manager programok, egyik egyszerűbb, mint a másik, whoa.
  És az amerikai fejlesztő boldogan hátradől, taughtoltam languagéket a Windowsnak, how very-very szuperhapsi I am.

Pedig még nem csinált semmit, illetve amit csinált, az inkább nega-, mint pozitív. Létrehozott egy hihetetlenül agyonbonyolított rendszert, ami olyan feltételezéseken alapul, amik lehet, hogy a felhasználók túlnyomó részénél igazak, de akinél nem, azt lehetetlen helyzetbe hozzák.
  Első feltételezés: az a user, aki lettül akar írni, nyilván Lettországban élő, lett anyanyelvű user. Hogy ez miért baj? Mert ha a feltételezés téves, akkor a user, aki nem lett, kellemetlen helyzetbe hozva lett. (Elnézést.) Mert a lett user Lettországban már megtanulta a Hivatalos Lett Billentyűkiosztást, és nem lepi meg, hogy a számítógépen is ugyanúgy lettek elhelyezve a lett betűk.
  
  Ez itt a Hivatalos Lett Billentyűkiosztás képernyőfotója; egy magyar vagy amerikai user ezzel még azt se tudja leírni, hogy George Bush, pedig abban semmilyen lett ékezetes betű nincs, épp csak minden más helyre lett pakolva.
  Arra pedig semmiféle módszer nincsen, hogy az ember áttegyen egy-két betűt máshová. Tessék letölteni egy very-very easy billentyűzetszerkesztő alkalmazást és csinálni új billentyűzetet.
  Második feltételezés: egy nyelv jelkészletét csak teljes egészében akarják használni. Az, hogy valaki mondjuk magyarul ír egy könyvet, amiben sűrűn említi Molière nevét, olyan lehetetlenség, amire föl se lehet készíteni egy számítógépet. Az ilyen user vagy másszon be minden egyes alkalommal a Szimbólum beszúrása ablakba (ha van ilyen a szövegszerkesztőjében), vagy tanuljon meg makrót programozni (ha van ilyen a szövegszerkesztőjében).
  Harmadik feltételezés: ha egy fontban megrajzoltuk a betűket és rátettük őket a billentyűzetre, akkor hátradőlhetünk, az a nyelv kész. Némely programban még az „és rátettük őket a billentyűzetre” rész is kimarad, jó példa erre az említett MobiOffice, ami úgy hirdeti magát: „read and write your own language whatever it is”. (Itt.) De ebből csak a read valósul meg, a write már nem, mert csak francia, német, olasz, spanyol és holland billentyűzet van a programban. (De én a Mobit egyelőre félkész verziónak tekintem, többek között ezért is.)
  Így például ha az ember a Wordben az alábbi kép szerint állítja be a szimbólumablakot, akkor a vietnami kivételével az összes latin betűs nyelv ékezetes betűit egyszerre látja. De akkor se tud írni egyiken se, mert az ékezet nélküli betűk nincsenek itt, ha pedig a billentyűzeten próbálja lenyomkodni őket, akkor az ablak vezérlői között fog ugrálni összevissza, betűk nem jelennek meg.
   A legtöbb programban legfeljebb a „fontosabb” latin és cirill betűs nyelvek meg a görög kapnak saját billentyűzetet, a többi nem. Ami baj, mert vannak nyelvek, amiken egyáltalán nem lehet szöveget szerkeszteni, ha nincsen speciális szoftver hozzá – de erről később részletesebben is mesélek.
  A megfelelő nyelvi billentyűzet nélkül, kódtáblával összeböködött szövegben könnyen előfordulhat, hogy ilyeneket látunk: Ultra Daisy tečni deterdţňent za pranje posuđa i čišćenje sa limunom, amint az ultradézis flakonon olvasható. A horvát nyelv azonban sem a ţ, sem az ň betűt nem használja.
  Negyedik feltételezés: a szótárakat nem készítik, hanem születnek. Mert ha készítenék őket, akkor lennének userek, akik az egyik pillanatban lettül akarják leírni, hogy ābeļu, a másik pillanatban pedig lengyelül, hogy jabłoń, direkt nem említettem a magyar megfelelőt, mert az almafa nem tartalmaz ékezetet. Ma már vannak olyan szótárak, mint a Wiktionary, ahol kisezer nyelven kell írni, és le kell tudni írni, hogy melegít az finnül lämmittää, héberül חימם, kínaiul 加热, románul a încălzi stb. Hogy hogyan írjuk le mindezt, az meghaladja az átlagos szoftverfejlesztő képzelőtehetségét.
  A gyakorlatban persze úgy oldódik meg a probléma, hogy az adatbázisba nem ugyanaz az ember írja be a különböző nyelvű szavakat, hanem az egyik a finnt, a másik a hébert stb., és mindegyiknek a gépe tudja azt az egy nyelvet, amit a gazdája ismer. De mi van a speciális esetekkel, amilyen ez a cikk?
  Aki több nyelven szerkeszt szöveget, nem ér rá egérrel vacakolni, rákattint, kiválaszt, rákattint, kiválaszt. Ha erre ráérne, akkor arra is, hogy minden egyes betűt egérrel jelölgessen ki. Gyorsan akar dolgozni, tehát gyorsan akar váltogatni is.
  Ötödik feltételezés: semmi szükség minden nyelven tudó szövegszerkesztőre, hiszen minden nyelven tud valamilyen szövegszerkesztő. Vannak arab, héber, hindi, kínai, orosz szövegszerkesztők, a világ minden nyelvéhez készült már. Ez kétségkívül igaz (úgy értve, hogy arapahó szövegszerkesztő bizonyára nincsen, de vannak olyanok, amiket némi erőfeszítéssel meg lehet tanítani arapahóul), csak hiába igaz, rajtunk nem segít. Nem is olyan régen még herkulesi feladatnak bizonyult volna mondjuk magyar szövegben orosz és kínai idézetet szerepeltetni, mert csak három teljesen különböző kódolásban lehetett volna elkészíteni őket, és feltehetőleg a képernyő lefotózása lett volna a legegyszerűbb mód, hogy végül egyazon szövegbe kerüljenek. Ez ma már sokkal egyszerűbb, mert van Unicode, „csak” a megfelelő szövegszerkesztőket kell megszerezni. A baj az, hogy a szoftverpiac csak arra a felhasználóra van felkészülve, aki folyamatosan, évek hosszú során át írni akar kínaiul. Neki megéri megvenni egy kínai szövegszerkesztőt, meg fog térülni az ára. Nekem egyszer azt mondta a kiadó, hogy kínai munka van, egy vagy két oldal, meg tudom-e csinálni. Igen, mondtam, ámbár akkor még nem volt kínai szövegszerkesztőm és nyilván ennyiért nem is érte volna meg, hogy vegyek egyet, de biztos voltam benne, hogy meg tudom csinálni – szoftverguru vagyok, kódolások és nyelvek terén nagyon otthon vagyok, nekem ez nem probléma (ámbár akkor még semmit se tudtam kínaiul). De postafordultával jött a válasz, hogy inkább lefényképezik.
  Van két könyvem Lomb Katótól, amikben bemutat összesen talán öt kínai írásjegyet. Természetesen berajzolta őket kézzel, amikor a könyvet készítették. Ma mi lenne a megoldás? Öt írásjegyért senki nem vesz meg egy szövegszerkesztőt. És ne tessék mondani, hogy freeware-ek is vannak, mert nem a pénz az egyetlen kérdés (egy kiadó költségvetésében egy húszdolláros program nem lenne tétel). Azt a szövegszerkesztőt fel kell kutatni, le kell tölteni, föl kell installálni, meg kell tanulni, majd a szükséges szövegrészek előállítása után meg kell oldani, hogy azok bekerüljenek a fő szövegbe. Macera, macera, macera.
  A soknyelvű szövegszerkesztőre tehát nem annak van szüksége, aki sok nyelven ír terjedelmes szövegeket, legfőképpen azért, mert ilyen ember nemigen van. Annak sincs rá szüksége, aki egy-két nyelven ír, és néha előfordul nála egy-egy szócska sokféle további nyelven. Az ilyennek elég, ha a szimbólumtáblából kikeresi a szükséges betűket. Soknyelvű szövegszerkesztőre annak van szüksége, akinél aránylag gyakran előfordulnak néhány mondattól egy-két oldalig terjedő hosszúságú szövegrészek mindenféle nyelveken. Elég hosszúak ahhoz, hogy a szimbólumtáblában való keresgélés idegtépővé váljon, de nem elég hosszúak, nem elég gyakoriak és/vagy nem elég fontosak ahhoz, hogy az illető elgondolkodjon az adott nyelvhez való szövegszerkesztő beszerzésén – különösen ha a nyelvek túl sokan vannak, tehát túl sokféle szövegszerkesztőt kellene tartania.

Nézzük meg, mi kell ahhoz, hogy egy szövegszerkesztőt csakugyan soknyelvűnek mondhassunk, azt állíthassuk róla, hogy támogatja a világ nyelveit.
  Először is: szabadon definiálható kiosztások. Az előregyártott billentyűzetek nem elegendőek, mert a felhasználónak esetleg nem felelnek meg. Előfordulhat, hogy a programba beépített magyar kiosztások valakinek nem jók, itt vagyok például én, aki másmilyet használok, mint a legtöbb magyar számítógép-felhasználó, és túl gyorsan, beidegzetten írok ahhoz, hogy átálljak más kiosztásra. Az is megeshet, hogy a kiosztás jó ugyan, de kellene még egy-két speciális jel, például € vagy §, netán az è betű, mert Molière-életrajzot ír.
  Másodszor: gyors váltás. A felhasználó gyorsan, kényelmesen akar váltani a különböző kiosztások között, ami azt jelenti, hogy saját maga akarja eldönteni, hogy melyik kiosztást milyen billentyűkombinációval akarja elérni. Nem akar hosszú listákat, amikből ki kell keresgélni azt az egy darabot, amire szüksége van. „Ha megnyomom a Tabot, kapcsolj vietnamira – ha megint megnyomom, kapcsolj magyarra.” A felhasználó nem azt akarja, hogy a szövegszerkesztője minden elképzelhetőt tudjon, hanem azt, hogy ami neki kell, azt gyorsan tudja. Amikor kiválogatja, hogy mit kell gyorsan tudni, akkor jöhetnek a hosszú listák meg minden elképzelhetőre fölkészített párbeszédablakok.
  Harmadszor: nyelvi támogatás. Az már bonyolultabb kérdés, hogy ez mit takar; nyelvenként változó. Állapodjunk meg abban, hogy a helyesírás-ellenőrzést és a program feliratainak lefordítását nem említem külön, ezeket vagy megvalósítják, vagy nem, általában nélkülözhetőek ahhoz, hogy az adott nyelven írhassunk. (Természetesen ha vannak, akkor is csak kívánságra szabad bekapcsolódniuk; a második legborzasztóbb gondolat, amit el tudok képzelni, az, hogy csak úgy tudjak leírni pár sort vietnamiul, ha a program összes menüparancsát és nyomógombját vietnami feliratúra kapcsolom. A legborzasztóbb gondolat pedig az, hogy egy program esetleg nem enged klallamul írni engemet, mert a menük nincsenek lefordítva klallamra!)
  Még a helyesírás-ellenőrzésről annyit, hogy ez egy kicsit ütközik egy másik elvvel, nevezetesen azzal, hogy nem nyelvet akarunk változtatni, hanem billentyűkiosztást. Teremtett lélek nem fog azzal bíbelődni, hogy egy német szövegben, ami finn idézeteket tartalmaz, oda-vissza kapcsolgasson a német és a finn kiosztás között, amikor a német billentyűzettel a finnt is hiánytalanul le lehet írni. (A némethez ä, ö, ü és ß betű kell, a finnhez csak ä és ö.) Így viszont a helyesírás-ellenőrző teljes joggal ki fog akadni, mert ő nem tudja, hogy melyik szöveg milyen nyelven van. Akinek ez fontos, annak rendelkezésére kell bocsátani az eszközöket, hogy megjelölhesse a szöveg részeinek nyelvét. De el tudok képzelni olyan szövegszerkesztőt is, aminek a helyesírás-ellenőrzője több szótárat is tud kezelni egyszerre, ilyenformán: „Ellenőrizz a német szótárral. Ha abban nem találod a szót, ellenőrizz a finnel. Ha abban sem, akkor kiabálj.”

A legkevesebb munka a latin betűs nyelvekhez kell. Itt csak annyi feladat van, hogy a billentyűzetet kiegészítsük a szükséges ékezetes betűkkel és egyéb jelekkel (például valamely ország pénzjelével, a spanyolhoz a ¿ és ¡ jellel, jogi szöveghez § jellel stb.). Vannak viszont országok, ahol a hivatalos billentyűzet különlegességeket is tartalmaz (és a hivatalos billentyűzetet célszerű ismerni, mert rengeteg felhasználó azt szokta meg). Mint például a lett, amit föntebb láttunk: teljesen eltér a QWERTY kiosztástól. A német és a magyar QWERTZ-t használ, a francia AZERTY-t. Nem szabad a felhasználót arra kényszeríteni, hogy AZERTY billentyűzetre kapcsoljon ahhoz, hogy le tudja írni a François Charrière nevet, de megfosztani se szabad a lehetőségtől, hogy megtegye, ha akarja.
  A franciák, a csehek és több más nép felhasználói kedvelik a döglött billentyűket, amikor az ember megnyom egy billentyűt, mire nem történik semmi, aztán megnyom egy betűt, és a betű ékezettel jelenik meg. Alternatív változata az, amikor először nyomják meg a betűt és utána az ékezetet. Egy jó szövegszerkesztőnek ezt is tudni kell, persze flexibilisen. Ha ahhoz van kedvem, akár a finn billentyűzetre is tehessek ˋ ékezetet adó döglött billentyűt, ámbár ez a nyelv ilyen ékezetet nem használ, de kit érdekel? Döglött billentyű terén az egyik csúcsot, azt hiszem, a myKbd tartja, ahol a Cycle billentyű úgy működik, hogy egyrészt lehet karaktersorozatokat definiálni, mint például uúüűūûùůŭųũủụưǔȕȗṳṵṷ (persze nem valószínű, hogy ezek mind meglegyenek egyugyanazon fontban), és ha a szövegben a sorozat bármelyik karaktere után megnyomjuk a Cycle-t, akkor a következő karaktert kapjuk helyette, újabb nyomásra az azután következőt stb. Másrészt pedig meg lehet csinálni, hogy bármely karakterre rádefiniálunk egy makrót, amit szintén úgy kapunk meg, hogy a karakter után megnyomjuk a Cycle-t, és végrehajtódik a makró. Ezt azért már elég nehéz überolni a döglött billentyű fogalomkörén belül.
  Fontos még, hogy némely nyelvek egyszerre több ékezetet is rátesznek ugyanarra a betűre (lásd a vietnami példát), így olyan sok betűjük lesz, hogy a döglött billentyűknek esetleg ékezetes betűből kell „még ékezetesebb” betűt csinálni. A vietnamiak például a különböző beszédhangokat jelölő â, ă, ê, ô, ơ és ư betűket önállóan fölteszik a billentyűzetre, a zenei hangsúlyokat jelölő ˊ ˋ ˜ ̉   ̣ ékezetek pedig döglött billentyűkkel kerülhetnek akár ékezetes, akár sima betűkre. De lehet, hogy például egy joruba billentyűzeten a kétféle hangsúlyjelet (ˊ ˋ) is döglött billentyű csinálná, meg a   ̣ ékezetet is, ami más hangot csinál egyes betűkből. (A LanguageGeek.com két joruba billentyűzete közül az egyik pontosan ilyen, a másik „vietnami módra” minden alsó pontos betűt külön tartalmaz, csak a hangsúlyjeleseket „dögleszti”.)
  Maradva még egy percig a döglött billentyűk társaságában, érdekes lehet, hogy miképpen írhatnánk döglött billentyűk segítségével magyarul. Ez nem annyira képtelenség, mint látszik, akadtak már ilyen megoldások a történelemben. S bármikor szükség lehet ilyenre, ha például olyan munkán dolgozunk, ami túlnyomórészt idegen nyelven van, olyanon, ami jó néhány ékezetes betűt használ, tehát nem marad hely a magyar betűknek, de a szöveg elég sok magyar szót is tartalmaz.
  Az első megoldás az, hogy a háromféle ékezet három döglött billentyűt kap, tehát á = a + ˊ, ö = o +  ̈, ő = o +  ̋.
  Második megoldás: a kétféle vesszőt összevonjuk, á = a + ˊ és ő = ö + ˊ, és egy másik döglött billentyű szolgál az  ̈ ékezetre. Tehát ö = o +  ̈, vagyis ő = o +  ̈ + ˊ.
  Harmadik megoldás: egyetlen döglött billentyűvel, ami első lenyomásra vesszőt ad, másodikra két pontot, harmadikra két vesszőt.

A latin ábécéhez még érdemes megjegyezni, hogy nagyon sokszor lenne szükség valamilyen írás (például dévanagári) és a latin betűs átírás könnyű elérésére egyszerre. A legtöbb szövegszerkesztő azt tudja, hogy lehet írni például dévanagárival, és persze lehet írni angolul, plusz akármilyen betűt ki lehet keresgélni a Unicode-táblázatból. Ez így azért nem az igazi. Egy komoly programban egy gombnyomással lehetne váltani az eredeti írás és az átírás között, sőt nyilván ugyanazt a hangot ugyanazon a billentyűn találnánk meg mindkét esetben, és szövegrészeket automatikusan lehetne ide-oda konvertálni a két módszer között (már amennyire az adott írásrendszerben ez egyértelműen megoldható).

Lépjünk tovább. A cirill, örmény, grúz stb. ábécéknek nincsen olyan jellegzetessége, ami különösebben megdolgoztatná a szoftverfejlesztőket. Esetleg néhol jól jönnek a döglött billentyűk, például orosz nyelvtankönyvhöz, ahol hangsúlyjeleket használnak, és szükség lehet „páncirill” kiosztásokra, ahol több cirill betűs nyelv betűi szerepelnek. Nekem például valaha volt egy olyan kiosztásom, ami Alttal hozta a szerb, macedón, óegyházi szláv stb. betűket (ez WordPerfect 5.1 alatt volt, ahol az urál-altaji és kaukázusi kisebbségi nyelvek cirill betűi nem voltak raktáron), eredendően pedig „oroszosított bolgár” volt, vagyis olyan kiosztás, amivel oroszul is lehetett írni, de bolgárul könnyebben, mert az ъ betű frekventált helyen volt, a ё, э és ы betűk viszont kint a széleken. Akkoriban ugyanis főleg bolgárul dolgoztam, oroszul nem annyira.

A görögnél is jól jöhetnek a döglött billentyűk, az ógörögnél pláne. Hétféle ékezet, amikből három is rákerülhet egyetlen betűre! Néhány közülük: ᾄ ᾂ ᾅ ᾃ ᾆ ᾇ. A gyakorlatban ezt hét döglött billentyűvel oldják meg, amik egy-egy ékezetet adnak, de persze meg lehet csinálni azt is, hogy a gyakoribb kettes-hármas kombinációkat külön döglött billentyűre teszik (vagy akár a gyakoribb ékezetes betűket).

Egyes felhasználásoknál előfordulhat, hogy túl sok a ritka karakter, amiket csak mindenféle Ctrl-Alt-Shift kombinációkkal lehetne elhelyezni a billentyűzeten, és nehéz megjegyezni, hogy mi hol van. Ilyenkor célszerű lehet, ha a Word-féle szimbólumbeszúró ablak célorientált változatát kínálja a program. A legnagyobb „karakterfogyasztók” a nyelvészek, némely dokumentumaikban rengetegféle fonetikus jel fordul elő; ők leginkább olyan megoldásokat tudnak használni, ahol a gyakori jelek és ékezetek rajta vannak a billentyűzeten, a ritkábbakat Alttal és hasonlókkal lehet elérni, a még ritkábbakat pedig kívánságra megjelenő ablakokban találják meg; olyan ablakokban, amik csak a szükséges jeleket tartalmazzák és mást nem.

Lássunk most már olyan írásokat, amik jobban megdolgoztatják a fejlesztőket. Aránylag egyszerű eset a héber: „csak” a jobbról balra haladó írás támogatását kell beépíteni, és máris megvan minden, ami kell. Persze a bibliai héberhez sok döglött billentyű kell.
  Az arabnál is kell a jobbról balra haladás, valamint a betűkötés. Így írnak az arabok címen kétrészes cikkben mutattam be nemrég az arab írást; billentyűzet szempontjából természetesen úgy kell működnie, hogy ﻫ ﻬ ﻪ ﻩ egy és ugyanazon billentyű (például a H), és a program magától tudja, hogy mikor melyik formát kell használni. A szabályok nem bonyolultak, csak kell ugye egy programrész, ami alkalmazza őket. A nálunk kevéssé ismert arab szövegszerkesztők ezt természetesen tudják. Viszont nem tudják azt a rengetegféle ékezetet és speciális jelet, amit az arab írást használó nyelvek sokasága alkalmaz; a perzsa szövegszerkesztők persze tudják azt, ami a perzsa nyelvhez kell, de nem tudják, ami az urduhoz stb.

A következő problémás csoport a bráhmi íráscsalád. A dévanagáriról háromrészes cikket közöltünk nemrégiben (első, második, harmadik rész), ott bemutattuk a ligatúrák, magánhangzók és más nyalánkságok problémáját. Ezt a programok általában nem tudják, csak a speciális dévanagári szövegszerkesztők, amikkel viszont nemigen lehet egy magyar nyelvű idézetet beszúrni a szövegbe.
  A bráhmi íráscsalád egyik nagy problémája, hogy „túl sokan van”. Az idetartozó írásrendszerek névsora a Unicode szerint: dévanagári, bengáli, gurmukhi, gudzsaráti, orijá, tamil, telugu, kannada, malajalám, szingaléz, thai, lao, tibeti, burmai, tagalog, hanunóo, buhid, tagbanwa, khmer, limbu, új tai lue, buginéz, balinéz, sziloti nagri, phagsz-pa. Huszonöt írásrendszer, amik nemcsak a betűk formájában különböznek, hanem a ligatúrák, magánhangzójelek és ékezetek számában, használatában, képzésének módjában. Ahhoz, hogy a szövegszerkesztőnk csakugyan mindegyiket tudja, mindegyikkel külön-külön kellene foglalkozni; meg kellene nézni, hogy a kódtáblában szereplő karaktereken kívül mik vannak még, azokat hogyan kell előállítani stb., és megcsinálni a szükséges programrészeket. Elég pepecs munka, sok utánjárást igényel, és minél kisebb a kereslet az adott írásrendszert ismerő szövegszerkesztő iránt, annál kevésbé kifizetődő. (A felsorolt írások némelyike már csak történelem, egykori használóik áttértek a latin betűkre.)

Újabb csoport a szótagírások. Ezeknek túl sok jelük van ahhoz, hogy rátegyük őket a billentyűzetre, viszont van egy sajátságuk: a jelek mássalhangzó-magánhangzó párokat alkotnak, így általában egy jelet két billentyűlenyomással leírhatunk. Persze ez nem mindig egyszerű. Az etióp írásnak például harminchat mássalhangzója van, amelyeket darabonként hétféle magánhangzóval lehet kiegészíteni. Egy lehetséges megoldás az, hogy a betűkön és a számokon helyezzük el a mássalhangzókat, amelyek után az írásjelek billentyűin elhelyezett magánhangzókat kell megnyomni, így kapjuk a jelet. A cseroki szótagírásban a jelek száma sokkal kisebb, mindössze 85, így lehet, hogy jobban járunk, ha két csoportra osztjuk őket, egy fontosabb és egy kevésbé fontos csoportra, és az elsőt simán, a másodikat Shifttel rátesszük a betűkre, számokra és írásjelekre. (Hasonló a helyzet a kétféle japán szótagírással is, de ott ez nem elég.)
  Külön megoldást igényel a UCAS, a kanadai indián nyelvek szótagírása, amelynek 630 jele van, de csak akkor kell az összessel foglalkozni, ha egységes UCAS billentyűzetet akarunk, amivel minden nyelven egyformán lehet írni. Az egyes nyelvek számára készített kiosztásokban jóval kevesebb jel kell. A jelek csoportokra oszthatók. A csoport egyes tagjai különböző magánhangzókat képviselnek, és az alapjel elforgatásával, illetve különböző kiegészítő pontokkal, vonalakkal jönnek létre. A teljes UCAS-ban egy-egy csoportnak harminc tagja is lehet (különböző nyelvek más jeleket használnak vagy másképpen használják ugyanazt a jelet), a csoportok száma pedig negyven körül van, plusz még sok kiegészítő jellel is kell foglalkozni.
  Így az egy-egy nyelv számára készítendő kiosztások úgy nézhetnek ki, hogy a mássalhangzókat rátesszük a betűkre, a magánhangzókat pedig döglött billentyűk gyanánt az írásjelekre. Az egységes UCAS billentyűzeten két, három vagy négy gombnyomást is igényelhet egy jel leírása: a betűkön lennének a leggyakoribb mássalhangzók, amikből bizonyos kiegészítő billentyűk állítanák elő a ritkábbakat, ezután jönne a magánhangzót jelölő döglött billentyű és végül, ha kell, a magánhangzó valamilyen változatát létrehozó kiegészítő billentyű. Határozottan érdekes programozástechnikai feladat volna.
  A legnagyobb készlet (nem számítva a koreait, ami végül is nem szótagírás) a ji szótagírásnál van: 1164 jel. Egy szótag három részből áll: a mássalhangzóból, a magánhangzóból és a hangsúlyból. A logikus megoldás itt is az, hogy három gombnyomással alakítsunk ki egy-egy szótagot.

Minden írás közül a legkülönlegesebb feladatot a mongol adja. Szerkezete nem bonyolult, az arabra emlékeztet, amennyiben a betűket össze kell kötni, így választani kell a különféle alakok közül – nem ez a baj. Hanem hogy az egész írás függőlegesen működik! Szó se róla, a kínaiak és a japánok is szeretnek függőlegesen írni, ez a hagyományos, de a mongol írás csak függőlegesen haladhat.
  A függőleges írás – erre a kínainál és japánnál már nem térek vissza – elsősorban azért tűnik megoldhatatlan feladatnak, mert egész beállítottságunk azt mondja, hogy a képernyő egy végtelen hosszú tekercs egy részletét mutatja, és ez a tekercs olvasás közben fölfelé halad. A képernyő alatt és fölött a tekercs hosszú-hosszú szakaszai vannak ott képzeletben, miközben a képernyő bal és jobb széle „kemény”, ott a szöveg megtörik. (Folyószöveget nem lehet word wrap nélkül olvasni, hogy minden sornál balra-jobbra kelljen ugráltatni a képernyőt.) Nos, függőleges írásnál az egészet meg kellene változtatni. A képernyő alsó és felső széle változna „keménnyé”, vagyis a képernyő aljára érő szöveg a következő oszlopban folytatódna, és vízszintessé változna a tekercs, ami bal felé halad, ahogy olvasunk.
  A legnagyobb probléma kétségkívül a kétféle irányú szöveg keverése, amikor a vízszintesen írt szöveg függőleges részleteket is tartalmaz. Erre egyelőre sehol nem láttam megoldást.

Bár a szimbólumok között szerepel, a Braille-írás mégiscsak inkább a nyelvek közé való. Logikus, hogy a mindentudó szövegszerkesztőnek támogatnia kell. Egyrészt lehet csinálni billentyűzeteket, amiken például az L gomb a Braille L betűjét adja, másrészt hasznosítani lehet egy digitális Braille-írógépet, ahol bármilyen pontkombinációt beállíthatunk, és megjelenik a karakter.

A kínai, japán és koreai szövegszerkesztők töméntelen kifinomult szolgáltatást tudnak, ötletekből tehát nincs hiány. Csak fel kell használni őket. A mindentudó szövegszerkesztő természetesen mindent tud, amit ezeknél az írásoknál hasznosítani lehet: a japán szöveget kifejezésenként dolgozza fel és alakítja kandzsikká és kana szótagokká; a kínaihoz mindenféle beviteli módszereket kínál, mint például a ceruzás bevitelt.

Egy minden nyelven tudó szövegszerkesztőben persze nemcsak a nyelvek támogatása várható el. A Unicode tekintélyes készletet tartalmaz különféle szimbólumokból. Akad köztük, amelyiket könnyen elérhetővé kell tenni bizonyos nyelveknél (például a spanyolnál a ¿ és ¡ jelet), másokat elég, ha táblázatból kiválasztóvá teszünk.
  A matematika, fizika, kémia képletei is felérnek egy nyelvvel. A Wordnek és néhány (nem sok) más szövegszerkesztőnek van képletszerkesztője is, ez tehát már létező technika – a minden nyelven tudó szövegszerkesztőben nyilvánvalóan benne kell hogy legyen. A Unicode mindenféle szimbólumai ötletet adnak olyasmire, mint hogy A betűből egy gombnyomással Ⓐ betűt lehessen csinálni és hasonlókra. Valaha régen, a karaktergrafikus képernyők korában voltak programok, amikben a felhasználó vízszintes és függőleges vonalakkal rajzolgathatott – ezek a karakterek ma is megvannak a Unicode-ban, esetleg lehetne hasznosítani őket, meg persze a sok-sok más grafikus célú jelet.
  El tudom képzelni azt is, hogy egy igazán mindentudó szövegszerkesztő még a Unicode sakkfiguráit is tudja rendeltetésszerűen használni: kis táblát rajzol, amin elhelyezhetjük a figurákat, a sakk-könyvek szerzői imádnák.

Természetesen a minden azt jelenti, hogy nem állunk meg az egyelőre technikai határnak tűnő U+FFFF kódszámnál, és a további kódtartományokat is felhasználjuk. Már vannak fontok, amik tartalmaznak idevalósi karaktereket is, de a szövegszerkesztők még nem készültek fel rájuk. Ideje változtatni ezen. Akkor lesz mindenféle ókori írásunk, deseret, oszmán ábécénk, kharosthi (a huszonhatodik bráhmi írás, amit kódbeli helye miatt nem említettem), lesznek kottajeleink, amikhez majd írhatunk kottaszerkesztőt (bizáncit és modernt is), körülbelül negyvenháromezer pótlólagos kínai írásjegyre teszünk szert, nem is beszélve a Unicode később létrehozandó bővítéseiről.

S végül, de nem utolsósorban egy mindentudó szövegszerkesztőből nem illene kihagyni a Unicode-ban Alphabetic Presentation Forms néven definiált jeleket, amilyen a fi ligatúra – amikkel szebbé lehetne tenni az írást, de soha nem használják őket. Pedig a keresőalgoritmusokat be lehetne tanítani arra, hogy így is megtalálják a szavakat.

Nagyjából ennyi az, amit meg lehetne tanítani egy szövegszerkesztőnek, és máris tudna a világ minden nyelvén. Ha ráadásul még tudja mindazt, amit a Word kategóriájú szövegszerkesztők, mindenféle platformon elszalad és minden file-formátummal táplálkozik, akkor már nemigen kell helyette semmi más.


Láng Attila D., 2008.1.26.

arab billentyűzet görög horvát írások kínai lett nyelvek orosz Palm spanyol számtech vietnami

Rondák vagyunkMegfontol

Hozzászólások

Hozzászólás írása. Wikiszintaxis használható: