A fura betűk óriási gyűjteménye

Pár hónapja már ejtettünk néhány szót a Unicode tervezett bővítéseiről, s lám, már meg is van az új változat, egyelőre bétaverzióban. A Unicode 6.0 kis híján száztízezer karaktert definiál, egyre közelebb kerülünk régi álmomhoz, hogy a számítógéppel mindent le lehessen írni.
  Két és fél éve felsoroltam huszonhat bráhmi írásrendszert, azóta további tizenöttel bővült a készlet: tai le, tai tham, szundanéz, batak, lepcsa, liszu, szaurastra, kajah li, redzsang, jávai, csam, tai viet, mítei majek, bráhmi, kaithi. Némelyikről még én se hallottam, pedig hát nyelvmániás vagyok.
  
  
  Nyelvmániásoknak a Unicode-táblázat kötelező olvasmány. A hatosban már olyan írásokat találunk, mint a szamaritánus az ókori Izraelből, a manda Mezopotámiából (és egy sor más írás azokból az időkből), az ol csiki Indiából (egy huszadik századi betűírás a szantali nyelv számára), a glagol a szláv középkorból, a vai szótagírás Libériából (nagyon szép jelekkel), a bamum szótagírás Kamerunból, ékírások, egyiptomi hieroglifák… Persze nem mind fog a hatosban bekerülni, egy részük már egy-két verzióval korábban is megvolt, de hát most nem egy what’s new leltárat írok.
  A bővítések is érdekesek. Kedvenc csoportom, Latin Extended–B kapott néhány betűt, többek között a SENĆOŦEN ábécé számára; nem kiabálok, ez egy olyan latin betűs ábécé, ami nem használ kisbetűket, az egy szem s kivételével, de az is csak egy végződésben fordul elő. A szelis nyelvcsalád egyik nyelve Washington állam és Brit-Kolumbia határán, húsz beszélőt tartanak számon.
  A Cyrillic Supplement remek hanti, mordvin, abház betűket kapott, de már van egy Cyrillic Extended–A is, felső indexbe tett betűkkel az óegyházi szláv számára. És persze van Extended–B, ócirill, óabház, a korábban is meglevő ócirill betűk változatai, nagyon klassz dolgok. De érdekes módon még mindig nincs hangsúlyjeles cirill; majd az Extended–C-ben vagy D-ben. Jópofa bővítések vannak az etiópban és a UCAS-ban is. Új fonetikai jelek is vannak, de sajnos a TESZ-ben használatos uralisztikai készlet még mindig hiányzik.
  A CJK-t is mindig bővítik, de most mást is tettek: átrendezték a táblázatokat. Most egy-egy írásjegyből három-négy glyphet is bemutat a dokumentáció.

Lássuk a szimbólumokat. Új pénzjelek vannak, még spesmilo is, ami egy eszperantista pénz volt egy évszázaddal ezelőtt és én eszperantista létemre se hallottam róla. Új Letterlike Symbols, a számok között külön nulla harmad közönséges tört, mert a baseballban ilyet is használnak. (Nagy probléma a Unicode-ban, hogy sok minden nincs előre eltervezve. Ha tervezve lennének, akkor például a törtjelek is folyamatosan haladnának nulla kettedtől kilenc kilencedig vagy ameddig a szakemberek jónak látják, és egyetlen egységes blokkot képeznének.) Rendszeresen bővítik a matematikai jelek és a részben szintén matematikai célú nyilak készletét is.
  A Miscellaneous Symbols blokk most már rengeteg mindent tartalmaz. Időjárási és asztrológiai jelek, nemzetközi és japán sakk, különféle mutató kezek, veszélyt jelző jelek, vallási és politikai jelek, I Ching-trigramok, emotikonok, kártyajelek, újrahasznosítási jelek, dobókockák, gójelek, szótári és térképjelek, nemi kapcsolatok jelei, dámabábuk, közlekedési jelek. Ennek talán az utolsó harmada tartozik az új bővítésekhez, de nagyon praktikusak. Van egy Miscellaneous Symbols and Pictographs, az előbbiek bővítéseivel, földgömbökkel, holdfázisokkal, növények, állatok, ünnepi kellékek, játékok, hangszerek, épületek, állatok, kézjelek, ruhák, emberek, tündérmesék, szívek, képregények, irodaszerek, távközlési eszközök, grafikus felhasználói felületek, szerszámok rajzaival, valamint óraszámlapokkal minden egész és fél óráról. Ezek nagyon népszerűek lehetnek, ha majd bekerülnek a fontokba.
  Akárcsak az emotikonok, amik most már külön blokkot kaptak, nem is kis választékban. Még macskafejek és kézjelek is vannak köztük. Külön blokkban vannak a közlekedési piktogramok, egy másikban az alkimisták szimbólumai.
  Született egy kis blokk Supplemental Punctuation néven, ógörög bibliai szövegek szerkesztésénél használatos jelekkel. Egyszer közreműködtem egy ilyen célú alkalmazásnál, akkor nagyon jól jött volna, ha ezek már szabványosítva vannak.
  Külön blokkot kaptak a madzsong- és a dominókövek, utóbbiak érdekes módon csak hat pontig, pedig kilencig is mehetnének. A francia kártya teljes lapkészlete is megvan egy blokkban, kétféle dzsókerrel.

El lehet gondolkodni, mi jöhet még. Hát mindenekelőtt amit már javasoltak, ugye. A bráhmi családból tizenhárom írás: az áhom, a nepáli, a nevari, a sziddham, a tulu, a limbu, a leke, a szorang szompeng, a khodzski, a csakma, a takri, a miao és a sarada. Ábécék: a kurd jezidi, az ópermi, az óarámi, a manicheus, a balti (a kasmíri Baltisztánból) és a székely rovásírás. A kínai eredetű szótagírások közül a nahszi geba és a nüsu, egyéb szótagírások közül a woleai, a loma, a mende és a hmong. Kép- és fogalomírások: a Húsvét-szigetről a rongorongo, az Indus-völgyi, az anatóliai, a tangut, a nahszi dongba, a dzsürcsen, a meroita hieroglifikus és kurzív, a lineáris–A és a modern fejlesztésű Bliss-fogalomírás. A Shaw-gyorsírás.
  És van olyan javaslat, hogy az összes netes ccTLD-t kódolják le egy-egy előregyártott jellel, amik rendereléskor kis nemzeti zászlókká változhatnak.
  A következő kérdés az, hogy mi lesz, ha minden valaha használt írásrendszer bekerül a Unicode-ba.


  

»»»»»»