Hirtelen jöttem rá, hogy a Ninda-programomban nincsen teljesszövegű keresés, ami pedig kellene, mert a negyedik résznél tartok és mindegyik rész külön dokumentum, vagyis valamit az egész szövegben megkeresni az négy művelet. Úgyhogy megírtam. Nagyon megszenvedtem ezzel is, de csoda cuki lett.
Ez egy részlet a szindor hosszú dupla zenei hangsúlyos magánhangzókra való keresésből, ami valójában nem ilyen előkelően néz ki, csak szimplán ([aeiouwy])\1 regexp nyelven, vagyis a hétféle szindor magánhangzóra keresünk rá megduplázva. Így persze kiad olyan szavakat is, mint odaad, beleegyezik. Igen, mert a keresés nem egészen Unicode-kompatibilis, konkrétan a preg_match_all
nem képes a PREG_OFFSET_CAPTURE
-rel karakteroffszeteket visszaadni, csak byte-offszeteket, és ezért nekem a könyv szövegét is meg a keresőkifejezést is le kell konvertálnom ékezet nélkülivé, de úgy ám, hogy a szöveg hossza ne változzon, mert különben szétesik az egész. Ezért ékezetérzéketlenül kell keresnünk, de ennek is van előnye. A gyakrabban előforduló szindor neveket már tudom kívülről, de például hogy hogy hívják Åmmaĩt barátnőjét, mármint pontosan milyen ékezetekkel, azt nem. Vagy ha igen, akkor az ékezetérzéketlen kereséssel tudom ellenőrizni, hogy mindenhol jó ékezeteket használtam-e.
Utóirat. Juszt is megoldottam egy órán belül, de megtartottam a kettős funkciót a kapcsolóval.