Sveiki,
noreciau nuskaityti XML faila (tei p5 formatu) ir susidet ji i db.
Esme, kad ten yra rislus tekstas, bet kiekvienas zodis morfologiskai
suzymetas, skyrybos zenklai ir tarpai tarp <pc></pc> tagu.
Reiktu:
1. Atskirai i lenteles susideti atributu "lemma", "ana" reiksmes, ir pati
zodi.
2. I lentele issisaugoti ir visa sakini.
Kaip pasiulytumet toki varianta realizuot? :)
Siaip radau, kad su $xml = simplexml_load_file("test.xml"); gali pasidaryti
objekta, ir tada gali gauti atributu reiksmes, zodi ir pan. Pvz. su print
$xml->text->body->p->w[1]['lemma']; gautume lemma reiksme "vadovas" ir t.t.
Bet nelabai sugalvoju kaip nusiskaityti sakinius su visais tarpais tarp
zodziu, skyrybos zenklais... Nes sakiniuose <pc></pc> tagu gali but daugiau
nei zodziu, tai nelabai iseina su vienu for ciklu prasisukt:)
Istrauka is XML failo:
....
<text>
<body>
<p>
<w lemma="Kautros" ana="#n">Kautros</w>
<pc> </pc>
<w lemma="vadovas" ana="#dbvdv">vadovai</w>
<pc> </pc>
<w lemma="prisipžinti" ana="#vatsted3">prisipažįsta</w>
<pc>.</pc>
</p>
</body>
</text>
....
Zinoma sakinys gali baigtis ir daugtaskiu, klaustuku, sauktuku..
Dekui.
www.boulingas.net - Boulingo diskusijos.