Tema: Re: Html failo parsinimas
Autorius: Rimantas Liubertas
Data: 2010-06-21 13:21:28
> Na gerai, koduotės šiaip yra vienodos - windows-1257, bet kažkodėl jei
> spausdinu iš DOM reikšmę, man rodo su hieroglifais. Tą ir noriu
> išsiaiškinti. Kodėl Spausdinant parsiųstą failą ir to failo reikšmę per
> DOM skiriasi koduotės?

Nes tas DOM yra kreivas ir duotam tekste neradęs <meta…> su nurodyta 
koduote, galvoja, kad ten latin-1.

Gali pamėginti vietoj

	$dom->loadHTML($html_data);

panaudoti

	$dom->loadHTML('<meta http-equiv="Content-Type" content="text/html; 
charset=Windows-1257">' . $html_data);

Negražu, bet turi suveikti.

Taip pat reikia nepamiršti, kad tai ką tu gauni IŠ DOM (su nodeValue)
jau bus UTF-8 koduotėj. Jei reikia iš DOM gautą tekstą pateikti kitokia 
koduote — teks konvertuoti.


ic
--
http://rimantas.com/