Tema: Re: xml excel koduote
Autorius: valytojas
Data: 2017-07-11 22:41:52
Kažkada dar winXP laikais vargau su keliasdešimt xml failų kuriuose kartais 
buvo/kartais ne - lietuvybė, kai kurie simboliai išdarkyti ir pan..

Radau dėsningumus, kad skirdavosi xml header'io encodin'gas pvz. <?xml 
version="1.0" encoding="UTF-16" standalone="no"?>
Suvienodinau encodin'gus, išsaugojau su notepad kelis failus problema 
pradėjo spręstis, bet po kurio laiko pastebėjau, kad vėl kažkas "sujoja" 
tuos failus ir encoding'o header'is nevisada turi įtakos, reikia tik 
persaugoti iš naujo su notepad pasirinktu encoding'u ir vėl viskas būdavo 
gerai..

Kadangi failai buvo pasharinti lokaliam tinkle, kažkas juos 
paskanuodavo/indeksuodavo ar kokį kitą š.. darydavo, bet sugadindavo, 
padėjus failus lokaliam diske sutvarkius persaugojus tinkamu encoding'u visi 
failai patapo tvarkingais ir nebesusigadindavo.

"Pilius"  wrote in message news:ok2q5k$vgl$1@trimpas.omnitel.net...

Labas.

Turiu kelis tūkstančius failų iš kažkokios programos. XML failuose didžioji
dalis lietuviškų simbolių, EUR ženklas ir kas nors dar žymimi &#...
triženkliais kodais. Kiek radau xml faile normaliai atvaizduojamų ąčęė...
pakeičiau į normalias raides acee raides.

Patarkite ką daryti su likusiais simboliaisi, kurie xml faile per notepad++
atvaizduojami &#240, o excel rodo šitaip varþtu iðgreþimas - varžtų
išgrežimas. Pastebėjau, kad ą ir Ą turi skirtingus kodus, tai galėčiau
tekste ieškoti žodžiuose kaip atrodo išdarkyti simboliai ir juos per paiešką
pakeisti, bet dideli šansai praleisti kitus užkoduotus simbolius

Gal yra koks geresnis būdas?