Tema: Re: ebook txt išsaugotos su ANSI kaip lengviau padaryt kad butu Unikode formate? knygų labai daug
Autorius: saimhe
Data: 2010-06-26 13:39:54
> parsisiųsta ~ 5 000 knygų rusų kalboje txt formatas išsaugotas su ANSI o reik, kad
> būtų unikode formatas, knygų šitokia krūvą po vieną perdarinėt į unikode formatą nusibos.

  http://gnuwin32.sourceforge.net/packages/libiconv.htm, tada (pvz.):

iconv.exe -f cp1251 -t utf-8 bookas.txt > naujasbookas.txt

  Seniau vietoje "cp1251" rusai mėgdavo "koi8-r". Tada visvien rodys šiukšles.
Vienintelis patikrinimas -- atidarant su notepadu, įsitikinti, ar įskaitoma.
  Tegul taip nėra, tada štai tokiu būdu sukonvertuotų visus iškart:

for /f "usebackq delims=" %f in (`dir /b /s *.txt`) do iconv.exe -f cp1251 -t utf-8 %f > "%~dpf__%~nxf"

-- einamajame kataloge ir giliau ras visus .txt failus, naujas failas atsiras
šalia senojo, vardo pradžioje bus "__". Verta prieš tai viską nusikopijuoti
į atskirą katalogą.

-- 
  saimhe