Tema: Re: Lrf koduote
Autorius: saimhe
Data: 2011-12-21 00:23:55
> isvertus i mobi ner lietuvisku raidziu. Bandziau ivairiai konvertuot, epub, html ir 
> zaist koduotem

   Originale ju ir nera. Pavyzdziui, HTML:

Didi epocha gimdo didţius ţmones. Pasauly daug kukliř didvyriř

   Sitai gaunasi, kai proto bokstai atsidaro pradini neunikodini teksta lyg
turinti cp1250 koduote, nors ten cp1257, ir issaugo kaip unikoda.


   1. Dabar padoriausias kelias yra search&replace. Patogumas tas, kad visame
<body /> unikodo nera. Jei keisi "&#355" i "z", nebus konflikto su tenai jau
galincia buti "z", ir taip toliau. Priesingu atveju dar reiketu gerai pasukti
galva, kokia eiles tvarka sukeitineti.
   Keisti reikia softe, kuris HTML nesupranta. Nezinau garantuoto recepto wordui,
kad atidarytu HTML kaip plika teksta. Bet jis patogus tuo, kad ten yra makrosai.
Stai gabalas vieno mano makroso, nesunkiai pritaikytum:

Sub EbookReformat()
    With Selection.Find
        .ClearFormatting
        .Wrap = Word.WdFindWrap.wdFindContinue
        .Forward = True
        
        Do
            .Execute Replace:=wdReplaceAll, FindText:="^p^p^p", ReplaceWith:="^p^p"
        Loop While .Found

        Do
            .Execute Replace:=wdReplaceAll, FindText:="^p ", ReplaceWith:="^p"
        Loop While .Found

        '(...)

    End With
End Sub


   2. Jei paveiksliukai nereikalingi, tada pakanka ir wordo. Atsidarom kaip HTML.
Save As, Plain Text. Tada pareiks, kad va sitie simboliai nebus issaugoti.
Nurodom koduote Central European (Windows). Gausis tekstas, kuris is tiesu yra
Baltic (Windows).
   O gal nafig ji. Vietomis nepagristai sulauzo eilutes.

-- 
  saimhe