Tema: Re: Lietuvisku garsu tarimas(transkripcija) ispaniskai
Autorius: IF
Data: 2010-08-25 10:00:39
Aciu :), bet man gal reiketu tikslesniu algoritmu, nors kazin ar ispanu 
kalboje pasiteisins. Trumpai paaiskinsiu kam man to reikia. Iskilo reikalas 
priversti tam tikra programine iranga kalbeti lietuviskai. Vadinama
talk(spech) from text , arba lietuviskai kalbos sintezes technologija. Beje 
pakenciam lygi ji isiuta i Microsoft kartos praktiskai visas operacines 
sistemas, bet tik populiariausiomis pasaulio kalbomis. Pradejau nagrinetis o 
kaip su siu technologija Lietuvos padangeje, ir visiskai tiesa pasakius 
susipainiojau. Truputi gal papasakosiu trumpai apie pacia technologija. Tiek 
programine iranga, tiek technologija pasauli senai isvystyta ir nieko kurti 
nebereikia. Kazkodel
Lietuvos padangeje vis kalbama apie kazkokios tai ipatingos programines 
irangos sia linkme kurima. Visa esme siai technologijai sudaro garsu duomenu 
baze, kuria kuria ne informatikai o kalbininkai. Microsoftas beje yra 
sukures pilna siam darbui atlikti programine iranga ir smulku aprasyma kaip 
kurti garsu duomenu bazes siai technologijai.  Ir kuo ji didesne ir 
tikslesne, tuo bus geresne tarimo kokybe tam tikra kalba. Mano ziniomis 
anksciau Lietuva siusdavo po dvi studentes, jei atmintis neapgauna is VU 
mokytis ir siai garsu bazei vystyti. Kiek si garsu baze isvystyta ir kas 
padaryta valstybiniame lygmeni neaisku. Bet staiga Lietuviska padange isvydo 
komercinis projektas garsieji Gintaras ir Aistis. Sukurti lietuviu LASS 
uzsakymu, ceku firmos Rosasoft. 
http://www.text-talk.com/lt/kalbos-sinteze.html . Man neaisku kodel 
panaudota labai brangi JAWS aplinka, ir kiek i si produkta "nukeliavo" musu 
valstybes investuota Lietuvisku garsu baze. Bet produkto savininkai, beje i 
kuri didziausias nuosavybes teises turi tas pats Rosasoft o ne lietuviai, 
teigia kad visas projektas tai ju asmenine nuosavybe. Gal taip ir yra, bet 
Lietuvisku informaciniu duomenu nutekejimas i privacijas strukturas, kur 
siek tiek pakeitus ju profili ar formata, staiga tampa kazkieno nuosavybe, 
daznas reiskinys. Taigi kol kas norint panaudoti Aiscio ar Gintaro tarima, 
reikia isigyti brangia JAWS programine iranga, kuri reikalinga tik 
neregiams, ir priedo ceku wintalker programa adaptuota Lietuvai. Kas mano 
galva nera tikslinga, nes kaip minejau pati garsu tarimo technologija yra 
"isiuta" praktiskai i visas Microsoft operacines sistemas, tik jai reikejo 
pritaikyti Lietuvisku garsu duomenu baze. Idomus pagyrunas ir mineto 
lietuvisko tinklapio kurejas, kai save pristato vos ne kaip visos siame 
tinklapi populiarinamos programines irangos kureju :). Nei jis kure 
programine iranga nei Lietuviska duomenu baze, elementariausiai tik adaptavo 
web interfeisa :). Tai cia tiek butu apie Aicio ir Gintaro peripetijas. Bet 
tuom kalbos sintezes nuotykiai Lietuvos padangeje nesibaigia. Toliau cituoju 
apie dar viena valstybini projekta siai
technologijai vystyti :
__________________________________________________________________________________________________________________________________________
Sio projekto veiklos is tikruju kazkiek susijusios su regejimo 
neigaliaisiais, taciau projekta iniciavo ir vykdo ne LASS. Projekto 
svetaineje www.bibliotekospazangai.lt informuojama, kad si projekta 
igyvendina Lietuvos Respublikos Kulturos ministerija ir Nacionaline Martyno 
Mazvydo biblioteka. Projekto veiklos vykdomos 2008-2012 metais. Lesu 
projektui igyvendinti skiria Billo ir Melindos Gatesu fondas (35,7 mln. 
litu), Lietuvos Respublikos Vyriausybe (14,7 mln. litu) ir bendrove 
"Microsoft", padovanojusi naujausios programines irangos uz 31 mln. litu, 
taip pat - vietos savivaldybes (10,7 mln. litu). LASS su siuo projektu 
neturi nieko bendro, isskyrus tai, kad LASS atstovai dalyvavo tiesioginese 
transliacijose (kaip geriausiai i vartotoju klausimus galintys atsakyti 
specialistai).
Apskritai neigalieji, tarp ju - ir neregiai, yra labai "patogi" visuomenes 
grupe visiems, kas tik nori rengti projektus ir kazkiek is ju uzdirbti. 
Todel labai daznai tokie projektai (dazniausiai mazesnio masto, nei 
"Bibliotekos pazangai") rengiami ir vykdomi be neigaliuju asociaciju zinios, 
gerai neisigilinus i neigaliu zmoniu poreikius.
___________________________________________________________________________________________________________________________________________________________________________________________
 Va cia man dar keisciau pasidare. Uz 60 mln Lt, priedo dar uz 31 mln 
dovanota programine iranga, mano akimis Lietuviska kalbos sintezes duomenu 
baze turetu blizgete blizgeti. Kazkodel siame projekte vel kalbama apie 
programines irangos
neregiams kurima, kai turiu pasikartoti kad pacios programines irangos kurti 
nera reikalo, senai sukurta kuria gali naudotis ir neregiai, o reikia 
pritaikyti tik lietuvisku garsu duomenu baze. As kaip suprantu pati 
technologija kaip ir turetu buti bendras
visos musu valstybes turtas, bet idomu ar nebus taip, kad kaip daznai buna, 
brangus projektas nugramzdinamas i uzmarsti, ir staiga isdygsta naujas 
komercinis produktas. Kaip bebuve sumeles apvalios, kada galima bus ir kokiu 
budu naudotis sio projekto vaisiais neaisku.
_________________________________________________________________________________________________________________________________________________________________

Taigi lieka kol kas naudotis tai kas yra. Tai yra bandyti priversti kalbeti 
lietuviskai kitu kalbos sintezes technologijas. Kol kas arciausiai tiesos 
gavau naudojant rusu kalbos sinteze, kuri taip pat yra operacineje sistemoje 
ir visiskai nemokama. Tai yra ieina i Microsoft operacines sistemos 
lizencijos kaina.  Tai yra automatiskai konvertuoti i lietuviska teksta i 
rusiskas Ö Ź Ć , nesudaro problemu. Priedo pries balses paversti lietuviska 
i , i miagkij znak rusiska. Bet bandau ir kitas kalbas, gal kas zinote is 
populiaresniu kuri butu gimininga lietuviu. Bandziau pagal duota pavyzduka 
ispanu-lietuviu transkripcija , bet kokybe gavosi labai prasta lyginant su 
rusu.  Jei kam idomu pateikiu Aiscio ir mano isgauta lietuviskos kalbos 
sintezes pavyzdukus.
Aisku mano kokybe stipriai nusileidzia, bet jai sugaisau laiko tik valanda 
ir nuli lesu :). Tai klausimas butu gal kas zinote kitu populiariu kalbu - 
giminingu lietuviu  pagal tarima :)