Tema: Re: OCR
Autorius: Justas.p
Data: 2010-03-14 20:42:27
Pas mus buvo taip, kad pradiniai duomenys - tai faksu gauta uzsakymo
forma, kur spausdintinemis raidemis uzrasyta pavadinimas ir dar keletas
eiluciu informacijos. Fax-2-email atsiusdavo pranesimus tiff formatu.
mes tada tiffa keisdavom su imagemagiku i kazka (png/pbm/??? kazkas
panasaus) ir tada su gocr traukdavom informacija. Kadangi spausdintines
informacijos kiekis buvo baigtinis - t.y. negaledavo buti parasyta
belekas, o kazkas ir produktu saraso, tai gocr'o apdorota informacija
lygindavom su pradine informacija ir teisingu laikydavom ta kuris budavo
labiausiai artimas.

Levas wrote:
> Pradiniai duomenys- jpg spalvoti. Shudinas tessaraktas valdo tik tiff ir dar nekompresinta. Su imagemagick paverciau i tiff... ir pavadinau failas.tiff, o tessaraktas sako unknown format... ilgai krusausi, kol nepervardinau failo i failas.tif (su trim raidem po tasko). Pirma karta gyvenime maciau toki kvaila sprendima. O gal man nepasiseke (jamiau debian standartinius paketus, jokiu ten rankiniu kompiliaciju nedariau).
>