Tema: Re: klausimelis programeriams apie teksto panasumus
Autorius: tranzoo
Data: 2018-07-22 20:37:56
On 7/22/2018 15:35, fenix wrote:
> Turime keliasdesimt tukstanciu teksto vienetu. tekstai nuo 500 iki 5000
> zodziu mazdaug. Visi parasyti lietuviu kalba, su lietuviskomis raidemis.
> Jokiu indeksu, jokiu tegu ir pan zymiu nera. Tik pliki tekstai.
> Paparastumo delei tarkime, kad juos galiu sukishti i bet koki formata:
> doc, mysql duombaze, txt failai ir pan.
> 
> kokie butu automatiniai sprendimai issirinkus bet kuri teksta N, surasti
> tarkim 5 panasiausius i juos kitus??? jeigu dar bet kokia panasumo
> skaitine israiska generuoti - butu super. Cia kazkas panasaus i plagiato
> paieska ;) Tiesa, gali but ir veikiantis algoritmas, pasiprograminciau.
> Online sprendimas, kur leidzia tik atlikti kelias operacijas - irgi
> neidomu...
> 
> trumpai: panasiu lietuvisku tekstu paieska.
> 
> dekui uz idejas. sprendimai EN kalbai irgi is esmes tiktu, tik turi buti
> pritaikomi LT kalbai.
> 

google 'sorting algorithms'