Tema: klausimelis programeriams apie teksto panasumus
Autorius: fenix
Data: 2018-07-22 16:35:27
Turime keliasdesimt tukstanciu teksto vienetu. tekstai nuo 500 iki 5000
zodziu mazdaug. Visi parasyti lietuviu kalba, su lietuviskomis raidemis.
Jokiu indeksu, jokiu tegu ir pan zymiu nera. Tik pliki tekstai.
Paparastumo delei tarkime, kad juos galiu sukishti i bet koki formata:
doc, mysql duombaze, txt failai ir pan.

kokie butu automatiniai sprendimai issirinkus bet kuri teksta N, surasti
tarkim 5 panasiausius i juos kitus??? jeigu dar bet kokia panasumo
skaitine israiska generuoti - butu super. Cia kazkas panasaus i plagiato
paieska ;) Tiesa, gali but ir veikiantis algoritmas, pasiprograminciau.
Online sprendimas, kur leidzia tik atlikti kelias operacijas - irgi
neidomu...

trumpai: panasiu lietuvisku tekstu paieska.

dekui uz idejas. sprendimai EN kalbai irgi is esmes tiktu, tik turi buti
pritaikomi LT kalbai.