Tema: Re: klausimelis programeriams apie teksto panasumus
Autorius: fenix
Data: 2018-08-07 22:52:43
2018.08.06 10:41, Nerijus rašė:
> On 2018-07-29 02:10 PM, fenix wrote:
>> 2018.07.25 10:33, Gvi2 rašė:
>>> Jei draugauji su Python'u, gal pasidomėk šituo paketu: https://spacy.io/usage/spacy-101
>>> Lietuvių kalbai modelio (dar?) neturi, bet yra kažkoks Multilanguage...
>>>
>>
>> dekui apsisviesiu.
>> siaip, LT net stemmingo lyg normalaus niekas nepadare, klystu?
>>
> 
> 	Tikrai yra sukurtu plagijavimo sistemu. Univierai naudoja. Rodo
> sutapimo %. Rezultatai panasus i tai, ka demonstravo seimo komisija su
> Petro barsausko disertacija.
> 	Nemanau, kad te kazka kure nuo nulio. Tiesiog reikia ieshkoti biblioteku.

ar turi priejima prie tu produktu? kaip sakiau - man reikia kazko
inhouse, na, arba tokiu, kurios leistu joms sushers 50K+ teksto vienetu,
po 1000-10000 zodziu