Cilj projekta je zadovoljiti potrebe po računalniških izdelkih in storitvah s področja jezikovnih tehnologij za slovenski jezik za raziskovalne organizacije, za podjetja in za širšo javnost. Končni izdelki bodo na uporabniško prijazen način pomagali pri sporazumevanju, sodelovanju, poslovanju, izmenjavi znanja in udeleževanju v družabnih in političnih razpravah, in prispevali k premagovanju jezikovnih meja.

Pri podrobnem opisu ciljev sledimo razdelitvi aktivnosti po sklopih:

Cilji vključujejo (1) nadgradnjo programa za strojno označevanje besedil in vzpostavitev spletnega delotoka, (2) izdelavo ali nadgradnjo učnih množic za procesiranje naravnega jezika, (3) nadgradnjo leksikona, (4) korpusov pisne standardne in nestandardne slovenščine, (5) korpusa govorjene slovenščine ter gradnjo (6) korpusa usvajanja slovenščine kot prvega in kot drugega/tujega jezika, (7) korpusa parlamentarnih razprav in (8) metakorpusa vseh večjih korpusov slovenskega jezika.

Predvidena je izdelava (1) govorne baze, ki bo osnova za izdelavo splošnega razpoznavalnika govora, (2) izdelava podpornih orodij in (3) postopka za razvoj robustnega splošnega ter (4) specializiranega razpoznavalnika, (5) razvoj portala s podpornimi orodji in modeli razpoznave ter (6) priprava dolgoročnega načrta nadgradnje splošnega razpoznavalnika z velikim slovarjem besed ter načrta izdelave razpoznavalnika v realnem času za domeno izobraževanja.

Cilji vključujejo (1) izdelavo osrednje digitalne slovarske baze, ki združuje različne tipe jezikovnih podatkov o slovenščini v odprtem dostopu, (2) avtomatsko izdelavo baze znanja oz. semantične mreže, (3) izdelavo virov in orodij za razdvoumljanje pomenov in prepoznavanje semantičnih premikov ter za (4) za avtomatsko povzemanje in odgovarjanje na vprašanja, (5) izdelavo korpusov za izvajanje semantičnih analiz.

Cilji zajemajo (1) namestitev referenčnega prevajalnika ter (2) razvoj podpornih orodij in definiranje evalvacijskih metod, (3) testiranje alternativnih ogrodij nevronskega strojnega prevajanja (NMT), (4) izdelavo modelov NMT in njihovo osveževanje glede na rast korpusa prevodov, (5) razvoj dela portala s strojnim prevajalnikom, (6) pripravo dolgoročnega načrta za razvoj strojnega prevajalnika v domeni izobraževanja ter načrta za nadaljnji razvoj splošnega prevajalnika, (7) zbiranje besedil za korpus prevodov.

Predvidena je izdelava (1) terminološkega portala z iskalnikom po terminoloških virih in spletnim konkordančnikom za analizo specializiranih korpusov, (2) orodja za luščenje terminoloških kandidatov iz korpusov, (3) spletnega urejevalnika terminoloških virov, (4) smernic in navodil za sestavljanje terminoloških virov z vzorčnimi podatkovnimi zbirkami, (5) vzpostavitev svetovalnice za reševanje terminoloških vprašanj in zagotovitev ažurne objave odgovorov ter (6) priprava načrta razvoja in nadgradnje terminološkega portala po zaključku projekta.

Cilji so (1) zagotoviti obstoječe in nadgrajene storitve infrastrukture CLARIN.SI, (2) poskrbeti za razvoj in vzdrževanje shem XML, za (3) distribucijo jezikovnih virov in orodij ter (4) zagotoviti odkup obstoječih jezikovnih virov ter (4) informirati uporabnike o projektnih rezultatih.

Cilj projekta je zadovoljiti potrebe po računalniških izdelkih in storitvah s področja jezikovnih tehnologij za slovenski jezik za raziskovalne organizacije, za podjetja in za širšo javnost. Končni izdelki bodo na uporabniško prijazen način pomagali pri sporazumevanju, sodelovanju, poslovanju, izmenjavi znanja in udeleževanju v družabnih in političnih razpravah, in prispevali k premagovanju jezikovnih meja.