Prijava z geslom
Pozabljeno geslo

Semantični analizator – pametni iskalnik besedil 351 ogledov


Semantični analizator je odprtokodno orodje, ki za svoje delovanje uporablja tehnike umetne inteligence za obdelavo naravnega jezika. Z njim lahko analiziramo slovenska besedila (na primer zakonske dokumente), ugotavljamo, kateri pojmi so ključni za razumevanje vsebine in kateri od teh manjkajo v nekem besednjaku oziroma slovarju (npr. besednjaku temeljnih pojmov javne uprave). Prototip smo razvili v sodelovanju s Fakulteto za računalništvo in informatiko Univerze v Ljubljani in je skupek gradnikov programskega sistema Orange. Semantični analizator pregleda vsa besedila in iz njih izlušči karakteristične pojme. Glede na to, kateri pojmi se hkrati pojavljajo v več besedilih, razkriva sorodnost med njimi ter po tem kriteriju določi skupine in mednje razvrsti besedila. Na podlagi karakterističnih pojmov posamezne grupe lahko dobimo hitri pregled obravnavanih vsebin v določeni zbirki. V grafičnem prikazu vidimo, v katero grupo sodi neko besedilo in tako najdemo besedila, ki govorijo o sorodnih vsebinah. Lahko pa iskano vsebino opišemo z naborom pojmov in najdemo besedila s temi pojmi, pa tudi s pojmi, ki jih nismo omenili, a so si blizu po vsebini (npr. sopomenke, podpomenke, nadpomenke). Karakteristični pojmi postanejo vezni člen med dokumenti, s čimer odkrivamo soodvisnosti in/ali vsebinske povezave med dokumenti v eni ali več različnih zbirkah besedil (na primer poiščemo najbolj relevantne zakone za izbrani predlog ukrepov iz zbirke predlogov ukrepov). Orodje omogoča tudi izbiro pojmov iz Centralnega besednjaka (https://nio.gov.si/nio/asset/centralni+besednjak), ki tako postanejo vezni člen med dokumenti v eni ali več različnih zbirkah besedil. Tako lahko na primer poiščemo tiste zakonske dokumente, ki se sklicujejo na nek vir podatkov iz besednjaka (register, evidenca, seznam).

Pred pripravljene podatkovne zbirke besedil (zakoni, predlogi vladi itd.), ki jih že lahko uporabimo, analiziramo in medsebojno iščemo sorodne vsebine, so objavljene na naslednji povezavi: http://file.biolab.si/text-semantics/data/

Prototip z odprto izvorno kodo in gradivi se nahaja na naslednji povezavi: https://github.com/biolab/text-semantics

V bodoče načrtujemo na osnovi že razvitega prototipa razvoj aplikacije, ki bo prosto spletno dostopna.

Za vse dodatne informacije v zvezi z orodjem Semantični analizator se prosimo obrnite na e-naslov: miha.jesenko@gov.si.

ATRIBUTI

Raven interoperabilnosti
Semantična interoperabilnost
Podraven interoperabilnosti
Semantična orodja
Tip interoperabilnosti po ADMS
Opis storitve
Institucija lastnica

MINISTRSTVO ZA JAVNO UPRAVO

Jezik

slovenščina

Država

Slovenija

Avtorji
FRI UL, MJU, Revelo
Omejitev uporabe
Ne
Skladnost z EU izdelki
Ne
Licenca
Creative Commons Priznanje avtorstva 4.0 International (CC BY 4.0)

Pregled komentarjev

Ni komentarjev

Komentiraj

Za komentiranje morate biti prijavljeni.