Otázky a odpovede
Sekcia 1: O projekte
Slovník pojmov je lingvistický nástroj uchovávajúci informácie o slovenských pojmoch a vzťahoch medzi pojmami v slovenskom jazyku. Zjednodušene povedané, ide o slovník slov, ktoré sú zoradené v hierarchickej štruktúre (taxonómii). Vďaka dátam v slovníku dokážete kategorizovať slová (napr. biely -> farba, smrek -> strom), určiť súvisiace pojmy (zdrobneniny, zveličenia, synonymá, antonymá, alternatívne formy slov) alebo vykonávať rôzne operácie (transformácie) s pojmami (napr. vyhľadať podobné slová, previesť slová do iného slovného druhu, previesť emotikon do textovej podoby).
Zoznam kategórii konceptov (hierarchiu) nájdete v sekcii kategórie pojmov. Opis typov vzťahov medzi pojmami nájdete v sekcii zoznam vzťahov.
Slová sú z hľadiska lingvistiky stavebné jednotky jazyka. V písanom formáte ide o sekvencie znakov oddelené medzerou (v slovenčine používame na oddelenie slov medzery).
Slová slúžia na pomenovanie pojmov. Pojmy sú myšlienkové reprezentácie niečoho (predmetu, javu). Významné rozdiely:
Nie všetky slová pomenúvajú pojem. Napríklad predložky alebo spojky nie sú pojmy.
Mnohé pojmy pozostávajú z viac slov (napr. vysoká škola alebo Nové Mesto nad Váhom)
Niektoré slová označujú viac rôznych pojmov (napr. hruška môže byť ovocie, alebo aj strom)
Na označenie toho istého pojmu vieme použiť odlišné slová (napr. pes, psík, havo, štvornohý miláčik, … )
Sekcia 2: Dáta
Zdrojom dát sú slovníky vytvorené pre eduself.sk, najmä Taxonomický slovník a Digitálna encyklopédia (geografické entity). Tvary slov sú zo slovníka Slovník tvarov slovenských slov. Preklady slov do cudzích jazykov vznikli pomocou prekladača Google (prostredníctovm prekladu v Google Sheets). Emotikony boli prevzaté z databázy Smajlíky a emotikony.
V súčasnosti je uložených okolo 140 000 slov a 300 000 vzťahov medzi slovami (júl 2025). Databáza sa neustále rozširuje a aktuálny stav je vidieť na hlavnej stránke projektu, prípadne v sekcii kategórie pojmov.
Slovník je tvorený z väčšej časti manuálne, s pomocou asistenčných algoritmov. Niektoré vzťahy boli vypočítané skriptami. Databáza nevznikala pomocou crowdsourcingu (ako napr. pôvodný zdroj dát ConceptNet). Nedokážeme žiaľ odhadnúť podiel chýb, ktoré mohli vzniknúť ľudským faktorom. Chyby sa snažíme okamžite opraviť. Ak nájdete chybu, môžete nám ju tiež nahlásiť.
Databáza obsahuje pojmy v slovenskom jazyku, ale mnohé z nich majú uložené preklady do ďalších 11 cudzích jazykov, čo môže pomôcť pri mapovaní pojmov na zahraničné slovníky. Tieto preklady sú však vytvorené automatizovane pomocou prekladového slovníka službou od Google. Zatiaľ neexistuje iné priame prepojenie záznamov na ostatné databázy (slovník zatiaľ nie je súčasťou siete prepojených dát, tzv. linked data).
Jazyky: anglický, český, francúzsky, chorvátsky, maďarský, nemecký, poľský, portugalský, španielsky, talianský a latinský.
Sekcia 3: Možnosti použitia
Projekt je v pilotnej prevádzke s cieľom získať spätnú väzbu a ďalej sa rozhodnúť, akým smerom budeme s jeho vývojom pokračovať. Nástroj je plne funkčný, postupne dopĺňame nové dáta. Štruktúra dát a typy vzťahov sa môžu v budúcnosti zmeniť.
Databáza je prístupná po bezplatnej registrácii. K dispozícii je určitý počet požiadaviek (denný a mesačný limit), ktorý by mal pre bežné použitie stačiť. Existujú dve možnosti dopytovania na dáta:
cez webové rozhranie po prihlásení (registrácia je zadarmo)
cez strojovo čitateľné rozhranie (API) - návod k API
Nie. Sťahovanie dát nie je povolené. Existujú len dve možnosti využívania nástroja spomenuté v predchádzajúcej otázke.
Ak by limit nebol dostačujúci, môžete sa nám ozvať (pojmy@kinit.sk). Limity sú nastavené z dôvodu zabezpečenia dostupnosti a zamedzenia automatizovaného sťahovania dát, ale je možné ich nastaviť individuálne pre špecifické potreby.
Nie, databáza slov v súčasnosti nie je voľne dostupná. Ani jej poskytnutie formou exportu štandardne nie je momentálne možné. Nástroj je možné používať len cez webové rozhranie alebo API s denným resp. mesačným limitom.
V prípade využitia nášho nástroja pre výskumné účely je potrebné projekt citovať (link na článok pribudne čoskoro). Nie je nutné autorov kontaktovať.
Zverejnená verzia nástroja nie je určená pre komerčné použitie. V prípade záujmu o použitie na komerčné účely je v súčasnosti potrebné dohodnúť sa s autormi projektu individuálne (kontakt nájdete v sekcii kontakt).
Sekcia 4: Nové dáta a budúcnosť
Ak ste našli chybu, budeme radi, ak nám o nej poviete. Na každej stránke je tlačidlo na nahlásenie chyby, prípadne použite kontaktný formulár alebo napíšte email autorom na pojmy@kinit.sk
Nie je možné vkladať nové dáta do databázy bez nášho zásahu. Ak vám niečo chýba, alebo máte k dispozícii dáta, ktorými by bolo možné obohatiť tento projekt, pokojne nás kontaktujte.
Databázu priebežne dopĺňame o nové pojmy a vzťahy medzi pojmami. Aktualizácia je dávková (projekt vyvíjame separátne a raz za určité obdobie túto živú verziu dávkovo aktualizujeme).