Na Fakulteti za družbene vede smo v sodelovanju s sodelavci s še petih znanstvenoraziskovalnih ustanov pripravili terminološko podatkovno zbirko odnosov z javnostmi, ki smo jo na kratko poimenovali TERMIS. Začeli smo že leta 2007 z manj ambicioznim ciljem – korpusom besedil slovenskih odnosov z javnostmi KoRP, ki je bil vse od izgradnje prosto spletno dostopen. Ideja je nato prerasla prvotne okvire - podatkovna zbirka, ki smo jo uredili v letih 2011-2013 s pomočjo najsodobnejših leksikografskih orodij ter s prostovoljnim delom več kot 50 strokovnjakov s področja odnosov z javnostmi ali s to stroko povezanih področij,  je sedaj prosto dostopna za javnost. Projekt, v katerega so se s svojimi strokovnimi znanji ter izkušnjami vključili tudi Gospodarska zbornica Slovenije, Pristop in Slovensko društvo za odnose z javnostmi, je leta 2011 kot pomemben prispevek k znanstvenemu razvoju Slovenije prepoznala tudi Javna agencija za raziskovalno dejavnost Republike Slovenije ter ga finančno podprla.

                      

Del te razvojne zgodbe so bili tudi naši sponzorji. Zahvaljujemo se jim, ker so v projektu prepoznali dodano vrednost in ga z nami soustvarjali.

                                                                                         

OSNOVNI PODATKI

Vodja:

Nataša Logar Berginc

Vodilna organizacija:

Fakulteta za družbene vede, Univerza v Ljubljani (Center za družboslovnoterminološko in publicistično raziskovanje)

Projektni sodelavci:

  • Monika Kalin Golob, Samo Kropivnik, Urša Golob, Klement Podnar (Fakulteta za družbene vede, Univerza v Ljubljani)
  • Dejan Verčič (Fakulteta za družbene vede, Univerza v Ljubljani; Pristop, d. o. o.)
  • Vojko Gorjanc, Damjan Popič (Filozofska fakulteta, Univerza v Ljubljani)
  • Miro Romih, Simon Krek (Amebis, d. o. o., Kamnik)
  • Iztok Kosem, Špela Arhar Holdt (Trojina, zavod za uporabno slovenistiko)
  • Polona Gantar (Inštitut za slovenski jezik Frana Ramovša, Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti)

Šifra projekta:

L6-4193

Finančni obseg:

3210 letnih raziskovalnih ur cenovnega razreda B

Financer:

Javna agencija za raziskovalno dejavnost Republike Slovenije

Sofinancerja:

Pristop, d. o. o., in Gospodarska zbornica Slovenije

Čas trajanja:

2011– 2013

IZHODIŠČE PROJEKTA

Terminologija je pomemben del vseh modernih nacionalnih knjižnih (standardnih) jezikov. Stalno prisotna poimenovalna potreba, povezana z novimi odkritji in spoznanji, zato nalaga vsem jezikom vprašanja, kako obvladovati in reševati te potrebe. Ustrezno reševanje teh nalog je del uresničevanja cilja ohranjanja jezika kot nacionalnega sredstva za sporočanje, ki v vseh položajih deluje polnofunkcionalno in brez zadreg. Razvoj terminologij, še bolj pa njihova standardizacija v obliki slovarjev (standardov, enciklopedij) zahteva meddisciplinarno sodelovanje področnih strokovnjakov in jezikoslovcev, v dobi gradnje podatkovnih baz pa so se jim pridružili še informatiki.

Odkar se je leta 1980 začel oblikovati korpus The Bank of English, slovarji nikjer več ne morejo nastajati brez vsaj zavesti o tem, da sodobni leksikografski pristop terja vključitev korpusov, četudi je ta vključitev le delna. Korpusi so eden od virov dokazov za boljše opise jezikovne zgradbe in rabe, njihov računalniško obvladljiv format pa je v te opise med drugim prinesel natančnost meritev zelo različnih lastnosti jezika. V slovenskem prostoru uresničevanje načel o obsežnem, premišljeno izbranem in po izboru razvidnem ter dokumentiranem gradivu ni bilo vedno dosledno ali pa ga sploh ni bilo. Raziskovalni projekt izhaja iz korpusnega pristopa, ki po našem prepričanju prinaša tehnološko sodobnejše, metodološko naprednejše in uporabniku prijaznejše rezultate. Obenem ta pristop omogoča delno avtomatizacijo postopka identifikacije terminoloških kandidatov (liste besed, luščenje).

Terminološki slovarji so le ena od mnogih vrst slovarjev. Njihovi uporabniki so različni (strokovnjaki, študenti, prevajalci ipd.), zato bi bilo treba v prihodnjih terminoloških slovarjih in terminoloških bazah podatkov informacije zajeti različno tako po načinu kot po obsegu – povedano drugače: zasnovo e-slovarjev in terminoloških baz podatkov je treba oblikovati tako, da bodo vključene informacije čim bolj celovite za vse. V zadnjih desetletjih je tuja leksikografija uporabnike slovarjev še bolj postavila v izhodišče svojega dela ter začela med njimi izvajati različne empirične študije, s katerimi prihaja do podatkov o razlogih za uporabo slovarjev, pogostosti uporabe, načinu iskanja podatkov ipd.

Ob prijavi projekta smo načrtovali, da bo končni izdelek kot aplikativni cilj raziskave izgradnja slovarsko-medbesedilne terminološke podatkovne zbirke na primeru odnosov z javnostmi, ki bo brezplačno dostopna na spletu. Ocenili smo, da bo ugotovitve raziskave kot model mogoče prenesti tudi na druge stroke, vede in področja.

REZULTATI RAZISKAVE

Izhodišče raziskave je bil jezikoslovno označeni korpus besedil odnosov z javnostmi KoRP, ki je od julija 2007 brezplačno dostopen na svetovnem spletu. Vsebuje 1,8 milijona besed in je enojezični, sinhroni, pisni ter statični korpus strokovnih besedil. Od leta 2013 je javno dostopen v konkordančnikih NoSketch Engine in CUWI.

Iz korpusa KoRP smo s pomočjo avtomatskega luščenja terminoloških kandidatov pripravili osnovni geslovnik, nato pa prek orodja Sketch Engine (http://www.sketchengine.co.uk/) oz. njegove aplikacije Besedne skice pridobili še relevantne podatke o besedilnem okolju terminov. Avtomatsko pridobljene podatke o besedilnem okolju smo skupaj z gesli uvozili v slovarski urjevalnik na portalu Termania, kjer smo opravili vso drugo redakcijo.

Terminološka podatkovna zbirka odnosov z javnostmi vsebuje 2.000 terminov, ki so opremljeni z naglasnimi, slovničnimi in normativnimi informacijami, razlagami, prevodi v angleščino ter prikazom besedilnega okolja v obliki kolokacij in zgledov rabe. V vsakem geselskem članku je možnost preklopa k sorodnim geslom ter v konkordančni niz korpusa KoRP in korpusa Gigafida. Terminološka podatkovna zbirka odnosov z javnostmi TERMIS je prosto dostopna na spletnem portalu Termania.

Infrastruktura na portalu Termania je bila v projektu nadgrajena v spletno orodje za izdelavo in urejanje slovarskih gesel na način, ki tehnološko neukemu strokovnjaku omogoča hiter začetek terminografskega dela na svojem strokovnem področju. Infrastruktura je prosto spletno dostopna.

Izdelava terminološke podatkovne zbirke odnosov z javnostmi je model, ki kaže, kako je mogoče na hiter način priti do velikega obsega za terminološko gradivo relevantnih besedilnih podatkov ter kakšna sta lahko njihova členitev in prikaz v spletni terminološki podatkovni zbirki, če si pri njihovem nastanku pomagamo s korpusi, jezikovnimi tehnologijami in najsodobnejšimi leksikografskimi orodji.

KORPUS KoRP

KORPUS KoRP

KoRP je sinhroni enojezični korpus pisnih besedil odnosov z javnostmi. Obsega nekaj več kot 1,8 milijona besed in zajema besedila iz obdobja od leta 1994 do leta 2007.

KoRP je rezultat prve faze izdelave slovarja slovenskega izrazja odnosov z javnostmi, ki je potekala v Centru za družboslovnoterminološko in publicistično raziskovanje Fakultete za družbene vede (FDV). Pobudo za izdelavo slovarja sta leta 2006 dala prof. dr. Monika Kalin Golob (FDV) in prof. dr. Dejan Verčiča (FDV in Pristop, d. o. o.). Korpus je kot del svoje doktorske disertacije izdelala doc. dr. Nataša Logar (FDV). Zbiranje besedil je potekalo v dveh fazah: (a) od aprila do maja 2006 in (b) od decembra 2006 do marca 2007. Računalniško obdelavo in jezikoslovno označitev je izvedlo podjetje Amebis, d. o. o., Kamnik. Za dostop do korpusa v spletnem konkordančniku in orodju za korpusno analizo NoSketchEngine na nl.ijs.si, ki je mogoč od aprila 2013, se zahvaljujemo doc. dr. Tomažu Erjavcu z Instituta "Jožef Stefan".

Vstopite v KoRP »

Oglejte si več podatkov o vsebini in zgradbi korpusa ter besedilodajalcih »

Oglejte si seznam besedil, ki so v korpusu »

Avtorica korpusa:
     doc. dr. Nataša Logar Berginc
     Center za družboslovnoterminološko in publicistično raziskovanje
     Fakulteta za družbene vede
     Kardeljeva ploščad 5, 1000 Ljubljana
     natasa.logar@fdv.uni-lj.si

TERMIS

TERMIS: Terminološka podatkovna zbirka odnosov z javnostmi je prosto dostopna na spletnem portalu Termania.  Vabimo vas k ogledu in uporabi; zbirko smo namreč zasnovali odprto: dopolnjevali jo bomo, popravljali in naredili še boljšo, tudi z vašo pomočjo. Več o TERMIS-u je mogoče prebrati v Uvodu in drugih objavah (gl. spodaj).

TERMIS: Uvod

TERMIS: Viri (kot pomoč pri razlagah)

OBJAVE

LOGAR, Nataša: Spričevalo stroke: njen slovar. V: POSTRUŽNIK, Natalija (ur.), KUŠAR, Matej (ur.): Zbornik 11. slovenske konference o odnosih z javnostmi. Ljubljana: Slovensko društvo za odnose z javnostmi, 2007. 38–45.

LOGAR, Nataša: KoRP: znanje slovenskih odnosov z javnostmi. Piar na kvadrat 5/2007. 41.

LOGAR, Nataša, ARHAR, Špela: Kaj početi s korpusom strokovnih besedil KoRP. Ljubljana: Fakulteta za družbene vede, 2008.

LOGAR BERGINC, Nataša, VINTAR, Špela: Korpusni pristop k izdelavi terminoloških slovarjev: od besednih seznamov in konkordanc do samodejnega luščenja izrazja. Jezik in slovstvo 5/2008. 3–17.

KALIN GOLOB, Monika, LOGAR BERGINC, Nataša: Globalisation and the formulation of technical terms: is there still a need for terminology in national languages?. Strani jezici 4/2008. 435–540.

KALIN GOLOB, Monika, LOGAR BERGINC, Nataša: Terminologija odnosov z javnostmi: od upoštevanja terminoloških načel do pridobivanja podatkov iz besedil. Teorija in praksa 6/2008. 663–677.

LOGAR BERGINC, Nataša: Slovene Terminologies / TERMIS: Preserving Slovene terminology in a globalising world. International Innovation: Disseminating science, research and technology. Bristol: Research media, avgust 2012. 79-81. //International Innovation is the leading global dissemination resource for the wider scientific, technology and research communities, dedicated to disseminating the latest science, research and technological innovations on a global level. More information and a complimentary subscription offer to the publication can be found at: www.researchmedia.eu.//

LOGAR BERGINC, Nataša, VINTAR, Špela, ARHAR HOLDT, Špela: Luščenje terminoloških kandidatov za slovar odnosov z javnostmi. V: ERJAVEC, Tomaž (ur.), ŽGANEC GROS, Jerneja (ur.): Zbornik Osme konference Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan, 2012. 135-140.

LOGAR, Nataša, VERČIČ, Dejan, KALIN GOLOB, Monika: Terminologija odnosa s javnošću u slovenskome jeziku. Medijske studije/Media Studies 4/2013. 94–110.

LOGAR, Nataša, VERČIČ, Dejan. Terminological databanks as the bodies of knowledge: Slovenian public relations terminology. Public relations review 5/2013. 569–571.

LOGAR, Nataša: Korpusna terminografija: primer odnosov z javnostmi. Ljubljana: Trojina, zavod za uporabno slovenistiko; Fakulteta za družbene vede, 2013.

LOGAR, Nataša, KOSEM, Iztok: TERMIS: a corpus-driven approach to compiling an e-dictionary of terminology. V: KOSEM, Iztok, in dr. (ur.): Electronic lexicography in the 21st century: thinking outside the paper: proceedings of eLex 2013 Conference. Ljubljana: Trojina, Institute for Applied Slovene Studies; Tallinn: Eesti Keele Instituut, 2013.  164–178.

LOGAR, Nataša: Aktualni terminološki opisi in njihova dostopnost. V: ŽELE, Andreja (ur.): Družbena funkcijskost jezika (vidiki, merila, opredelitve): Obdobja 32. Ljubljana: Znanstvena založba Filozofske fakultete, 2013. 247–253.

LOGAR BERGINC, Nataša, VINTAR, Špela, ARHAR HOLDT, ŠPELA: Terminologija odnosov z javnostmi: korpus — luščenje — terminološka podatkovna zbirka. Slovenščina 2.0 2/2013. 113–138.

LOGAR, Nataša, GANTAR, Polona, KOSEM, Iztok: Collocations and examples of use: a lexical-semantic approach to terminology. Slovenščina 2.0 1. 41–61.

LOGAR, Nataša: A corpus based e-dictionary of terminology as a body of knowledge. V: BUDIN, Gerhard (ur.): Languages for special purposes in a multilingual, transcultural world  proceedings of the 19th European Symposium on Languages for Special Purposes, LSP, 2013 8-10 July, 2013 Vienna, Austria. Vienna: Centre for Translation Studies, 2014. 386–392.

KOSEM, Iztok, GANTAR, Polona, LOGAR, Nataša, KREK, Simon: Automation of lexicographic work using general and specialized corpora : two case studies. V: ABEL, Andrea, VETTORI, Chiara, RALLI, Natascia (ur.): The user in focus: proceedings of the XVI EURALEX International Congress, 15-19 July 2014, Bolzano/Bozen. Bolzano: Institute for Specialised Communication and Multilingualism, 2014. 355–364.

VERČIČ, Dejan, LOGAR, Nataša. TERMIS: opremljenost stroke za dobo internacionalizacije in digitalizacije = TERMIS: aptness of a discipline for the era of internationalisation and digitalisation. V: AŠANIN GOLE, Pedja, SERAJNIK SRAKA, Nada, KERNEL, Vita (ur.): Teorija in praksa slovenskih odnosov z javnostmi II = Slovenian public relations theory and practice II. Ljubljana: Slovensko društvo za odnose z javnostmi: Sekcija IABC Slovenija = PRSS, Public Relations Society of Slovenia: IABC Slovenia Chapter, 2014. 32-53.

LOGAR, Nataša, POPIČ, Damjan. Kaj je termin?. V: Zuljan Kumar, Danila, Dobrovoljc, Helena (ur.): Zbornik prispevkov s simpozija 2013. Nova Gorica: Založba Univerze, 2015. 118-131.

POVEZAVE

KONTAKT

Doc. dr. Nataša Logar
Fakulteta za družbene vede
Kardeljeva ploščad 5
1000 Ljubljana
natasa.logar@fdv.uni-lj.si