Tezaury na vyhľadávanie informácií: štruktúra, účel a postup vývoja. Význam slova tezaurus Čo vám tezaurus umožňuje nájsť

Oddelenie TAOI KemGUKI

Tezaury na vyhľadávanie informácií:

štruktúru, účel a postup vývoja

1. Tezaurus ako spôsob systematickej reprezentácie poznatkov a

druh ideografického slovníka.

2. Tezaury na vyhľadávanie informácií: podstata a účel

3. Štruktúra IPT

4. Postup vývoja, skúšania, registrácie a údržby IPT.

Referencie

1. GOST 7.74 – 96. Jazyky na vyhľadávanie informácií. Termíny a definície [Text]. – Zadajte. 1997-07-01. – Minsk: Medzištátna rada pre normalizáciu, metrológiu a, 1997. – 34 s. (Systém noriem pre informácie v knižnici a vydavateľstve) TC 191.

2. GOST 7.25-2001. Jednojazyčný tezaurus na vyhľadávanie informácií. Pravidlá vývoja, štruktúra a forma prezentácie [Text]. - GOST 7.25-80; Zadajte 2002-07-01. – M.: Vydavateľstvo noriem IPK, 2001. – 16 s. MTK 191.

3. GOST 7.24-2007 Viacjazyčný tezaurus na vyhľadávanie informácií. Zloženie, štruktúra a základné požiadavky na stavbu. – Namiesto GOST 7.24-90; vstup 2008-07-01. / Medzištátna rada pre normalizáciu, metrológiu a certifikáciu. – M.: Standartinform, 2008. – 7 s. (Systém noriem pre informácie, knižnicu a publikovanie)

4. Baranov, O. S. Ideografický slovník ruského jazyka / O. S. Baranov. – M.: Vydavateľstvo ETS, 1995. – 820 s.

5. Zhmailo, S. V. K problematike definovania tezauru [Text] / S. V. // NTI. Ser. 1 Organizácia a informačná práca. – 2003. – č.12. – S.20 – 25.

6. Zhmailo, S. V. K rozvoju moderných tezaurov na vyhľadávanie informácií [Text] / S. V. Zhmailo // NTI. Ser. 1 Organizácia a metodika práce s informáciami. –2004. – č. 1. – S.23 – 31.

V ideografickom slovníku ruského jazyka od O. S. Baranova (4) je teda identifikovaných 12 vyšších častí ideografického slovníka, medzi ktorými sú: „poriadok, príroda, činnosť, kultúra“ atď., z ktorých každá je rozdelená do skupín , podskupiny, oddelenia, sekcie . Všetky slová v tomto slovníku sú zozbierané do hniezd podľa ich významu a sú zoskupené podľa určitého pojmu, s ktorým sú najčastejšie spojené druhovými vzťahmi. Hniezda sú zoskupené do podsekcií atď. V súčasnosti slovník obsahuje 5923 hniezd, 7 úrovní delenia (podľa www.rifmovnik.ru/thesaurus.htm k 16.2.2010). Tu je príklad položky v slovníku z tohto slovníka:

178.4.7 aróma ▲ - príjemná vôňa (napríklad vôňa kvetov, trávy, sena. delikátna #. opojná #).

aromatizácia .

. jantárová. kadidlo. Kód slova „aróma“ odráža ideografickú klasifikáciu prijatú v tomto prípade, najmä koreláciu tohto slova s ​​kategóriou „178-senzácií“. Pojmy „tezaurus“, „ideografický slovník“, „slovník typu tezauru“ teda v prvom rade znamenajú, že súhrn slov jazyka v nich je prezentovaný takým spôsobom, že jedna skupina slov zahŕňa slová, ktoré sú významovo podobný. Hlavným účelom ideografických slovníkov je zbierka zjednotených lexikálnych jednotiek všeobecný pojem

; to uľahčuje čitateľovi

vhodné prostriedky

pre primerané vyjadrovanie myšlienok a podporuje aktívnu jazykovú zdatnosť.

Z histórie tezaurov

BUNDY 2302

v kostýmových výrobkoch

Kabátové výrobky

Šijacie výrobky

n Dvojradové sako

Kombinovaná bunda

Športová bunda

v opatreniach na balenie

Zvyškový materiál

Odpadový materiál

Lexikálna poznámka;

Askriptory alebo synonymné deskriptory;

nadradené deskriptory;

Podriadené deskriptory;

Asociatívne deskriptory;

Deskriptory súvisiace s inými typmi vzťahov.

V rámci každej skupiny LE spojených s deskriptorom hlavy jedným typom paradigmatického vzťahu musí existovať abecedné poradie usporiadania. Napríklad:

ALGORITMICKÉ JAZYKY

s algoritmickými jazykmi

strojovo orientované jazyky

problémovo orientované jazyky

v SOFTVÉRI

FORMÁLNE JAZYKY

n AUTOKÓDY

a ALGORITHMY

PROGRAMOVANIE cf umelé jazyky

Článok ascriptor pozostáva z ascriptoru a deskriptorov alebo kombinácie deskriptorov, ktoré ho nahrádzajú pri spracovaní a získavaní informácií. Tu sú príklady článkov ascriptor:

Alfanumerické znaky

Španielske FORMÁLNE JAZYKY

PRÍRODNÉ JAZYKY

pozri ALGORITMICKÉ JAZYKY

Kód deskriptora systematického indexu;

Klasifikačné indexy;

Ďalšie sémantické a lexikografické poznámky;

Cudzojazyčné ekvivalenty.

Kvalitu lexikálno-sémantického indexu určuje úplnosť lexikálnych jednotiek v ňom zahrnutých. sa chápe ako pravdepodobnosť zaradenia do tezauru akéhokoľvek informačne zmysluplného slova pre daný tematický okruh. Úplnosť lexikálno-sémantického indexu a následne aj celého tezauru má významný vplyv na výsledky indexovania dokumentov a dopytov.

Ďalšie časti môžu zahŕňať systematické, permutačné, hierarchické a iné indexy a zoznamy špeciálnych kategórií lexikálnych jednotiek.

Systematický index je index, v ktorom sú deskriptory zoskupené podľa kategórií prijatých v IPT. Systematický index určuje tematické smerovanie tezauru, odhaľuje jeho obsah a odráža tie oblasti vedy a techniky, ktoré možno vyhľadávať s rôznou mierou detailov. Jeho potreba ako súčasť IPT je spôsobená skutočnosťou, že poskytuje jasnú predstavu o všeobecnom stave terminológie v konkrétnej oblasti vedomostí, umožňuje vám vybudovať koherentný terminologický model a ak je to možné, všetky termíny a pojmy, ktoré by si mali nájsť miesto v tezaure. Je určený na uľahčenie vyhľadávania výrazov pri zostavovaní vyhľadávacích obrázkov dokumentov a dopytov usporiadaním súboru deskriptorov a askriptorov podľa predmetu.

Systematický index je v podstate klasifikačná schéma na naplnenie tezauru terminológiou, pretože sa vytvára zoradením súboru deskriptorov podľa tematických oblastí.

Systematické indexy IPT sú rozdelené do troch typov:

tematické,

Zmiešané.

Toto rozdelenie odráža princíp konštrukcie klasifikačnej schémy pre systematický index.

Hlavné funkcie vykonávané systematickým indexom IPT:

Použitie ako pomocné pri indexovaní, ktoré vo všeobecnosti poskytuje vyhľadávanie deskriptorov pre koncepty indexovania, ktoré nie sú explicitne uvedené v tezaure (funkcia vyhľadávania);

Použitie tezauru v procese udržiavania (funkcia udržiavania IPT);

Využitie IPT ako štrukturálneho základu, ako riadenia jeho rozvoja (konštruktívna funkcia).

V súlade s GOST 7.25-2001 (2) by ste pri zostavovaní systematického indexu tematických a zmiešaných typov v jeho tematickej časti mali používať nadpisy medzištátneho rubrikátora NTI alebo rubrikátora konkrétneho ASNTI, kompatibilného s medzištátnym rubrikátorom NTI. . Pri zostavovaní systematického indexu kategorických a zmiešaných typov by sa v jeho kategoriálnej časti mali nachádzať tieto všeobecné kategórie:

Názvy odborov a odvetví činnosti;

Položky, materiály;

Metódy, procesy, operácie, javy;

Vlastnosti, množstvá, parametre, charakteristiky;

Vzťahy, štruktúry, modely, zákony, pravidlá, abstraktné pojmy.

Hierarchický index. Hierarchický index je index, v ktorom je uvedený zoznam zoznamov deskriptorov, pričom každý zoznam začína deskriptorom, ktorý nemá žiadne nadradené. Odráža úplnú štruktúru hierarchických vzťahov v IPT. Za každým deskriptorom sú uvedené samotné deskriptory, ktoré označujú ich úroveň v hierarchii pomocou číslovania alebo grafického označenia úrovne:

Potreba vypracovať hierarchický index IPT je spôsobená tým, že celý systém podriadenosti pojmov nie je v slovníkových heslách IPT pevne stanovený, pretože znamenalo by to výrazné zvýšenie lexikálno-sémantického indexu. je potrebné vyvinúť nezávislú sekciu IPT – hierarchický index, ktorý by odrážal celý hierarchický reťazec velenia deskriptorov až nadol.

Permutačný index je index, v ktorom sú v abecednom poradí uvedené všetky jednotlivé slová zahrnuté v zložkách fráz označujúcich deskriptory a pri každom z nich sú uvedené všetky deskriptory, ktoré tieto slová obsahujú. V dôsledku toho sa každý výraz objaví v permutačnom indexe toľkokrát, koľko významných slov obsahuje. Účelom permutačného indexu je poskytnúť vyhľadávanie deskriptorových fráz podľa ľubovoľného slova zahrnutého v ich zložení, vrátane tých, ktoré sa nenachádzajú na začiatku lexikálnej jednotky. Umožňuje vám zoskupiť slová s rovnakým koreňom na jednom mieste.

Permutačný index sa spravidla zostavuje automatizovaným spôsobom a zvyčajne má formu indexu typu KWIC (Key Word – In Context), v ktorom je všetko zmysluplné slová– pojmy – sú zoradené v abecednom poradí. v permutačnom indexe sa nachádza v strede stĺpca, ktorý je tvorený mikrokontextami prvkov termínu, a nemiestna časť pojmov je presunutá na ľavú stranu toho istého riadku:

optické kvantá

vzrušenie

elektrický

so závislou excitáciou

GENERÁTORY rušenia

seriál GENERÁTOROV

GENERÁTORY DC

GENERÁTORY DC budú potrebné.

4. Postup vývoja, skúšania, registrácie a údržby IPT

V súčasnosti je postup vývoja, skúmania a registrácie IPT určený dvoma normami: GOST 7.25-2001 „Jednojazyčný tezaurus na vyhľadávanie informácií. Pravidlá vývoja, štruktúra, zloženie a forma prezentácie“ a GOST 7.24-2007 „Tzaurus na vyhľadávanie viacjazyčných informácií. Zloženie, štruktúra a základné požiadavky na stavbu.“ V súlade s týmito štandardmi vykonávajú funkcie skúmania a registrácie IPT národné a medzinárodné depozitné fondy.

Národný depozitný fond IPT v ruštine (vrátane IPT obsahujúci ekvivalentné deskriptory v ruštine) sa nachádza vo VINITI.

Existujú tiež dva medzinárodné depozitné IPT:

1) medzinárodný depozitný fond IPT v angličtine, vrátane IPT obsahujúci ekvivalentné deskriptory v angličtine. Nachádza sa v Toronte, v knižnici Fakulty informačných vied University of Toronto (Thesaurus Clearinghouse – „výpočet“, The Library, Faculty of Information Studies, University of Toronto, TORONTO, Canada);

2) medzinárodný depozitný fond IPT vo všetkých ostatných jazykoch okrem angličtiny. Nachádza sa vo Varšave, vo vedeckých a technicko-ekonomických informáciách (Instytut Informacji Naukowej, Technicznej i Ekonomicznej, Clearinghouse, WARSZAW A, Poľsko.).

Úplné adresy týchto organizácií sú uvedené v GOST 7.25-2001.

GOST 7.25-2001 a GOST 7.24-2007 definujú akcie vývojárov IPT takto:

1. Pred začatím prác na vytvorení IPT musí vývojár kontaktovať príslušný národný alebo medzinárodný depozitný fond, aby zistil dostupnosť registrovaných tezaurov na danú tému. Ak sú takéto tezaury k dispozícii, posudzuje sa možnosť ich zavedenia do daného systému. Ak sa takéto tezaury nenájdu, môže sa vytvoriť IPT. Zároveň všetky technológie na vytváranie IPT musia prísne spĺňať GOST 7.25-2001 a GOST 7.24-2007

2. Hotový (vyvinutý) IPT sa musí podrobiť skúške zhody s GOST 7.25-2001. vyhovujú norme, potom ju Národná rada vydá developerovi. Tento IPT je uložený (uložený) v príslušnom národnom alebo niektorom z medzinárodných depozitných fondov (v Toronte alebo Varšave).

Národné depozitáre šíria informácie o zložení fondu uložených IPT a poskytujú ich vývojárom nových IPT za účelom zapožičania prvkov a zabezpečenia kompatibility jazykovej podpory pre rôzne informačných systémov. Vykonávajú teda funkcie vyšetrenia, registrácie, uchovávania IPT a informovania o existujúcich IPT.

veľa operácií pre riadenie IPT);

Prechod AIS z nezávislej prevádzky na prevádzku v sieťovom režime (pri využívaní IPT v rámci jednotného rámca je potrebné dohodnúť princípy ich fungovania).

Postup udržiavania IPT v prevádzkovom stave sa nazýva udržiavanie alebo úprava tezauru. Typicky zahŕňa nasledovné:

Zmena lexikálneho zloženia IPT: zavádzanie nových lexikálnych jednotiek, ich, zmena stavu lexikálnych jednotiek (preklad kľúčového slova na deskriptory a naopak);

Zmena paradigmatických vzťahov v IPT (posilnenie, oslabenie);

Udržiavanie IPT zahŕňa povinné používanie automatizačných nástrojov, ktoré vám umožňujú rýchlo vykonávať také práce náročné na prácu, ako je abecedné triedenie slovnej zásoby, slovnej zásoby, kontrola reciprocity a konzistentnosti odkazov, pomocou ktorých sa paradigmatické vzťahy zaznamenávajú v IPT atď. .

, antonymá, paronymá, hyponymá, hyperonymá a pod.) medzi lexikálnymi jednotkami. Tezaury sú jedným z najúčinnejších nástrojov na popis jednotlivých tematických okruhov.

V minulosti termín tezaurus Väčšinou boli určené slovníky reprezentujúce slovnú zásobu jazyka s maximálnou úplnosťou s príkladmi jeho použitia v textoch.

Tiež termín tezaurus používa sa v teórii informácie na označenie súhrnu všetkých informácií, ktoré má subjekt.

V psychológii je tezaurus jednotlivca charakterizovaný vnímaním a chápaním informácií. Komunikačná teória zohľadňuje aj všeobecný tezaurus komplexný systém, vďaka čomu jeho prvky interagujú.

Príbeh

Jeden z prvých tezaurov sa nazýva „Slovník synoným“ od Phila z Byblosu. Presnejšia korešpondencia s termínom je Amara-kosha, napísaná v sanskrte v poetickej forme v 6. storočí. Prvý moderný anglický tezaurus vytvoril Peter Mark Roger v roku 1805. Vyšla v roku 1852 a odvtedy sa používa bez dotlače.

V sedemdesiatych rokoch sa tezaury začali aktívne využívať na úlohy súvisiace s vyhľadávaním informácií. V takýchto tezauroch sú slová mapované na deskriptory, prostredníctvom ktorých sa vytvárajú sémantické spojenia.

tezaurusy

Pozri tiež

Napíšte recenziu na článok "Tezaurus"

Poznámky

Úryvok charakterizujúci tezaurus

- Aký si dnes dandy! – povedal Nesvitskij a pozrel sa na svoj nový plášť a sedlovú podložku.
Denisov sa usmial, vytiahol z tašky vreckovku, ktorá voňala parfumom, a strčil ju Nesvitskému do nosa.
- Nemôžem, idem do práce! Vystúpila som, umyla si zuby a dala si voňavku.
Dôstojná postava Nesvitského v sprievode kozáka a odhodlanie Denisova, mávajúceho šabľou a zúfalého výkriku, mali taký účinok, že sa pretlačili na druhú stranu mosta a zastavili pechotu. Nesvitsky našiel pri východe plukovníka, ktorému potreboval odovzdať rozkaz, a po splnení jeho pokynov sa vrátil.
Po uvoľnení cesty sa Denisov zastavil pri vchode na most. Nenútene zadržiaval žrebca, ktorý sa rútil k svojim a kopal, a pozrel sa na letku, ktorá sa k nemu blížila.
Po doskách mosta bolo počuť priehľadné zvuky kopýt, ako keby cválalo niekoľko koní, a eskadra s dôstojníkmi vpredu, štyrmi v rade, sa natiahla pozdĺž mosta a začala sa vynárať na druhej strane.
Zastavení vojaci pechoty, ktorí sa tlačili v rozdupanom blate pri moste, hľadeli na čistých, elegantných husárov, ktorí okolo nich harmonicky pochodovali, s tým zvláštnym nepriateľským pocitom odcudzenia a výsmechu, s ktorým sa rôzne zložky armády bežne stretávajú.
- Inteligentní chlapci! Len keby to bolo na Podnovinskom!
- Načo sú dobré? Jazdia len na parádu! - povedal ďalší.
- Pešiaci, neprášte! - žartoval husár, pod ktorým kôň, hrajúci sa, špliechal blato na pešiaka.
„Keby som ťa bol previezol na dva pochody s tvojím batohom, šnúrky by boli opotrebované,“ povedal pešiak a rukávom si utrel špinu z tváre; - inak to nie je človek, ale sedí vták!
„Keby som ťa mohol posadiť na koňa, Zikin, keby si bol obratný,“ žartoval desiatnik o útlom vojakovi, zohnutom od váhy batohu.
„Vezmi si palicu medzi nohy a budeš mať koňa,“ odpovedal husár.

Zvyšok pechoty sa ponáhľal cez most a pri vchode vytvoril lievik. Nakoniec všetky vozíky prešli, tlačenica sa zmenšila a posledný prápor vstúpil na most. Na druhej strane mosta proti nepriateľovi ostali len husári Denisovovej eskadry. Nepriateľ, viditeľný v diaľke z protiľahlej hory, zospodu, z mosta, ešte nebol viditeľný, pretože z priehlbiny, ktorou rieka tiekla, sa horizont končil v opačnej nadmorskej výške nie viac ako pol míle. Pred nami bola púšť, po ktorej sa sem-tam presúvali skupinky našich putujúcich kozákov. Zrazu sa na protiľahlom kopci cesty objavili jednotky v modrých kuklách a delostrelectvo. Toto boli Francúzi. Kozácka hliadka odklusala dolu kopcom. Všetci dôstojníci a muži Denisovovej eskadry, hoci sa snažili hovoriť o cudzincoch a rozhliadať sa, neprestali myslieť len na to, čo bolo na hore, a neustále hľadeli na miesta na obzore, ktoré poznali ako nepriateľské jednotky. Popoludní sa počasie opäť vyjasnilo, slnko jasne zapadalo nad Dunajom a tmavými horami, ktoré ho obklopovali. Bolo ticho a z tej hory bolo občas počuť zvuky rohov a výkriky nepriateľa. Medzi eskadrou a nepriateľmi sa okrem malých hliadok nikto nenachádzal. Oddeľovalo ich od neho prázdne miesto, tristo siah. Nepriateľ prestal strieľať a tým jasnejšie pocítil tú prísnu, hrozivú, nedobytnú a nepolapiteľnú líniu, ktorá oddeľuje dve nepriateľské jednotky.
„Jeden krok za touto čiarou, pripomínajúcu čiaru oddeľujúcu živých od mŕtvych a - neznáme utrpenie a smrť. Tak čo tam je? kto je tam? tam, za týmto poľom, a strom a strecha osvetlená slnkom? Nikto nevie a ja to chcem vedieť; a je strašidelné prekročiť túto hranicu a chcete ju prekročiť; a viete, že skôr či neskôr ju budete musieť prekročiť a zistiť, čo je na druhej strane čiary, rovnako ako je nevyhnutné zistiť, čo je na druhej strane smrti. A on sám je silný, zdravý, veselý a podráždený a obklopený takými zdravými a podráždene animovanými ľuďmi.“ Aj keď si to nemyslí, cíti to každý človek, ktorý je na dohľad nepriateľa, a tento pocit dáva zvláštny lesk a radostnú ostrosť dojmov všetkému, čo sa v týchto minútach deje.
Na kopci nepriateľa sa objavil dym z výstrelu a delová guľa s hvízdaním preletela nad hlavami husárskej eskadry. Spoločne stojaci dôstojníci odišli na svoje miesta. Husári začali opatrne narovnávať kone. Všetko v letke stíchlo. Všetci hľadeli dopredu na nepriateľa a na veliteľa letky a čakali na príkaz. Preletela ďalšia, tretia delovka. Vidno, že strieľali na husárov; ale delová guľa, rovnomerne rýchlo hvízdúca, preletela ponad hlavy husárov a udrela kdesi vzadu. Husári sa neobzreli, no pri každom zvuku letiacej delovej gule sa ako na povel celá eskadra s monotónne pestrými tvárami, zatajujúcimi dych, kým delová guľa letela, zdvihla v strmeňoch a opäť klesla. Vojaci, bez toho, aby otočili hlavy, pozreli bokom na seba a zvedavo hľadali dojem svojho kamaráta. Na každej tvári, od Denisova po bubáka, sa v blízkosti pier a brady objavil jeden spoločný znak boja, podráždenia a vzrušenia. Seržant sa zamračil a obzeral sa po vojakoch, akoby hrozil trestom. Junker Mironov sa zohol pri každej prihrávke delovej gule. Rostov, ktorý stál na ľavom boku na nohe, ktorá sa mu dotýkala, ale bol viditeľný, mal šťastný pohľad študenta predvolaný pred početné publikum na skúšku, v ktorej si bol istý, že vynikne. Pozrel sa jasne a žiarivo na všetkých, akoby ich žiadal, aby venovali pozornosť tomu, ako pokojne stojí pod delovými guľami. Ale aj v jeho tvári sa objavil ten istý rys niečoho nového a prísneho, proti jeho vôli, pri jeho ústach.
-Kto sa tam klania ? Yunkeg "Mig"ons! Hexog, pozri sa na mňa! - skríkol Denisov, neschopný stáť na mieste a krútiť sa na koni pred letkou.
Nosatá a čiernovlasá tvár Vasky Denisovovej a celá jeho malá, ubitá postava so šľachovitou (s krátkymi prstami pokrytými vlasmi) rukou, v ktorej držal rukoväť vytasenej šable, bola úplne rovnaká ako vždy, hlavne večer, po vypití dvoch fliaš. Bol len červenší ako zvyčajne a zdvihnúc svoju strapatú hlavu ako vtáky, keď pijú, nemilosrdne vtláčal ostrohy do bokov dobrého beduína svojimi malými nohami, akoby klesol dozadu, cvalom na druhý bok. letka a chrapľavým hlasom zakričal, aby dal preskúmať pištole. Odviezol sa ku Kirsten. Kapitán veliteľstva na širokej a usadenej kobyle išiel tempom smerom k Denisovovi. Štábny kapitán so svojimi dlhé fúzy, bol vážny, ako vždy, len oči sa mu leskli viac ako zvyčajne.
- Čo? - povedal Denisovovi, - nepríde k bitke. Uvidíš, vrátime sa.
"Kto vie, čo robia," zavrčal Denisov "Ach!" - zakričal na kadeta, keď si všimol jeho veselú tvár. - No, čakal som.
A súhlasne sa usmial, zrejme sa tešil z kadeta.
Rostov sa cítil úplne šťastný. V tom čase sa na moste objavil náčelník. Denisov cválal smerom k nemu.
- Vaša Excelencia, dovoľte mi zaútočiť!
"Aké sú to útoky," povedal náčelník znudeným hlasom a trhol sa, akoby ho znepokojovala mucha. - A prečo tu stojíš? Vidíte, bokovky ustupujú. Veďte letku späť.
Eskadra prešla cez most a unikla paľbe bez straty jediného muža. Za ním prešla druhá eskadra, ktorá bola v reťazi, a poslední kozáci vyčistili tú stranu.
Dve eskadry obyvateľov Pavlogradu, ktoré prešli mostom, jedna po druhej, sa vrátili späť do hory. Veliteľ pluku Karl Bogdanovič Schubert došiel k Denisovovej eskadre a išiel tempom neďaleko Rostova a nevenoval mu žiadnu pozornosť, napriek tomu, že po predchádzajúcom strete o Telyanin sa teraz prvýkrát videli. Rostov, ktorý sa cítil na fronte v moci muža, pred ktorým sa teraz považoval za vinného, ​​nespustil oči z vyšportovaného chrbta, blonďavého zátylku a červeného krku veliteľa pluku. Rostovovi sa zdalo, že Bogdanich len predstiera nepozornosť a že jeho celým cieľom bolo teraz vyskúšať odvahu kadeta, vzpriamil sa a veselo sa rozhliadol; potom sa mu zdalo, že Bogdanich úmyselne išiel blízko, aby ukázal Rostovovi svoju odvahu. Potom si myslel, že jeho nepriateľ teraz úmyselne pošle eskadru na zúfalý útok, aby ho potrestal, Rostov. Predpokladalo sa, že po útoku k nemu príde a veľkoryso podá ruku na zmierenie jemu, zranenému.

Thesaurus(z gréckeho thesauros - poklad) v modernej lingvistike - osobitný druh slovníkov všeobecnej alebo špeciálnej slovnej zásoby, ktoré označujú sémantické vzťahy (synonymá, antonymá, paronymá, hyponymá, hyperonymá atď.) medzi lexikálnymi jednotkami. Tezaury, najmä v elektronickom formáte, sú teda jedným z účinných nástrojov na popis jednotlivých tematických okruhov.

Na rozdiel od vysvetľujúceho slovníka vám tezaurus umožňuje identifikovať význam nielen pomocou definície, ale aj koreláciou slova s ​​inými pojmami a ich skupinami, vďaka čomu môže byť použitý v systémoch umelej inteligencie.

Pod pojmom tezaurus sa v minulosti označovali predovšetkým slovníky, ktoré maximálne kompletne prezentovali slovnú zásobu jazyka s príkladmi jeho použitia v textoch.

Paronymia- čiastočná zvuková podobnosť slov s ich významovou odlišnosťou (úplnou alebo čiastočnou). Paronymá sú často zdrojom rečových chýb.

Príklady rovnakých koreňových paroným: obliekať – obliecť, ľudský – humánny, platiť – platiť – platiť.

Príklady úplne nesúvisiacich paroným: biológia - bryológia, vývar - brouillon, kompót - komplot, textúra - fraktura.

Avšak tezaurus je viac ako len nástroj na vyhľadávanie informácií. Tezaurus možno považovať za univerzálny model terminologického systému, a teda za formálny systém vedomostí obsiahnutých v jazyku konkrétneho vedného odboru.

Všeobecný tezaurus

Tezaurus vo svojej najvšeobecnejšej definícii je slovník so sémantickými prepojeniami medzi jednotkami slovnej zásoby. Od konca 50. rokov sa tezaury používajú v systémoch strojového prekladu a systémoch na vyhľadávanie informácií (IRS).

Na rozdiel od sémantických slovníkov, ktoré sú navrhnuté tak, aby podrobne popisovali všeobecnú slovnú zásobu, sú tezaury vytvorené na ukladanie a klasifikáciu mimoriadne špecifických slov a fráz. Napríklad slovo látka je v slovníku ROSS (Ruský všeobecný sémantický slovník) a všetky názvy chemických zlúčenín sú už v tezaure.

Aké súvislosti sú opísané v tezaure? Spravidla platí:

    rod-druh (AKO)

    časť-celok (POF)

    synonymia/antonymia

    asociatívne.

Príklad rodovo-druhového vzťahu

Príklad sémantickej analýzy

Toto paradigmatický(stabilné spojenia, ktoré existujú medzi slovami v jazyku). A to nie je všetko.

Syntagmatický(textové) spojenia nie sú v tezaure zastúpené.

Príklad: WORDNET - inteligentný počítačový tezaurus

http://wordnet.princeton.edu/perl/webwn

Vytvorené na Princetonskej univerzite a voľne distribuované.

Hlavné vlastnosti.

Slová v ňom sú zoskupené do synonymných skupín ( synsety). Sú rozdelené do 4 slovníkov – podstatné mená, prídavné mená, slovesá a príslovky.

Synsety sa spájajú tak v hierarchických spojeniach (hyponymá a hyperonymá), ako aj vo vzťahu antonymie a tiež meronymie (byť súčasťou niečoho alebo pozostávať z častí).

Vyriešený je aj problém morfológie – slovo sa po adresovaní WN vracia v pôvodnej podobe.

Tezaurus vyhľadávania informácií

V oblasti získavania informácií výhoda používania tezaurov spočíva v prechode od textu k deskriptorom, ktoré opisujú objekt reálneho sveta. Presun na deskriptory umožňuje pokročilé (nadbytočné) indexovanie.

V tezaure na vyhľadávanie informácií sú explicitne vyjadrené PARADIGMATICKÉ vzťahy medzi deskriptormi (nie všetkými, ale tými, ktoré sú najčastejšie dôležité pre zvýšenie úplnosti vyhľadávania informácií). Experimentálne sa zistilo, že najdôležitejšie paradigmatické vzťahy sú

    podriadenosti

    podobnosť

    druh-rod (rod-druh)

    príčina-dôsledok

    časť-celok.

Príklad položky v slovníku:

Poľnohospodárske stroje

Syn. poľnohospodárska technika, poľnohospodárska technika,

Zobraziť: kombajn na zemiaky, sejačka atď.

Príklad redundantného indexovania

Žiadosť "poľnohospodárske stroje"

Príklad: Sociálno-politický tezaurus ruského jazyka Univerzitný informačný systém RUSKO

http://www.cir.ru/index.jsp

Vyvinuté autonómnou neziskovou organizáciou „Centrum pre výskum informácií“ (ANO ITSI)

Tezaurus je terminologický zdroj implementovaný vo forme slovníka pojmov a termínov so súvislosťami medzi nimi. Hlavným účelom tezauru je pomôcť pri získavaní informácií: na základe odkazov tezauru sa dopyt rozširuje, navigácia cez odkazy tezauru pomáha jasnejšie formulovať samotný dotaz.

Charakteristickým znakom hierarchie tezauru UIS „Rusko“ je mnohopočetnosť klasifikácie, to znamená, že pre väčšinu pojmov sa nehľadá jeden klasifikačný koncept (vzťah NAD - POD), ale rôzne uhly pohľadu na konkrétny konceptu sú popísané, napríklad koncept PREDAJŇA možno považovať aj za BUDOVU aj ako MALOOBCHODNÚ ORGANIZÁCIU.

Tezaurus na spoločensko-politické témy zahŕňa viac ako 26 000 pojmov, 62 000 pojmov, 100 000 priamych a 700 000 zdedených vzťahov medzi pojmami. Aktuálna verzia tezauru popisuje terminológiu používanú v spoločensko-politickej oblasti vrátane ekonomickej, politickej, vojenskej, legislatívnej, sociálnej, medzinárodných vzťahov a iných oblastí.

Úplný názov tezauru je Informačný a vyhľadávací tezaurus o spoločensko-politických témach na automatické indexovanie. Všetky definície sú tu dôležité:

    „vyhľadávanie informácií“ – pretože je navrhnutý špeciálne na použitie pri získavaní informácií, aby pomohol používateľovi pri vytváraní (objasňovaní) dopytu a na automatické rozširovanie podmienok dopytu počas vyhľadávania;

    „o sociálno-politických témach“ - pretože pokrýva 95-99% slovnej zásoby a terminológie ruskojazyčného textu o sociálno-politických témach;

    „pre automatické indexovanie“ – keďže je základom pre proces automatického určovania predmetu dokumentov – zoskupovanie pojmov uzavretých v hierarchii tezauru do tematických uzlov, automatická kategorizácia a automatická anotácia.

Thesauri - záver

Pre mnohé známe tezaurusy (WordNet, Roget, EuroWordNet) zostáva veľkým problémom automatické vyvodzovanie zo spojení tezaurov – keď je rozšírenie na najbližšie okolie správne, ale nie úplné a pokusy o rozšírenie okolia vedú k chybám.

Sekcia sa používa veľmi jednoducho. Stačí zadať požadované slovo do príslušného poľa a my vám poskytneme zoznam jeho významov. Dovolím si poznamenať, že naša stránka poskytuje údaje z rôznych zdrojov – encyklopedických, výkladových, slovotvorných slovníkov. Tu si môžete pozrieť aj príklady použitia zadaného slova.

Význam slova tezaurus

tezaurus v krížovkárskom slovníku

Výkladový slovník ruského jazyka. S.I.Ozhegov, N.Yu.Shvedova.

tezaurus

[te], -a, m.

    Slovník jazyka, ktorého cieľom je plne odrážať celú jeho slovnú zásobu.

    Slovník alebo súbor údajov, ktorý plne pokrýva výrazy koncepty nejakého druhu. špeciálne pole.

    adj. synonymický slovník, -aya, -oe.

Nový výkladový slovník ruského jazyka, T. F. Efremova.

tezaurus

    Slovník nejakého druhu jazyk, ktorý predstavuje jeho slovnú zásobu v plnom rozsahu.

    Kompletný systematizovaný súbor údajov o niečom. oblasť vedomostí, ktorá umožňuje človeku alebo počítaču sa v nej orientovať (v informatike).

Encyklopedický slovník, 1998

tezaurus

THESAURUS (z gréckeho thesauros - poklad)

    slovník, v ktorom sú slová jazyka prezentované čo najúplnejšie s príkladmi ich použitia v texte (je plne realizovateľný len pre mŕtve jazyky).

    Slovník, v ktorom sú slová súvisiace s ľubovoľnou oblasťou poznania usporiadané podľa tematického princípu a zobrazené sémantické vzťahy (rodovo-druhové, synonymické a pod.) medzi lexikálnymi jednotkami. V tezauroch na vyhľadávanie informácií sú lexikálne jednotky textu nahradené deskriptormi.

Thesaurus

(z gréckeho thesaurós ≈ poklad, pokladnica), súbor sémantických jednotiek jazyka, v ktorom je špecifikovaný systém sémantických (pozri Sémantika) vzťahov. T. vlastne určuje sémantiku jazyka ( národný jazyk, jazyk špecifickej vedy alebo formalizovaný jazyk pre automatizovaný riadiaci systém). Pôvodne bol T. považovaný za jednojazyčný slovník, v ktorom sa sémantické vzťahy určujú zoskupovaním slov do tematických okruhov. Napríklad anglický T. (autor P. M. Roget), vydaný v roku 1962 (1. vydanie 1852), obsahuje 1040 nadpisov, do ktorých je distribuovaných asi 240 000 slov. Index (kľúč) k tomuto T. obsahuje abecedný zoznam slov s uvedením nadpisov a podnadpisov, do ktorých každé slovo patrí. Existujú tradičné všeobecné lingvistické texty (opisy sémantických systémov jednotlivých jazykov) pre angličtinu, francúzštinu, španielske jazyky. Jednojazyčné slovníky, ktoré špecifikujú výrazy základných sémantických parametrov každého slova, sú veľmi blízke T., napríklad ruský slovník S. I. Ozhegova.

V 70. rokoch 20. storočia Technológie získavania informácií sa rozšírili V týchto systémoch sa identifikujú špeciálne lexikálne jednotky – deskriptory, pomocou ktorých je možné automaticky vyhľadávať dokumentárne informácie. Každé slovo takéhoto T. je spojené so synonymným deskriptorom (pozri Synonymia) a pre deskriptory sú výslovne uvedené sémantické vzťahy: rod ≈ druh, časť ≈ ​​celok, cieľ ≈ prostriedky atď. Zvyčajne je zvykom rozlišovať medzi rodovo špecifické (hierarchické) a asociatívne vzťahy. Preto „Thesaurus získavania informácií v informatike“, publikovaný v ZSSR v roku 1973, poskytuje pre každý deskriptor heslo do slovníka, kde sú samostatne uvedené synonymické kľúčové slová, generické, špecifické a asociatívne deskriptory. Pre lepšiu orientáciu v asociatívnych spojeniach medzi deskriptormi sú k tomuto T pripojené sémantické mapy tematických tried. Pri automatizovanom vyhľadávaní informácií sa vyhľadávajú dokumenty, ktorých index obsahuje nielen deskriptory dotazov, ale aj tie deskriptory, ktoré sú s nimi v určitých sémantických vzťahoch. Niekedy je užitočné zdôrazniť špecifické asociatívne vzťahy v slovnej zásobe, ktoré sú špecifické pre danú tematickú oblasť: choroba ≈ patogén, zariadenie ≈ účel (alebo nameraná hodnota) atď. Pozícia lexikálnej jednotky (slova, frázy) v slovnej zásobe charakterizuje jeho význam v jazyku ; znalosť systému sémantických vzťahov, do ktorých dané slovo vstupuje (vrátane kategórií, do ktorých je zaradené), nám umožňuje posúdiť význam tohto slova.

V širšom zmysle sa T. interpretuje ako opis systému vedomostí o realite, ktorý vlastní individuálny nosič informácie alebo skupina nosičov. Toto médium môže vykonávať funkcie prijímača dodatočných informácií, v dôsledku čoho sa mení aj jeho T pôvodné T určuje schopnosti prijímača pri prijímaní sémantickej informácie. V psychológii a pri štúdiu systémov s umelou inteligenciou sa zvažujú vlastnosti jednotlivcov, ktoré sa prejavujú vo vnímaní a chápaní informácií. V sociológii a teórii komunikácie študujú vlastnosti komunikácie jednotlivcov a skupín, ktoré zabezpečujú možnosť vzájomného porozumenia na základe spoločnej komunikácie V týchto situáciách musí komunikácia obsahovať zložité výpovede a ich sémantické súvislosti, ktoré určujú zásobu informácií dostupných pre komplexný systém. T. v skutočnosti obsahuje nielen informácie o realite, ale aj metainformácie (informácie o informáciách), ktoré umožňujú prijímať nové správy.

Lit.: Cherny A.I., Všeobecná technika konštrukcia tezaurusov, „Vedecké a technické informácie. Ser. 2", 1968, ╧5; Varga D., Metodika prípravy informačných tezaurov, prekl. [z maďarčiny], M., 1970; Shreider Yu. A., Thesauruses in computer science a teoretická sémantika, „Vedecké a technické informácie. Ser. 2", 1971, ╧ Z.

Yu A. Schrader.

Wikipedia

Thesaurus

Thesaurus vo všeobecnom zmysle - špeciálna terminológia, presnejšie a konkrétnejšie - slovník, zbierka informácií, korpus alebo kód, ktorý plne pokrýva pojmy, definície a termíny špeciálnej oblasti poznania alebo oblasti činnosti, ktoré by mali prispieť k správnej lexikálnej oblasti, firemná komunikácia; v modernej lingvistike - špeciálny typ slovníka, ktorý označuje sémantické vzťahy (synonymá, antonymá, paronymá, hyponymá, hyperonymá atď.) medzi lexikálnymi jednotkami. Tezaury sú jedným z najúčinnejších nástrojov na popis jednotlivých tematických okruhov.

Na rozdiel od vysvetľujúceho slovníka vám tezaurus umožňuje identifikovať význam nielen prostredníctvom definície, ale aj koreláciou slova s ​​inými pojmami a ich skupinami, vďaka čomu môže byť použitý na naplnenie znalostných báz systémov umelej inteligencie.

V minulosti termín tezaurus Väčšinou boli určené slovníky reprezentujúce slovnú zásobu jazyka s maximálnou úplnosťou s príkladmi jeho použitia v textoch.

Tiež termín tezaurus používa sa v teórii informácie na označenie súhrnu všetkých informácií, ktoré má subjekt.

V psychológii je tezaurus jednotlivca charakterizovaný vnímaním a chápaním informácií. Teória komunikácie zvažuje aj všeobecný tezaurus komplexného systému, prostredníctvom ktorého jeho prvky interagujú.

tezaurus (zjednoznačnenie)

Thesaurus:

  • Thesaurus je slovník, zbierka informácií pokrývajúcich pojmy, definície a termíny špeciálnej oblasti vedomostí alebo oblasti činnosti.
  • Rogerov tezaurus je jedným z prvých v histórii a najznámejších ideografických slovníkov súčasnosti.

Príklady použitia slova tezaurus v literatúre.

Pre vnímanie a spolutvorbu určité optimum tezaurus, nie malý, ale ani príliš veľký.

S neobmedzeným veľké množstvá prichádzajúce informácie výrazne prevyšujú tezaurus, jeho hodnota nezávisí od tejto veličiny a je úplne určená tezaurus ohm

Všestrannosť a systematickosť umenia vedie k nerovnomernému vnímaniu diela ako celku: pre vnímanie niektorých aspektov verša tezaurus optimálne, pre ostatných je nedostatočné alebo príliš veľké.

Pretože tezaurus rastie a mení sa, opätovné zoznámenie sa s prácou môže znamenať získanie nových cenných informácií.

Túžba dieťaťa prečítať si svoju obľúbenú rozprávku mnohokrát je pochopiteľná: on tezaurus rýchlo rastie a jeho schopnosť spolutvorby a asociatívnej fantázie je obzvlášť veľká.

Tento aspekt veci je premenlivejší a subjektívnejší ako tezaurus, a pri hľadaní objektívneho estetického posúdenia diela ho treba zredukovať na minimum.

Preniká tezaurus básnik a adresuje preklad tezaurus od cudzojazyčného čitateľa.

Najdôležitejšie je určiť, aký veľký je váš tezaurus, T.

Nie, len jeho vlastná batožina je skromná, je nevyvinutá, jeho tezaurus je v plienkach a ak tomu nerozumie tezaurus treba zvysit, tak v kazdom pripade ta zena to bude mat s nim tazke.

Bohatý tezaurus, na základe pravdivého poznania, umožňuje človeku pri komunikácii s inou osobou, vrátane najbližšej komunikácie s najbližšou osobou, správne reagovať na čokoľvek, čo sa deje.

Je zrejmé, že s rastúcou hodnotou klesá hodnota informácií tezaurus musí závisieť od vzťahu tezaurus k množstvu prijatých informácií.

Je zrejmé, že optimálna hodnota umeleckej informácie zodpovedá blízkosti tezaurusčitateľ a tezaurus básnik.

Môžeme povedať, že spolutvorba si rovnako ako kreativita vyžaduje inšpiráciu, teda inklúziu tezaurus v širšom zmysle slova.

Takéto vnútorné opakovanie jasného obrazu a jasného zvuku, pričom zostáva v rámci existujúceho tezaurus, obohacuje o rovnaký estetický moment opakovania.

V tomto bode tezaurus Nabokova a Prišvina treba považovať za protinožcov Platonova a Marina Cvetajevovú možno považovať za podobnú ako on.

3.1. Koncept tezauru

Thesaurus (z gr. θήσαϋροξ - poklad, zásoba) alebo ideografický slovník (z gr. idea - pojem, reprezentácia, idea a grafo - písať, opisovať) - v modernej lingvistike: 1) špeciálny druh slovníka všeobecnej alebo špeciálnej slovnej zásoby, ktorý obsahuje sémantické vzťahy medzi lexikálnymi jednotkami; 2) slovník na vyhľadávanie slova na základe jeho sémantickej súvislosti s inými slovami; 3) určitý spôsob organizácie (usporiadania) slov v slovníku; 4) spôsob organizácie lexikálneho zloženia, ktorý vám umožňuje ekonomicky „modelovať svet“.

V prvom, pôvodnom význame - úložisko, poklad, termín synonymický slovník používal L.V. Shcherba v článku „Skúsenosti zo všeobecnej lexikografie“ (tretia opozícia: tezaurus - obyčajný (vysvetľujúci alebo prekladový) slovník). Vedec píše: „Keď sa povie tezaurus, dnes máme najčastejšie na mysli „Thesaurus linguae latinae“, podnik piatich nemeckých akadémií, ktorý začal v roku 1900 a doteraz bol dokončený s vynechaním iba písmena M. Funkcia Tento typ slovníkov spočíva v tom, že obsahujú úplne všetky slová, ktoré sa v danom jazyku aspoň raz vyskytujú, a že pod každým slovom sú uvedené úplne všetky citácie z textov dostupných v danom jazyku. Základom vyššie uvedenej opozície – tezauru – bežného (výkladového alebo prekladového) slovníka – je opozícia „jazykového materiálu“ a „jazykového systému“ – pojmov, ktoré som sa pokúsil zdôvodniť v článku „O trojakom aspekte jazykových javov a o experimente v lingvistike“.

Druhý význam tohto výrazu je spojený so všeobecne známym slovníkom-tezaurom „Thesaurus anglické slová a výrazy“ P.M. Roger (Rogetov Tezaurus anglických slov a fráz, 1852) a jeho pokračovanie, slovník O.V.

V tomto výklade pojem tezaurus označuje istý spôsob organizácie a usporiadania lexikálnej skladby v slovníku (pozri tretí význam pojmu).

Štvrtý význam termínu tezaurus je spojený so všeobecným uznaním tejto metódy organizácie lexikálneho zloženia, ktorá umožňuje ekonomicky „modelovať svet“. Z tohto hľadiska je slovník tezauru „systematické usporiadanie slovnej zásoby akejkoľvek vednej alebo technickej oblasti a v naj celkový pohľad- všeobecná literárna slovná zásoba a navyše celá slovná zásoba daného jazyka.“

Podľa Yu.N. Karaulova, všeobecný jazykový tezaurus, fixujúci v štruktúre a vzťahoch svojich nadpisov, sekcií, zón, oblastí široké možnosti neverbálneho prepojenia myšlienok, zabezpečuje výklad ľudských hodnôt.

A.N. Baranov a D.O. Dobrovolsky v predslove „Od redaktorov“ k svojmu „Slovníkovému tezauru moderných ruských idiómov“ dáva tezauru nasledujúcu definíciu - špeciálny typ slovníka, ktorý sa od ostatných (najmä vysvetľujúcich, dvojjazyčných atď.) líši spôsobom organizovania lingvistického materiálu. V tezaure sa jazykové jednotky neuvádzajú v abecednom poradí ako v bežnom slovníku, ale sú zoskupené podľa ich významu.

L.P. Krysin nazýva tezaurus (ideografický slovník) zvláštnym druhom výkladového slovníka, slovníkom „naopak“. „Ak vo vysvetľujúcom slovníku vedec píše, „zápis“ do slovníkového hesla je slovo a obsahom slovníkového hesla je výklad významu tohto slova, potom v ideografickom slovníku je „zápis“ význam, myšlienka (odtiaľ názov tohto typu slovníka - ideografický) a obsah slovníkového hesla je zoznam slov vyjadrujúcich daný význam. A ak je výkladový slovník nepostrádateľným nástrojom na porozumenie textu, potom ideografický slovník môže byť použitý pri vytváraní textu: veľmi často chce človek vyjadriť určitú myšlienku, ale nemôže nájsť slová vhodné na to; ideografický slovník uľahčuje tieto vyhľadávania. Existujú dva hlavné typy tezaurov:

lingvistický tezaurus - slovník obsahujúci zoznam slov v prirodzenom jazyku vybraných ako výsledok zmysluplnej analýzy textov a systematizovaných v súlade s prijatým klasifikačným systémom;

štatistický tezaurus - slovník na vyhľadávanie informácií obsahujúci zoznam slov vybraných na základe štatistickej analýzy textov na konkrétnu tému a zoskupených do slovníkových hesiel na základe frekvencie spoločného výskytu týchto slov v rovnakých textoch.

Tezaury na vyhľadávanie informácií (IRT) uľahčujú vyhľadávanie informácií pri ich automatickom spracovaní. IPT maximálne odhaľuje sémantické vzťahy medzi lexikálnymi jednotkami. Ako sa uvádza v GOST na IPT, „jednojazyčný tezaurus na vyhľadávanie informácií je riadený a meniaci sa slovník lexikálnych jednotiek založený na slovnej zásobe jedného prirodzeného jazyka, ktorý zobrazuje sémantické vzťahy medzi lexikálnymi jednotkami a je určený na spracovanie a získavanie informácií.

Základnou jednotkou IPT sú deskriptívne termíny. Abecedná, lexikálno-sémantická časť IPT je súborom deskriptorových členov.

Opisné slovníky sú určené na úplný opis slovnej zásoby určitého odboru a zaznamenávanie všetkých použití v ňom; zaznamenávajú všetky dostupné relevantné prípady. Typický príklad Opisným slovníkom je „Výkladový slovník živého veľkého ruského jazyka“ od V.I. Dahl (prvé vydanie v štyroch zväzkoch vyšlo v rokoch 1863-1866). Cieľom jeho tvorcu nebolo štandardizovať jazyk, ale plne opísať celú rozmanitosť veľkoruskej reči – vrátane jej nárečových foriem ľudovej reči.

Každé heslo slovníka deskriptorov začína deskriptorom, v ktorom sú nižšie v článku GOST uvedené synonymá tohto deskriptora, ako aj ďalšie lexikálne jednotky spojené s hlavným deskriptorom rodovo špecifickými alebo asociačnými vzťahmi.

Tezaury, najmä v elektronickom formáte, sú teda jedným z účinných nástrojov na popis jednotlivých tematických okruhov.

V čistej forme sa tezaurus nachádza len zriedka. V skutočných tezauroch je pôvodná myšlienka zjednodušená alebo nadbytočná, ale potenciálne potrebná je informácia pridaná používateľovi. Najznámejšie sú dnes „Ruský sémantický slovník“ od Yu.N. Karaulova, „Slovník identických mien“ N.Yu. Shvedova," Tematický slovník ruský jazyk“ L.G. Smekhovej a ďalších.

Obnoviť. Termín tezauru L.V. Ščerba ho použil vo vzťahu k slovníku, ktorý zaznamenával podľa možnosti všetky kontexty, v ktorých sa dané slovo vyskytuje. Charakteristickým znakom tezaurusov je, že uvádzajú zoznam všetkých slov, ktoré sa v danom jazyku vyskytujú aspoň raz a pod každým slovom sú uvedené všetky citáty z textov dostupných v danom jazyku. Obsah slovníka tezauru je jazykový materiál a bežný slovník je jazykový materiál a jazykový systém (pojmy L.V. Shcherba).

Túto charakteristiku dopĺňajú krížové spojenia rôzneho druhu – často paradigmatické (synonymné alebo antonymické), ktoré naznačujú zhodnosť alebo protiklad významov. Okrem toho rôzne druhy združení. spojenia (t. j. spojenia syntagmy).

Úlohou tezauru (ideografického slovníka) je teda poskytnúť predstavu o sémantickej organizácii určitého prierezu jazykového materiálu, ukazujúc hlavné sémantické polia, ich vnútornú štruktúru a vonkajších vzťahov. Tezaurus je jasnou ukážkou systémovej povahy jazyka, ktorý umožňuje vidieť mnoho typov vzťahov spájajúcich jednotlivé jazykové jednotky a skupiny jednotiek.

3.2. História reprezentácie pojmových vedomostí o svete vo forme tezauru

Potreba usporiadať slová podľa podobnosti, súvislostí a analógie ich významov bola pociťovaná počas celej pozorovateľnej histórie ľudského myslenia.

Aby sme vystopovali počiatky myšlienky reprezentovať konceptuálne poznatky o svete vo forme tezauru, pomôže nám to, ak sa obrátime na históriu zostavovania tezaurov (ideografických slovníkov).

A tak na úsvite civilizácie, keď ľudia mohli svoje myšlienky vyjadrovať písomne ​​len pomocou ideogramov a symbolov, bol asi jediný možný slovník, v ktorom boli slová usporiadané do tematických skupín. Pre lexikografa bolo v tom čase jednoducho ťažké nájsť iné kritérium na klasifikáciu slov, ako sú vzťahy, ktoré existujú v samotnej realite.

Žiaľ, nemáme žiadne dôkazy o tom, či národy, ktoré používali ideografické písanie, takéto slovníky skutočne mali. Medzi najstaršie známe pokusy o ideografickú klasifikáciu patrí Attikai Lexeis gréckeho gramatika, riaditeľa Alexandrijskej knižnice Aristofanesa Byzantského (zomrel 180 pred Kr.).

V II storočí. n. e. objavuje sa hlavné dielo „Onomasticon“, ktoré na materiáli z gréckeho jazyka zostavil lexikograf a sofista Julius Pollux (vlastným menom Polydeuces), rodák z egyptského mesta Naucratis. Yu Pollux napísal niekoľko diel, ale k nám sa dostal iba „Onomasticon“ (Pollux Yu. Onomasticon. M., 1956).


Onomasticon pozostáva z 10 kníh. Knihy sú v podstate samostatné pojednania a obsahujú najdôležitejšie slová súvisiace s konkrétnou témou. Prvá kniha teda hovorí o bohoch a kráľoch; v druhej - o ľuďoch, ich živote a fyziologickej štruktúre; v treťom - o príbuzenstve a občianskych vzťahoch atď. Slová zahrnuté v slovníku sú doplnené stručnými výkladmi. V modernej dobe bol slovník prvýkrát vydaný v roku 1502 v Benátkach.

Medzi 2. a 3. stor. n. e. Bol vydaný úžasný sanskrtský slovník „Amarakosha“ (Amarakosha. Paris, 1839). Jej autorom je staroindický básnik, gramatik a lexikograf Amara Sina, ktorý bol nazývaný „jednou z deviatich perál, ktoré zdobia trón Vikramaditya“. Amarakosha v preklade do ruštiny znamená pokladnica Amara. Slovník obsahuje 10 tisíc slov. Pre lepšie zapamätanie si výkladu významov slov sú slovníkové heslá konštruované vo forme básní. Všetok slovníkový materiál je rozdelený do 3 kníh. Každá kniha obsahuje niekoľko kapitol a kapitola je v prípade potreby rozdelená na niekoľko častí. Prvá kniha je venovaná oblohe, bohom a všetkému, čo s nimi priamo súvisí. Druhá kniha obsahuje slová súvisiace so zemou, sídlami, rastlinami, zvieratami a ľuďmi (najskôr je človek považovaný za živú bytosť a potom za spoločenskú bytosť; pred očami sa nám zjavuje celá kastová štruktúra súčasnej autorovej spoločnosti, kňazi , ako Boží správcovia, sú úplne hore a dole sú vojaci a králi, ešte nižšie sú vlastníci pôdy a úplne dole sú remeselníci, žongléri, sluhovia atď.). Tretia kniha je prísne lingvistická, ako je zrejmé z názvov jej šiestich kapitol.

Do povedomia európskych vedcov sa slovník dostal až koncom 18. storočia, keď v roku 1798 vyšla v Ríme jeho prvá časť. V úplnom znení s prekladom do angličtiny ju publikoval v roku 1808 anglický sanskrtský učenec G.T. Colebrooke (N.T. Colebrooke). V roku 1839 sa objavil jeho francúzsky preklad, ktorý vytvoril A.L. Delonchamps (A.L. Deslongchamps). Ďalší vývoj Myšlienka sémantickej klasifikácie slovnej zásoby je spojená s problémom takzvaného svetového jazyka.

Obnoviť. Toto je vo všeobecnosti prvá etapa vo vývoji tradície ideografickej klasifikácie slovnej zásoby. Túto etapu možno nazvať prehistóriou ideografických slovníkov. Teraz je vhodné obrátiť sa na moderná klasifikácia slovníky-tezaurusy.

Je dobre vidieť, ako sa popisované diela líšia od abecedných slovníkov. Ak je v abecedných slovníkoch uvádzanie slov upravené takýmto podmieneným a vysoký stupeň neutrálny nástroj, ako je abeceda, potom pri konštrukcii ideografického slovníka rozhoduje svetonázor samotného lexikografa.

3.3. Princípy klasifikácie slovníkov-tezaurov

Ako už bolo uvedené vyššie, problém zostavovania klasifikácie tezaurov nie je nový a už niekoľko desaťročí priťahuje pozornosť mnohých domácich i zahraničných lingvistov (C. Marello, V. V. Morkovkin, L. P. Stupin, V. V. Dubichinsky atď. ). Výsledkom výskumu v tejto oblasti bolo vytvorenie alternatívnych klasifikácií týchto lexikografických diel. Jedna z najnovších klasifikácií je založená na nasledujúcich kritériách: a) typ sémantických spojení medzi jednotkami slovnej zásoby; 2) objem slovnej zásoby; 3) zovšeobecňovanie slovnej zásoby; 4) rozvoj významu lexém; 5) gramatická a štylistická kvalifikácia lexém; 6) demonštrácia fungovania lexém; 7) počet zastúpených jazykov; 8) typ semiotických prostriedkov používaných na sémantizáciu lexém. Táto klasifikácia je založená na predtým vytvorených klasifikáciách O.M. Karpova a I. Burchanov (Burchanov I. K ideografickému opisu štylisticky a pragmaticky relevantných aspektov lexikálnych významov. Londýn, 1996); terminológia používaná pri klasifikácii sa zavádza do lexikografického aparátu


V.V. Morkovkin, Yu.N. Karaulov, K. Marello. Klasifikačné kritériá sformuloval O.M. Karpovej. C. Marello zároveň rozlišuje tri typy tezaurov:

kumulatívne, čo sú zoskupenia slov bez definovania ich významov;

definitívny, interpretujúci každú lexikálnu jednotku skupiny slov;

dvoj- a viacjazyčné tezaury pre cestovateľov (Marello C. Thesaurus//W.D.D. 1990. V. 2. P. 1083).

Kumulatívne tezaury nielenže predstavujú možnosť nájsť zrozumiteľnejšie, presnejšie, štylisticky správne slovo v situácii byť v určitom sémantickom poli, ale stať sa aj základom pre formovanie tematických počítačových databáz.

Definitívne tezaury môžu obsahovať spolu s definíciami významu aj etymologické informácie a citáty z literárnych diel, čo ukazuje priamu encyklopedickú orientáciu tohto typu tezauru. Okrem toho slovníky tohto typu zoznamujú používateľa s potrebným systémom pojmov, vysvetľujú podstatu, podobnosti a rozdiely pojmov, ich paradigmatické a syntagmatické súvislosti, niekedy poskytujú informácie o výslovnosti, gramatike, slovotvorbe a iných možnostiach lexikálne jednotky označujúce tieto pojmy.

Dvojjazyčné a viacjazyčné tezaury pre cestovateľov sa zvyčajne vytvárajú podľa tematických sekcií: čísla, jedlo, doprava, hotely atď. s prekladovými ekvivalentmi dvoch alebo viacerých jazykov.

Na čo najúplnejšie zobrazenie typov existujúcich slovníkov tezaurov je vytvorená viacúrovňová klasifikácia. Po prvé, podľa typu sémantických spojení medzi jednotkami slovnej zásoby sa tezaury delia do troch veľkých tried:

1. Asociačný tezaurus (terminológia Yu.N. Karaulova

2. Analogický tezaurus (terminológia V. V. Morkovkina

3. Ideografický (ideologický) tezaurus (terminológia L.V. Shcherba, V.V. Morkovkin. Uvedené tri typy tezaurov odrážajú tieto typy významových spojení lexém, resp.

1. Sémanticko-syntaktické súvislosti, na základe ktorých
slová sa spájajú do skupín alebo dvojíc, ktorých výskyt a existenciu predurčujú dvojité spojenia: sémantické a syntaktické. Sémantické spojenia medzi slovami sa vytvárajú najmä medzi slovesami a prídavnými menami, ktoré plnia predikačnú funkciu vo vete, a podstatnými menami, napr.

a) medzi úkonom a orgánom (nástrojom), ktorým sa vykonáva: chytiť - ruku, vidieť - oko, plávať - ​​čln atď.;

b) medzi dejovými slovesami, ktoré vyžadujú jeden podmet a podmet: štekať - pes, rehotať - kôň atď.; c) medzi slovesami a určitým gramatickým doplnením, ktoré prvé vyžadujú: rúbať - drevo, jesť - jedlo atď.

Asociačný tezaurus je teda slovníkový tezaurus, ktorý organizuje lexikálne jednotky na základe sémantických a syntaktických spojení, ktoré medzi nimi existujú, a zoskupuje skupiny podľa grafickej podoby stredových slov.

2. Lexikálno-sémantické spojenia. Zoskupovanie s týmto typom spojenia sa vyskytuje podľa hlavného znaku pre slová - lexikálneho významu. V tomto prípade sa zohľadňujú aj lexiko-gramatické spojenia, v podobe ktorých sa realizujú jednotlivé významy slov.

Analogický tezaurus je teda lexikografická referenčná kniha, ktorej hlavnou jednotkou makroštruktúry je lexikálno-sémantická skupina; skupiny sú systematizované v abecednom poradí sémantických dominánt.

3. Predmetové alebo tematické spojenia, kde spojenie slov do jednej skupiny nastáva v dôsledku podobnosti alebo zhody funkcií objektov a procesov označovaných slovami: objekty
predmety pre domácnosť, časti tela, typy odevov, budovy atď.

Ideografický tezaurus je teda lexikografickým dielom, ktoré predstavuje lexikálne jednotky ako súčasť vecných (tematických) skupín a organizuje ich do hierarchickej štruktúry určenej na reprezentáciu konceptualizovaných poznatkov o svete.

V rámci toho istého kritéria ďalej delíme typy. Ideografický tezaurus je teda reprezentovaný nasledujúcimi 4 typmi:


Vlastne ideografický tezaurus.

Tematický slovník.

Systematický slovník.

Tematicko-systematický slovník


Skutočný ideografický tezaurus je špeciálny typ ideografický slovník, ktorého makroštruktúra je usporiadaná v súlade so synoptickou mapou a priori, nadradená lexikálnej skladbe jazyka. Na rozdiel od iných typov ideografického slovníka sa samotný ideografický tezaurus vyznačuje logickou a prísne usporiadanou klasifikačnou štruktúrou vytvorenou na základe vedeckej taxonómie, aj keď všeobecná slovná zásoba podlieha lexikografickému popisu (New Webster „Thesaurus. Landoll, 1991).

Tematický slovník je osobitný typ ideografického tezauru, ktorého hlavnou jednotkou makroštruktúry je tematická skupina vrátane lexém, zjednotená na základe klasifikácie ich denotátov (referentov) a posudzovaná z hľadiska súladu s tzv. konkrétnu tému.

Systematický slovník je špeciálny typ ideografického tezauru, ktorého klasifikačná štruktúra má reprezentovať skutočné sémantické vzťahy, ktoré existujú medzi lexikálnymi jednotkami jazyka. Klasifikačná štruktúra vo svojom jadre predstavuje lexiko-gramatickú klasifikáciu slovnej zásoby, inými slovami, jej paradigmatickú štruktúru, opísanú z hľadiska podriadenosti a kompozície.

Tematicko-systematický slovník je osobitný druh ideografického slovníka, ktorý je kombináciou tematického a systematického slovníka.

Obnoviť. Uvažovaná klasifikácia lingvistických tezaurov zahŕňa tieto typy slovníkov: analogický tezaurus (terminológia V. V. Morkovkina); ideografický (ideologický) tezaurus (terminológia L.V. Shcherba a V.V. Morkovkin); doc. tezaurus (terminológia Yu.N. Karaulova). Ďalej bude predstavený pop. sú odhalené tezaury a ich črty.

3.4. Populárne tezaury a ich vlastnosti

Najznámejší z dostupných slovníkov-tezaurusov, ktorým tento pojem vďačí za svoju existenciu, bol vytvorený na materiáli anglický jazyk; toto je neustále dotlačovaný tezaurus od P.M. Tezaurus anglických slov a fráz (1852) Rogera Rogeta.

Je dôležité poznamenať, že autor Tezauru anglických slov a výrazov naplno využil dovtedy dostupné skúsenosti. „Princíp, ktorý ma viedol pri klasifikácii slov,“ píše P.M. Roger je ten istý, ktorý sa používa pri klasifikácii jednotlivcov v rôznych oblastiach prírodnej histórie. Preto časti, ktoré som zvýraznil, zodpovedajú prirodzeným čeľadiam botaniky a zoológie a séria slov je stmelená rovnakými vzťahmi, ktoré spájajú prirodzené rady rastlín a živočíchov.“

P.M. Roger veril, že presvedčivá klasifikácia slov podľa ich významov je nemožná, kým objekty reality nazývané tieto slová nie sú riadne preštudované a usporiadané. Preto svoju prácu začína rozdelením pojmového poľa anglického jazyka do štyroch veľkých tried: abstraktné vzťahy, priestor, hmota a duch (myseľ, vôľa, pocity). Tieto triedy sa ďalej delia na niekoľko rodov, ktoré sa zase delia na určitý počet druhov.

Medzi nedostatky ideografického slovníka P.M. Vedci Rogerovi pripisujú nasledovné: 1) nie celkom presvedčivá nomenklatúra hlavných pojmových tried; 2) abstraktná logika prevláda nad prirodzenými spojeniami slov; 3) relatívne nepohodlie pri používaní (tento nedostatok bol z veľkej časti opravený v nasledujúcich vydaniach).

V modernej ruskej lexikografii existuje niekoľko slovníkov, ktoré by sa mali klasifikovať ako slovníky-tezaury (ideografické slovníky). Toto napríklad vzniklo pod vedením Yu.N. Karaulova „Ruský sémantický slovník“, „Ruský sémantický slovník“ editoval N.Yu. Shvedova, „Tematický slovník ruského jazyka“ od L.G. Sayakhova, D.M. Khasanova a V.V. Morkovkina, „Slovník lexikálno-sémantických skupín ruských slovies“, vyd. E.V. Kuznetsova, „Ideografický slovník ruského jazyka“ od O.S. Baranova, „Konceptosféra vnútorného sveta človeka v ruskom jazyku“ od V.I. Ubiyko, komplexný vzdelávací slovník „Lexikálny základ ruského jazyka“ pod vedením V.V. Morkovkina.

Poďme sa s niektorými zoznámiť.

Slovník-tezaurus moderných ruských idiómov“ editoval A.N. Baranovej a D.O. Dobrovolsky zahŕňa štyri hlavné časti: 1) synopsa; 2) legenda; 3) hlavná časť slovníka-tezauru; 4) ukazovatele. Účelom súhrnu je poskytnúť všeobecnú predstavu o štruktúre hlavnej časti tezauru. Uvádza všetky taxóny s podtaxónmi a zodpovedajúcimi paradigmatickými odkazmi. Hlavnou časťou slovníka-tezauru je zbierka slovníkové heslá, zoskupené do skupín (taxónov) a podskupín (subtaxónov) v súlade s významom v nich opísaných frazémov. Každý článok obsahuje idióm a príklady jeho použitia v modernej ruštine. Synopsa, Legenda, Indexy sú servisné časti vyššie uvedeného Slovníka-tezauru, ktoré užívateľovi poskytujú možnosť pracovať rýchlo a efektívne. Legenda sa používa v prípadoch, keď príklady použitia frazémov nie sú potrebné, pretože reprodukuje všetky informácie okrem príkladov. V skutočnosti ide o slovnú zásobu Slovníka. Jednotkami slovnej zásoby sú lemmy. Lema v tomto prípade predstavuje frazému v jej pôvodnej (slovníkovej) podobe a zahŕňa podľa možnosti všetky jej významné varianty. Napríklad idióm stoj nehybne je súčasťou lemmy označiť čas, stoj v pokoji, šmyk na mieste.

Slovník obsahuje dva ukazovatele. Na konci knihy je článok „Teoretický koncept slovníka-tezaurus modernej ruskej ideomatiky“, ktorý podrobne analyzuje vedecké črty tohto projektu.

„Ruský sémantický slovník“, vytvorený pod vedením Yu.N. Karaulova obsahuje 10 000 ruských slov, ktoré sú rozdelené do 1600 pojmových skupín. Výber skupín je založený na opakovaní prvkov výkladu slov vo výkladových slovníkoch: napríklad „akcia“, „vlastnosť“, „nástroj“ atď.

„Ruský sémantický slovník“, vytvorený pod vedením akademika N.Yu. Shvedova, je založený na mierne odlišných princípoch charakteristických pre zostavovanie ideografických a výkladové slovníky. Po prvé, všetky slová jazyka sú tu rozdelené do štyroch tried: 1) označujúce jednotky (zámená), 2) pomenovanie (fiktívne slová), 3) skutočné konektory (spojky, predložky, spojovacie slovesá), 4) triedenie (modálne slová , častice, citoslovcia). Po druhé, v rámci každej triedy sú všetky slová rozdelené podľa slovných druhov. Po tretie, v rámci každého slovného druhu sú množiny a podmnožiny identifikované na základe tematickej blízkosti alebo naopak protikladnosti významov slov.

DUDEN je kniha s obrázkami (nákresmi) na ľavej strane (podľa iného softvéru) s očíslovanými časťami (až po najmenšie). Na pravej strane je tento očíslovaný zoznam sprevádzaný názvami (dokonca v dvoch jazykoch). Napríklad železničné zariadenia, stanice a koľaje sú nakreslené na celej strane. Vpravo sú názvy šípov, semaforov, barlí atď.

„Tematický slovník ruského jazyka“ L.G. Sayakhova, D.M. Khasanova a V.V. Morkovkina obsahuje 25 tisíc lexikálnych jednotiek, zoskupených do troch veľkých tried: „Človek“, „Spoločnosť“, „Príroda“, ktoré sa postupne rozvetvujú do menších podtried. Napríklad v triede „Človek“ sú podtriedy „Ľudské telo a organizmus“, „Ľudský život“, „ Vzhľad, výzor človeka“, „Emocionálny výzor človeka“ atď. Každá z podtried je zase rozdelená na ešte špecifickejšie: „Emocionálny svet človeka“ - „Duševné vlastnosti človeka“ – „Temperament“ , „Postava“ - „Všeobecné charakterové vlastnosti“ atď. Význam a použitie slov patriacich do každej triedy ilustrujú najbežnejšie frázy. Napríklad slovo „smiech“, ktoré je v podskupine „vyjadrenie pocitov, emócií“ triedy „Človek“, je sprevádzané označením takých kombinácií s týmto slovom, ako je veselý smiech, radostný smiech, detský smiech, výbuch. do smiechu atď.

Obnoviť. Jedným z efektívnych nástrojov na popis jednotlivých tematických okruhov, najmä v elektronickej podobe, sú tezaury.

Termín tezaurus sa už dlho používa v lingvistike ako význam špeciálny typ slovníky, ktoré v tej či onej miere odrážajú „obraz sveta“, „jazykový model sveta“ (podľa Yu.N. Karaulova). Tezaurus ako „pokladnica“ narástol vo svojom sémantickom rozsahu a dostal nový význam. Začali ho nazývať slovníkom, ktorý nielenže absorbuje všetky lexikálne bohatstvá jazyka, ale ich určitým logicko-systémovým spôsobom organizuje. V slovníku tezaurov sa slová spájajú do skupín a k tomuto zjednoteniu dochádza na základe schopnosti konkrétneho slova sprostredkovať určitý pojem.

Slovník tezauru bol v lingvistike vždy považovaný za akýsi univerzálny systém, ktorý zabezpečuje uchovávanie kolektívnych (pre konkrétnu spoločnosť) poznatkov o svete vo verbálnej podobe. Na rozdiel od iných slovníkov sú v slovníku tezauru tieto poznatky uložené v štruktúrovanej forme, ktorá odráža naše predstavy o „štruktúre sveta“.

Najznámejšími a najobľúbenejšími tezaurmi sú v súčasnosti anglický Roger's Thesaurus, O.V. Baranova, ruský sémantický slovník Yu.N. Karaulova, ruský sémantický slovník akademika N.Yu. Shvedova, DUDEN, Tematický slovník ruského jazyka L.G. Sayakhova, D.M. Khasanova a V.V. Morkovkina.



mob_info