Domů > Odborné články > Základní vzdělávání > Jak rozpoznat věrohodnost, relevanci, spolehlivost informací a informačních pramenů
Odborný článek

Jak rozpoznat věrohodnost, relevanci, spolehlivost informací a informačních pramenů

18. 10. 2004 Základní vzdělávání
Autor
Zdeněk Jonák

Anotace

Nárůst objemu informací vyžaduje schopnost rozlišování jejich hodnoty (věrohodnosti, relevance, spolehlivosti). Tomuto účelu mohou posloužit i postupy, které tento článek zmiňuje.

Článek je součástí cyklu Uplatňování kritického myšlení.


Jedním z charakteristických rysů informační společnosti je dramatický, obtížně zvládnutelný nárůst informací. Publikační exploze vypovídá o tom, že věda dospěla do stadia, kdy svými aplikacemi v oblasti průmyslových a informačních technologií zasahuje do stále většího počtu oblastí společenského života.

Ve světě vychází ročně 70 000 odborných a vědeckých časopisů, což představuje 100 000 stránek za den ve více než 65 jazycích. Denně je publikováno 6000 - 7000 vědeckých článků, přičemž počet publikovaných článků se každých 5,5 roku zdvojnásobuje. V současnosti žije 80 - 90 % všech vědců v dějinách lidstva. (Vymětal, 2000) Internetové prohlížeče obsahují řádově miliardy webových stránek a zabezpečují služby desítkám miliónů uživatelů.

Publikační a informační exploze má ale i své negativní stránky. Stále větší měrou narůstá počet informací a informačních zdrojů, které nejsou zárukou zmnožení dosavadního poznání. Nejenže mu mnohdy neprospívají, někdy dokonce škodí.

Vzdělávací instituce i rodiče stojí před problémem ochránit mladou generaci před zavádějícími poznatky, ale i před zhoubným vlivem eticky závadných stránek. Často ani soudný člověk (natožpak dítě školou povinné) se nedokáže v množství informací orientovat a při nedostatku času spolehlivě odlišit informace relevantní od nerelevantních, ověřené od neověřených, pravdivé od nepravdivých. Zvláště dospívající jedinec není, bez předchozího varování, často připraven předpokládat, že by veřejně kontrolovaná média mohla poskytovat falešné informace.

Spolehlivé nebo nespolehlivé?

Pokusíme se alespoň ve stručnosti poukázat na nástroje, metody či alespoň intuitivní mechanismy, které napomáhají kvalifikovat kvalitu informačních zdrojů a s určitou pravděpodobností usnadňují dosažení vyšší míry spolehlivosti při jejich selekci.

Seriózní vědecké články a publikace by měly splňovat následující kritéria.

1. Odkaz1 na zdroj poznatků

Pokud vědecký článek odkazy na prameny postrádá, může čtenář považovat text za úvahu, fejeton nebo jinak popularizující článek, v horším případě za pokus přiživit se na výsledcích práce skutečného badatele.

Čtenář, který chce proniknout k jádru věci, by se nikdy neměl spoléhat na jediný informační zdroj, ale ověřit, zda odkaz (pokud existuje) je citován přesně nebo ho autor článku upravil ve svůj prospěch. Cílevědomý čtenář by měl usilovat o nalezení sítě odkazů směřujících k určitému prvotnímu zdroji (jakým je např. v oblasti teorie relativity Einstein), od něhož se ostatní teorie odvíjejí, a od tohoto zdroje dospět k jeho současným důsledkům. Internet díky síti hypertextových odkazů tuto možnost plně podporuje.

2. Garance spolehlivosti zdroje

Důležitou indicií dokumentu je již samo jméno autora a instituce, kterou reprezentuje. Prostým nahlédnutím do encyklopedie, slovníku typu Who is Who či dotazem odborné autoritě lze věrohodnost autora ověřit. Existuje vědní odvětví - scientometrie -, které používá exaktní metody k identifikaci faktorů, jež by mohly automaticky (u intelektuálně jinak nezvládnutelného množství informací) odlišit kvalitní informace od nekvalitních. Scientometrie (též infometrie, naukometrie apod.) představuje metodu stanovení kvality vědecké práce, která se opírá o jednoduchý intuitivní předpoklad, že čím více si vědecká obec určité publikace všímá a cituje ji, tím větší hodnotu publikace má. "Hodnota" dokumentu je sumou hodnot dokumentů, které na daný dokument odkazují, dělenou počtem odkazů vedoucích z dokumentu. Pro získání vysokého hodnocení musí na daný dokument vést buď velké množství odkazů z málo významných dokumentů nebo stačí i menší množství z významných dokumentů. Spolehlivost informačního zdroje lze odvodit z míry citovanosti2, která se zjišťuje tzv. impaktovým faktorem (IF) časopisu, ve kterém je informace zveřejněna. Hodnota IF udává, kolikrát byl článek v určitém časopisu citován během prvních dvou let. Snahou vědce by mělo být publikování v nejkvalitnějších časopisech s maximálním IF. (Ukázka časopisů s uvedením zmíněných ukazatelů viz tabulka http://www.geocities.com/bioreference2003/impact2003-1.htm)

Dalším faktorem, který umožňuje odlišit relevantní informace od méně relevantních, je stáří informace. Tento ukazatel vychází ze zkušenosti, že užitná hodnota informace klesá v závislosti na čase. Příčinou je dynamika vývoje vědy a překonávání starších poznatků novými. V souvislosti s exponenciálním růstem informací (každé 2 až 4 roky se v průměru objem informací zdvojnásobí) se mluví o zrychlení tempa stárnutí informací. Stárnutí se projevuje v souvislosti s tzv. informačním cyklem, tj. rychlostí toku informace od jejího vzniku v hlavě autora ke vzniku rukopisu, článku či knihy v nakladatelství až po její distribuci na knižním trhu a zpracování v knihovnicko-bibliografickém procesu. Cílem je tento cyklus zkracovat. V elektronickém publikování se čas mezi vznikem rukopisu a jeho publikováním daří zkracovat na minimum.

Průměrná hodnota životnosti informace (poločas stárnutí) se zjišťuje statistickým rozborem souborů informačních zdrojů. V roce 1960 bylo pravděpodobně poprvé použito analogie mezi průběhem vzrůstu vědecké literatury a průběhem rozpadu radioaktivních látek. V obou případech je možné při měření průběhu události použít pojmu "poločas". Informační poločas je čas, který uplyne od zveřejnění informace do doby, kdy se v literatuře objeví polovina informací o této tematice. Protože tento čas lze jen těžko měřit, zjišťuje se zpravidla tzv. zpětný poločas, tj. čas, za který se od určitého data vyskytne ještě polovina citací. Tento čas ve skutečnosti představuje dobu, během níž zestárla polovina publikované literatury, nebo také čas, ve kterém kulminuje využívání určitého informačního pramene.

Informační věda zjistila některé zákonitosti chování informací, které umožňují exaktně odlišit relevantní zdroje informací od nerelevantních. Jedním z nich je Bradfordův zákon, který popisuje rozptyl dokumentů v určité vědní oblasti. Rozptylem rozumíme vlastnost informací projevující se tím, že relevantní informace se vyskytují v různých dokumentech, kontextech a v různé formě. Bradfordův zákon stanoví závislost mezi celkovým počtem dokumentů (nejčastěji časopisů) a rozložením článků týkajících se jisté tematiky. Ze zákona vyplývá, že maximální počet relevantních článků je soustředěn v minimálním počtu časopisů tvořících tzv. jádro oboru.

Znalost tohoto "jádra" představuje další z možností, jak odlišit informace neověřené od ověřených. Existují oborové "žebříčky" časopisů, uspořádaných podle stupně blízkosti k jádru.

3. Architektura struktury uspořádání myšlenek a argumentů v článku

Ta může signalizovat výskyt zjevných nesrovnalostí a protimluv ve výrocích a tvrzeních. Prvotním vodítkem je intuice čtenáře, která ho díky jeho zkušenostem a nabytým vědomostem dovede varovat před očividně nespolehlivými informacemi. Škola zásobuje žáka spolehlivými a zaručenými poznatky, které jsou fixovány v encyklopediích a učebnicích. Ve svém soukromém životě, v kontaktu s vrstevníky, dospělými a médii nabývá však žák zkušenosti, jež jsou často v rozporu se získanými poznatky. I neucelené školní poznatky se však mohou stát základnou, o níž se žák může opřít. Rozpory s fakty textu a znalostmi získanými v přírodovědě, přírodopise, fyzice apod. jsou navzdory své neúplnosti prvními vodítky při rozlišování věrohodné a nevěrohodné informace.

4. Pravidlo o ekonomii myšlení (Occamova břitva)

Bez tohoto kritéria by neexistoval spolehlivý a rozhodující způsob, jak si vybrat mezi jednotlivými hypotézami. Occamova břitva uplatňuje názor, že pokud existují dvě nebo více vysvětlení nějakého fenoménu, mělo by být zvoleno to nejjednodušší.

Příznakem teoreticky málo přínosných prací bývá často neúčelné rozpitvávání a zamlžování. Uvedené pravidlo doporučuje zabývat se výlučně tím, co je podstatné, nutí autory opírat se doložitelná fakta a používat podložené argumenty.

Důležitost ekonomického myšlení se projevuje významnou měrou v oblasti ICT zejména při algoritmizaci a tvorbě programů. Neúsporně vytvořené programy se při obrovských kapacitách toků dat a množství operací uplatňovaných nad těmito daty projevují měřitelnými finančními a časovými ztrátami.

Ověřování spolehlivosti informací na internetu

Žák se často již v období předškolního a elementárního vzdělávání setkává s obrovským množstvím textových, obrazových a zvukových informací uložených na nejrůznějších multimédiích. Internet přinesl do publikační činnosti naprostou svobodu uveřejňovat na celosvětové síti cokoliv. Autor může navíc na tomto médiu cokoli ze dne na den změnit. Zdánlivě neexistuje možnost, podle níž lze s určitou pravděpodobností odlišit informace kvalitní od nekvalitních. Přesto lze nastavit určitá pravidla proti tlaku komerce a pokleslé vědy. Internetovým prohlížečům pomáhají k řešení tohoto problému poznatky řady věd - lingvistiky, kognitivní vědy, umělé inteligence apod. Na následující adrese lze zjistit statistické údaje o nejvýznamnějších webových prohlížečích.

Jednodušší vyhledávače vyhledávané dokumenty uspořádávají do struktury vytvořené na základě analýzy frekvenční struktury textu. Stránka, jejíž frekvenční struktura se největší měrou blíží struktuře dotazu, tzn. slova formulovaná v dotazu se maximálně shodují se slovy v textu, je vybrána do souboru vyhledaných dokumentů.

Nejinteligentnější vyhledávače však používají metody opírající se jak o hlubší lingvistickou analýzu textu, tak o rutinizaci a kvantifikaci intuitivního předpokladu, že nejvíce odkazů směřuje na známé a oceňovaná stránky. Např. internetový prohlížeč Google řadí vyhledané stránky do pořadí nejen podle shody zadaného dotazu a frekvenční struktury textu. Významným ukazatelem, který rozhoduje o pořadí významnosti vyhledaného textu mezi ostatními, je počet odkazů, které vedou na danou stránku z jiných stránek. Tuto úlohu plní funkce PageRank.3

Neetické chování tvůrců webových stránek

Někteří tvůrci stránek se pokoušejí obelstít hodnotu indexovacích systémů prohledavačů tím, že opakují stejné obsahy na několika stránkách. To zvyšuje údaj o frekvenci výskytů, a tím i pravděpodobnost, že obsah jejich stránek bude upřednostněn. Určitý počet webových stránek uloží naprosto stejný, duplicitní obsah na různých stránkách nebo doménách. Kdyby vyhledávače neuměly rozeznat, že jde o stejný obsah, uživatelé by mohli být klamáni, protože by ve výsledcích dostávali nadbytečný počet naprosto stejných stránek.

Vyhledávače mají proto algoritmy, kterými zjišťují, zda jde o stejný obsah. Jsou prý schopné poznat, že se stránka liší třeba jen navigací. Prohledávač Google např. duplicitní stránky indexuje tak, že si vybere jednu stránku z mnoha stejných a ostatní ignoruje. Webmasteři používají ke zmatení vyhledávačů i skrytý text obsahující klíčová slova, neviditelné odkazy a jiné metody. Google z těchto důvodů přistoupil k penalizaci takových praktik. Podobné kvalitní služby jako zmiňovaný Google nabízí i některé další - alltheweb.com a náš jyxo.cz.

Závěr

Odhalování neseriózních přístupů k pravdivému poznání skutečnosti nemá vždy tak průkazné prostředky, jaké byly uvedeny v našem článku. "Mimikry", které používají někteří autoři, dokáží skrýt pravdivé poznání tak úspěšně, že oklamán může být i seriózní vědec.

Chtěli bychom od jednoznačných a snadno průkazných dokladů, které jsme předvedli, přistoupit k případům, v nichž jsou vědecké pravdy přehlušeny komerčními zájmy jedinců (popř. celých korporací), kteří jsou ve svém zájmu ochotni dokonce obracet výsledky vědy proti ní samotné. Obrana proti těmto přístupům vyžaduje ze strany zastánců vědy trpělivější a radikálnější přístupy.


Literatura:
Česká terminologická databáze knihovnictví a informační vědy (TDKIV)
sigma.nkp.cz/F/?func=file&file_name=find-a&local_base=ktd
Kritické myšlení www.fzs-chlupa.cz/o-skole/charakter-vyuky/metody-vyuky/kriticke-mysleni/
VYMĚTAL, J. (2000) Současné informační prostředí. Vesmír, s. 335-336.


1 Odkaz na zdroj poznatků (bibliografická citace) představuje formalizovaný údaj o dokumentu, který autor bezprostředně použil při přípravě své práce.
2 Faktor vyjadřující informační hodnotu, oblíbenost dokumentu. Stanoví se metodou citační analýzy zjišťující vztahy citujícího a citovaného dokumentu. Slouží jako podklad při citačním mapování vědy pomocí konstrukce citační sítě a praktické využití nalézá rovněž při rozhodování o profilování a optimalizaci knihovních fondů.
3 Page Rank je skalární číslo přiřazené každé stránce. Vyjadřuje něco jako věrohodnost nebo důležitost stránky, dosahuje hodnot od 0 do 1. Google si Page Rank počítá (zjednodušeně řečeno) podle toho, kolik a jak důležitých stránek na tu počítanou stránku odkazuje. Existuje na to vzoreček. Nainstalováním Google Toolbar lze zjistit jakou hodnotu PageRank (na škále 0-1) má vámi vyhledaná stránka.

Licence

Všechny články jsou publikovány pod licencí Creative Commons BY-NC-ND.

Autor
Zdeněk Jonák

Hodnocení od uživatelů

Tomáš Firman
7. 4. 2016, 09:25
Velmi pěkné info.

Váš komentář

Pro vložení komentáře je nutné se nejprve přihlásit.

Článek není zařazen do žádného seriálu.

Článek pro obor:

Informační a komunikační technologie 2. stupeň