Domů > Odborné články > Gymnaziální vzdělávání > Zajímavé nástroje na práci s textem – analytické nástroje
Odborný článek

Zajímavé nástroje na práci s textem – analytické nástroje

5. 10. 2021 Gymnaziální vzdělávání
Autor
RNDr. Michal Černý Ph.D.

Anotace

Článek se zaměřuje na méně obvyklé nástroje pro práci s texem v rovině analýzy, ať již kvalitativní, nebo kvantitativní. V současnosti dostupné online nástroje (Voyant Tools, Lexos, Verview, …) umožňují o řadě témat v této oblasti přemýšlet zcela jiným způsobem, než jaký by byl adekvátní ještě před deseti lety – frekvenční analýza, analýza sentimentu, práce s klíčovými slovy, velkými korpusy textů atp.

Práce s textem – ať již čtení, nebo psaní – má v anglosaské tradici rozměr základu vzdělanosti, jde o něco, co činí rozdíl mezi těmi, kdo se dostanou na dobré školy, a těmi ostatními. Také v českém prostředí se s textem samozřejmě pracuje. Rádi bychom v tomto článku ukázali pět zajímavých nástrojů, které umožňují s textem a jeho analýzou nebo čtením pracovat poněkud neobvykle a mohou být dobrým odrazovým můstkem jak pro vlastní tvůrčí činnost studentů, tak třeba i pro malé výzkumné projekty v gymnaziálních hodinách.

Budeme se soustředit především na nástroje, které umožňují s textem pracovat zásadně jinak, než jak s ním lze operovat v případě „papírového“ psaní. Tím ale současně nechceme říci, že jedna nebo druhá cesta je jediná možná nebo ideální, ale spíše odkrýt určitou širokou paletu přístupů a směrů uvažování o textu. Podobně je možné uvažovat o nástrojích na frekvenční analýzy v textu – těžko nahradí soustředěné čtení, ale umožňují snadno, rychle a přesně provádět práci s textem, která je běžnému uživateli zcela nedostupná nebo by trvala měsíce či roky.

Voyant Tools. Autor díla: Michal Černý

 

Náš výběr nemá ambici být úplný, to ani není možné, ale spíše nabídnout inspiraci – u každého nástroje vždy mimo samotné stručné představení zkusíme nabídnout nějaké možné stručné implikace do praxe. Domníváme se, že práce s těmito nástroji může mít tři významné roviny, o kterých je třeba v edukaci uvažovat (a které nás vedou k tomu, že práce s takovými nástroji na střední školu jednoznačně patří):

  • Vlastní přínos nástroje pro práci s textem – pomoc s překladem, identifikace opakujících se slov a frází, analýza základních konceptů, propojenost termínů atp. Zde se tedy pohybujeme na úrovni vlastních funkcionalit daných aplikací.
  • Zkušenost se strojovým zpracováním textu – tento rozměr považujeme za zásadní, protože může vést k úvahám, co počítač umí a neumí, jakým způsobem je možné ho využít pro tvůrčí práci, co vůbec je možné o textu říci z hlediska jeho kvantitativních charakteristik.
  • Nový pohled na text – v literatuře je možné se soustředit (protože to člověk nemůže dělat jinak) na kvalitu textu z hlediska kvalitativních přístupů. Kvantitativní analýzy ale mohou pomoci textu nejen lépe porozumět, ale také ho sledovat ze zcela nových perspektiv. To může být pak užitečné třeba i pro téma počítačově generovaného umění.

Domníváme se, že všechny tyto tři roviny se mohou u zvolených nástrojů v určitém způsobu objevit a určitě pomohou s jejich implementací do běžných hodin, ať již půjde o informatiku, nebo třeba jazyky.

Voyant Tools

Jeden z nejzajímavějších nástrojů pro rychlou analýzu libovolného textu je Voyant Tools. Tomuto volně dostupnému nástroji je možné předložit libovolný text a on provede jeho analýzu. Nabízí základní informace o počtu slov v dokumentu, o šířce slovní zásoby (Vocabulary Density) nebo seznam nejčastěji používaných slov. Pro vlastní texty se hodí na první kontrolu – snadno identifikuje opakující se slova a fráze, které student může jednoduše přepsat a vždy sledovat, zda již jde o dostatečnou úpravu či nikoliv.

Mnoha lidem se stává, že do textů, které sami píšou, zanáší autory, které zrovna čtou. Voyant je možné použít i na tento druh analýzy, protože lze porovnat zdrojový text (pokud je elektronicky k dispozici) s tím studentským a sledovat případné rozdíly, anebo naopak podobné slovní konstrukce, fráze, cizí slova.

Voyant Tools. Autor díla: Michal Černý

 

Aplikace ale umožňuje jít mnohem dále. Lze pomocí ní sledovat výskyt určitého slova v dokumentu tak, že je vždy počítán po desetině, takže lze na grafu snadno vidět, jak se mění užívání různých slov v částech práce nebo třeba v celém románu. Lze počítat i korelace a vazby mezi slovy, jejich vzájemné spojení a lexikální blízkost. Na jedno kliknutí se také člověk v prostředí snadno dozví, v jakém kontextu je určité slovo využíváno. Současně umožňuje pracovat s různými korpusovými přístupy, vyloučit stopová slova a dalších prvky, které případnou analýzu mohou znesnadňovat. Studenti ale mohou být vedeni i k tomu, aby si zdrojový soubor před analýzou čistili sami, což může být také pěkné cvičení do informatiky.

K dispozici je obrovské množství dalších analytických a vizualizačních nástrojů, které ukazují různorodý pohled na text – Wordcloud, TermsBerry, StreamGrpah, … a více než desítka dalších. Velkou výhodou tohoto nástroje je nejen nulová cena, ale také poměrně velké množství návodů a příkladů, co všechno lze s texty dělat. Výsledky lze snadno exportovat a pak dále zpracovávat. Pokud ve škole hledáte nástroj na rychlou, a přitom náročnou analýzu textu, pak lze Voyant jen doporučit.

Online-utility

Soubor drobných aplikací Online-utility je zajímavý v tom, že je rozdrobený na více než desítku drobných aplikací, kterým je vždy znovu nutné předložit text k analýze. Z hlediska didaktického využití to ale může být velice praktické, protože se zde najdou aplikace určené speciálně pro učitele angličtiny, a jiné, které s textem pracují obecněji, mohou využít například učitelé češtiny nebo informatiky.

Příklady zajímavých funkcí pro učitele angličtiny:

  • Learn English Text – do aplikace vložíme libovolný anglický text a nastavíme úroveň jazykové znalosti. Aplikace analyzuje text a k pojmům, které by studentovi nemusely být známé, nabídne synonyma. Učení tedy probíhá mnohem více jako v konverzaci nebo při interakci s rodilým mluvčím než při klasickém, dnes již opouštěném „slovníčkovém“ vyhledávání pojmů.
  • Tests Document Readability – je nástroj pro anglicky psané eseje; nabídne informace o počtu slov, frází, rozmanitosti slovní zásoby, ale především se zaměřuje na čtivost – jak jsou věty dlouhé, zda se neužívají slova s mnoha slabikami atp. Zajímavý je „Gunning Fog index“, který udává, kolik let ve formálním vzdělávání musí člověk strávit, aby textu porozuměl dobře na první přečtení, tedy jeho obtížnost. Aplikace také identifikuje nejnáročnější pasáže textu s doporučením pro přepsání.
  • Vocabulary Builder – aplikace z předloženého textu na základě dalších nastavení extrahuje slova, která by student nemusel znát, a ke každému popíše synonyma, definici a příklady užití. Opět se stále pracuje pouze s angličtinou, jde tedy o vylepšený výkladový slovník vztažený pouze k analyzovanému textu.

Z nástrojů na „běžnou“ textovou analýzu jsou dostupné funkce, jako je počítání slov, identifikace frází, práce s regulárními výrazy nad textem nebo nástroje pro automatické opravy. Zajímavá je také funkce, ve které aplikaci předložíme text, vybereme jazyk a výstupem je plně „klikatelný“ dokument, který – slovo po slově – vede do WikiSlovníku v daném jazyce.

Online-utility. Autor díla: Michal Černý

 

Aplikace celkově nenabízí skvělé analytické funkce pro literární vědu, ale především pro výuku angličtiny, ať již při práci s vlastními eseji, nebo zadanými texty je neocenitelným pomocníkem. Většina funkcí je založená na poměrně jednoduché analýze, z nichž některé (alespoň v jednoduché formě) by studenti střední školy mohli zvládnout naprogramovat také.

Seoscout

Poměrně jednoduchý nástroj se snaží pracovat s klíčovými slovy a je primárně určený pro marketing. I studentům se jistě může hodit schopnost napsat dobrý marketingový text, ve kterém se bude s klíčovými slovy vhodně pracovat (jde o úplně jinou disciplínu než psát román). Rádi bychom ale upozornili na některé zajímavé funkce, které lze u tohoto nástroje využít.

Tou první je měření úrovně textu – tedy jednoduše analýza toho, jak je text čtivý. Aplikace umí text rozdělit do vět a u každé (v angličtině) dokáže nabídnout informaci o tom, jak je těžká na čtení, s jakým se pojí emočním sentimentem (vykresluje smajlíky, což je velice pohodlné pro rychlý přehled) a kolik má věta slov. Jde o velice dobrý nástroj pro analýzu buď vlastního, nebo cizího textu a diskusi nad tím, proč užívá právě tyto, a ne jiné jazykové prostředky, jakým způsobem s nimi pracuje a proč.

Analýza emočního sentimentu, tedy jaké má text vyznění, je dnes velice důležitým a aktivně zkoumaným rysem textu v případě počítačového zpracování přirozeného jazyka, pracuje s ním mimo jiné i Grammarly. Domníváme se, že jde o důležitý prvek v práci s angličtinou, který bychom na úrovni střední školy již měli aktivně reflektovat. Současně možná otevírá prostor pro diskusi nad tím, co vlastně takový řečový akt činí optimistickým nebo přátelským, anebo naopak neutrálním či negativním.

U čtivosti nabízí hned několik sledovaných parametrů (Reading Ease, Grade Level, Gunning Fog, Coleman Liau Index, Smog Index a Automated Reading Index), ale nabízí i základní informace o textu, jako je slovní zásoba, délka vět nebo počet slov. Velice dobře se hodí na různé komparace textů nebo na vylepšování textu studentů tak, aby výsledné sdělení bylo co nejsrozumitelnější.

Lexos

Nástroje na tvorbu různých mraků slov jsou poměrně dobře známé a dostupné. Rádi bychom ale upozornili na Lexos, což je poměrně komplexní nástroj zaměřený na vizuální práci s textem, a to nejen na úrovni jednoho dokumentu, ale ideálně celých korpusů. Ideálně se tedy hodí například pro společné analýzy textů z celé třídy nebo ještě širší aktivity.

Dokáže pracovat jen s prostým textem, takže klasické dokumenty je třeba exportovat nebo hromadně převést. Dokáže například pracovat s porovnáváním wordcloudu z více dokumentů vedle sebe, rozdělovat dokumenty, filtrovat výsledky atp. Z dalších analýz se nabízí k-means, consensus tree nebo dentogram.

Lexos. Autor díla: Michal Černý

 

Z didaktického hlediska je zajímavý design nástroje, který vede uživatele jednotlivými fázemi práce s textem – nahrání, organizace dat, příprava souborů, vizualizace a statistické zpracování. V každém kroku je přitom možné se snadno vrátit. Právě tato didaktická návodnost může být pro školní využití také zajímavá.

Verview

Když už upozorňuje na možnost pracovat s velkými soubory textů, pak musíme upozornit ještě na Verview, který umožňuje nad velkými soubory dat (třeba nad stovkami či tisíci dokumenty) v různých formátech provádět poměrně jednoduché analýzy, které ale mohou vést k rychlému prozkoumání nějakého jevu. Velkou výhodou je, že s různými dokumenty, takže není třeba řešit složitý převod. Silnou stránkou je také snadné odkazování do jednotlivých textů, takže z jednotlivých slov se snadno dostáváme k širšímu kontextu. Aplikace dokáže pracovat také s metadaty souborů, dokumenty lze různě štítkovat a filtrovat.

Pokud máme k dispozici dobrý zdroj dat (například Čapkovy nebo Němcové romány takto mohou posloužit velice dobře), můžeme snadno analyzovat to, jaká slova autor používá, v jakých souvislostech atp. Typické frankofonní práce – ve struktuře pojem X u Y lze v základním a jednoduchém provedení realizovat během několika málo minut.

Verview. Autor díla: Michal Černý

 

Aplikace je bezplatná, ale jde o jediný nástroj v našem přehledu, do kterého je třeba se přihlásit.

Závěr

V článku jsme se pokusili nabídnout ukázku pěti konkrétních nástrojů, které umožňují zajímavým způsobem pracovat s textem a nově o něm přemýšlet. V jeho pokračování se zaměříme na dalších pět aplikací, které k textu přistupují opět z jiného pohledu. Domníváme se, že všechny výše představené nástroje jsou snadno dostupné – pro jejich ovládání není třeba žádné speciální vzdělání nebo dovednost. A přesto mohou být dobrou vstupní branou pro datovou analýzu, a především slouží pro rozvoj informační gramotnosti. To se projevuje mimo jiné v tom, že student dokáže pro zpracování informací nebo dat využít vhodné nástroje. S rozvojem informatického myšlení a programování na školách lze předpokládat, že se podobným nástrojům bude věnovat stále větší pozornost a že programování se nemusí točit jen kolem jednoduchých her a složitějších kalkulaček, ale možná přidá další zajímavá témata – čištění a příprava textových dat, práce s regulárními výrazy, znalost adekvátní statistiky.

Domníváme se, že jednou z nejsložitějších věcí, které jsou před námi v této oblasti, není samotné ovládání nástrojů, ale schopnost promyslet, co všechno s nimi můžeme dělat. Technika nám umožňuje jít mnohem dále, než bychom si mohli před dvaceti lety vůbec myslet. Ale je otázka, zda těmto možnostem dokážeme dostatečně rychle a efektivně přizpůsobovat témata badatelsky orientované výuky, ročníkových prací, konkrétní školní výstupy i naše vlastní vzdělávání. Doufáme, že proto bude tento text inspirací.

Článek vznikl jako součást řešení projektu Platforma pro transfer znalostí: informační gramotnost pro středoškoláky v otevřeném mash-up virtuálním učebním prostředí (TIGUP) podpořeného TA ČR – kód projektu TL02000040. Web: https://kisk.phil.muni.cz/onlife.

Licence

Všechny články jsou publikovány pod licencí Creative Commons BY-NC-ND.

Autor
RNDr. Michal Černý Ph.D.

Hodnocení od uživatelů

Jakub Holec
30. 11. 2021, 07:02
5 z 5
Zajímavý článek. Přijde mi, že používání různých nástrojů na analýzu textu umožňuje propojovat hledání podobností a rozdílů v uspořádání textu jako součásti čtenářské gramotnostmi s gramotností matematickou a digitální.
5 z 5

Váš komentář

Pro vložení komentáře je nutné se nejprve přihlásit.

Téma článku:

Informační a komunikační technologie