Stroj versus plagiát

04. března 2011, 12:02 - Kristýna Balajová
04. března 2011, 12:02

Systémy na odhalování opsaných prací jsou stále dokonalejší

Nechte svoje práce vydělávat za vás! láká jeden z tuzemských webových portálů, jejichž prostřednictvím lze prodat i koupit vysokoškolský text od referátu po habilitační práci. Z internetu je navíc možné zkopírovat obrovské množství prací i zadarmo. Není divu, že vysokoškolští učitelé hlásí mezi studentskými pracemi rostoucí počet odhalených plagiátů.
Opisování se ale netýká zdaleka jen studentů. Kupříkladu Jaroslav Světlík, bývalý děkan Fakulty multimediálních komunikací zlínské Univerzity Tomáše Bati, svou disertační práci téměř beze změn znovu obhájil jako habilitační. Ivo Budil ze Západočeské univerzity v Plzni ve své habilitační práci pro změnu opomněl citovat rozsáhlé převzaté části. Světlík zůstává i nadále docentem, Budil dokonce profesorem. Světlík musel sice své místo na fakultě opustit, zato Budil úspěšně působí ve vedení filozofické fakulty coby proděkan pro vědu. Nedávná aféra Karla-Theodora zu Guttenberga dokazuje, že dopomoci si k vyššímu titulu nebo zajímavější kariéře podvodem není jen českým specifikem. Na rozdíl od Česka je ale na tom Německo přece jen podstatně lépe – bývalý ministr obrany se k prohřešku přiznal a univerzita ho zbavila doktorského titulu pár dní od jeho usvědčení z plagiátorství. Přesto se i v Česku, kde zatím chybí společenský konsenzus ohledně jednoznačného odsouzení podobných praktik, proti plagiátorům mobilizují dostupné zbraně. Nasazují se moderní počítačové technologie, které už nepracují jen pro plagiátory, ale také proti nim. Oproti tradičním formám kontroly, především průběžnému sledování výsledků práce studenta nebo vědeckého pracovníka, stojí jejich provoz školu méně energie a času.

Ulož a porovnej

Řeč je především o antiplagiátorském systému Theses, který začaly některé vysoké školy využívat v roce 2008. Program vyvinula o dva roky dříve brněnská Masarykova univerzita a od té doby jej stále vylepšuje. V roce 2009 byla nabídka pro školy rozšířena o kontrolu seminárních prací a referátů prostřednictvím rozhraní Odevzdej.cz. Od letošního roku se pozornost informatiků zaměří i na vysokoškolské zaměstnance a doktorandy.
Zpočátku aplikaci využívalo šestnáct škol v republice, dnes jsou to již tři desítky. Do jednotné databáze, spravované brněnskými experty, vkládají referáty, seminární a závěrečné práce. V případě výraznějších podobností vedoucí práce vyhodnotí, zda se skutečně jedná o úplný nebo částečný plagiát. Systém zároveň slouží jako národní úložiště závěrečných prací – školy zde mohou veřejnosti zpřístupňovat základní informace o pracích i jejich plné texty. Dnes obsahuje databáze téměř tři miliony dokumentů, z toho zhruba sto šedesát tisíc závěrečných prací. Zbytek tvoří seminárky, referáty, články z Wikipedie a dalších oblíbených internetových zdrojů. Díky systému se podařily odhalit desítky shod, z nichž některé skutečně nebyly řádně citovány, a šlo tedy o plagiáty.
Letos v září by měl být spuštěn systém Repozitář, který bude využívat společnou databázi textů se systémy Theses a Odevzdej.cz. „Repozitář.cz je určený pro sběr, řízenou prezentaci a kontrolu odborných článků, publikací a jiných děl vytvořených zaměstnanci nebo doktorskými studenty,“ vysvětluje Jitka Brandejsová, manažerka vnějších vztahů a marketingu Centra výpočetní techniky Masarykovy univerzity. Představy brněnských informatiků jdou ale ještě dál. V budoucnu by chtěli uvést do praxe plně funkční algoritmus na vyhledávání podobností v celém internetu.

Děravá databáze

Snad dočasnou slabinou projektu, který je financován z veřejných zdrojů a stál dosud bezmála osmatřicet milionů korun, je zatím poměrně malé množství navzájem porovnávaných textů. Závěrečné práce do databáze nahrávají dvě slovenské školy, dvacet sedm českých vysokých škol a jedna česká vyšší odborná škola. Vysokých škol je přitom v republice třiasedmdesát, z toho šestadvacet veřejných, dvě státní a pětačtyřicet soukromých. V případě některých škol je vzhledem k charakteru obhajovaných závěrečných prací nezájem o projekt pochopitelný. To je případ třeba pražské ČVUT. „Závěrečné klasifikační práce v technických oborech mají jiný charakter, než je tomu v humanitních oborech, nejsou založeny pouze na textových výstupech. Ve většině z nich se navíc využívají výpočty,“ vysvětluje Andrea Vondráková z odboru vnějších vztahů, proč technickým školám nemá textově založený Theses co nabídnout. Dalším problémem je, že některé školy jsou v systému zatím přítomny spíše jen na papíře. Důvodem může být konzervatismus a nechuť k otevřenějšímu nakládání s výsledky škol. To byly podle některých zdrojů z jiných vysokých škol důvody, proč s připojením k projektu dlouho váhala Karlova univerzita. Její tiskový mluvčí Václav Hájek ovšem v médiích již dříve uvedl, že škola si dlouho ujasňovala, jestli má ke vkládání studentských prací do systému bez souhlasu autorů právo. Užívání systému by měla naostro spustit až od října letošního roku. Jiný případ je Západočeská univerzita v Plzni. Ta se k projektu připojila už v roce 2008 a její prorektor pro informatiku Jan Rychlík tehdy regionální MF Dnes řekl: „Do dvou let chceme, aby v systému byla kompletní databáze prací a my ho mohli využívat pro efektivní odhalování plagiátů.“ To se ale nestalo. Dodnes do Theses nahrála pouze o něco méně než tři stovky závěrečných prací. Ročně ji přitom opustí okolo čtyř tisíc absolventů.
Dá se očekávat, že v případě vznikajícího Repozitáře bude ochota škol ještě nižší. Z třiceti škol, které využívají Theses, o Repozitář zatím projevila zájem zhruba polovina.

Padesátiletá paměť

Pokud se zatím nezúčastněné školy někdy k projektu připojí, přehlcení systému se prý bát nemusíme. A to ani v případě, že by všechny typy prací, včetně doktorských a vědeckých, školy ukládaly po dobu třeba padesáti let. „Kapacita je dána aktuální potřebou a v případě narůstajícího počtu prací není problém ji rozšířit,“ vysvětluje Jitka Brandejsová. Za pravdu jí dávají i další odborníci. „Množství textu, které je v databázi dnes, je zanedbatelné v porovnání s jinými existujícími databázemi. Kapacita harddisku není problém, i padesát let sbíraná data by se vešla do úložiště velikosti skříně,“ říká Jan Mach, vedoucí Odboru informační podpory studia a výzkumu z pražské Vysoké školy ekonomické. Na vymýcení podvodů nicméně počítače samy o sobě nemůžou stačit. Existují totiž i způsoby, jak odevzdat cizí práci, aniž by to systém měl vůbec šanci odhalit. Všechno tedy začíná a končí u nastavení spolupráce mezi učitelem a studentem během tvorby práce. Pokud má pedagog vůli a možnost skutečně aktivně sledovat vznik textu, šance úspěchu v případě odevzdání plagiátu se blíží nule.

Mohlo by vás zajímat

  • Je o mě zájem, říká expremiér Jiří Paroubek v Euro TV

  • Pavel Ryba - muž, který Čechům prodá ročně tunu zlata

  • Majitel textilky Juta a senátor Hlavatý: V Senátu by…

  • Jan Hawelka: kavárenská hvězda z Mostu

  • Aleš Kučera: Chvíli potrvá, než se lidé naučí se státem…

  • Ondřej Kania: Otevřeme další dvě školy

  • Martin Burda: Bankám v Česku ujíždí vlak

  • Mnislav Zelený Atapana: Přítel amazonských indiánů

  • Jan Bílý: Nebuď uštvaný manažer. Buď král!

Hry pro příležitostné hráče