Odevzdej.cz

Seminární a školní práce

Automatické stahování nalezených podobností


 1. Možnosti automatického stahování nalezených podobností.

  Informace o nalezených podobnostech souborů v odevzdávárně můžete zjištovat automaticky pomocí aplikace https://odevzdej.cz/auth/plagiaty/plag_ode.pl. Ke zjištování podobností k určitému souboru pak slouží aplikace https://odevzdej.cz/auth/plagiaty/plag_soubor.pl. Podrobné návody jak postupovat při automatickém sběru podobností naleznete v otázkách níže.

 2. Jak vyhledám podobnosti souborů v odevzdávárně?

  Pro vyhledávání podobností souborů v odevzdávárně použijte aplikaci https://odevzdej.cz/auth/plagiaty/plag_ode.pl. Při spouštění je nutné použít parametr pts:sender.id a pts:textworks.id, které jste zadávali i při importu. Nepovinné je použití parametru from, který omezuje export podle doby vložení souborů (format YYYY-MM-DD), tedy například, pokud potřebujete zjistit podobnosti jen v souborech vložených od 8. 12. 2010 parametr from bude mít hodnotu 2010-12-08.

  Příklad použití:
  Nejprve je nutno se autentizovat vůči systému:

  curl -c cookie_jar.txt https://odevzdej.cz/system/login_form.pl --data destination=/auth/ --data 'credential_0=10035' --data-urlencode 'credential_1=im5b2mFoc'
  kde parametr credential_0 je učo a parametr credential_1 heslo.
  Následně spustíte vyhledávání podobností v souborech v odevzdávárně:
  curl -c cookie_jar.txt -b cookie_jar.txt -F pts:sender.id=S14 -F pts:textworks.id=6415657 https://odevzdej.cz/auth/plagiaty/plag_ode.pl
  kde pts:textworks.id je identifikátor odevzdávárny, který jste uvedli při importu, pts:sender.id je identifikátor instituce uvedený při importu.

 3. Jak vyhledám podobnost k souboru?

  Pokud chcete zjistit jen podobnost jednotlivého souboru, lze použít aplikaci Podobnosti ke strojově vloženému souboru. Namísto identifikátoru odevzdávárny (pts:textworks.id) je nutno použít prvky pts:sender.id a pts:url, kde je uvedeno url, ze kterého si systém stáhl daný soubor. Tato hodnota tedy musí byt shodná s hodnotou, která byla použita při importu dat.

  Výsledný dokument je automaticky exportován ve formátu xml. Jeho popis je možné najít na stránkách https://odevzdej.cz/auth/od_dok/format_metadata.pl.

  Příklad použití:

  curl -c cookie_jar.txt -b cookie_jar.txt -F pts:sender.id=S14 -F pts:url=http://domena.cz/soubor.doc https://odevzdej.cz/auth/plagiaty/plag_soubor.pl
  Případně můžete sbírat výsledky i ve formátu pdf. K tomu je potřeba použít parametr pdf=1.
  Příklad stažení pdf s výsledky podobností k Odevzdávárně:
  curl -u neosobni_uco:heslo -F pts:sender.id=S14 -F pts:textworks.id=2456456 -F pdf=1 https://odevzdej.cz/auth-basic/plag_ode.pl

 4. Jak zjistím celkovou podobnost daného dokumentu?

  Po zjištění podobnosti u vybrané práce je v xml dokumentu uveden i prvek plg:doc_hash, který jednoznačně identifikuje soubor v Odevzdej.

  Pro zjištění celkové podobnosti lze použít odkaz: https://odevzdej.cz/auth/podob/XXX/?all;xml

  Celkové procento je v prvku plg:fullscore, všechny podobné pasáže pak v prvku plg:common.

  Pro výstup ve formátu PDF stačí v odkazu nahradit atribut xml atributem pdf.

 5. Jak zjistím podobnost mezi vybranými soubory?

  Pro zobrazení podobností ve vzorovém dokumentu 00000 s dokumenty 11111 a 22222 lze použít odkaz: https://odevzdej.cz/auth/podob/00000/11111/22222/, kde první identifikátor je vzorový soubor a další dva jsou identifikátory souborů, ke kterým chceme zobrazit podobnosti.

  Při zobrazení většího počtu podobných dokumentů, může být URL příliš dlouhé. V takovém případě lze podobnosti získat odesláním GET požadavku, který má následující parametry:

  - vzor: doc_hash vzorového dokumentu
  - dok: doc_hash podobného dokumentu

  Parametr dok může být zadán opakovaně. Je možné použít i další parametry viz níže.

  Příklad použití:

  curl -u 200425:ti54as234la -F vzor=000000 -F dok=111111 -F dok=222222 -F itos=1 -F xml=1 https://odevzdej.cz/auth/dok/plag_pod_dokumentu.pl

 6. Mohu stahovat výsledky podobností automaticky pomocí basic autentizace místo cookies?

  Ano, stačí použít jinou adresu:

  Místo https://odevzdej.cz/auth/plagiaty/plag_ode.pl použijte https://odevzdej.cz/auth-basic/plag_ode.pl.
  Místo https://odevzdej.cz/auth/podob/XXX/YYY použijte https://odevzdej.cz/auth-basic/podob/XXX/YYY.
  Místo https://odevzdej.cz/auth/plagiaty/plag_soubor.pl použijte https://odevzdej.cz/auth-basic/plag_soubor.pl.

 7. Mohu parametrizovat výsledky stahování podobností?

  Ano, lze získat celkové procento podobností nebo vynechat z nalezených podobností dokumenty, které mají stejného autora jako vzorový dokument.

  itos - ignorovat dvojice souborů, které mají stejného autora
  all_perc - zobrazit celkové procento podobností u daného dokumentu
  perc_min - zobrazit pouze podobnosti, které jsou větší než určené minimální procento (např.: perc_min=5 zobrazí podobnosti jen se soubory, jejichž podobnost je větší než 5 %)
  pdf - výstupní formát ve formátu PDF
  xml - výstupní formát ve formátu XML

  Příklad použití:

  curl -u 200425:ti54as234la "https://odevzdej.cz/auth-basic/plag_ode.pl?pts:sender.id=th1490;pts:textworks.id=111111;pdf=1"

 8. Jak při stahování podobností zjistím, v jakém stavu je požadovaný dokument?

  Stav požadovaného dokumentu můžete zjistit prostřednictvím atributu plg:status, který se nachází v prvku plg:info.

  Atribut plg:status může nabývat hodnoty od 1 do 9 následovně:

  1. Dokument není v metadatech - neznámé url. Je nutné provést nový import.
  2. Dokument je připraven ke stažení (stahování proběhne v noci).
  3. Dokument je zaveden v systému, ale nemá vytvořenou textovou verzi (může se zobrazit i důvod, proč bylo vytvoření neúspěšné nebo upozornění, že soubor není v textovém formátu ale např. ve formátu .eps apod.).
  4. Dokument není zkontrolovaný systémem na odhalování plagiátů - po vytvoření textové verze chvíli trvá, než dojde k nalezení podobností (prvek plg:info se zde nachází v prvku plg:record).
  5. K souboru nebyly nalezeny žádné podobnosti (prvek plg:info se zde nachází v prvku plg:record).
  6. K souboru byly nalezeny podobnosti, informace najdete ve vnořených prvcích plg:plagiat.
  7. Dokument zkontrolován u předchozí verze, podobnosti se teď přepočítávají.
  8. Dokument nezkontrolován, je příliš malý.
  9. Dokument nezkontrolován, obsahuje různá kódování textu.


Nenašli jste odpověď? Kontaktujte nás prostřednictvím formuláře.


Odevzdej.czOperated by Masaryk University Faculty of Informatics – Vývojový tým IS MU. 31. 10. 2020 07:28 |