Automatické stahování nalezených podobností
- Možnosti automatického stahování nalezených podobností.
- Jak vyhledám podobnosti souborů v odevzdávárně?
- Jak vyhledám podobnost k souboru?
- Jak zjistím celkovou podobnost daného dokumentu?
- Jak zjistím podobnost mezi vybranými soubory?
- Mohu stahovat výsledky podobností automaticky pomocí basic autentizace místo cookies?
- Mohu parametrizovat výsledky stahování podobností?
- Jak při stahování podobností zjistím, v jakém stavu je požadovaný dokument?
- Možnosti automatického stahování nalezených podobností.
Informace o nalezených podobnostech souborů v odevzdávárně můžete zjištovat automaticky pomocí aplikace https://odevzdej.cz/auth/plagiaty/plag_ode.pl. Ke zjištování podobností k určitému souboru pak slouží aplikace https://odevzdej.cz/auth/plagiaty/plag_soubor.pl. Podrobné návody jak postupovat při automatickém sběru podobností naleznete v otázkách níže. - Jak vyhledám podobnosti souborů v odevzdávárně?
Pro vyhledávání podobností souborů v odevzdávárně použijte aplikaci https://odevzdej.cz/auth/plagiaty/plag_ode.pl. Při spouštění je nutné použít parametr pts:sender.id a pts:textworks.id, které jste zadávali i při importu. Nepovinné je použití parametru from, který omezuje export podle doby vložení souborů (format YYYY-MM-DD), tedy například, pokud potřebujete zjistit podobnosti jen v souborech vložených od 8. 12. 2010 parametr from bude mít hodnotu 2010-12-08. Příklad použití:
Nejprve je nutno se autentizovat vůči systému:curl -c cookie_jar.txt https://odevzdej.cz/system/login_form.pl --data destination=/auth/ --data 'credential_0=10035' --data-urlencode 'credential_1=im5b2mFoc'
kde parametr credential_0 je učo a parametr credential_1 heslo.
Následně spustíte vyhledávání podobností v souborech v odevzdávárně:curl -c cookie_jar.txt -b cookie_jar.txt -F pts:sender.id=S14 -F pts:textworks.id=6415657 https://odevzdej.cz/auth/plagiaty/plag_ode.pl
kde pts:textworks.id je identifikátor odevzdávárny, který jste uvedli při importu, pts:sender.id je identifikátor instituce uvedený při importu. - Jak vyhledám podobnost k souboru?
Pokud chcete zjistit jen podobnost jednotlivého souboru, lze použít aplikaci Podobnosti ke strojově vloženému souboru. Namísto identifikátoru odevzdávárny (pts:textworks.id) je nutno použít prvky pts:sender.id a pts:url, kde je uvedeno url, ze kterého si systém stáhl daný soubor. Tato hodnota tedy musí byt shodná s hodnotou, která byla použita při importu dat. Výsledný dokument je automaticky exportován ve formátu xml. Jeho popis je možné najít na stránkách https://odevzdej.cz/auth/od_dok/format_metadata.pl. Příklad použití:curl -c cookie_jar.txt -b cookie_jar.txt -F pts:sender.id=S14 -F pts:url=http://domena.cz/soubor.doc https://odevzdej.cz/auth/plagiaty/plag_soubor.pl
Případně můžete sbírat výsledky i ve formátu pdf. K tomu je potřeba použít parametr pdf=1.
Příklad stažení pdf s výsledky podobností k Odevzdávárně:curl -u neosobni_uco:heslo -F pts:sender.id=S14 -F pts:textworks.id=2456456 -F pdf=1 https://odevzdej.cz/auth-basic/plag_ode.pl
- Jak zjistím celkovou podobnost daného dokumentu?
Po zjištění podobnosti u vybrané práce je v xml dokumentu uveden i prvek plg:doc_hash, který jednoznačně identifikuje soubor v Odevzdej. Pro zjištění celkové podobnosti lze použít odkaz: https://odevzdej.cz/auth/podob/XXX/?all;xml Celkové procento je v prvku plg:fullscore, všechny podobné pasáže pak v prvku plg:common. Pro výstup ve formátu PDF stačí v odkazu nahradit atribut xml atributem pdf. - Jak zjistím podobnost mezi vybranými soubory?
Pro zobrazení podobností ve vzorovém dokumentu 00000 s dokumenty 11111 a 22222 lze použít odkaz: https://odevzdej.cz/auth/podob/00000/11111/22222/, kde první identifikátor je vzorový soubor a další dva jsou identifikátory souborů, ke kterým chceme zobrazit podobnosti. Při zobrazení většího počtu podobných dokumentů, může být URL příliš dlouhé. V takovém případě lze podobnosti získat odesláním GET požadavku, který má následující parametry: - vzor: doc_hash vzorového dokumentu
- dok: doc_hash podobného dokumentu Parametr dok může být zadán opakovaně. Je možné použít i další parametry viz níže. Příklad použití:curl -u 200425:ti54as234la -F vzor=000000 -F dok=111111 -F dok=222222 -F itos=1 -F xml=1 https://odevzdej.cz/auth/dok/plag_pod_dokumentu.pl
- Mohu stahovat výsledky podobností automaticky pomocí basic autentizace místo cookies?
Ano, stačí použít jinou adresu: Místo https://odevzdej.cz/auth/plagiaty/plag_ode.pl použijte https://odevzdej.cz/auth-basic/plag_ode.pl.
Místo https://odevzdej.cz/auth/podob/XXX/YYY použijte https://odevzdej.cz/auth-basic/podob/XXX/YYY.
Místo https://odevzdej.cz/auth/plagiaty/plag_soubor.pl použijte https://odevzdej.cz/auth-basic/plag_soubor.pl.
- Mohu parametrizovat výsledky stahování podobností?
Ano, lze získat celkové procento podobností nebo vynechat z nalezených podobností dokumenty, které mají stejného autora jako vzorový dokument. itos - ignorovat dvojice souborů, které mají stejného autora
all_perc - zobrazit celkové procento podobností u daného dokumentu
perc_min - zobrazit pouze podobnosti, které jsou větší než určené minimální procento (např.: perc_min=5 zobrazí podobnosti jen se soubory, jejichž podobnost je větší než 5 %)
pdf - výstupní formát ve formátu PDF
xml - výstupní formát ve formátu XML Příklad použití:curl -u 200425:ti54as234la "https://odevzdej.cz/auth-basic/plag_ode.pl?pts:sender.id=th1490;pts:textworks.id=111111;pdf=1"
- Jak při stahování podobností zjistím, v jakém stavu je požadovaný dokument?
Stav požadovaného dokumentu můžete zjistit prostřednictvím atributu plg:status, který se nachází v prvku plg:info. Atribut plg:status může nabývat hodnoty od 1 do 9 následovně:- Dokument není v metadatech - neznámé url. Je nutné provést nový import.
- Dokument je připraven ke stažení (stahování proběhne v noci).
- Dokument je zaveden v systému, ale nemá vytvořenou textovou verzi (může se zobrazit i důvod, proč bylo vytvoření neúspěšné nebo upozornění, že soubor není v textovém formátu ale např. ve formátu .eps apod.).
- Dokument není zkontrolovaný systémem na odhalování plagiátů - po vytvoření textové verze chvíli trvá, než dojde k nalezení podobností (prvek plg:info se zde nachází v prvku plg:record).
- K souboru nebyly nalezeny žádné podobnosti (prvek plg:info se zde nachází v prvku plg:record).
- K souboru byly nalezeny podobnosti, informace najdete ve vnořených prvcích plg:plagiat.
- Dokument zkontrolován u předchozí verze, podobnosti se teď přepočítávají.
- Dokument nezkontrolován, je příliš malý.
- Dokument nezkontrolován, obsahuje různá kódování textu.
Nenašli jste odpověď? Kontaktuje nás prostřednictvím formuláře.
