Odevzdej.cz

Seminární a školní práce

Přihlásit se | Založit účet

Automatické stahování nalezených podobností

Možnosti automatického stahování nalezených podobností.
Jak vyhledám podobnosti souborů v odevzdávárně?
Jak vyhledám podobnost k souboru?
Mohu stahovat výsledky podobností automaticky pomocí basic autentizace místo cookies?
Mohu parametrizovat výsledky stahování podobností?
Jak při stahování podobností zjistím, v jakém stavu je požadovaný dokument?
Mohou uživatelé zkontrolovat výsledky podobností neautentizovaně přímo v systému Odevzdej?

Možnosti automatického stahování nalezených podobností.

Informace o nalezených podobnostech souborů v odevzdávárně můžete zjišťovat automaticky pomocí aplikace https://odevzdej.cz/auth/plagiaty/plag_ode.pl. Ke zjišťování podobností k určitému souboru pak slouží aplikace https://odevzdej.cz/auth/plagiaty/plag_soubor.pl. Podrobné návody jak postupovat při automatickém sběru podobností naleznete v otázkách níže.
Jak vyhledám podobnosti souborů v odevzdávárně?

Pro vyhledávání podobností souborů v odevzdávárně použijte aplikaci https://odevzdej.cz/auth/plagiaty/plag_ode.pl. Při spouštění je nutné použít parametr pts:sender.id a pts:textworks.id, které jste zadávali i při importu. Nepovinné je použití parametru from, který omezuje export podle doby vložení souborů (format YYYY-MM-DD), tedy například, pokud potřebujete zjistit podobnosti jen v souborech vložených od 8. 12. 2010 parametr from bude mít hodnotu 2010-12-08.
Příklad použití:
Nejprve je nutno se autentizovat vůči systému:
```
curl -c cookie_jar.txt https://odevzdej.cz/system/login_form.pl --data destination=/auth/ --data 'credential_0=10035'  --data-urlencode 'credential_1=im5b2mFoc'
```
kde parametr credential_0 je učo a parametr credential_1 heslo.
Následně spustíte vyhledávání podobností v souborech v odevzdávárně:
```
curl -c cookie_jar.txt -b cookie_jar.txt -F pts:sender.id=S14 -F pts:textworks.id=6415657 https://odevzdej.cz/auth/plagiaty/plag_ode.pl
```
kde pts:textworks.id je identifikátor odevzdávárny, který jste uvedli při importu, pts:sender.id je identifikátor instituce uvedený při importu.
Jak vyhledám podobnost k souboru?

Pokud chcete zjistit jen podobnost jednotlivého souboru, lze použít aplikaci Podobnosti ke strojově vloženému souboru. Namísto identifikátoru odevzdávárny (pts:textworks.id) je nutno použít prvky pts:sender.id a pts:url, kde je uvedeno url, ze kterého si systém stáhl daný soubor. Tato hodnota tedy musí byt shodná s hodnotou, která byla použita při importu dat.
Výsledný dokument je automaticky exportován ve formátu xml. Jeho popis je možné najít na stránkách https://odevzdej.cz/auth/od_dok/format_metadata.pl.
Příklad použití:
```
curl -c cookie_jar.txt -b cookie_jar.txt -F pts:sender.id=S14 -F pts:url=https://domena.cz/soubor.doc https://odevzdej.cz/auth/plagiaty/plag_soubor.pl
```
Případně můžete sbírat výsledky i ve formátu pdf. K tomu je potřeba použít parametr pdf=1.
Příklad stažení pdf s výsledky podobností k Odevzdávárně:
```
curl -u neosobni_uco:heslo -F pts:sender.id=S14 -F pts:textworks.id=2456456 -F pdf=1 https://odevzdej.cz/auth-basic/plag_ode.pl
```
Mohu stahovat výsledky podobností automaticky pomocí basic autentizace místo cookies?

Ano, stačí použít jinou adresu:
Místo https://odevzdej.cz/auth/plagiaty/plag_ode.pl použijte https://odevzdej.cz/auth-basic/plag_ode.pl.
Místo https://odevzdej.cz/auth/plagiaty/plag_soubor.pl použijte https://odevzdej.cz/auth-basic/plag_soubor.pl.
Mohu parametrizovat výsledky stahování podobností?

Ano, lze získat celkové procento podobností nebo vynechat z nalezených podobností dokumenty, které mají stejného autora jako vzorový dokument.
itos - ignorovat dvojice souborů, které mají stejného autora
all_perc - zobrazit celkové procento podobností u daného dokumentu
perc_min - zobrazit pouze podobnosti, které jsou větší než určené minimální procento (např.: perc_min=5 zobrazí podobnosti jen se soubory, jejichž podobnost je větší než 5 %)
pdf - výstupní formát ve formátu PDF
xml - výstupní formát ve formátu XML
Příklad použití:
```
curl -u 200425:ti54as234la "https://odevzdej.cz/auth-basic/plag_ode.pl?pts:sender.id=th1490;pts:textworks.id=111111;pdf=1"
```
Jak při stahování podobností zjistím, v jakém stavu je požadovaný dokument?

Stav požadovaného dokumentu můžete zjistit prostřednictvím atributu plg:status, který se nachází v prvku plg:info.
Atribut plg:status může nabývat hodnoty od 1 do 9 následovně:
1. Dokument není v metadatech - neznámé url. Je nutné provést nový import.
2. Dokument je připraven ke stažení (stahování proběhne v noci).
3. Dokument je zaveden v systému, ale nemá vytvořenou textovou verzi (může se zobrazit i důvod, proč bylo vytvoření neúspěšné nebo upozornění, že soubor není v textovém formátu ale např. ve formátu .eps apod.).
4. Dokument není zkontrolovaný systémem na odhalování plagiátů - po vytvoření textové verze chvíli trvá, než dojde k nalezení podobností (prvek plg:info se zde nachází v prvku plg:record).
5. K souboru nebyly nalezeny žádné podobnosti (prvek plg:info se zde nachází v prvku plg:record).
6. K souboru byly nalezeny podobnosti, informace najdete ve vnořených prvcích plg:plagiat.
7. Dokument zkontrolován u předchozí verze, podobnosti se teď přepočítávají.
8. Dokument nezkontrolován, je příliš malý.
9. Dokument nezkontrolován, obsahuje různá kódování textu.
Mohou uživatelé zkontrolovat výsledky podobností neautentizovaně přímo v systému Odevzdej?

Pokud škola přebírá výsledky hromadně do svého (studijního) systému, může si uživatel prohlédnout výsledky podobností přímo v systému Odevzdej pomocí speciálně vygenerovaného odkazu s tajným klíčem bez nutnosti se do systému Odevzdej autentizovat.
Správce, který stahuje výsledky podobností ke konkrétnímu dokumentu pomocí XML souboru, má k dispozici i jednoznačný identifikátor dokumentu v systému Odevzdej, kterým je prvek plg:doc_hash. V případě požadavku uživatele může správce použitím tohoto identifikátoru v aplikaci
```
https://odevzdej.cz/auth/plagiaty/get_noauth_url?plg:doc_hash=XXXXX
```
požádat o unikátní odkaz, kde se nachází aplikace Zobrazení podobností k příslušnému dokumentu pro pokročilou práci s nalezenými podobnostmi.
Systém vrátí XML soubor s prvkem plg:similar, kde se nachází neautentizovaný odkaz, a ten předá uživateli, který může následně přistoupit k dokumentu, dále s ním pracovat a využívat rozšířené grafické funkcionality systému (více o práci s dokumentem naleznete v této Nápovědě).

Unikátní odkaz je platný po dobu 6 hodin od vygenerování odkazu. Po prvním použití však může uživatel přistupovat k dokumentu ze stejné IP adresy jen po maximální dobu 1 hodiny. Po uplynutí této doby může správce požádat znovu o další odkaz, a to opakovaně.

Nenašli jste odpověď? Kontaktujte nás prostřednictvím formuláře.

Provozuje Fakulta informatiky Masarykovy univerzity – Vývojový tým IS MU. 19. 4. 2024 19:35 |