Odevzdej.cz

Seminární a školní práce

Automatické stahování nalezených podobností


  1. Možnosti automatického stahování nalezených podobností.

    Informace o nalezených podobnostech souborů v odevzdávárně můžete zjištovat automaticky pomocí aplikace https://odevzdej.cz/auth/plagiaty/plag_ode.pl. Ke zjištování podobností k určitému souboru pak slouží aplikace https://odevzdej.cz/auth/plagiaty/plag_soubor.pl. Podrobné návody jak postupovat při automatickém sběru podobností naleznete v otázkách níže.

  2. Jak vyhledám podobnosti souborů v odevzdávárně?

    Pro vyhledávání podobností souborů v odevzdávárně použijte aplikaci https://odevzdej.cz/auth/plagiaty/plag_ode.pl. Při spouštění je nutné použít parametr pts:sender.id a pts:textworks.id, které jste zadávali i při importu. Nepovinné je použití parametru from, který omezuje export podle doby vložení souborů (format YYYY-MM-DD), tedy například, pokud potřebujete zjistit podobnosti jen v souborech vložených od 8. 12. 2010 parametr from bude mít hodnotu 2010-12-08.

    Příklad použití:
    Nejprve je nutno se autentizovat vůči systému:

    curl -c cookie_jar.txt https://odevzdej.cz/system/login_form.pl --data destination=/auth/ --data 'credential_0=10035'  --data-urlencode 'credential_1=im5b2mFoc'
    kde parametr credential_0 je učo a parametr credential_1 heslo.
    Následně spustíte vyhledávání podobností v souborech v odevzdávárně:
    curl -c cookie_jar.txt -b cookie_jar.txt -F pts:sender.id=S14 -F pts:textworks.id=6415657 https://odevzdej.cz/auth/plagiaty/plag_ode.pl
    kde pts:textworks.id je identifikátor odevzdávárny, který jste uvedli při importu, pts:sender.id je identifikátor instituce uvedený při importu.

  3. Jak vyhledám podobnost k souboru?

    Pokud chcete zjistit jen podobnost jednotlivého souboru, lze použít aplikaci Podobnosti ke strojově vloženému souboru. Namísto identifikátoru odevzdávárny (pts:textworks.id) je nutno použít prvky pts:sender.id a pts:url, kde je uvedeno url, ze kterého si systém stáhl daný soubor. Tato hodnota tedy musí byt shodná s hodnotou, která byla použita při importu dat.

    Výsledný dokument je automaticky exportován ve formátu xml. Jeho popis je možné najít na stránkách https://odevzdej.cz/auth/od_dok/format_metadata.pl.

    Příklad použití:

    curl -c cookie_jar.txt -b cookie_jar.txt -F pts:sender.id=S14 -F pts:url=http://domena.cz/soubor.doc https://odevzdej.cz/auth/plagiaty/plag_soubor.pl
    Případně můžete sbírat výsledky i ve formátu pdf. K tomu je potřeba použít parametr pdf=1.
    Příklad stažení pdf s výsledky podobností k Odevzdávárně:
    curl -u neosobni_uco:heslo -F pts:sender.id=S14 -F pts:textworks.id=2456456 -F pdf=1 https://odevzdej.cz/auth-basic/plag_ode.pl

  4. Jak zjistím celkovou podobnost daného dokumentu?

    Po zjištění podobnosti u vybrané práce je v xml dokumentu uveden i prvek plg:doc_hash, který jednoznačně identifikuje soubor v Odevzdej.

    Pro zjištění celkové podobnosti lze použít odkaz: https://odevzdej.cz/auth/podob/XXX/?all;xml

    Celkové procento je v prvku plg:fullscore, všechny podobné pasáže pak v prvku plg:common.

    Pro výstup ve formátu PDF stačí v odkazu nahradit atribut xml atributem pdf.

  5. Jak zjistím podobnost mezi vybranými soubory?

    Pro zobrazení podobností ve vzorovém dokumentu 00000 s dokumenty 11111 a 22222 lze použít odkaz: https://odevzdej.cz/auth/podob/00000/11111/22222/, kde první identifikátor je vzorový soubor a další dva jsou identifikátory souborů, ke kterým chceme zobrazit podobnosti.

    Při zobrazení většího počtu podobných dokumentů, může být URL příliš dlouhé. V takovém případě lze podobnosti získat odesláním GET požadavku, který má následující parametry:

    - vzor: doc_hash vzorového dokumentu
    - dok: doc_hash podobného dokumentu

    Parametr dok může být zadán opakovaně. Je možné použít i další parametry viz níže.

    Příklad použití:

    curl -u 200425:ti54as234la -F vzor=000000 -F dok=111111 -F dok=222222 -F itos=1 -F xml=1 https://odevzdej.cz/auth/dok/plag_pod_dokumentu.pl

  6. Mohu stahovat výsledky podobností automaticky pomocí basic autentizace místo cookies?

    Ano, stačí použít jinou adresu:

    Místo https://odevzdej.cz/auth/plagiaty/plag_ode.pl použijte https://odevzdej.cz/auth-basic/plag_ode.pl.
    Místo https://odevzdej.cz/auth/podob/XXX/YYY použijte https://odevzdej.cz/auth-basic/podob/XXX/YYY.
    Místo https://odevzdej.cz/auth/plagiaty/plag_soubor.pl použijte https://odevzdej.cz/auth-basic/plag_soubor.pl.

  7. Mohu parametrizovat výsledky stahování podobností?

    Ano, lze získat celkové procento podobností nebo vynechat z nalezených podobností dokumenty, které mají stejného autora jako vzorový dokument.

    itos - ignorovat dvojice souborů, které mají stejného autora
    all_perc - zobrazit celkové procento podobností u daného dokumentu
    perc_min - zobrazit pouze podobnosti, které jsou větší než určené minimální procento (např.: perc_min=5 zobrazí podobnosti jen se soubory, jejichž podobnost je větší než 5 %)
    pdf - výstupní formát ve formátu PDF
    xml - výstupní formát ve formátu XML

    Příklad použití:

    curl -u 200425:ti54as234la "https://odevzdej.cz/auth-basic/plag_ode.pl?pts:sender.id=th1490;pts:textworks.id=111111;pdf=1"

  8. Jak při stahování podobností zjistím, v jakém stavu je požadovaný dokument?

    Stav požadovaného dokumentu můžete zjistit prostřednictvím atributu plg:status, který se nachází v prvku plg:info.

    Atribut plg:status může nabývat hodnoty od 1 do 9 následovně:

    1. Dokument není v metadatech - neznámé url. Je nutné provést nový import.
    2. Dokument je připraven ke stažení (stahování proběhne v noci).
    3. Dokument je zaveden v systému, ale nemá vytvořenou textovou verzi (může se zobrazit i důvod, proč bylo vytvoření neúspěšné nebo upozornění, že soubor není v textovém formátu ale např. ve formátu .eps apod.).
    4. Dokument není zkontrolovaný systémem na odhalování plagiátů - po vytvoření textové verze chvíli trvá, než dojde k nalezení podobností (prvek plg:info se zde nachází v prvku plg:record).
    5. K souboru nebyly nalezeny žádné podobnosti (prvek plg:info se zde nachází v prvku plg:record).
    6. K souboru byly nalezeny podobnosti, informace najdete ve vnořených prvcích plg:plagiat.
    7. Dokument zkontrolován u předchozí verze, podobnosti se teď přepočítávají.
    8. Dokument nezkontrolován, je příliš malý.
    9. Dokument nezkontrolován, obsahuje různá kódování textu.


Nenašli jste odpověď? Kontaktuje nás prostřednictvím formuláře.