中標津町文化スポーツ振興財団

トップページ




RSS

Ringworld
RingBlog v3.06a

2019年 4月 24日 (水)

Zaawansowana technika antyplagiatowa

by hawkeye

Odkrycie plagiatu to proces znajdowania przypadków plagiatu w obrębie dzieła lub dokumentu. Powszechne korzystanie z komputerów i pojawienie się Internetu znacznie ułatwia plagiat pracy innych. Większość przypadków plagiatu znajduje się w akademiach, gdzie dokumenty są zwykle esejami lub raportami. Plagiat można jednak znaleźć w prawie każdej dziedzinie, w tym w pracach naukowych, projektach artystycznych i kodzie źródłowym.

Pokaż plagiat za pomocą komputera
Wykrywanie plagiatu komputerowego to wyszukiwanie informacji i jest wspierane przez specjalistyczne systemy zwane systemami wykrywania plagiatu.

Wykrywanie plagiatu może być ręczne lub przy pomocy komputera. Ręczne wykrywanie wymaga znacznego wysiłku i doskonałej pamięci i jest niepraktyczne w przypadkach, gdy konieczne jest porównanie zbyt wielu dokumentów lub oryginalne dokumenty nie są dostępne do porównania. Dzięki wykrywaniu komputerów ogromne zbiory dokumentów można porównywać ze sobą, aby uzyskać najbardziej skuteczne i prawdopodobne wykrycie plagiatu.

Wykryj plagiatowane dokumenty tekstowe
Systemy wykrywania plagiatów tekstowych takie jak program Rapidus wdrażają jedno z dwóch ogólnych podejść do wykrywania, z których jedno jest zewnętrzne, a drugie jest niezbędne. Systemy zewnętrzne porównują podejrzany dokument z kolekcją referencyjną, która jest zbiorem dokumentów uważanych za oryginalne.
Na podstawie wybranego modelu dokumentu i wstępnie zdefiniowanych kryteriów podobieństwa zadaniem plagiatowania jest uzyskanie wszystkich dokumentów zawierających tekst, który jest do pewnego stopnia podobny do tekstu w podejrzanym dokumencie .
Podstawowe podejście analizuje tekst, który ma być oceniany, bez porównywania zewnętrznych dokumentów. Podejście to ma na celu rozpoznanie zmian w unikalnym stylu pisania autora jako wskaźnika potencjalnego plagiatu.
Programy wykrywania plagiatu, takie jak program antyplagiatowy są w stanie wiarygodnie zidentyfikować plagiatu bez ludzkiego rozumowania. Podobieństwa są ujawniane za pomocą poprzednich modeli dokumentów.

Sprawdzanie dokumentów nakładki tekstowej jest problemem klasycznego łączenia słów znanych w innych dziedzinach informatyki. Zaproponowano szereg podejść, aby skutecznie poradzić sobie z tym zadaniem, z których niektóre są dostosowane do zewnętrznych detektorów plagiatu. Sprawdzanie podejrzanego dokumentu za pomocą tej opcji wymaga obliczenia i przechowywania skutecznie porównywalnych reprezentacji dla wszystkich dokumentów w kolekcji referencyjnej, która jest używana do porównywania ciągów do par. Ogólnie, wzory dla dokumentu przyrostkowego, takie jak drzewa przyrostków lub wektory przyrostkowe, są przystosowane do tego zadania w kontekście plagiatu komputerowego. Jednak łączenie łańcuchów pozostaje metodą kosztowną, co czyni je niedopuszczalnym rozwiązaniem do sprawdzania kolekcji z wieloma dokumentami.

Metody wykrywania
Klasyfikacja proponowanych metod wykrywania plagiatu za pomocą komputera z technicznego punktu widzenia. Techniki charakteryzują się rodzajem oceny, wykorzystaniem programu antyplagiat z którą są związane. Globalne oszacowania podobieństwa wykorzystują funkcje zaczerpnięte z większych części tekstu lub dokumentu jako całości w celu określenia podobieństwa, podczas gdy metody lokalne są ograniczone do segmentów tekstu jako danych wejściowych.
Odciski palców są obecnie najczęściej stosowane w przypadku uzyskiwania dostępu do komputera w celu wykrywania plagiatu. System Rapidus to doskonałe narzędzie, które prowadzi do uzyskania dokumentów poprzez wybranie z nich zestawu wielu żargonów (n-gramów). Zestawy reprezentują odciski palców, a ich elementy nazywane są szczegółami.
Podejrzany dokument sprawdza, czy jest plagiatowany przez komputerowe przetwarzanie wydruków i użycie wstępnie obliczonego indeksu odcisków palców dla wszystkich dokumentów w kolekcji referencyjnej. Szczegóły tych innych dokumentów pokazują wspólne segmenty tekstu i sugerują możliwy plagiat .
Ogólnie rzecz biorąc, porównuje się tylko podzbiór szczegółów w celu przyspieszenia procesu i umożliwienia uwierzytelnienia w przypadku dużej kolekcji dokumentów, takich jak Internet .