Программа предназначена для проверки и сравнения схожести домашних заданий, представленных студентами в электронном виде. Она способна анализировать схожесть кода на различных языках программирования (например, Java, C/C++, Python и т.д.), а также документов на разных форматах (например, txt, doc, docx, pdf и т.д.) и на разных языках (китайский, английский, традиционный и упрощённый китайский). Кроме того, программа сравнивает схожесть изображений на различных форматах (например, png, jpg, gif, bmp и т.д.).
Программу можно скачать или клонировать исходный код проекта, либо скачать версию для разработки releases.
Исходный код можно импортировать напрямую в Eclipse, основной точкой входа является класс PlagGUI в пакете gui.plag.edu.
Программа разработана и работает на Windows 10, с использованием jdk11 64-битной версии.## Использование
Для запуска программы в версии для разработки, дважды щелкните по файлу run.bat. Инструкции по использованию программы можно найти в документации, расположенной в соответствующей папке. Основное окно программы представлено на следующем изображении:
Основные технологии, используемые в программе, включают алгоритмы сравнения схожести строк, лексико-синтаксический анализ кода, токенизацию в рамках естественного языка (NLP) и алгоритмы сравнения схожести изображений.Сравнение схожести текстовых документов основывается на трёх открытых системах:
В данной системе были выполнены дополнительные разработки и интеграции этих систем. Для системы MOSS был разработан клиентский модуль для доступа к системе, который позволяет отправлять файлы кода, получать и анализировать результаты, а также сортировать результаты. Для систем sim и jplag были выполнены интеграции, которые могут использоваться в качестве альтернативных продуктов при недоступности MOSS из-за сетевых проблем и т. д.Для сравнения схожести китайских и английских текстовых документов были разработаны два алгоритма:
Первый метод основан на алгоритме shinglecloud (быстрый метод вычисления схожести, основанный на текстовых отпечатках и независимый от языка). Основные этапы обработки документов следующие:
Второй метод основан на алгоритме GST, использующем jplag, с расширенными функциями, включая новый тип языка "doc", который позволяет вычислять степень схожести различных документов и предоставляет веб-визуализацию для сравнения.Сравнение схожести изображений основано на проекте JImageHash:
Основным использованным методом является алгоритм сравнения схожести по PHASH-отпечаткам изображений.
Открытый исходный код, открытые достижения, открытость — это добродетель, а звезды на GitHub — тоже.## Обновления
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )