학생들이 에세이를 비교하고 그 에세이 중 하나가 표절되었는지 알고 싶다고합시다. 어떻게하면 순진한 방식으로 진행할 수 있습니까 (즉, 너무 복잡하지는 않은 접근 방식)? 물론 에세이에서 사용 된 단어를 비교하는 것과 같은 간단한 방법과 압축 기능을 사용하는 것과 같은 복잡한 방법이 있지만 너무 복잡한/이론없이 표절을 검사하는 다른 방법은 무엇입니까?표절 탐지에 대한 순수한 접근법은 무엇입니까?
0
A
답변
1
Dick Grune의 similarity comparator에서 자연어 텍스트 작업을 수행 할 수 있습니다 (소프트웨어에서만 시도했습니다). 알고리즘도 설명되어 있습니다. (그런데, 구문 분석에 대한 자신의 책은 내 의견으로는, 정말 좋은 것입니다.)
는
2
, 내가 this 을 읽어 보시기 바랍니다 몇 가지 방법을 제공하는 몇 가지 서류가 있습니다 용지 전체에 걸쳐 구축 된 인덱스 구조 을 기반으로하는 알고리즘을 보여줍니다 파일 컬렉션.
따라서 알고리즘은 대형 소프트웨어 시스템에서 유사한 코드 조각을 찾는 데 사용할 수 있다고합니다. 인덱스가 작성되기 전에 컬렉션의 모든 파일이 토큰 화됩니다. 이것은 간단한 구문 분석 문제이며 선형 시간으로 해결할 수 있습니다. 컬렉션의 각 파일에 대해, F_i에 대한 토큰 화 장치 의 출력은 n_i 토큰의 문자열입니다.
here 당신이 테스트 문서 등록 문서 사이에 일반적인 단어의 집합에 비교하여 표절을 검출에 구성
다른 좋은 알고리즘 is a scam based algorithm을 읽을 수있는 다른 종이입니다. 우리의 표절 탐지 시스템은 많은 정보 검색 시스템과 마찬가지로 정밀도와 회수율의 측정 기준으로 평가됩니다.
관련 문제
- 1. 수은 API에 대한 최선의 접근법은 무엇입니까
- 2. DTO에 대한 더 나은 접근법은 무엇입니까?
- 3. 커스텀 UIToolBar에 대한 올바른 접근법은 무엇입니까?
- 4. 백분위 수에 대한 또 다른 접근법은 무엇입니까?
- 5. 문서 분류 접근법은 무엇입니까?
- 6. Obj-C에서 삼각형 충돌 탐지에 대한 도움말
- 7. 충돌 탐지에 대한 기본적인 질문. XNA 초보자
- 8. 표절 감지기
- 9. C의 표준 유형에 대한 typedef에 대한 권장 접근법은 무엇입니까?
- 10. JavaScript로 코드 표절 검사하기
- 11. 표절 분석기 (웹 콘텐츠와 비교)
- 12. 표절 감지기 문제
- 13. 표절 탐지기의 알고리즘
- 14. 대량 물품에 표절 물 찾기
- 15. 델파이의 모듈 프로그래밍에 대한 최선의 접근법은
- 16. 이 테이블에 대한 가장 빠른 스키마 접근법은 무엇입니까?
- 17. SQL Server에서 롤백 트랜잭션에 대한 더 나은 접근법은 무엇입니까?
- 18. Python try-except 블록에 대한 DRY 접근법은 무엇입니까?
- 19. 합계와 정렬을 사용하는 mongodb 쿼리에 대한 최선의 접근법은 무엇입니까
- 20. 사용자 정의 테이블의 잘 알려진 행에 대한 최선의 접근법은 무엇입니까?
- 21. 일련의 순수한 난수에 대한 혼동
- 22. N 직사각형 충돌 탐지에 대한 직사각형의 논리 흐름
- 23. Wcopyfind for python - 표절 소프트웨어?
- 24. 사용자 정의 페이지에서 더 나은 접근법은 무엇입니까?
- 25. SP에서 SQL 커서를 사용하는 다른 접근법은 무엇입니까?
- 26. 순수한 터치 이벤트와 순수한 제스처 이벤트를 구분하십시오.
- 27. 대부분의 메모리 누수 방지 접근법은 무엇입니까
- 28. csproj 파일에서 어셈블리 참조를위한 올바른 접근법은 무엇입니까?
- 29. XML을 작성하기위한 XOM 또는 DOM 접근법은 무엇입니까?
- 30. Java를 사용하여 XML을 변형하는 다른 접근법은 무엇입니까?
이것은 뭔가 잘못 처리하는 것이 전혀하지 않는 것보다 훨씬 나빠질 수있는 일 중 하나입니다. 내가 대학에있을 때, 나는 한 번 종이에 F를 부여 받았고,이 순진한 표절 탐지기 중 하나를 기반으로 한 표절 혐의로 기소되었습니다. 표절 혐의로 기소 된 기사는 귀속이있는 제 논문 *을 인용 한 것입니다! 표절 탐지기는 일치하는 섹션 만 포함하고 다른 종이에서 컨텍스트 (인용문 포함)를 잘라냅니다! 그냥하지 마. –
사용자가보고자하는 유사한 문서를 찾는 것만으로는 탐지기가 최종 결정을 내리지 않는 한 계속해서 도움을 받아야합니다. – fgb
동의합니다. 이것은 실용적인 응용보다는 이론적 인 것입니다. 나는이 하하를 기반으로 한 표절 탐지기를 만들 계획을 가지고 있지 않다. – user1921187