4lang: Open Access Dataset for Cross-Lingual Plagiarism Detection
A dataset for cross-lingual plagiarism evaluation. 4collection.zip: a subset of Wikipedia articles on 4 languages (ru, hy, es, en). 4query.zip: wikipedia documents in each of the four languages with translated sentences with Google Translate API from collection. The archieve contains text documents...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Dataset |
Sprache: | eng |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!