4lang: Open Access Dataset for Cross-Lingual Plagiarism Detection

A dataset for cross-lingual plagiarism evaluation. 4collection.zip: a subset of Wikipedia articles on 4 languages (ru, hy, es, en). 4query.zip: wikipedia documents in each of the four languages with translated sentences with Google Translate API from collection. The archieve contains text documents...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: German Gritsay
Format: Dataset
Sprache:eng
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!