Engelsk-svensk guldstandard för ordlänkning (GES)

DOI

Reference corpus for word linking, divided into training data and test data. The sentences come from the English and Swedish parts of Europarl. Data are created from the English-Swedish part of the Europarl corpus. For each sentence pair in the selected subset, token correspondences are stated as pairs of integral token identifiers

En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar. Data är skapade från den engelsk-svenska delen av den parallella korpusen Europarl och utgörs, för varje meningspar, av par av tokenidentifierare på formen n-m där n och m är heltal.

Identifier
DOI https://doi.org/
Metadata Access https://datacatalogue.cessda.eu/oai-pmh/v0/oai?verb=GetRecord&metadataPrefix=oai_ddi25&identifier=ad9883a5efe8b8342d55c0394a3a7efec138cd4a0617cc83415af7ae00658bf9
Provenance
Creator Ahrenberg, Lars; Holmqvist, Maria
Publisher Swedish National Data Service; Svensk nationell datatjänst
Publication Year 2019
Rights Access to data through an external actor. Data are freely accessible.; Åtkomst till data via extern aktör. Data är fritt tillgängliga.
OpenAccess true
Contact https://snd.gu.se
Representation
Language English
Discipline Computer Science; Computer Science, Electrical and System Engineering; Construction Engineering and Architecture; Engineering; Engineering Sciences; Humanities; Information Science; Linguistics; Natural Sciences