SALSA - The SAarbrücken Lexical Semantics Annotation and Analysis Project

PID

The SALSA corpus is based on the TIGER corpus. The TIGER corpus (Version 2.1) consists of app. 900,000 tokens (50,000 sentences) of German newspaper text, taken from the Frankfurter Rundschau. The corpus was semi-automatically POS-tagged and annotated with syntactic structure. Moreover, it contains morphological and lemma information for terminal nodes. (cf. TIGER corpus website) SALSA provides an additional annotation layer to the TIGER corpus: FrameNet semantic roles.

Das SALSA-Korpus basiert auf dem Tiger-Korpus. Letzteres besteht aus ca. 900.000 Token (50.000 Sätzen) deutschen Zeitungstextes aus der Frankfurter Rundschau. Das Korpus wurde semi-automatisch syntaktisch annotiert und enthält außerdem POS, Lemma und morphologische Information. (s.a. TIGER-Korpus-Webseite) SALSA fügt der TIGER-Annotation eine weitere Annotationsebene mit semantischen Rollen (FrameNet) hinzu.

Identifier
PID https://hdl.handle.net/11858/00-246C-0000-0005-BD13-1
Related Identifier http://www.ims.uni-stuttgart.de/projekte/TIGER/
Related Identifier https://framenet.icsi.berkeley.edu/fndrupal/
Metadata Access http://fedora.clarin-d.uni-saarland.de/oaiprovider/?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:fedora.clarin-d.uni-saarland.de:clarind-uds:salsa
Provenance
Creator Manfred Pinkal Universität des Saarlandes Fachrichtung 4.7 Allgemeine Linguistik Postfach 15 11 50 66041 Saarbrücken, Germany
Publisher CLARIN
Contributor Manfred Pinkal; Hagen Fürstenau; Ines Rehbein; Josef Ruppenhofer; Caroline Sporleder; Gemma Boleda; Aljoscha Burchardt; Katrin Erk; Anette Frank; Andrea Kowalski; Sebastian Padó; Marco Pennacchiotti; Jiri Semecky; Dennis Spohr
Publication Year 2006
Rights Copyrighted, Agreement needed; SALSA license agreement: http://www.coli.uni-saarland.de/projects/salsa/corpus/doc/license.html; Precondition to use SALSA is to sign TIGER's license agreement: http://www.ims.uni-stuttgart.de/projekte/TIGER/TIGERCorpus/license/htmllicense.shtml
OpenAccess true
Contact j.knappen(at)mx.uni-saarland.de
Representation
Language German
Resource Type Collection
Format text/xml
Discipline Linguistics