Korpus / Textsammlung

Veröffentlicht

    Inhaltliche Angaben

    Das Element ist ein Pflichtfeld
    Southern Sotho Web subcorpus (South Africa) from 2018 (sot-za_web_2018_10K) eng
    Das Element ist ein Pflichtfeld
    Southern Sotho Web subcorpus (South Africa) based on material from 2018 (10,000 sentences) created in the project Deutscher Wortschatz or Leipzig Corpora Collection. The project regularly collects ... Southern Sotho Web subcorpus (South Africa) based on material from 2018 (10,000 sentences) created in the project Deutscher Wortschatz or Leipzig Corpora Collection. The project regularly collects and processes available documents from the Internet (typically in an annual cycle) and other sources. The results are corpora and corpora-based dictionaries for more than 250 languages, which provide statistical information about almost each word, example sentences and links to related words. Because of the huge amount of used text material containing several million sentences, information about almost every word can be provided. The service ranks among the most comprehensive information systems about the German language and provides the largest freely available amounts of data for many other languages. For copyright reasons, the data are provided as derived text formats that do not allow reconstruction of the original document structures. eng
    Süd-Sotho Web-Teilkorpus (Südafrika) basierend auf Texten von 2018 (10.000 Sätze) erstellt im Rahmen des Projektes Deutscher Wortschatz bzw. Wortschatz Leipzig. Das Projekt sammelt regelmäßig (meis... Süd-Sotho Web-Teilkorpus (Südafrika) basierend auf Texten von 2018 (10.000 Sätze) erstellt im Rahmen des Projektes Deutscher Wortschatz bzw. Wortschatz Leipzig. Das Projekt sammelt regelmäßig (meist jährlich) frei verfügbare Dokumente im Internet und aus anderen Quellen und bereitet diese auf. Das Ergebnis sind Korpora und korpusbasierte Wörterbücher für über 250 Sprachen, in denen zu jedem Wort statistische Angaben, Beispielsätze und Links zu verwandten Wörtern verfügbar sind. Das Angebot zählt zu den umfangreichsten Informationssystemen zur deutschen Sprache und stellt für viele weitere Sprachen die jeweils größten frei verfügbaren Datenmengen bereit. Zum Schutz des Urheberrechtes werden die Daten als abgeleitete Textformate bereit gestellt, die keine Rekonstruktion der ursprünglichen Dokumentenstrukturen erlauben. deu
    Das Element ist ein Pflichtfeld
    10000 sentences, 213418 tokens
    Das Element ist ein Pflichtfeld
    Mehrfachangaben sind erlaubt
    public
    Das Element ist ein Pflichtfeld
    Mehrfachangaben sind erlaubt
    Regeln zur Validierung der Inhalte werden angewendet
    Das Element ist ein Pflichtfeld
    Mehrfachangaben sind erlaubt
    geschrieben
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Das Element ist ein Pflichtfeld
    Mehrfachangaben sind erlaubt
    corpus
    text
    Optionales Feld, keine Pflichtangabe
    Optionales Feld, keine Pflichtangabe
    Optionales Feld, keine Pflichtangabe
    Das Element ist ein Pflichtfeld
    nicht vorhanden
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt

    Technische Angaben

    Das Element ist ein Pflichtfeld
    Regeln zur Validierung der Inhalte werden angewendet
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt

    Organisatorische Angaben

    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt

    Das Element ist ein Pflichtfeld
    Das Element ist ein Pflichtfeld
    Mehrfachangaben sind erlaubt
    Verantwortliche Institution
    Optionales Feld, keine Pflichtangabe
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt
    Optionales Feld, keine Pflichtangabe
    Mehrfachangaben sind erlaubt

    Registry Metadaten

    Das Element ist ein Pflichtfeld
    Das Element ist ein Pflichtfeld
    Das Element ist ein Pflichtfeld
    2. Mai 2025, 13:17:05
    Das Element ist ein Pflichtfeld
    0704566
    Das Element ist ein Pflichtfeld
    1
    Das Element ist ein Pflichtfeld
    2. Mai 2025, 13:17:05
    Das Element ist ein Pflichtfeld
    0704566