~ Registry Navigation
Suche
Ressourcen und Entitäten
Korpora und Textsammlungen
Dienste
Editionen
Lexikalische Ressourcen
Repositorien
Weitere Entitäten
Importquellen
Institutionen
Personen
Werke
DE
Deutsch
Englisch
Anmelden
Probleme, Fehlerbehebung, Features
Korpus / Textsammlung
Veröffentlicht
Inhaltliche Angaben
Titel
Das Element ist ein Pflichtfeld
Southern Sotho Web subcorpus (South Africa) from 2018 (sot-za_web_2018_10K)
eng
Beschreibung
Das Element ist ein Pflichtfeld
Southern Sotho Web subcorpus (South Africa) based on material from 2018 (10,000 sentences) created in the project Deutscher Wortschatz or Leipzig Corpora Collection. The project regularly collects ...
Southern Sotho Web subcorpus (South Africa) based on material from 2018 (10,000 sentences) created in the project Deutscher Wortschatz or Leipzig Corpora Collection. The project regularly collects and processes available documents from the Internet (typically in an annual cycle) and other sources. The results are corpora and corpora-based dictionaries for more than 250 languages, which provide statistical information about almost each word, example sentences and links to related words. Because of the huge amount of used text material containing several million sentences, information about almost every word can be provided. The service ranks among the most comprehensive information systems about the German language and provides the largest freely available amounts of data for many other languages. For copyright reasons, the data are provided as derived text formats that do not allow reconstruction of the original document structures.
eng
Süd-Sotho Web-Teilkorpus (Südafrika) basierend auf Texten von 2018 (10.000 Sätze) erstellt im Rahmen des Projektes Deutscher Wortschatz bzw. Wortschatz Leipzig. Das Projekt sammelt regelmäßig (meis...
Süd-Sotho Web-Teilkorpus (Südafrika) basierend auf Texten von 2018 (10.000 Sätze) erstellt im Rahmen des Projektes Deutscher Wortschatz bzw. Wortschatz Leipzig. Das Projekt sammelt regelmäßig (meist jährlich) frei verfügbare Dokumente im Internet und aus anderen Quellen und bereitet diese auf. Das Ergebnis sind Korpora und korpusbasierte Wörterbücher für über 250 Sprachen, in denen zu jedem Wort statistische Angaben, Beispielsätze und Links zu verwandten Wörtern verfügbar sind. Das Angebot zählt zu den umfangreichsten Informationssystemen zur deutschen Sprache und stellt für viele weitere Sprachen die jeweils größten frei verfügbaren Datenmengen bereit. Zum Schutz des Urheberrechtes werden die Daten als abgeleitete Textformate bereit gestellt, die keine Rekonstruktion der ursprünglichen Dokumentenstrukturen erlauben.
deu
Größe
Das Element ist ein Pflichtfeld
10000 sentences, 213418 tokens
Lizenz
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
public
Lizenz-URL
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Regeln zur Validierung der Inhalte werden angewendet
https://creativecommons.org/licenses/by-nc/4.0/
Modalität
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
geschrieben
Sprache
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Süd-Sotho-Sprache (sot)
Datentyp
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
corpus
text
Erstellungsdatum
Optionales Feld, keine Pflichtangabe
Veröffentlichungsdatum
Optionales Feld, keine Pflichtangabe
Abgedeckter Zeitraum
Optionales Feld, keine Pflichtangabe
Volltext verfügbar
Das Element ist ein Pflichtfeld
nicht vorhanden
Annotationslayer
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Kollektionstyp
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Genre
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Fachliche Zuordnung
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Schlagworte
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Technische Angaben
PID
Das Element ist ein Pflichtfeld
Regeln zur Validierung der Inhalte werden angewendet
https://hdl.handle.net/hdl:11022/0000-0007-CA6B-E
Zugang
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
https://repo.data.saw-leipzig.de/resources?identifier=lcc/corpora/1102200000007CA6BE
https://fcs.data.saw-leipzig.de/lcc
Bezüge zu anderen Korpora und Textsammlungen
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Dateien und Datenströme
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Technische Dokumentation
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Organisatorische Angaben
Personen
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Institutionen
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Sächsische Akademie der Wissenschaften zu Leipzig; https://d-nb.info/gnd/37863-X; wissenschaftliche Akademie in Leipzig
Verantwortliche Institution
Institution
Das Element ist ein Pflichtfeld
Sächsische Akademie der Wissenschaften zu Leipzig; https://d-nb.info/gnd/37863-X; wissenschaftliche Akademie in Leipzig
Bezug
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Verantwortliche Institution
Anmerkungen
Optionales Feld, keine Pflichtangabe
Ansprechperson
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Förderer-ID
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Projekttitel
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Registry Metadaten
Ressource (neueste Version)
Das Element ist ein Pflichtfeld
dae3fad8-037b-4821-8fb5-a9ca035a35c7
Dargestellte Version
Das Element ist ein Pflichtfeld
6814a9b1db0dfd74bb48593d
Zeitstempel der Version
Das Element ist ein Pflichtfeld
2. Mai 2025, 13:17:05
Ersteller*in der Version
Das Element ist ein Pflichtfeld
0704566
Versionen
Das Element ist ein Pflichtfeld
1
Ressource erzeugt
Das Element ist ein Pflichtfeld
2. Mai 2025, 13:17:05
Ersteller*in der Ressource
Das Element ist ein Pflichtfeld
0704566