~ Registry Navigation
Suche
Ressourcen und Entitäten
Korpora und Textsammlungen
Dienste
Editionen
Lexikalische Ressourcen
Repositorien
Weitere Entitäten
Importquellen
Institutionen
Personen
Werke
DE
Deutsch
Englisch
Anmelden
Probleme, Fehlerbehebung, Features
Korpus / Textsammlung
Veröffentlicht
Inhaltliche Angaben
Titel
Das Element ist ein Pflichtfeld
German news subcorpus from 2008 (deu_news_2008_100K)
eng
Beschreibung
Das Element ist ein Pflichtfeld
German news subcorpus based on material from 2008 (100,000 sentences) created in the project Deutscher Wortschatz or Leipzig Corpora Collection. The project regularly collects and processes availab...
German news subcorpus based on material from 2008 (100,000 sentences) created in the project Deutscher Wortschatz or Leipzig Corpora Collection. The project regularly collects and processes available documents from the Internet (typically in an annual cycle) and other sources. The results are corpora and corpora-based dictionaries for more than 250 languages, which provide statistical information about almost each word, example sentences and links to related words. Because of the huge amount of used text material containing several million sentences, information about almost every word can be provided. The service ranks among the most comprehensive information systems about the German language and provides the largest freely available amounts of data for many other languages. For copyright reasons, the data are provided as derived text formats that do not allow reconstruction of the original document structures.
eng
Deutsches Nachrichten-Teilkorpus basierend auf Texten von 2008 (100.000 Sätze) erstellt im Rahmen des Projektes Deutscher Wortschatz bzw. Wortschatz Leipzig. Das Projekt sammelt regelmäßig (meist j...
Deutsches Nachrichten-Teilkorpus basierend auf Texten von 2008 (100.000 Sätze) erstellt im Rahmen des Projektes Deutscher Wortschatz bzw. Wortschatz Leipzig. Das Projekt sammelt regelmäßig (meist jährlich) frei verfügbare Dokumente im Internet und aus anderen Quellen und bereitet diese auf. Das Ergebnis sind Korpora und korpusbasierte Wörterbücher für über 250 Sprachen, in denen zu jedem Wort statistische Angaben, Beispielsätze und Links zu verwandten Wörtern verfügbar sind. Das Angebot zählt zu den umfangreichsten Informationssystemen zur deutschen Sprache und stellt für viele weitere Sprachen die jeweils größten frei verfügbaren Datenmengen bereit. Zum Schutz des Urheberrechtes werden die Daten als abgeleitete Textformate bereit gestellt, die keine Rekonstruktion der ursprünglichen Dokumentenstrukturen erlauben.
deu
Größe
Optionales Feld, keine Pflichtangabe
100000 sentences, 1676598 tokens
Lizenz
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
public
Lizenz-URL
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Regeln zur Validierung der Inhalte werden angewendet
https://creativecommons.org/licenses/by-nc/4.0/
Modalität
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
geschrieben
Sprache
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Deutsch (deu)
Datentyp
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
corpus
text
Erstellungsdatum
Optionales Feld, keine Pflichtangabe
Veröffentlichungsdatum
Optionales Feld, keine Pflichtangabe
Abgedeckter Zeitraum
Optionales Feld, keine Pflichtangabe
Volltext verfügbar
Das Element ist ein Pflichtfeld
nicht vorhanden
Annotationslayer
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Kollektionstyp
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Genre
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Fachliche Zuordnung
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Schlagworte
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Size_length
Size_objects
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Size_length
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Size_filesize
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Technische Angaben
PID
Das Element ist ein Pflichtfeld
Regeln zur Validierung der Inhalte werden angewendet
https://hdl.handle.net/hdl:11022/0000-0000-20E2-C
Zugang
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
https://repo.data.saw-leipzig.de/resources?identifier=lcc/corpora/110220000000020E2C
https://fcs.data.saw-leipzig.de/lcc
Fcs_endpoint
Optionales Feld, keine Pflichtangabe
Regeln zur Validierung der Inhalte werden angewendet
Fcs_resource_id
Optionales Feld, keine Pflichtangabe
Bezüge zu anderen Korpora und Textsammlungen
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Dateien und Datenströme
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Technische Dokumentation
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Organisatorische Angaben
Personen
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Institutionen
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Sächsische Akademie der Wissenschaften zu Leipzig; https://d-nb.info/gnd/37863-X; wissenschaftliche Akademie in Leipzig
Verantwortliche Institution
Institution
Das Element ist ein Pflichtfeld
Sächsische Akademie der Wissenschaften zu Leipzig; https://d-nb.info/gnd/37863-X; wissenschaftliche Akademie in Leipzig
Bezug
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Verantwortliche Institution
Anmerkungen
Optionales Feld, keine Pflichtangabe
Ansprechperson
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Förderer-ID
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Projekttitel
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Registry Metadaten
Ressource (neueste Version)
Das Element ist ein Pflichtfeld
1824937c-f919-415d-9de8-dac679c7c2c5
Dargestellte Version
Das Element ist ein Pflichtfeld
6814af50db0dfd74bb485965
Zeitstempel der Version
Das Element ist ein Pflichtfeld
2. Mai 2025, 13:41:04
Ersteller*in der Version
Das Element ist ein Pflichtfeld
0704566
Versionen
Das Element ist ein Pflichtfeld
1
Ressource erzeugt
Das Element ist ein Pflichtfeld
2. Mai 2025, 13:41:04
Ersteller*in der Ressource
Das Element ist ein Pflichtfeld
0704566