~ Registry Navigation
Suche
Ressourcen und Entitäten
Korpora und Textsammlungen
Dienste
Editionen
Lexikalische Ressourcen
Lexikalische Ressourcen (v2)
Repositorien
Weitere Entitäten
Importquellen
Institutionen
Personen
Werke
DE
Deutsch
Englisch
Anmelden
Probleme, Fehlerbehebung, Features
Lexikalische Ressource
Veröffentlicht
Ungültig
Nur lesbar
TALAR
Bibliografische Metadaten
Titel
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Vector representations of German words and compounds
eng
Bib_creator_person
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Dima; Gina-Corina; Promotion Universität Tübingen, Philosophische Fakultät, Fachbereich Allgemeine und vergleichende Sprachwissenschaft; https://d-nb.info/gnd/1181819423
Person
Das Element ist ein Pflichtfeld
Dima; Gina-Corina; Promotion Universität Tübingen, Philosophische Fakultät, Fachbereich Allgemeine und vergleichende Sprachwissenschaft; https://d-nb.info/gnd/1181819423
Comment
Optionales Feld, keine Pflichtangabe
Bib_creator_institution
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Verwaltungsinformationen
Md_id
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Regeln zur Validierung der Inhalte werden angewendet
https://doi.org/10.57754/FDAT.fx84s-dxe33
Md_timestamp
Das Element ist ein Pflichtfeld
2017-03-14
Md_creator_person
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
nnsdg01@uni-tuebingen.de
Person
Das Element ist ein Pflichtfeld
nnsdg01@uni-tuebingen.de
Comment
Optionales Feld, keine Pflichtangabe
Md_creator_institution
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Relationale_metadaten
Rel
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Metadaten_zum_lebenszyklus
Lc_version
Das Element ist ein Pflichtfeld
1
Lc_status
Das Element ist ein Pflichtfeld
Produktiv
Rechtliche_metadaten
Ar_license
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
restricted use, request required
Ar_license_holder
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Lexikologische_metadaten
Typ
Typ der Ressource
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Wörterbuch
Objektsprache
Sprache der Objekte
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Deutsch (deu)
Beschreibungssprache
Sprache der Ressourcenbeschreibung
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Lex_entry_type
Das Element ist ein Pflichtfeld
Lex_data_type
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Lex_modality
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
Written
Lex_language_region
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Lex_language_period
Das Element ist ein Pflichtfeld
Lex_dialect
Optionales Feld, keine Pflichtangabe
Lex_diaphrasic
Optionales Feld, keine Pflichtangabe
Lex_diastratic
Optionales Feld, keine Pflichtangabe
Lex_domain
Optionales Feld, keine Pflichtangabe
Lex_size
Das Element ist ein Pflichtfeld
Mehrfachangaben sind erlaubt
50 dimensions
100 dimensions
200 dimensions
300 dimensions
Technische_metadaten
Tech_api_endpoint
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Regeln zur Validierung der Inhalte werden angewendet
Fcs_endpoint
Optionales Feld, keine Pflichtangabe
Regeln zur Validierung der Inhalte werden angewendet
Tech_landing_page
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Regeln zur Validierung der Inhalte werden angewendet
https://doi.org/10.57754/FDAT.fx84s-dxe33
Tech_data_format
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Tech_text_encoding
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Tech_text_script
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Tech_font_spec
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Klartextbeschreibung
Beschreibung der Ressource
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Word representations used in Dima(2015), Dima (2019). The vectors were generated from the decow14ax corpus (https://corporafromtheweb.org/), ~10 billion words of raw text. Corpus pre-processing: wo...
Word representations used in Dima(2015), Dima (2019). The vectors were generated from the decow14ax corpus (https://corporafromtheweb.org/), ~10 billion words of raw text. Corpus pre-processing: words lowercased, punctuation removed, each number was replaced by the string 'NUMBER'. Embeddings trained using a minimum word frequency of 100, leading to a vocabulary 1,029,270 words. The vocabulary file 'decow14ax_all_min_100.vocab' contains these word representations and their frequency in the support corpus. 'decow14ax_full.vocab' contains the full vocabulary generated for the corpus (no cut-off). The embeddings were trained with GloVe, for 15 iterations, using a 10-word symmetric window of text (20 words surrounding a particular word). The files are suffixed with the dimensionality of the vector representations: 50 dimensional, 100 dimensional, 200 dimensional and 300 dimensional. MAX_ITER=15 WINDOW_SIZE=10 BINARY=0 NUM_THREADS=8 X_MAX=100
eng
Raumbezogene_metadaten
Dct_covers
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Geo_feature
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Regeln zur Validierung der Inhalte werden angewendet
Geo_has_geometry
Optionales Feld, keine Pflichtangabe
Mehrfachangaben sind erlaubt
Geo_image
Optionales Feld, keine Pflichtangabe
Geo_epsg
Optionales Feld, keine Pflichtangabe
Registry Metadaten
Ressource (neueste Version)
Das Element ist ein Pflichtfeld
3b2f7fe4-2081-47af-aeeb-0f822a262770
Dargestellte Version
Das Element ist ein Pflichtfeld
6841d38ddfe34a43998c43c2
Zeitstempel der Version
Das Element ist ein Pflichtfeld
5. Juni 2025, 19:27:41
Versionen
Das Element ist ein Pflichtfeld
5
Ressource erzeugt
Das Element ist ein Pflichtfeld
27. Mai 2025, 10:23:45