This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Felix Schneider, Maria Gogolev, Sven Sickert, Joachim Denzler

Articles by Felix Schneider, Maria Gogolev, Sven Sickert, Joachim Denzler

Academic · 1 min

Beyond Subtokens: A Rich Character Embedding for Low-resource and Morphologically Complex Languages

arXiv:2602.21377v1 Announce Type: new Abstract: Tokenization and sub-tokenization based models like word2vec, BERT and the GPTs are the state-of-the-art in natural language processing. Typically, these …

5 views Feb 27

Something extraordinary is coming.

Felix Schneider, Maria Gogolev, Sven Sickert, Joachim Denzler

Articles by Felix Schneider, Maria Gogolev, Sven Sickert, Joachim Denzler

Beyond Subtokens: A Rich Character Embedding for Low-resource and Morphologically Complex Languages

JCG, PC

HSOLLC Co., Ltd.