This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Jinwoong Kim, Sangjin Park

Articles by Jinwoong Kim, Sangjin Park

Academic · 1 min

MaBERT:A Padding Safe Interleaved Transformer Mamba Hybrid Encoder for Efficient Extended Context Masked Language Modeling

arXiv:2603.03001v1 Announce Type: new Abstract: Self attention encoders such as Bidirectional Encoder Representations from Transformers(BERT) scale quadratically with sequence length, making long context modeling expensive. …

3 views Mar 5

Jinwoong Kim, Sangjin Park

Articles by Jinwoong Kim, Sangjin Park

MaBERT:A Padding Safe Interleaved Transformer Mamba Hybrid Encoder for Efficient Extended Context Masked Language Modeling

JCG, PC

HSOLLC Co., Ltd.