This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Tao Xu

Articles by Tao Xu

Academic · 1 min

Index Light, Reason Deep: Deferred Visual Ingestion for Visual-Dense Document Question Answering

arXiv:2602.14162v1 Announce Type: new Abstract: Existing multimodal document question answering methods universally adopt a supply-side ingestion strategy: running a Vision-Language Model (VLM) on every page …

Tao Xu

11 views Feb 18

Something extraordinary is coming.

Tao Xu

Articles by Tao Xu

Index Light, Reason Deep: Deferred Visual Ingestion for Visual-Dense Document Question Answering

JCG, PC

HSOLLC Co., Ltd.