LiLT
Как оказалось датасет, на котором обучали LiLT - IIT-CDIP (доступный для скачивания здесь) весит 1.41 Тб.
Поэтому добрые люди создали поддатасет RVL-CDIP, ещё и добавили в huggingface.
- FUNSD - на этом датасете дообучали
В качестве датасета для NER задачи на Android Layout был выбран RICO-WidgetCaptioning по результатам Gemini Deep Research