MangaUB

MangaUB は,Large Multimodal Model (Vision-Language Model) のための漫画を理解する能力を測るベンチマークです. Manga109およびその派生データセットに基づき,漫画の理解に関連した様々な難易度および内容のタスクを含んでいます. MangaUB は,単一のコマの内容の認識および理解だけでなく,複数のコマにまたがる情報の把握も評価できるように設計されており,漫画の理解に必要なモデルの様々な能力を詳細に分析することを可能にします.

内容:

タスク一覧:

関連リンク: