Building Detection from Satellite Imagery using Ensemble of Size-specific Detectors
CVPR2018の衛星画像コンテストで優勝した手法。コンテストのタスクは建物検知。
キモは建物の大きさ(small, medium, large)で分類したこと。
手順は非常にシンプルで、まず二値画像の正解ラベ ...
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding[ACL2018][論文読み]
VQAタスクにおいて,文と画像のベクトルを統合する為の手法.
VQAのようなマルチモーダルなタスクだと,文と画像のベクトルを統合した際のデータ量が肥大化してしまうことが問題.
より
その問