↓Skip to main content

🏢 University of Adelaide

SAME: Learning Generic Language-Guided Visual Navigation with State-Adaptive Mixture of Experts

7 December 2024·3252 words·16 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 University of Adelaide

State-Adaptive Mixture of Experts (SAME) model excels in generic language-guided visual navigation by consolidating diverse tasks and dynamically adapting to varying instruction granularities.