↓Skip to main content

🏢 Tennessee Tech University

Basic Category Usage in Vision Language Models

16 March 2025·1339 words·7 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 Tennessee Tech University

VLMs exhibit human-like object categorization, favoring basic levels and mirroring biological/expertise nuances, suggesting learned cognitive behaviors.