Paper Reviews by AI

M3-AGIQA: Multimodal, Multi-Round, Multi-Aspect AI-Generated Image Quality Assessment

21 February 2025·1433 words·7 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Image Generation 🏢 Heifei University of Technology

M3-AGIQA: A multimodal AI solution that comprehensively assesses AI-generated image quality, achieving state-of-the-art performance by distilling online MLLM capabilities into a local model.

LightThinker: Thinking Step-by-Step Compression

21 February 2025·1662 words·8 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Zhejiang University - Ant Group Joint Laboratory of Knowledge Graph

LightThinker: LLMs dynamically compress intermediate steps, reducing memory & boosting reasoning efficiency without sacrificing accuracy.

Forecasting Open-Weight AI Model Growth on Hugging Face

21 February 2025·2415 words·12 mins· loading · loading

AI Generated 🤗 Daily Papers AI Theory Representation Learning 🏢 Rensselaer Polytechnic Institute

Predicting open-weight AI model growth on Hugging Face using a citation-style model, revealing adoption dynamics and influencing factors.

Evaluating Multimodal Generative AI with Korean Educational Standards

21 February 2025·2108 words·10 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 NAVER Cloud AI

KoNET: Evaluating multimodal AI in Korean with edu standards.

UPCORE: Utility-Preserving Coreset Selection for Balanced Unlearning

20 February 2025·3455 words·17 mins· loading · loading

AI Generated 🤗 Daily Papers Machine Learning Unsupervised Learning 🏢 UNC-Chapel Hill

UPCORE reduces unintended unlearning effects via coreset selection, balancing knowledge removal and utility preservation.

Unstructured Evidence Attribution for Long Context Query Focused Summarization

20 February 2025·3830 words·18 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Text Summarization 🏢 University of Copenhagen

LLMs struggle with positional bias and lack transparency when summarizing long contexts. This paper introduces SUnsET dataset and fine-tuning methods to improve unstructured evidence citation and summ…

SurveyX: Academic Survey Automation via Large Language Models

20 February 2025·2720 words·13 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Large Language Models 🏢 Renmin University of China

SURVEYX automates academic survey generation, enhancing content and citation quality.

StructFlowBench: A Structured Flow Benchmark for Multi-turn Instruction Following

20 February 2025·3134 words·15 mins· loading · loading

AI Generated 🤗 Daily Papers Natural Language Processing Dialogue Systems 🏢 School of Artificial Intelligence, Jilin University

Current LLM evaluation benchmarks often overlook the structural dependencies in multi-turn dialogues, treating them as simple concatenations of single-turn interactions. This approach neglects user in…

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

20 February 2025·4915 words·24 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 Google DeepMind

SigLIP 2: Multilingual Vision-Language Encoders with Semantic Understanding, Localization, and Dense Features.

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

20 February 2025·4251 words·20 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Vision-Language Models 🏢 University of Pennsylvania

CoSyn: Code-guided synth data for scaling text-rich image understanding, achieving SOTA via targeted multimodal data generation!

S*: Test Time Scaling for Code Generation

20 February 2025·2539 words·12 mins· loading · loading

AI Generated 🤗 Daily Papers Machine Learning Deep Learning 🏢 UC Berkeley

S*: Hybrid test-time scaling for code generation, boosting both coverage and selection accuracy.

ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation

20 February 2025·4128 words·20 mins· loading · loading

AI Generated 🤗 Daily Papers Machine Learning Deep Learning 🏢 Gaoling School of Artificial Intelligence, Renmin University of China

ReQFlow: Efficiently generate high-quality protein backbones with rectified quaternion flow, outperforming existing methods in speed and designability.

RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

20 February 2025·2754 words·13 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Image Generation 🏢 University of Science and Technology of China

RelaCtrl: Relevance-guided control boosts diffusion transformer efficiency, cutting parameters by intelligently allocating resources.

PhotoDoodle: Learning Artistic Image Editing from Few-Shot Pairwise Data

20 February 2025·1606 words·8 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Image Generation 🏢 National University of Singapore

PhotoDoodle: Mimicking artistic image editing with personalized decorative elements through learning from few-shot pairwise data.

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

20 February 2025·2325 words·11 mins· loading · loading

AI Generated 🤗 Daily Papers Multimodal Learning Embodied AI 🏢 MAIS, Institute of Automation, Chinese Academy of Sciences, China

PC-Agent: A new hierarchical framework that significantly improves complex task automation on PCs by 32%!

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

20 February 2025·1911 words·9 mins· loading · loading

AI Generated 🤗 Daily Papers Machine Learning Reinforcement Learning 🏢 UC Santa Barbara

MLGYM: A new framework & benchmark to advance AI Research Agents

Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning

20 February 2025·3688 words·18 mins· loading · loading

AI Generated 🤗 Daily Papers Machine Learning Reinforcement Learning 🏢 Microsoft Research Asia

Logic-RL unlocks LLM reasoning via rule-based reinforcement learning, generalizing to math problems after training on logic puzzles.

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

20 February 2025·1710 words·9 mins· loading · loading

AI Generated 🤗 Daily Papers AI Theory Interpretability 🏢 AIRI

LLMs use punctuation in context memory, surprisingly boosting performance by using seemingly trivial tokens.

LLM-based User Profile Management for Recommender System

20 February 2025·2332 words·11 mins· loading · loading

AI Generated 🤗 Daily Papers Machine Learning Recommender Systems 🏢 Ulsan National Institute of Science and Technology

PURE: LLM-driven user profile management boosts recommendation by harnessing user reviews for personalized insights while tackling token limits. PURE enhances LLMs for better recommendations.

KITAB-Bench: A Comprehensive Multi-Domain Benchmark for Arabic OCR and Document Understanding

20 February 2025·3707 words·18 mins· loading · loading

AI Generated 🤗 Daily Papers Computer Vision Scene Understanding 🏢 MBZUAI

KITAB-Bench: A new multi-domain Arabic OCR benchmark to bridge the performance gap with English OCR technologies.