new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Oct 23

Submitted by

myownskyW7

PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction

·
11 authors

Submitted by

yulunliu

SpectroMotion: Dynamic 3D Reconstruction of Specular Scenes

·
7 authors

2

Submitted by

ruohongz

Improve Vision Language Model Chain-of-thought Reasoning

·
9 authors

2

Submitted by

Tigerph

Aligning Large Language Models via Self-Steering Optimization

·
9 authors

3

Submitted by

michaelryoo

xGen-MM-Vid (BLIP-3-Video): You Only Need 32 Tokens to Represent a Video Even in VLMs

·
10 authors

2

Submitted by

xing0047

Mitigating Object Hallucination via Concentric Causal Attention

·
4 authors

2

Submitted by

AtsuMiyai

JMMMU: A Japanese Massive Multi-discipline Multimodal Understanding Benchmark for Culture-aware Evaluation

·
8 authors

2

Submitted by

t1101675

MiniPLM: Knowledge Distillation for Pre-Training Language Models

·
5 authors

2

Submitted by

shenzhi-wang

LLM-based Optimization of Compound AI Systems: A Survey

·
10 authors

2

Submitted by

OliverSieberling

EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search

·
4 authors

2

Submitted by

bryanchrist

Math Neurosurgery: Isolating Language Models' Math Reasoning Abilities Using Only Forward Passes

·
4 authors

2

Submitted by

Xi8006

3DGS-Enhancer: Enhancing Unbounded 3D Gaussian Splatting with View-consistent 2D Diffusion Priors

·
3 authors

2

Submitted by

DanielJi

Frontiers in Intelligent Colonoscopy

·
7 authors