new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jan 6

Submitted by

AmirhoseinGH

Can LLMs Predict Their Own Failures? Self-Awareness via Internal Circuits

UAlberta

University of Alberta

Submitted by

taesiri

K-EXAONE Technical Report

LGAI-EXAONE

Submitted by

leo1117

NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation

ByteDance

Submitted by

XuGuo699

DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

ByteDance

Submitted by

leo1117

VAR RL Done Right: Tackling Asynchronous Policy Conflicts in Visual Autoregressive Generation

ByteDance

2

Submitted by

haoranhe

GARDO: Reinforcing Diffusion Models without Reward Hacking

·
10 authors

Submitted by

taesiri

VINO: A Unified Visual Generator with Interleaved OmniModal Context

·
6 authors

Submitted by

yantaiyang05

InfiniteVGGT: Visual Geometry Grounded Transformer for Endless Streams

Submitted by

rajkumarrawal

Recursive Language Models

MIT

Massachusetts Institute of Technology

Submitted by

taesiri

Falcon-H1R: Pushing the Reasoning Frontiers with a Hybrid Model for Efficient Test-Time Scaling

tiiuae

Technology Innovation Institute

Submitted by

JiaaqiLiu

SimpleMem: Efficient Lifelong Memory for LLM Agents

·
8 authors

Submitted by

taesiri

Talk2Move: Reinforcement Learning for Text-Instructed Object-Level Geometric Transformation in Scenes

·
9 authors

Submitted by

caiqizh

Confidence Estimation for LLMs in Multi-turn Interactions

uni-cambridge

University of Cambridge

Submitted by

yixuantt

KV-Embedding: Training-free Text Embedding via Internal KV Re-routing in Decoder-only LLMs

·
2 authors

Submitted by

AhNr

CPPO: Contrastive Perception for Vision Language Policy Optimization

·
9 authors

Submitted by

wrk226

DiffProxy: Multi-View Human Mesh Recovery via Diffusion-Generated Dense Proxies

·
4 authors

Submitted by

oneonlee

COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs

AIM-Intelligence

AIM Intelligence

Submitted by

YuxinJiang

SWE-Lego: Pushing the Limits of Supervised Fine-tuning for Software Issue Resolving

SWE-Lego

Submitted by

XavierJiezou

Toward Stable Semi-Supervised Remote Sensing Segmentation via Co-Guidance and Co-Fusion

·
10 authors

Submitted by

taesiri

OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment

·
23 authors

Submitted by

mjbuehler

Selective Imperfection as a Generative Framework for Analysis, Creativity and Discovery

lamm-mit

LAMM: MIT Laboratory for Atomistic and Molecular Mechanics

Submitted by

kabhishe

IMA++: ISIC Archive Multi-Annotator Dermoscopic Skin Lesion Segmentation Dataset

sfu-mial

Medical Image Analysis Lab, SFU

Submitted by

lalitmaurya47

Prithvi-Complimentary Adaptive Fusion Encoder (CAFE): unlocking full-potential for flood inundation mapping

·
3 authors

Submitted by

Suren15

Project Ariadne: A Structural Causal Framework for Auditing Faithfulness in LLM Agents

TorontoMetropolitanUniversity

Toronto Metropolitan University

Submitted by

jwliao1209

M-ErasureBench: A Comprehensive Multimodal Evaluation Benchmark for Concept Erasure in Diffusion Models

·
4 authors

3