haneol j. kim's picture

51

haneol j. kim

HaneolKijm

·

https://haneol-kijm.github.io/

AI & ML interests

computer vision, diffusion, LLM agent, deep RL

Recent Activity

upvoted a paper 12 days ago

PaSa: An LLM Agent for Comprehensive Academic Paper Search

upvoted a paper 12 days ago

Evolving Deeper LLM Thinking

upvoted a paper 12 days ago

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

View all activity

Organizations

None yet

HaneolKijm's activity

upvoted 13 papers 12 days ago

PaSa: An LLM Agent for Comprehensive Academic Paper Search

Paper • 2501.10120 • Published 26 days ago • 43

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published 26 days ago • 105

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published 23 days ago • 90

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published 21 days ago • 316

Improving Video Generation with Human Feedback

Paper • 2501.13918 • Published 20 days ago • 46

SRMT: Shared Memory for Multi-agent Lifelong Pathfinding

Paper • 2501.13200 • Published 21 days ago • 62

Humanity's Last Exam

Paper • 2501.14249 • Published 19 days ago • 57

Chain-of-Retrieval Augmented Generation

Paper • 2501.14342 • Published 19 days ago • 48

Towards General-Purpose Model-Free Reinforcement Learning

Paper • 2501.16142 • Published 16 days ago • 24

Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published 17 days ago • 55

Optimizing Large Language Model Training Using FP4 Quantization

Paper • 2501.17116 • Published 15 days ago • 33

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published 15 days ago • 102

Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate

Paper • 2501.17703 • Published 14 days ago • 51

upvoted a paper 25 days ago

Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps

Paper • 2501.09732 • Published 27 days ago • 67

upvoted 4 papers 27 days ago

Transformer^2: Self-adaptive LLMs

Paper • 2501.06252 • Published Jan 9 • 53

VideoAuteur: Towards Long Narrative Video Generation

Paper • 2501.06173 • Published Jan 10 • 31

Tensor Product Attention Is All You Need

Paper • 2501.06425 • Published Jan 11 • 83

The Lessons of Developing Process Reward Models in Mathematical Reasoning

Paper • 2501.07301 • Published 30 days ago • 90

upvoted a paper 28 days ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published 29 days ago • 273

upvoted a paper about 1 month ago

The GAN is dead; long live the GAN! A Modern GAN Baseline

Paper • 2501.05441 • Published Jan 9 • 88