Han-Bit Kang

hbkang

AI & ML interests

Recent Activity

liked a model 8 minutes ago

ds4sd/SmolDocling-256M-preview

updated a collection about 21 hours ago

cool-papers

upvoted a paper about 21 hours ago

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

View all activity

Organizations

None yet

hbkang's activity

upvoted a paper about 21 hours ago

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published 3 days ago • 90

upvoted a paper 4 days ago

Transformers without Normalization

Paper • 2503.10622 • Published 4 days ago • 118

upvoted 2 papers 5 days ago

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published 5 days ago • 54

AnyMoLe: Any Character Motion In-betweening Leveraging Video Diffusion Models

Paper • 2503.08417 • Published 7 days ago • 7

upvoted a paper 7 days ago

ProReflow: Progressive Reflow with Decomposed Velocity

Paper • 2503.04824 • Published 13 days ago • 9

upvoted 2 papers 8 days ago

Forgetting Transformer: Softmax Attention with a Forget Gate

Paper • 2503.02130 • Published 14 days ago • 27

LLMVoX: Autoregressive Streaming Text-to-Speech Model for Any LLM

Paper • 2503.04724 • Published 11 days ago • 63

upvoted a paper 11 days ago

Fine-Tuning Small Language Models for Domain-Specific AI: An Edge AI Perspective

Paper • 2503.01933 • Published 15 days ago • 11

upvoted a paper 12 days ago

Large Language Diffusion Models

Paper • 2502.09992 • Published Feb 14 • 103

upvoted a paper 13 days ago

AI-Invented Tonal Languages: Preventing a Machine Lingua Franca Beyond Human Understanding

Paper • 2503.01063 • Published 15 days ago • 5

upvoted a paper 14 days ago

How far can we go with ImageNet for Text-to-Image generation?

Paper • 2502.21318 • Published 17 days ago • 25

upvoted 2 papers 18 days ago

UniTok: A Unified Tokenizer for Visual Generation and Understanding

Paper • 2502.20321 • Published 18 days ago • 29

GHOST 2.0: generative high-fidelity one shot transfer of heads

Paper • 2502.18417 • Published 20 days ago • 63

upvoted a paper 19 days ago

Distill Any Depth: Distillation Creates a Stronger Monocular Depth Estimator

Paper • 2502.19204 • Published 20 days ago • 11

upvoted a paper 20 days ago

KV-Edit: Training-Free Image Editing for Precise Background Preservation

Paper • 2502.17363 • Published 21 days ago • 33

upvoted a paper 21 days ago

PhotoDoodle: Learning Artistic Image Editing from Few-Shot Pairwise Data

Paper • 2502.14397 • Published 26 days ago • 38

upvoted a paper 22 days ago

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 25 days ago • 130

upvoted a paper 25 days ago

InstantStyle-Plus: Style Transfer with Content-Preserving in Text-to-Image Generation

Paper • 2407.00788 • Published Jun 30, 2024 • 24

upvoted a paper 26 days ago

EQ-VAE: Equivariance Regularized Latent Space for Improved Generative Image Modeling

Paper • 2502.09509 • Published Feb 13 • 7

upvoted a paper 27 days ago

EMOPortraits: Emotion-enhanced Multimodal One-shot Head Avatars

Paper • 2404.19110 • Published Apr 29, 2024 • 4