3 25 52

min jun kim PRO

mjkmain

mjkmain

AI & ML interests

None yet

Recent Activity

updated a model 1 day ago

TEL-LLM/Llama-3.2-3B-CPT-finance

published a model 1 day ago

TEL-LLM/Llama-3.2-3B-CPT-finance

updated a model 1 day ago

TEL-LLM/Llama-3.2-3B-TEL-finance-retent

View all activity

Organizations

mjkmain's activity

upvoted a paper 8 days ago

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published 10 days ago • 100

upvoted a paper 21 days ago

Towards Best Practices for Open Datasets for LLM Training

Paper • 2501.08365 • Published 24 days ago • 53

upvoted a paper 28 days ago

MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code

Paper • 2410.08196 • Published Oct 10, 2024 • 46

upvoted a paper about 1 month ago

VLR-Bench: Multilingual Benchmark Dataset for Vision-Language Retrieval Augmented Generation

Paper • 2412.10151 • Published Dec 13, 2024 • 5

upvoted 2 papers about 2 months ago

How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published Dec 19, 2024 • 49

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 345

upvoted a paper 6 months ago

Transformer Explainer: Interactive Learning of Text-Generative Models

Paper • 2408.04619 • Published Aug 8, 2024 • 157

upvoted a paper 7 months ago

Understanding Reference Policies in Direct Preference Optimization

Paper • 2407.13709 • Published Jul 18, 2024 • 17

upvoted a paper 9 months ago

X-LLaVA: Optimizing Bilingual Large Vision-Language Alignment

Paper • 2403.11399 • Published Mar 18, 2024 • 6

upvoted 4 papers 10 months ago

LayerSkip: Enabling Early Exit Inference and Self-Speculative Decoding

Paper • 2404.16710 • Published Apr 25, 2024 • 77

BOK-VQA: Bilingual outside Knowledge-Based Visual Question Answering via Graph Representation Pretraining

Paper • 2401.06443 • Published Jan 12, 2024 • 2

PERL: Parameter Efficient Reinforcement Learning from Human Feedback

Paper • 2403.10704 • Published Mar 15, 2024 • 58

sDPO: Don't Use Your Data All at Once

Paper • 2403.19270 • Published Mar 28, 2024 • 41

upvoted 2 papers 11 months ago

Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking

Paper • 2403.09629 • Published Mar 14, 2024 • 76

SaulLM-7B: A pioneering Large Language Model for Law

Paper • 2403.03883 • Published Mar 6, 2024 • 78

upvoted 5 papers 12 months ago