Yuxin Jiang

YuxinJiang

https://yjiangcm.github.io/

AI & ML interests

NLP

Recent Activity

updated a dataset 3 days ago

YuxinJiang/gsm8k

published a dataset 3 days ago

YuxinJiang/gsm8k

updated a dataset 3 days ago

YuxinJiang/gsm8k_format

View all activity

Organizations

None yet

YuxinJiang's activity

updated a dataset 3 days ago

YuxinJiang/gsm8k

Viewer • Updated 3 days ago • 7.47k • 25

published a dataset 3 days ago

YuxinJiang/gsm8k

Viewer • Updated 3 days ago • 7.47k • 25

updated a dataset 3 days ago

YuxinJiang/gsm8k_format

Viewer • Updated 3 days ago • 7.47k • 25

published a dataset 3 days ago

YuxinJiang/gsm8k_format

Viewer • Updated 3 days ago • 7.47k • 25

liked a dataset 3 days ago

HuggingFaceH4/MATH-500

Viewer • Updated Nov 15, 2024 • 500 • 49.3k • 124

updated a dataset 5 days ago

YuxinJiang/auto_if_qwq_32b

Viewer • Updated 5 days ago • 15.8k • 37

published a dataset 6 days ago

YuxinJiang/auto_if_qwq_32b

Viewer • Updated 5 days ago • 15.8k • 37

liked a model 8 days ago

Qwen/QwQ-32B

Text Generation • Updated 2 days ago • 256k • • 2.12k

updated a dataset 15 days ago

YuxinJiang/RL_IF

Viewer • Updated 15 days ago • 61.5k • 49

published a dataset 15 days ago

YuxinJiang/RL_IF

Viewer • Updated 15 days ago • 61.5k • 49

authored 6 papers 23 days ago

FollowBench: A Multi-level Fine-grained Constraints Following Benchmark for Large Language Models

Paper • 2310.20410 • Published Oct 31, 2023 • 1

MT-Eval: A Multi-Turn Capabilities Evaluation Benchmark for Large Language Models

Paper • 2401.16745 • Published Jan 30, 2024

Learning to Edit: Aligning LLMs with Knowledge Editing

Paper • 2402.11905 • Published Feb 19, 2024 • 1

Improved Universal Sentence Embeddings with Prompt-based Contrastive Learning and Energy-based Learning

Paper • 2203.06875 • Published Mar 14, 2022

Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization

Paper • 2408.07471 • Published Aug 14, 2024

Crowd Comparative Reasoning: Unlocking Comprehensive Evaluations for LLM-as-a-Judge

Paper • 2502.12501 • Published 24 days ago • 6

upvoted a paper 23 days ago

Crowd Comparative Reasoning: Unlocking Comprehensive Evaluations for LLM-as-a-Judge

Paper • 2502.12501 • Published 24 days ago • 6

liked a dataset about 1 month ago

bespokelabs/Bespoke-Stratos-17k

Viewer • Updated Jan 31 • 16.7k • 60.7k • 293

liked 2 models about 2 months ago

Qwen/Qwen2.5-Math-PRM-72B

Text Classification • Updated Jan 17 • 1.03k • 71

Qwen/QwQ-32B-Preview

Text Generation • Updated Jan 12 • 249k • • 1.72k