Hao Jiang's picture

Hao Jiang

TechxGenus

·

https://techxgenus.github.io/

TechxGenus

AI & ML interests

Code Intelligence; Large Language Model; AI Alignment; Efficient Inference

Recent Activity

liked a dataset about 8 hours ago

cognitivecomputations/dolphin-r1

liked a dataset 6 days ago

TechxGenus/deepseek_r1_code_1k

liked a model 8 days ago

allenai/Llama-3.1-Tulu-3-405B

View all activity

Organizations

None yet

TechxGenus's activity

upvoted a paper 15 days ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published 16 days ago • 302

upvoted a paper 25 days ago

Byte Latent Transformer: Patches Scale Better Than Tokens

Paper • 2412.09871 • Published Dec 13, 2024 • 90

upvoted a collection about 1 month ago

DeepSeek-V3

3 items • Updated Jan 6 • 178

upvoted 2 collections about 2 months ago

ModernBERT

Bringing BERT into modernity via both architecture changes and scaling • 3 items • Updated Dec 19, 2024 • 133

DeepSeek-V2.5

2 items • Updated Dec 10, 2024 • 38

upvoted a collection 2 months ago

Tulu 3 Datasets

All datasets released with Tulu 3 -- state of the art open post-training recipes. • 33 items • Updated 9 days ago • 67

upvoted 2 papers 3 months ago

MagicQuill: An Intelligent Interactive Image Editing System

Paper • 2411.09703 • Published Nov 14, 2024 • 65

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published Nov 7, 2024 • 115

upvoted 2 collections 3 months ago

OpenCoder Datasets

OpenCoder datasets! • 6 items • Updated Nov 15, 2024 • 39

OpenCoder

OpenCoder is an open and reproducible code LLM family which matches the performance of top-tier code LLMs. • 8 items • Updated Nov 23, 2024 • 79

upvoted a paper 3 months ago

LLM-Assisted Code Cleaning For Training Accurate Code Generators

Paper • 2311.14904 • Published Nov 25, 2023 • 4

upvoted 2 collections 4 months ago

Text to SVG papers

7 items • Updated Apr 30, 2024 • 5

SVG generation

6 items • Updated Apr 30, 2024 • 5

upvoted an article 4 months ago

Article

Fine-tuning LLMs to 1.58bit: extreme quantization made easy

Sep 18, 2024

• 217

upvoted 4 collections 4 months ago

LayerSkip

Models continually pretrained using LayerSkip - https://arxiv.org/abs/2404.16710 • 8 items • Updated Nov 21, 2024 • 47

Direct Preference Optimization Datasets

Datasets suitable for DPO based on having 'chosen', 'rejected', and 'prompt' columns. Created using librarian-bots/dataset-column-search-api • 4982 items • Updated about 11 hours ago • 6

CursorCore-Series

CursorCore-Series • 13 items • Updated Oct 10, 2024 • 4

CursorCore-Quantization

CursorCore-Quantization • 25 items • Updated Oct 10, 2024 • 2

upvoted a paper 4 months ago

Emu3: Next-Token Prediction is All You Need

Paper • 2409.18869 • Published Sep 27, 2024 • 94

upvoted an article 4 months ago

Article

Faster Assisted Generation with Dynamic Speculation

Oct 8, 2024

• 45