Zhenhua Han's picture

1 2

Zhenhua Han

hzhua

hzhua

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

authored a paper 5 months ago

RetrievalAttention: Accelerating Long-Context LLM Inference via Vector Retrieval

authored a paper 7 months ago

MInference 1.0: Accelerating Pre-filling for Long-Context LLMs via Dynamic Sparse Attention

View all activity

Organizations

None yet

Papers 3

arxiv:2409.10516

arxiv:2407.02490

arxiv:2405.19888

models

None public yet

datasets

None public yet