6 26 12

Nikita Sushko

chameleon-lizard

http://chameleon-lizard.ru:81

chameleon-lizard

AI & ML interests

NLP, Multilingual Models, Multiagent Systems

Recent Activity

upvoted a paper 4 days ago

EuroBERT: Scaling Multilingual Encoders for European Languages

upvoted a paper 4 days ago

RuCCoD: Towards Automated ICD Coding in Russian

upvoted a collection 6 days ago

SynthDetoxM

View all activity

Organizations

chameleon-lizard's activity

upvoted 2 papers 4 days ago

EuroBERT: Scaling Multilingual Encoders for European Languages

Paper • 2503.05500 • Published 7 days ago • 72

RuCCoD: Towards Automated ICD Coding in Russian

Paper • 2502.21263 • Published 13 days ago • 122

upvoted a collection 6 days ago

SynthDetoxM

Collection

Data and models from NAACL 2025 paper "SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators" by Moskovskiy et al. • 4 items • Updated 8 days ago • 2

upvoted a paper 10 days ago

When an LLM is apprehensive about its answers -- and when its uncertainty is justified

Paper • 2503.01688 • Published 11 days ago • 19

updated a dataset 11 days ago

chameleon-lizard/judge_correlation

Viewer • Updated 11 days ago • 3.2k • 52

published a dataset 11 days ago

chameleon-lizard/judge_correlation

Viewer • Updated 11 days ago • 3.2k • 52

liked a dataset 12 days ago

OpenLeecher/lmsys_chat_1m_clean

Viewer • Updated Dec 31, 2024 • 273k • 345 • 75

upvoted a paper 15 days ago

GHOST 2.0: generative high-fidelity one shot transfer of heads

Paper • 2502.18417 • Published 16 days ago • 63

updated a dataset 18 days ago

chameleon-lizard/DTF-comments-DPO

Viewer • Updated 18 days ago • 2.39k • 84

upvoted a paper 18 days ago

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published 21 days ago • 162

upvoted a paper 21 days ago

How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

Paper • 2502.14502 • Published 22 days ago • 85

published a dataset 21 days ago

chameleon-lizard/DTF-comments-DPO

Viewer • Updated 18 days ago • 2.39k • 84

upvoted a paper 23 days ago

Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity

Paper • 2502.13063 • Published 23 days ago • 67

upvoted a paper about 1 month ago

LM2: Large Memory Models

Paper • 2502.06049 • Published Feb 9 • 30

authored a paper about 1 month ago

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Paper • 2502.06394 • Published Feb 10 • 86

upvoted a paper about 1 month ago

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Paper • 2502.06394 • Published Feb 10 • 86

updated a collection about 1 month ago

DTF

Collection

Finetune of Qwen-2.5-7B model on a dump of DTF posts and comments. • 3 items • Updated Feb 7

updated 2 models about 1 month ago

chameleon-lizard/Qwen-2.5-7B-DTF-SFT

Text Generation • Updated Feb 7 • 72

chameleon-lizard/Qwen-2.5-7B-DTF

Text Generation • Updated Feb 7 • 191 • 2

published a model about 1 month ago

chameleon-lizard/Qwen-2.5-7B-DTF-SFT

Text Generation • Updated Feb 7 • 72