OpenMOSS

Team

university

http://openmoss.sii.edu.cn/

OpenMOSS

Activity Feed Request to join this org

AI & ML interests

LLM

Recent Activity

lkdhy updated a dataset 7 days ago

OpenMOSS-Team/VideoThinkBench

sinwang authored a paper 9 days ago

SRPO: Self-Referential Policy Optimization for Vision-Language-Action Models

artpli published a model 10 days ago

OpenMOSS-Team/FRoM-W1

View all activity

Papers

SRPO: Self-Referential Policy Optimization for Vision-Language-Action Models

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

View all Papers

OpenMOSS-Team 's collections 9

DiRL

An Efficient Training Framework for Diffusion Language Models

OpenMOSS-Team/DiRL-8B-Instruct

8B • Updated 12 days ago • 30 • 9

MOSS-Speech

True Speech-to-Speech Langugage Model

OpenMOSS-Team/MOSS-Speech

9B • Updated Sep 30 • 582 • 15
OpenMOSS-Team/MOSS-Speech-Codec

0.9B • Updated Oct 1 • 248 • 4
Running on Zero

13

MOSS-Speech Demo

🚀

13

True Speech-to-Speech Language Model
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance

Paper • 2510.00499 • Published Oct 1 • 19

MOSS Embodied Planner

OpenMOSS-Team/Embodied_R1-ScienceWorld

8B • Updated Jun 30 • 8
OpenMOSS-Team/Embodied_Planner-R1-Alfworld

8B • Updated Jun 30 • 7
Unleashing Embodied Task Planning Ability in LLMs via Reinforcement Learning

Paper • 2506.23127 • Published Jun 29 • 1
World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning

Paper • 2503.10480 • Published Mar 13 • 55

MHA2MLA-refactor

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

OpenMOSS-Team/SmolLM-135M-MLA-d_kv_8-refactor

Text Generation • 0.1B • Updated Jun 23 • 15
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_32-refactor

Text Generation • 0.1B • Updated Jun 17 • 11
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_16-refactor

Text Generation • 0.1B • Updated Jun 17 • 11
OpenMOSS-Team/SmolLM-360M-MLA-d_kv_8-refactor

Text Generation • 0.3B • Updated Jun 17 • 14

MOSS

OpenMOSS-Team/moss-moon-003-sft-plugin

Text Generation • Updated Apr 25, 2023 • 26 • 69
OpenMOSS-Team/moss-moon-003-sft

Text Generation • Updated Apr 25, 2023 • 56 • 127
OpenMOSS-Team/moss-moon-003-base

Text Generation • Updated Apr 25, 2023 • 236 • 131
OpenMOSS-Team/moss-moon-003-sft-int4

Text Generation • Updated Apr 26, 2023 • 31 • 40

RoboOmni

Proactive Robot Manipulation in Omni-modal Context

OpenMOSS-Team/RoboOmni

Robotics • Updated Oct 30 • 44 • 5
OpenMOSS-Team/RoboOmni-LIBERO-Spatial

Robotics • Updated 30 days ago • 25
OpenMOSS-Team/RoboOmni-LIBERO-Goal

Updated Oct 29 • 11
OpenMOSS-Team/RoboOmni-LIBERO-Object

Updated Oct 29 • 17

MOSS-TTSD

OpenMOSS-Team/MOSS-TTSD-v0.5

Text-to-Speech • 2B • Updated Sep 2 • 890 • 52
OpenMOSS-Team/MOSS-TTSD-v0

Text-to-Speech • 2B • Updated Jun 20 • 28 • 27
Runtime error

39

MOSS TTSD

📉

39

MOSS-TTSD: Text to Spoken Dialogue Generation
OpenMOSS-Team/MOSS-TTSD-v0.7

Text-to-Speech • 2B • Updated 19 days ago • 4.35k • 15

Low Rank Sparse Attention

Open source weights of Lorsa modules introduced in "Towards Understanding the Nature of Attention with Low-Rank Sparse Decomposition".

OpenMOSS-Team/Lorsa

Updated Apr 28 • 2
OpenMOSS-Team/Lorsa-Pythia-160M

Updated May 8 • 1
OpenMOSS-Team/Lorsa-Llama-3.1-8B

Updated May 8

MHA2MLA

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-based LLMs

Paper • 2502.14837 • Published Feb 20 • 3
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_16

Text Generation • 6B • Updated Mar 13 • 10
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_32

Text Generation • 6B • Updated Mar 13 • 7
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_64

Text Generation • 7B • Updated Mar 13 • 7

DiRL

An Efficient Training Framework for Diffusion Language Models

OpenMOSS-Team/DiRL-8B-Instruct

8B • Updated 12 days ago • 30 • 9

RoboOmni

Proactive Robot Manipulation in Omni-modal Context

OpenMOSS-Team/RoboOmni

Robotics • Updated Oct 30 • 44 • 5
OpenMOSS-Team/RoboOmni-LIBERO-Spatial

Robotics • Updated 30 days ago • 25
OpenMOSS-Team/RoboOmni-LIBERO-Goal

Updated Oct 29 • 11
OpenMOSS-Team/RoboOmni-LIBERO-Object

Updated Oct 29 • 17

MOSS-Speech

True Speech-to-Speech Langugage Model

OpenMOSS-Team/MOSS-Speech

9B • Updated Sep 30 • 582 • 15
OpenMOSS-Team/MOSS-Speech-Codec

0.9B • Updated Oct 1 • 248 • 4
Running on Zero

13

MOSS-Speech Demo

🚀

13

True Speech-to-Speech Language Model
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance

Paper • 2510.00499 • Published Oct 1 • 19

MOSS-TTSD

OpenMOSS-Team/MOSS-TTSD-v0.5

Text-to-Speech • 2B • Updated Sep 2 • 890 • 52
OpenMOSS-Team/MOSS-TTSD-v0

Text-to-Speech • 2B • Updated Jun 20 • 28 • 27
Runtime error

39

MOSS TTSD

📉

39

MOSS-TTSD: Text to Spoken Dialogue Generation
OpenMOSS-Team/MOSS-TTSD-v0.7

Text-to-Speech • 2B • Updated 19 days ago • 4.35k • 15

MOSS Embodied Planner

OpenMOSS-Team/Embodied_R1-ScienceWorld

8B • Updated Jun 30 • 8
OpenMOSS-Team/Embodied_Planner-R1-Alfworld

8B • Updated Jun 30 • 7
Unleashing Embodied Task Planning Ability in LLMs via Reinforcement Learning

Paper • 2506.23127 • Published Jun 29 • 1
World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning

Paper • 2503.10480 • Published Mar 13 • 55

Low Rank Sparse Attention

Open source weights of Lorsa modules introduced in "Towards Understanding the Nature of Attention with Low-Rank Sparse Decomposition".

OpenMOSS-Team/Lorsa

Updated Apr 28 • 2
OpenMOSS-Team/Lorsa-Pythia-160M

Updated May 8 • 1
OpenMOSS-Team/Lorsa-Llama-3.1-8B

Updated May 8

MHA2MLA-refactor

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

OpenMOSS-Team/SmolLM-135M-MLA-d_kv_8-refactor

Text Generation • 0.1B • Updated Jun 23 • 15
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_32-refactor

Text Generation • 0.1B • Updated Jun 17 • 11
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_16-refactor

Text Generation • 0.1B • Updated Jun 17 • 11
OpenMOSS-Team/SmolLM-360M-MLA-d_kv_8-refactor

Text Generation • 0.3B • Updated Jun 17 • 14

MHA2MLA

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-based LLMs

Paper • 2502.14837 • Published Feb 20 • 3
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_16

Text Generation • 6B • Updated Mar 13 • 10
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_32

Text Generation • 6B • Updated Mar 13 • 7
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_64

Text Generation • 7B • Updated Mar 13 • 7

MOSS

OpenMOSS-Team/moss-moon-003-sft-plugin

Text Generation • Updated Apr 25, 2023 • 26 • 69
OpenMOSS-Team/moss-moon-003-sft

Text Generation • Updated Apr 25, 2023 • 56 • 127
OpenMOSS-Team/moss-moon-003-base

Text Generation • Updated Apr 25, 2023 • 236 • 131
OpenMOSS-Team/moss-moon-003-sft-int4

Text Generation • Updated Apr 26, 2023 • 31 • 40

AI & ML interests

Recent Activity

Papers

Team members 13

OpenMOSS-Team 's collections 9

MOSS-Speech Demo

MOSS TTSD

MOSS-Speech Demo

MOSS TTSD