Movatterモバイル変換

slime Public
slime is an LLM post-training framework for RL Scaling.
THUDM/slime’s past year of commit activity
Python 2,882Apache-2.0 343 103 (6 issues need help) 46 UpdatedDec 18, 2025
AgentRL Public
Scaling Agentic Reinforcement Learning with a Multi-Turn, Multi-Task Framework
THUDM/AgentRL’s past year of commit activity
Python 155MIT 8 5 0 UpdatedDec 16, 2025
MobileRL Public
THUDM/MobileRL’s past year of commit activity
Python 36MIT 3 0 0 UpdatedDec 16, 2025
AgentBench Public
A Comprehensive Benchmark to Evaluate LLMs as Agents (ICLR'24)
THUDM/AgentBench’s past year of commit activity
Python 3,002Apache-2.0 220 57 (38 issues need help) 7 UpdatedNov 17, 2025
ComputerRL Public
THUDM/ComputerRL’s past year of commit activity
Python 9Apache-2.0 4 3 0 UpdatedNov 7, 2025
PETra Public
THUDM/PETra’s past year of commit activity
Python 20 0 0 UpdatedNov 5, 2025
AlignBench Public
大模型多维度中文对齐评测基准 (ACL 2024)
THUDM/AlignBench’s past year of commit activity
Python 423 31 15 0 UpdatedOct 25, 2025
LLM4CardGame Public
THUDM/LLM4CardGame’s past year of commit activity
Python 9 1 2 0 UpdatedOct 15, 2025
DeepDive Public
DeepDive: Advancing Deep Search Agents with Knowledge Graphs and Multi-Turn RL
THUDM/DeepDive’s past year of commit activity
Python 216 19 2 0 UpdatedOct 2, 2025
TDRM Public
THUDM/TDRM’s past year of commit activity
Python 9Apache-2.0 1 0 0 UpdatedSep 25, 2025