Chao (@cwweb3) 's Twitter Profile
Chao

@cwweb3

Observing the co-evolution of culture and algorithm.
Investing with @metropolis_dao. Experimenting @cryptobenchorg

ID: 1469952764981567489

linkhttps://chaow.xyz/ calendar_today12-12-2021 08:50:44

2,2K Tweet

12,12K Takipçi

2,2K Takip Edilen

Chao (@cwweb3) 's Twitter Profile Photo

之前就一直在关注INTELLECT-2的训练,这是全球首个使用去中心化方式进行的强化学习训练,其技术报告在上午正式发布。 这次训练是在QwQ-32B(Qwen的一款高性能推理模型)基础上进行的强化学习训练。(从DeepSeek V3到DeepSeek R1-zero的过程就是典型的强化训练)。