Yunjie Dai (@xdanger) 's Twitter Profile
Yunjie Dai

@xdanger

ID: 1166571

linkhttps://github.com/xdanger calendar_today14-03-2007 16:36:20

1,1K Tweet

4,4K Followers

245 Following

Yunjie Dai (@xdanger) 's Twitter Profile Photo

DeepSeek-R1 并不是在 scale law 的老路上追赶上了,而是探索出了一条新的提升模型智力的技术路线。RL 这条上限更高(其次才是更经济)的路被走通了,这才是 AI 大厂既惊喜又惊吓的原因。 yunjie.com/p/notes-of-dee…

Yunjie Dai (@xdanger) 's Twitter Profile Photo

真正打动人心、能形成自我意识的、能自省的、能 Aha moment 的、能迸发出创造力的 …… 是 RL

Yunjie Dai (@xdanger) 's Twitter Profile Photo

Perplexity CEO: DeepSeek R1 has figured out RL finetuning. They wrote a whole paper on this topic called DeepSeek R1 Zero, where no SFT was used.

Peiyi Wang (@sybilhyz) 's Twitter Profile Photo

This unified formula has made me truly believe in the potential of RL. During the training of r1-zero, it was because of this formula that I was able to wait for and eventually witness r1-zero's aha moment.

Yunjie Dai (@xdanger) 's Twitter Profile Photo

o3 的 “知识” 和 o1 一样只截止到 2023 年 10 月的,和 GPT-4o 的 cutofff date 一样。说明基础模型就是 4o 的,OpenAI 最近一年的进展集中在 post-training 上了。

o3 的 “知识” 和 o1 一样只截止到 2023 年 10 月的,和 GPT-4o 的 cutofff date 一样。说明基础模型就是 4o 的,OpenAI 最近一年的进展集中在 post-training 上了。
Yunjie Dai (@xdanger) 's Twitter Profile Photo

Dario Amodei 前几天刚说 “几乎在所有事情上超越所有人类的 AI 大概率在 2026~27 年实现”,这个说在编程上超越所有人类的 AI 已经大概率在今年就能实现了。

Yunjie Dai (@xdanger) 's Twitter Profile Photo

发言的都是实体制造业的。 但想想,撑起新能源汽车的小米理想蔚来小鹏,都是从虚拟经济出来的;这次也去座谈的梁文锋,被称作改变国运级别的 DeepSeek 是从量化交易出来的,DeepSeek 无论是核心团队的积累、显卡的积累、还是对于 GPU

发言的都是实体制造业的。
但想想,撑起新能源汽车的小米理想蔚来小鹏,都是从虚拟经济出来的;这次也去座谈的梁文锋,被称作改变国运级别的 DeepSeek 是从量化交易出来的,DeepSeek 无论是核心团队的积累、显卡的积累、还是对于 GPU
Andrej Karpathy (@karpathy) 's Twitter Profile Photo

I was given early access to Grok 3 earlier today, making me I think one of the first few who could run a quick vibe check. Thinking ✅ First, Grok 3 clearly has an around state of the art thinking model ("Think" button) and did great out of the box on my Settler's of Catan

I was given early access to Grok 3 earlier today, making me I think one of the first few who could run a quick vibe check.

Thinking
✅ First, Grok 3 clearly has an around state of the art thinking model ("Think" button) and did great out of the box on my Settler's of Catan
Yunjie Dai (@xdanger) 's Twitter Profile Photo

查了下,OpenAI 只说了这是个很贵的模型,但没提到 10 倍。如果有可靠信息源的话也要注意 “计算量” 并不等同于 “训练成本”,GPT-4 发布已经是 2 年前的事了,以业界平均每 12 个月成本降 10 倍来算,即使 10 倍计算量,以激进的方式估计训练成本也不会超过 GPT-4。 预训练到现在这个阶段,计算量 10

Yunjie Dai (@xdanger) 's Twitter Profile Photo

把管理一个超级大国玩成了多益网络,对内对外玩大型服从性测试。李强总理应该把徐波招进去当幕僚,否则有点玩不过 🤣

Yunjie Dai (@xdanger) 's Twitter Profile Photo

200 刀的 Max 月卡值了呀。一边付月卡一边还要 Pay-as-You-Go 太疼了,看看 Codex 会不会跟进 support.anthropic.com/en/articles/11…

Yunjie Dai (@xdanger) 's Twitter Profile Photo

chromestatus.com/feature/520257… 继 iOS 13 之后,Chrome 终于也要在 CJK 字符与西文数字之间自动插入间隙了。

Yunjie Dai (@xdanger) 's Twitter Profile Photo

到美国一不小心就到了个没信号的地方,然后手机直接连上了卫星。 我以前脑补过一个 Starlink 自己做运营商的方案:把建基站这件事做成可以众包加盟的形式:设计一套接收卫星信号然后转成 4G/5G

到美国一不小心就到了个没信号的地方,然后手机直接连上了卫星。

我以前脑补过一个 Starlink 自己做运营商的方案:把建基站这件事做成可以众包加盟的形式:设计一套接收卫星信号然后转成 4G/5G
Yunjie Dai (@xdanger) 's Twitter Profile Photo

1913年,心理学家 Henry Goddard 在 Ellis Island 给移民做智力测试。结论:83%的犹太人、80%的匈牙利人、79%的意大利人是”弱智”。测试方法是让刚坐了几周船、不懂英语的人在五分钟内拼好一个木质人脸拼图,拼不好就会遭到遣返。

Yunjie Dai (@xdanger) 's Twitter Profile Photo

In the 1950s, a young Syrian Muslim named Abdulfattah Jandali came to America to study political science at the University of Wisconsin-Madison. He fell in love with a woman whose father disapproved. In 1955, their newborn son was adopted by Paul and Clara Jobs. They named him