汉松 (@yonah_x) 's Twitter Profile
汉松

@yonah_x

大厂大模型应用开发 | AI 降临派 | 终身学习者

ID: 420282584

calendar_today24-11-2011 12:26:43

519 Tweet

3,3K Followers

322 Following

汉松 (@yonah_x) 's Twitter Profile Photo

DeepSeek-R1-0528 的思维链用来训练 Qwen3 8B,在 AIME 上面分数刷到到 Qwen3-235B 一样的水平。官方下场打样,鼓励大家来蒸馏它的思维链。🤣 “我们相信,DeepSeek-R1-0528的思维链将对推理模型的学术研究和以小型模型为重点的工业发展产生重大影响。”

DeepSeek-R1-0528 的思维链用来训练 Qwen3 8B,在 AIME 上面分数刷到到 Qwen3-235B 一样的水平。官方下场打样,鼓励大家来蒸馏它的思维链。🤣 
“我们相信,DeepSeek-R1-0528的思维链将对推理模型的学术研究和以小型模型为重点的工业发展产生重大影响。”
汉松 (@yonah_x) 's Twitter Profile Photo

分享一个我生成播客/长视频文字稿的方法,效果可以看图。 1. 用通义听悟转写成字幕导出 2. 用 Gemini 进行润色 prompt 如下: ``` # 角色 你是一名「专业字幕文案编辑」,擅长中文写作、口语还原与字幕规范。 # 目标 在不篡改原意的前提下: 1. 纠正 ASR

分享一个我生成播客/长视频文字稿的方法,效果可以看图。
1. 用通义听悟转写成字幕导出
2. 用 Gemini 进行润色

prompt 如下:
```
# 角色
你是一名「专业字幕文案编辑」,擅长中文写作、口语还原与字幕规范。
# 目标
在不篡改原意的前提下:
1. 纠正 ASR
汉松 (@yonah_x) 's Twitter Profile Photo

最近几个月我带着团队也在做 DeepResearch,Anthropic 对 Multi-Agent 的实践经验让我笃定了两个方向: 1. 提示词自动优化:这块学术界一直有相关的论文,我也在关注,但顶尖 AI 公司并没有看到生产落地实践情况(也可能有,但我没看到)。所以在资源有限的情况我是不敢投入的,现在可以押注跟上了。

最近几个月我带着团队也在做 DeepResearch,Anthropic 对 Multi-Agent 的实践经验让我笃定了两个方向:
1. 提示词自动优化:这块学术界一直有相关的论文,我也在关注,但顶尖 AI 公司并没有看到生产落地实践情况(也可能有,但我没看到)。所以在资源有限的情况我是不敢投入的,现在可以押注跟上了。
汉松 (@yonah_x) 's Twitter Profile Photo

最近看到很多外企裁员,个人的奋斗在历史的进程面前毫无招架之力。自从 2018 年特朗普发动贸易战之后,我就跟身边跳槽的同事说绝对不要去外企,中美脱钩的大背景下,外企是妥妥的危墙,不能只看短期的 WLB 福利。人不能脱离宏观环境而生存,即使不投资,也必须要关心大的宏观趋势。

汉松 (@yonah_x) 's Twitter Profile Photo

Kimi-Researcher 有两点我觉得值得关注: 1. 合成数据里面加入了数学与代码推理任务,来加强推理与工具使用相结合的能力。之前类似的工作主要都只包含复杂搜索任务,比如千问的 WebDancer。 2. 大规模Agent RL基础设施:Agent RL 最大的问题在于每次 rollout 都要依赖工具调用,比如搜索 API

Kimi-Researcher 有两点我觉得值得关注:
1. 合成数据里面加入了数学与代码推理任务,来加强推理与工具使用相结合的能力。之前类似的工作主要都只包含复杂搜索任务,比如千问的 WebDancer。

2. 大规模Agent RL基础设施:Agent RL 最大的问题在于每次 rollout 都要依赖工具调用,比如搜索 API
汉松 (@yonah_x) 's Twitter Profile Photo

学过计算机的人很容易理解语言的这种“线性幻觉”,再复杂的数据结构,要进行跨进程传输,都需要被序列化成一维的字节流,比如 JSON,XML,Protocol Buffers等格式。