tzwm (@tzwm) 's Twitter Profile
tzwm

@tzwm

……

ID: 113048411

linkhttps://github.com/tzwm calendar_today10-02-2010 14:47:07

15,15K Tweet

1,1K Followers

1,1K Following

tzwm (@tzwm) 's Twitter Profile Photo

头部的图像和视频生成模型就那么几个,还各自有明显特色。agent 要套 prompt 出来一版没有特别困难。结合到一起就是想认真扒一个做得好的产品,花点时间就应该能复刻到类似效果。(单只特定领域 agent

Hunyuan (@tencenthunyuan) 's Twitter Profile Photo

We are excited to unveil HunyuanVideo 1.5, the strongest open-source video generation model. Built upon DiT architecture, it redefines the open-source SOTA for accessibility and performance.🚀🚀🚀 HunyuanVideo 1.5 delivers state-of-the-art visual quality and motion coherence

tzwm (@tzwm) 's Twitter Profile Photo

有时候怀疑自己接的是个假模型,gemini 3 agent 场景效果一般,sora 2 新手上手效果往往很差远不如 seedance pro。

Wey Gu 古思为 (@wey_gu) 's Twitter Profile Photo

Anthropic 这次给了三个非常重要的 LLM Inference API 的可选能力,算是进一步优化 Tool Use 过程中比较头疼的问题。 - 搜索工具的工具 - Programmatic Tool Calling:Inference 层的面向 Tool Use 流程、上下文选取处理的 DSL(Python) - Tool Use 例子字段

Anthropic 这次给了三个非常重要的 LLM Inference API 的可选能力,算是进一步优化 Tool Use 过程中比较头疼的问题。

- 搜索工具的工具
- Programmatic Tool Calling:Inference 层的面向 Tool Use 流程、上下文选取处理的 DSL(Python)
- Tool Use 例子字段
tzwm (@tzwm) 's Twitter Profile Photo

LLM conversation 的存储成本还挺夸张的,特别是如果在用 chat 而不是 response api 的情况下会有大量冗余。同时核心 prompt 往往还有不止一个评估在 live 抽样跑着,1/10 的采样率就可能跑出几乎一倍的额外 tokens 和存储。不做 retention 和冷热分区很难持续下去。

宝玉 (@dotey) 's Twitter Profile Photo

Ilya:扩展时代已经结束了,研究的时代已经开始 Ilya Sutskever 大概得有一年多没参加播客访谈了,自从 OpenAI 宫斗离职创办 SSI(Safe Superintelligence)后之后就很少露面了, 最近,他在 Dwarkesh Patel 的播客中进行了一场长达一个半小时的深度对谈。Ilya 毕竟是 Ilya,他不像 Sam Altman

tzwm (@tzwm) 's Twitter Profile Photo

Z-Image-Turbo bf16 4090D 下测速,附图都是 1.2s 推理的: 1024x1024 9steps - 4.6s 1024x1024 4steps - 2.5s 768x768 4steps - 1.2s

Z-Image-Turbo bf16 4090D 下测速,附图都是 1.2s 推理的:
1024x1024 9steps - 4.6s
1024x1024 4steps - 2.5s
768x768 4steps - 1.2s
tzwm (@tzwm) 's Twitter Profile Photo

当前 agent + mcp 调用 5min 以上长时间运行 tool 感觉还是有点蛋疼。虽然协议里面给了一些进度等可能性,但要么大部分 client 实现不全要么不是很好用。不如直接无视这个问题保持一个超长时间同步请求,压力给到 server。