Jay Zhuang
@jayzhuang1
Strategy | Products | Books | Crypto
MBA Stu @SmithQueensMBA
Former Reporter @SCMPNews @Crypto_Potato
中英
ID: 1207862723658309632
20-12-2019 03:18:21
753 Tweet
142 Takipçi
868 Takip Edilen
added polymarket data to the public dataset. 400m+ trades going back to 2020. 36gb compressed. MIT licensed, free to download via Cloudflare R2.
从直觉到度量:用 Eval 体系化验证 Agent Skill 的质量,来自 OpenAI Developers 分享 developers.openai.com/blog/eval-skil… Skill 本质上是给 LLM 的结构化指令集。开发者在迭代 Skill 时,常常只能凭感觉判断"是否变好了",直到回归错误出现——Skill 没触发、步骤被跳过、多余文件被遗留。 OpenAI 的核心主张:用 Eval