吾道Carlos (@carlos5913142) 's Twitter Profile
吾道Carlos

@carlos5913142

时光荏苒,愿与尔共,清风盈面,阳光满怀,美好相拥。
盼此生,过五洋,行七洲,阅万卷,葆童心,远纷争。

ID: 1555115834741100546

calendar_today04-08-2022 08:58:08

4,4K Tweet

92 Takipçi

2,2K Takip Edilen

WquGuru🦀 (@wquguru) 's Twitter Profile Photo

有人用AI做面试作弊器:Whisper偷听面试官,Tesseract偷拍屏幕题,Claude两秒写完代码加口语解释,骨传导耳机低声报答案,或者干脆用Cluely的透明浮窗,连共享屏幕都看不到。Interview Coder一年赚几千万美元,Final Round AI

pippingg (@suyanzhenq) 's Twitter Profile Photo

牛逼的塔勒布( Nassim Nicholas Taleb )说过一句话: 真正危险的系统,是在大部分时间里显得极其稳定的系统。表面上的“安稳”,是用未来某一次的灾难在买单。 典型脆弱系统的这几大要素——东亚中产(包括日本)、很多公司、甚至一些国家都中招。 1,高杠杆 + 高固定成本 只要现金流一断,就要命。 •

𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞 (@tangsoft) 's Twitter Profile Photo

good catch 一个好的persona提示词设计和情境体系,就是一个恰当的具身经验的本体投射。 其中最有价值的是cognitive core。无论是个人情境还是企业行为。 A proper persona prompt design and context system operates differently: deep persona architectures with multi-layered context systems

karminski-牙医 (@karminski3) 's Twitter Profile Photo

哪个模型最适合微调? 来看 distil labs 花了一万刀测试的结论 distil labs 对一大堆小模型进行了微调测试, 结论来说, 微调后的 Qwen3-4B 在 8 项基准中的 7 项上表现与 GPT-OSS-120B 相当. 他们评估了包括: Qwen3

哪个模型最适合微调? 来看 distil labs 花了一万刀测试的结论

distil labs 对一大堆小模型进行了微调测试, 结论来说, 微调后的 Qwen3-4B 在 8 项基准中的 7 项上表现与 GPT-OSS-120B 相当.

他们评估了包括:

Qwen3
karminski-牙医 (@karminski3) 's Twitter Profile Photo

教大家一招解决AI PPT内容空洞、时效性问题 看到好多朋友在用AI生成PPT, 但是普遍反馈说生成得并不能直接用, 还需要人肉修改大量内容才行. 于是我试了一下, 给大家做了一个小教程. 首先我们要了解一个背景,AI生成PPT实际上是调用生成PPT的工具(Agent/Tool Call). 但是, 这些工具只是用来生成PPT的,

教大家一招解决AI PPT内容空洞、时效性问题

看到好多朋友在用AI生成PPT, 但是普遍反馈说生成得并不能直接用, 还需要人肉修改大量内容才行. 于是我试了一下, 给大家做了一个小教程.

首先我们要了解一个背景,AI生成PPT实际上是调用生成PPT的工具(Agent/Tool Call). 但是, 这些工具只是用来生成PPT的,
Olivert (@indiehackercase) 's Twitter Profile Photo

强烈推荐Gilbert Strang新出的《线性代数与数据学习》(Linear Algebra and Learning from Data)。 有一定数学基础,想入门机器学习领域的老铁会发现什么叫醍醐灌顶。这本书是建立已有数学知识跟人工智能之间的一道桥梁。 没学过高等数学的同学,也可以看他的Linear Algebra for Everyone。

强烈推荐Gilbert Strang新出的《线性代数与数据学习》(Linear Algebra and Learning from Data)。

有一定数学基础,想入门机器学习领域的老铁会发现什么叫醍醐灌顶。这本书是建立已有数学知识跟人工智能之间的一道桥梁。

没学过高等数学的同学,也可以看他的Linear Algebra for Everyone。
karminski-牙医 (@karminski3) 's Twitter Profile Photo

来看新框架 MagicQuant 帮你自动选择最佳量化模型 大家在本地部署大模型的时候, 肯定会因为显存不足考虑量化版本, 而一个大模型通常会有好几种甚至几十种量化版本, 该选哪个? 就在前几天 MagicQuant 的出现解决这个问题, 这是一个框架, 可以通过进化算法为任何模型找到最佳的张量级混合量化方案.

来看新框架 MagicQuant 帮你自动选择最佳量化模型

大家在本地部署大模型的时候, 肯定会因为显存不足考虑量化版本, 而一个大模型通常会有好几种甚至几十种量化版本, 该选哪个?

就在前几天 MagicQuant 的出现解决这个问题, 这是一个框架, 可以通过进化算法为任何模型找到最佳的张量级混合量化方案.
karminski-牙医 (@karminski3) 's Twitter Profile Photo

unsloth 又发力了, 3GB 显存训练Qwen3-4b unsloth 最新的更新提升巨大, 简单来说, 他们把原本Q和K各自需要的2个Triton内核合并为1个,并支持可变长度RoPE, 这样可以很大程度上节省显存和提升计算速度(原本Q和K需要两个Triton Kernel计算,现在合并为了一个),

unsloth 又发力了, 3GB 显存训练Qwen3-4b

unsloth 最新的更新提升巨大, 简单来说, 他们把原本Q和K各自需要的2个Triton内核合并为1个,并支持可变长度RoPE, 这样可以很大程度上节省显存和提升计算速度(原本Q和K需要两个Triton Kernel计算,现在合并为了一个),
karminski-牙医 (@karminski3) 's Twitter Profile Photo

阿里刚刚又发布了新模型 Qwen3-Omni-Flash-20251201 这是个 Qwen3-Omni-Flash 的更新版本, 这个模型是个所谓的"全模态"模型, 可以接受文本,语音,图片,视频输入, 然后可以输出文本和语音. 特别适合用在端侧设备上, 辅助通用任务的执行. 我能想到的比如各种无人场景都可以, 比如无人导购,

阿里刚刚又发布了新模型 Qwen3-Omni-Flash-20251201

这是个 Qwen3-Omni-Flash 的更新版本, 这个模型是个所谓的"全模态"模型, 可以接受文本,语音,图片,视频输入, 然后可以输出文本和语音. 特别适合用在端侧设备上, 辅助通用任务的执行.

我能想到的比如各种无人场景都可以, 比如无人导购,
Feiteng (@feitengli) 's Twitter Profile Photo

面壁 #VoxCPM 1.5B TTS 模型是极好的,支持输出 44.1kHZ 音频达到商用级别音质; 整体模型架构也参考了字节 DiTAR,也是标准 GPT + FlowMatching/DiT 变体,使用连续 Codec 表征压缩到低至 6.25 Hz demo 体验:huggingface.co/spaces/openbmb… GitHub: github.com/OpenBMB/VoxCPM HF:

面壁 #VoxCPM 1.5B TTS 模型是极好的,支持输出 44.1kHZ 音频达到商用级别音质;

整体模型架构也参考了字节  DiTAR,也是标准 GPT + FlowMatching/DiT 变体,使用连续 Codec 表征压缩到低至 6.25 Hz

demo 体验:huggingface.co/spaces/openbmb…
GitHub: github.com/OpenBMB/VoxCPM
HF:
Nagi Yan (@naki2012) 's Twitter Profile Photo

《为什么软件永远会有 bug?因为软件只是结构的低维投影》 我们习惯把 bug 当成程序员粗心的结果,好像只要“多测试、多 review、多加人”,一个系统就能趋近完美。 这是错的。 从结构的角度看,bug 根本不是错误,而是宿命。 要理解这个,你必须先知道软件究竟是什么。 ⸻

Susan/STEM MOM (@feltanimalworld) 's Twitter Profile Photo

Nagi Yan兄, 是中推最被低估的博主之一。 醍醐灌顶啊,醍醐灌顶! 我有一个越来越强的直觉: 我们很有可能已经在各自的位置上,做着同一类工程。 您有没有想过 过去五十年,我们几乎一直活在“封闭软件”的时代: 代码写完、打包、部署,好像世界是静止的,软件也是静止的。

Marco Franzon (@mfranz_on) 's Twitter Profile Photo

I can't stop playing with Rapid Roboflow. The process is so smooth that you can just: - Go to the rapid roboflow platform - Drop a few images or a short video - Type a prompt like “yellow cap” or “person wearing red hat” - Instantly get a working detection model No training,

Robin Seun (@robinsu55107188) 's Twitter Profile Photo

刷了一早上抖音和推啊,还定了关键词“中央经济工作会议” 特别逗,特别好玩儿。 这个帖子纯闲聊,没正事儿! 发现几个特好玩的现象: 一、屁股决定一切 地产主播:最新解读,地产腾飞 证券主播:国家定调,金融崛起 商贩主播:定了定了,利好消费 颜值主播,啥也不说,继续跳舞

刷了一早上抖音和推啊,还定了关键词“中央经济工作会议”

特别逗,特别好玩儿。

这个帖子纯闲聊,没正事儿!

发现几个特好玩的现象:

一、屁股决定一切

地产主播:最新解读,地产腾飞
证券主播:国家定调,金融崛起
商贩主播:定了定了,利好消费
颜值主播,啥也不说,继续跳舞
Luo说不啰嗦 (@luosays) 's Twitter Profile Photo

过去我们讲 SaaS(软件即服务),现在硅谷那边开始流行”服务即软件“了。 什么是”服务即软件“呢,简单点说就是 agent 系统,不卖软件,卖会干活的“工人”,占信息源、收人力钱,这是一个 4.6 万亿美元的市场。

Andy Stewart (@manateelazycat) 's Twitter Profile Photo

每个技术转销售的同学都应该读这本书 《成交闭环》 这本书的作者非常好的讲解了销售菜鸟才做销售应该注意的各种细节 销售要同时和很多客户去聊,而且要同时聊。销售本质是一个数量、概率和转化率的问题,所以要把销售做得好,就要接触很多客户,这样数量才多,通过合适的销售技巧来提高转化率。

每个技术转销售的同学都应该读这本书 《成交闭环》

这本书的作者非常好的讲解了销售菜鸟才做销售应该注意的各种细节

销售要同时和很多客户去聊,而且要同时聊。销售本质是一个数量、概率和转化率的问题,所以要把销售做得好,就要接触很多客户,这样数量才多,通过合适的销售技巧来提高转化率。