於乎 (@wtmbrsn) 's Twitter Profile
於乎

@wtmbrsn

鱼护

ID: 366411743

calendar_today02-09-2011 03:54:01

1,1K Tweet

83 Followers

2,2K Following

Alex_感知 (@alex_perception) 's Twitter Profile Photo

转发一个我在国内平台看到不错的文 父母真正要明白的是,在孩子成长的过程中:放手不是一瞬间的决定,而是漫长而系统的培养。

娜美知识库 (@fhwofjow51260) 's Twitter Profile Photo

推荐一个开源项目ebook-treasure-chest 资源非常全,分类做得很细,能直接按需找书。 收录了不少来自 樊登读书、微信读书、喜马拉雅 的高质量电子书,整体质量在线。 项目地址: github.com/jbiaojerry/ebo… 适合想系统囤书、补认知的人。

推荐一个开源项目ebook-treasure-chest  资源非常全,分类做得很细,能直接按需找书。
收录了不少来自 樊登读书、微信读书、喜马拉雅 的高质量电子书,整体质量在线。

项目地址:
github.com/jbiaojerry/ebo…

适合想系统囤书、补认知的人。
Fu Sheng (@fusheng_0306) 's Twitter Profile Photo

关于最近很火的Agent Skills,我最近看了很多资料去学习,但这期视频15分钟就讲透了‼️ 很多人只讲操作,但这个视频把Agent Skills的底层逻辑讲活了。从Metadata、Instruction到Resources的三层架构拆解,逻辑极其严密。从Agent Skills的概念,技术原理,到多场景实战,一个视频看懂Agent

关于最近很火的Agent Skills,我最近看了很多资料去学习,但这期视频15分钟就讲透了‼️
很多人只讲操作,但这个视频把Agent Skills的底层逻辑讲活了。从Metadata、Instruction到Resources的三层架构拆解,逻辑极其严密。从Agent Skills的概念,技术原理,到多场景实战,一个视频看懂Agent
XDash (@xdash) 's Twitter Profile Photo

因为 claude code + skills 太强力了,最近持续处于兴奋状态,满脑子构想着又能实现什么好玩的,结果今晨四点就醒了,辗转反侧索性爬起来到电脑前开整。 又因为 claude code + skills

Dash (@dashhuang) 's Twitter Profile Photo

刚才同事在公司季度会上分享了用 Cursor 写飞书文档的心得,非常好。同样的方法也一样适用于 Confluence、Slack、Jira 等等所有的日常工具。 我和同事们说过很多次,我们的日常工作不应该还在工作内容和 AI 聊天框之间复制黏贴了,需要通过 AI Agent 让 AI 有自己的眼睛和手。Cursor、Claude Code

Geek Lite (@qingq77) 's Twitter Profile Photo

神器,简直是内网穿透界的泥头车,专治各种端口打不开的便秘——PortBuddy 这玩意儿干啥的?就是把你本地的服务瞬间扔到公网上去,跟 ngrok 那个老六差不多,但这货更猛。不管你是写 Web 应用、测 Webhook,还是想跟基友共享本地数据库,这工具都能让你丝滑操作,安全又省心 github.com/amak-tech/port…

神器,简直是内网穿透界的泥头车,专治各种端口打不开的便秘——PortBuddy

这玩意儿干啥的?就是把你本地的服务瞬间扔到公网上去,跟 ngrok 那个老六差不多,但这货更猛。不管你是写 Web 应用、测 Webhook,还是想跟基友共享本地数据库,这工具都能让你丝滑操作,安全又省心

github.com/amak-tech/port…
GitHubDaily (@github_daily) 's Twitter Profile Photo

想要提取文档或 PDF 里的文字,上传到在线转换工具总让人心里不踏实。而很多本地工具要么识别率感人,要么格式乱成一团。 偶然在 GitHub 看到local_ai_ocr 这个开源项目,基于 DeepSeek-OCR 模型构建,专门用于 Windows 端的本地离线文字识别。 能够利用 GPU 加速处理图片和 PDF

想要提取文档或 PDF 里的文字,上传到在线转换工具总让人心里不踏实。而很多本地工具要么识别率感人,要么格式乱成一团。

偶然在 GitHub 看到local_ai_ocr 这个开源项目,基于 DeepSeek-OCR 模型构建,专门用于 Windows 端的本地离线文字识别。

能够利用 GPU 加速处理图片和 PDF
✧ 𝕀𝔸𝕄𝔸𝕀 ✧ (@iamai_eth) 's Twitter Profile Photo

尝试用OpenCode搞软件逆向,真的有惊艳到我,之前研究了很久没有结果的一款软件,只花了几块钱token就搞定了,全程我就坐在哪里静静地看着,像看魔术一样,十多年的技术积累和能力价值瞬间归零。

karminski-牙医 (@karminski3) 's Twitter Profile Photo

一口气听完1小时会议, 还能分清谁在说话! 微软刚刚发布了了 VibeVoice-ASR, 一个 9B 参数的统一语音识别模型, 最猛的是能单次处理长达 60 分钟的音频! 传统 ASR 模型都是把音频切成小片段分开处理, 这样做虽然简单但会丢失全局上下文, 说话人追踪也容易乱. VibeVoice 直接在 64K token 长度内一把梭,

一口气听完1小时会议, 还能分清谁在说话!
微软刚刚发布了了 VibeVoice-ASR, 一个 9B 参数的统一语音识别模型, 最猛的是能单次处理长达 60 分钟的音频!

传统 ASR 模型都是把音频切成小片段分开处理, 这样做虽然简单但会丢失全局上下文, 说话人追踪也容易乱. VibeVoice 直接在 64K token 长度内一把梭,
余温 (@gkxspace) 's Twitter Profile Photo

AI时代,真的不一样了。 以前 GitHub 上那些牛逼的开源项目,对编程小白来说就是“看得到用不了”。 就比如这个 yt-dlp,143k star 的视频下载神器。你知道它很强,但光是看到部署、命令行、环境配置,就有点劝退了。 现在不一样了。 有了 Skills ,你可以直接跟 Claude Code 说:“帮我把 yt-dlp

YL (Yucheng Liu) (@lyc_zh) 's Twitter Profile Photo

被AI消息轰炸这几年,我以为内心早就波澜不惊了。 直到装了 。 从战战兢兢的「hi,你能做什么」到火力全开:设计评审、Code Review、报税、项目管理、内容管线…… 完全把AI当队友用,不是工具。 数字员工的终局形态,已经成型了。🤖

沉浸式翻译 (@immersivetran) 's Twitter Profile Photo

哎呦!发现了一个超级宝藏! BBC 把自己几十年广播、纪录片、影视里积累的声音资产,直接搬到公众面前的「免费声音金矿」 声音量级离谱大。全站收录两万九千多条专业音效,涵盖自然、交通、机械、人群、动物、脚步声等十多个大类,单自然类就有一万七千多条。 每条都是广播级录音。音效来自 BBC

哎呦!发现了一个超级宝藏!

BBC 把自己几十年广播、纪录片、影视里积累的声音资产,直接搬到公众面前的「免费声音金矿」

声音量级离谱大。全站收录两万九千多条专业音效,涵盖自然、交通、机械、人群、动物、脚步声等十多个大类,单自然类就有一万七千多条。

每条都是广播级录音。音效来自 BBC
向阳乔木 (@vista8) 's Twitter Profile Photo

朋友说这个是这几年最让他震撼的开源产品之一。 比Claude Skill还厉害,应该是下一个大趋势。 地址见评论区

朋友说这个是这几年最让他震撼的开源产品之一。

比Claude Skill还厉害,应该是下一个大趋势。

地址见评论区
向阳乔木 (@vista8) 's Twitter Profile Photo

我去,真的牛逼啊! 装了clawdbot,再装他们的Chrome插件,就能让AI基于视觉理解控制浏览器做好多事情。 现在让它整理我的 x 书签,全搞定了。 配置稍微有点复杂,但真的实用~

我去,真的牛逼啊!

装了clawdbot,再装他们的Chrome插件,就能让AI基于视觉理解控制浏览器做好多事情。

现在让它整理我的 x 书签,全搞定了。

配置稍微有点复杂,但真的实用~
supermao (@buaaxhm) 's Twitter Profile Photo

我现在愿意等 Codex 完成了 而不是跟 Claude code 要费好多轮口舌 Codex 虽然时间久,但是一次就对的概率极大 换句话说,Codex 真的耐操

向阳乔木 (@vista8) 's Twitter Profile Photo

如果你买了罗技的高端鼠标(如MX Master等)。 结果发现要用它的全部功能,必须装一个叫 Logitech Options+ 的SB软件。 这软件要联网,要账号,还会在后台偷偷收集数据。 有个叫 TomBadash 的程序员受够了。 他开发了一个叫 Mouser 的开源工具,用来替代罗技官方程序。 开源地址见评论

如果你买了罗技的高端鼠标(如MX Master等)。

结果发现要用它的全部功能,必须装一个叫 Logitech Options+ 的SB软件。

这软件要联网,要账号,还会在后台偷偷收集数据。

有个叫 TomBadash 的程序员受够了。

他开发了一个叫 Mouser 的开源工具,用来替代罗技官方程序。

开源地址见评论
Berryxia.AI (@berryxia) 's Twitter Profile Photo

智谱前几天发布的这个专为本地使用的OCR 模型,又一次极大利好本地设备。 比如个人或者小公司直接部署到自己设备或者Mac mini上就可以开始使用! 模型只有0.5B 大小,是个电脑都可以跑。 可以套个壳子在公司给大家就用起来了,或者鬼才可以卖给公司🤣 100%免费!不需要花费API!

智谱前几天发布的这个专为本地使用的OCR 模型,又一次极大利好本地设备。

比如个人或者小公司直接部署到自己设备或者Mac mini上就可以开始使用!

模型只有0.5B 大小,是个电脑都可以跑。
可以套个壳子在公司给大家就用起来了,或者鬼才可以卖给公司🤣 

100%免费!不需要花费API!
宝玉 (@dotey) 's Twitter Profile Photo

发布一个新的 Skill:baoyu-youtube-transcript 输入 YouTube URL,直接抓取视频字幕,生成带章节、发言人和封面图的文档,不需要任何 API Key。 【怎么用】 选择这个 Skill,把 YouTube 链接丢进去就行。支持完整链接、短链接、嵌入链接、Shorts 链接,甚至直接输入视频 ID 都可以。