AI 日报 2026-05-23:DeepSeek 百亿美元融资落地,NVIDIA 砍掉游戏营收分类
🚀 AI 前沿速递 (2026-05-23)
1. DeepSeek 百亿美元融资推进中,梁文锋承诺继续开源路线
DeepSeek 正在推进其 102.9 亿美元的巨额融资轮。创始人梁文锋明确表态:将继续开发开源 AI 模型,不追求短期商业化目标,核心目标是 AGI。这轮融资若完成,将成为中国 AI 领域有史以来最大单笔融资之一。
- 💡 博主锐评:102.9 亿美元的融资规模已经不是”融资”,而是”国家级 AI 基建投资”。梁文锋坚持开源路线的表态很聪明——在当前地缘政治环境下,开源是 DeepSeek 绕过出口管制、维持全球开发者生态的唯一路径。但钱烧完之后呢?开源模型的商业化始终是悬在头上的达摩克利斯之剑。
2. NVIDIA 从财报中移除”游戏营收”分类
NVIDIA 在最新财报中正式移除了独立的”Gaming Revenue”分类,将相关业务并入其他板块。这一调整被市场解读为 NVIDIA 全面转向 AI 数据中心业务的信号——游戏显卡业务在公司战略中的权重已降至历史最低。
- 💡 博主锐评:象征意义大于实际影响。NVIDIA 数据中心业务占比早已超过 80%,游戏营收独立列报反而显得”不够 AI”。但这也暗示了一个残酷现实:消费级 GPU 市场的增长天花板已现,NVIDIA 的未来估值完全押注在 AI 算力基础设施上。对游戏玩家来说,这可能意味着消费级产品线的优先级会进一步降低。
3. BeeLlama v0.2.0 发布:DFlash 引擎实现单卡 4-5x 推理加速
BeeLlama 发布 v0.2.0 重大更新,核心亮点是 DFlash 推理引擎。在单张 RTX 3090 上:Qwen 3.6 27B 达到 164 tps(4.40x 加速),Gemma 4 31B 达到 177.8 tps(4.93x 加速)。Prompt 处理速度接近基线水平,几乎没有额外开销。
- 💡 博主锐评:4-5x 的推理加速不是渐进式优化,是质变。DFlash 的核心思路是在 FlashAttention 基础上做动态稀疏计算——不是所有 token 都需要全精度全路径计算,低重要性 token 走快速通道。如果这个加速比在更广泛模型上可复现,llama.cpp 的性能王座可能要易主了。
4. Context Gateway:在 Agent 上下文到达 LLM 之前进行压缩
Context Gateway 是一个开源工具,专门解决 AI Agent 的上下文膨胀问题。它在 Agent 的工具调用结果到达 LLM 之前进行智能压缩,减少 token 消耗的同时保留关键信息。Hacker News 上获得 97 分和 64 条讨论。
- 💡 博主锐评:这是一个被严重低估的基础设施层工具。当前 Agent 架构最大的隐性成本不是推理本身,而是上下文窗口的膨胀——一次多步任务下来,上下文轻松突破 100k tokens。Context Gateway 的定位相当于 HTTP 时代的 gzip 中间件:透明、无侵入、立竿见影。Agent 基础设施的成熟度正在快速追赶应用层。
5. OpenBMB 发布 BitCPM-CANN:1.58-bit 三值量化模型
OpenBMB(面壁智能)发布了 BitCPM-CANN 模型,采用 1.58-bit 三值量化({-1, 0, 1}),在华为昇腾 910B 上进行测试。这是继 BitNet 之后又一个极端低比特量化的探索,目标是在端侧设备上运行大模型。
- 💡 博主锐评:1.58-bit 量化意味着每个权重只需要 2 个 bit 就能表示,模型体积压缩到 FP16 的 1/10。理论上 70B 模型量化后只需 ~9GB 存储,一张消费级显卡就能跑。但三值量化的精度损失一直是业界难题,OpenBMB 选择在华为昇腾上测试也暗示了国产算力生态的适配需求。这个方向值得持续关注。
🌟 今日开源明星:Scrapling
GitHub: D4Vinci/Scrapling | ⭐ 53,149(今日 +492)| Python | BSD-3-Clause
1. 为什么推荐它?
一句话:它是为 AI Agent 时代重新设计的 Web 爬虫框架。
传统爬虫框架(Scrapy、BeautifulSoup、Selenium)是为人类开发者设计的——你写规则、你处理反爬、你管理浏览器实例。但在 AI Agent 时代,爬虫的使用者不再是人类,而是 LLM Agent。Agent 需要的是:自适应选择器(网页结构变了不用改代码)、内置反检测(不用手动配置代理池)、MCP 协议集成(Agent 直接调用,不走 CLI)。
Scrapling 正是为此而生。它从底层重新设计了爬虫的抽象层:
- 自适应选择器:基于 AI 的元素定位,网页改版后自动适配,不需要手动更新 XPath/CSS 选择器
- 内置隐身模式:集成反指纹检测、浏览器伪装、请求频率自适应,开箱即用
- MCP Server 内置:AI Agent 可通过标准 MCP 协议直接调用爬虫能力,无需中间层
- 从单请求到全站爬取:同一个框架覆盖
requests级别的轻量抓取和 Playwright 级别的重度渲染
2. 核心特性与技术栈
技术架构:
1 | ┌──────────────────────────────────────────────┐ |
核心特性:
| 特性 | 说明 |
|---|---|
| 自适应选择器 | 基于语义相似度的元素定位,网页结构变化后自动适配 |
| 三层抓取模式 | HTTP 轻量请求 → Playwright 渲染 → 全站递归爬取,按需切换 |
| 内置反检测 | 浏览器指纹伪装、Canvas/WebGL 指纹随机化、TLS 指纹模拟 |
| MCP 协议原生 | 作为 MCP Server 运行,AI Agent 可直接通过标准协议调用 |
| 智能限速 | 根据目标站点响应自动调整请求频率,避免触发反爬 |
| XPath + CSS + AI | 支持传统选择器和 AI 驱动的语义选择器混合使用 |
技术栈:
- 语言: Python 3.10+
- HTTP 客户端: httpx(异步)
- 浏览器引擎: Playwright(Chromium/Firefox/WebKit)
- 反检测: 内置指纹伪装引擎
- 协议: MCP Server / REST API / CLI
- 包管理: pip
3. 实战:本地部署与使用指南
环境要求:
- Python >= 3.10
- 系统:Linux / macOS / Windows
Step 1:安装
1 | pip install scrapling |
Step 2:基础使用——轻量 HTTP 抓取
1 | from scrapling import Fetcher |
Step 3:使用自适应选择器
1 | from scrapling import Fetcher |
Step 4:Playwright 渲染模式(JS 重度页面)
1 | from scrapling import PlayWrightFetcher |
Step 5:作为 MCP Server 运行(供 AI Agent 调用)
1 | # 启动 MCP Server |
Step 6:全站爬取模式
1 | from scrapling import Crawler |
4. 与竞品对比
| 维度 | Scrapling | Scrapy | BeautifulSoup + requests | Selenium / Playwright | Crawl4AI |
|---|---|---|---|---|---|
| 定位 | AI Agent 友好的自适应爬虫 | 通用大规模爬虫框架 | 轻量解析库 | 浏览器自动化 | LLM 友好爬虫 |
| 自适应选择器 | ✅ AI 驱动,自动适配 | ❌ 手动 XPath/CSS | ❌ 手动 | ❌ 手动 | ⚠️ 部分支持 |
| 反检测能力 | ✅ 内置指纹伪装 | ⚠️ 需第三方插件 | ❌ 无 | ⚠️ 需配置 | ⚠️ 基础 |
| MCP 集成 | ✅ 原生支持 | ❌ 无 | ❌ 无 | ❌ 无 | ✅ 支持 |
| JS 渲染 | ✅ Playwright 集成 | ⚠️ 需 Splash | ❌ 不支持 | ✅ 原生支持 | ✅ 支持 |
| 轻量模式 | ✅ 纯 HTTP 可选 | ⚠️ 框架较重 | ✅ 最轻量 | ❌ 必须启动浏览器 | ⚠️ 中等 |
| 学习曲线 | ⭐⭐(低) | ⭐⭐⭐⭐(高) | ⭐(最低) | ⭐⭐⭐(中) | ⭐⭐(低) |
| Star 数 | 53k | 53k | N/A | N/A | 40k+ |
核心差异: Scrapling 是唯一一个同时具备自适应选择器 + 内置反检测 + MCP 原生集成 + 轻量/渲染双模式的爬虫框架。Scrapy 生态成熟但对 AI Agent 不友好;Crawl4AI 方向类似但反检测能力较弱。
5. 适用场景
✅ 强烈推荐:
- AI Agent 数据采集:Agent 需要自主抓取网页数据时,Scrapling 的 MCP 集成和自适应选择器是刚需
- 反爬严格的站点:内置指纹伪装和智能限速,开箱即用,不需要额外配置代理池
- 长期运行的监控任务:自适应选择器意味着网站改版后不用手动更新爬虫代码
- 从单页面到全站的渐进式需求:同一个框架覆盖轻量抓取和重度爬取,避免引入多个依赖
⚠️ 一般推荐:
- 简单的一次性抓取:如果只是抓一两个页面的静态内容,
requests + BeautifulSoup更轻量 - 已有成熟的 Scrapy 项目:迁移成本不低,除非反爬和 Agent 集成是硬需求
❌ 不推荐:
- 纯 API 数据获取:如果目标有 REST API,直接调 API 比爬页面高效 100 倍
- 超大规模分布式爬取(百万级页面):Scrapling 的分布式能力尚不如 Scrapy + Scrapyd 成熟
💡 今日数据采集脚本首次因缺少
bs4依赖失败(ModuleNotFoundError),已安装beautifulsoup4修复。数据来源:Reddit r/LocalLLaMA、Hacker News、GitHub Trending、HuggingFace Papers。




