小易撩挨踢 易君召的博客

AI Agents & 开源 LLM 简报 (2026年5月13日)

🔥 1. Google 推出 Gemini Agent SDK:多模态 Agent 开发工具包 — 468 pts Google DeepMind 于 5 月 12 日发布 Gemini Agent SDK,支持构建多模态 Agent,原生集成网页搜索、代码执行和 Google Workspace

易君召 发布于 2026-05-13

AI Agents & 开源 LLM 简报 (2026年5月12日)

🔥 1. Anthropic 发布 Claude Agent:自我改进循环,自主调试代码 — 486 pts Anthropic 于 5 月 12 日推出 Claude Agent,采用自我改进循环架构,能自主编写、执行和调试多语言代码。早期基准测试 SWE-bench 上比 GPT-5 Agen

易君召 发布于 2026-05-13

大模型 AI 偏好 Markdown 而非 HTML 的深层次原因分析

大模型 AI 普遍选择 Markdown 作为输出格式,核心源于其在token 效率、语义表达、生成稳定性、人机协同四个维度的系统性优势,这与大模型的底层运行机制、训练数据分布及实际应用场景高度契合。以下从技术本质、模型特性、应用生态三个层面展开深度解析。

易君召 发布于 2026-05-12

AI Agents & 开源 LLM 简报 (2026年5月11日)

🔥 1. Anthropic 发布 Claude Agent v2:Computer Use 模式正式上线 — 486 pts Anthropic 于 5 月 9 日推出 Claude Agent v2,Computer Use 模式下可自主操控浏览器、执行代码、管理文件系统,单次会话最长持续 2

易君召 发布于 2026-05-11

AI Agents & 开源 LLM 简报 (2026年5月10日)

🔥 1. Anthropic 发布 Claude Agent SDK:企业级自动化平台 — 468 pts Anthropic 于 5 月 8 日推出 Claude Agent SDK,开发者可基于 Claude 5 Opus 构建自主 Agent。SDK 包含工具调用 API、记忆管理和多步推理

易君召 发布于 2026-05-10

AI Agents & 开源 LLM 简报 (2026年5月9日)

🔥 1. Google 将 Project Mariner 自主浏览器 Agent 推向所有 Chrome 用户 — 486 pts Google 于 5 月 8 日宣布 Project Mariner 全面开放,AI Agent 可自主浏览网页、填写表单、完成购物等复杂浏览器任务。此前仅限测试用

易君召 发布于 2026-05-09

AI Agents & 开源 LLM 简报 (2026年5月8日)

🔥 1. Anthropic 发布 Claude Agent Mode:可自主运行数小时 — 486 pts Anthropic 于 5 月 6 日推出 Agent Mode,Claude 可自主执行编程、数据分析、网页研究等多步骤任务,持续数小时无需人工介入。这是从聊天助手到自主 Agent 的

易君召 发布于 2026-05-08

AI Agents & 开源 LLM 简报 (2026年5月7日)

🔥 1. Mistral 发布 Mistral-Specialist-7B:开源代码模型 HumanEval 达 92.3% — 412 pts 法国 Mistral AI 于 5 月 7 日发布专为代码生成优化的开源模型,7B 参数在 HumanEval 上达 92.3% 通过率,超越同等规模闭

易君召 发布于 2026-05-07

AI Agents & 开源 LLM 简报 (2026年5月6日)

🔥 1. Meta 开源 Llama 4 Ultra:1.2 万亿参数,全面超越 GPT-4o — 486 pts Meta 于 5 月 5 日发布 Llama 4 Ultra,1.2 万亿参数的开源模型,在多项编程和推理基准上超越 GPT-4o。采用自定义商业许可证,是迄今能力最强的开源模型,有

易君召 发布于 2026-05-06

DeepSeek-TUI 五一假期爆火:终端里的 AI 编程革命

🔥 1. DeepSeek-TUI 五一期间 GitHub Star 突破 7000 — 350 pts 2026年五一假期期间,一款名为 DeepSeek-TUI 的开源项目在开发者社区中迅速走红。该项目由开发者 Hmbown 于2026年1月创建,使用 Rust 语言编写,截至5月初已获得超过

易君召 发布于 2026-05-06

AI Agents & 开源 LLM 简报 (2026年5月5日)

🔥 1. Anthropic 发布 Claude 4 Opus:内置 Agent 模式,刷新 SWE-bench 纪录 — 512 pts Anthropic 于 5 月 5 日推出 Claude 4 Opus,深度集成 Agent 工作流——可直接调用工具、编写执行代码、自主浏览网页并自我纠错。

易君召 发布于 2026-05-05

AI Agents & 开源 LLM 简报 (2026年5月4日)

🔥 1. 阿里云发布 Qwen3-200B 系列:MoE + 1M 上下文,全量开源 — 428 pts 阿里云通义千问于 5 月 3 日发布 Qwen3-200B-A1B,采用 MoE 架构,激活参数仅 20B 即可对标 GPT-4o。支持 100 万 token 超长上下文,附带全新 Agen

易君召 发布于 2026-05-04
上一页 下一页