小易撩挨踢 易君召的博客

归档

2026 年 05 月

《高质量数据集 质量评测规范》(TC609-5-2025-04) 是全国数据标准化技术委员会 (TC609) 于 2025 年 8 月 29 日发布实施的技术文件,为人工智能领域高质量数据集的质量评估提供了统一标准框架。该规范首次明确了 "高质量数据集" 的定义与三维度 (说明文档、数据质量、模型应
可信数据空间的标准规范已形成国际 - 国家 - 行业三级体系,核心由ISO/IEC 国际标准、欧盟 IDSA/Gaia-X与中国 TC609三大阵营主导,支撑跨主体、跨行业、跨区域数据安全可信流通。以下为结构化全景梳理。
2026年4月15日,国家数据局综合司发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》。
Rocky Linux 和 AlmaLinux 是 CentOS Linux 停更后最主要的两个 RHEL 二进制兼容发行版,均提供10 年长期支持和免费使用的企业级体验。两者核心功能高度一致,但在治理模式、更新策略、企业支持等方面存在关键差异。 一、核心背景与起源
🔥 1. Mistral 发布 Mistral-Specialist-7B:开源代码模型 HumanEval 达 92.3% — 412 pts 法国 Mistral AI 于 5 月 7 日发布专为代码生成优化的开源模型,7B 参数在 HumanEval 上达 92.3% 通过率,超越同等规模闭
《高质量数据集建设指引》(国数发〔2025〕18 号)于 2025 年 8 月 28 日在 2025 中国国际大数据产业博览会正式发布,由国家数据局指导,中国信息通信研究院、国家数据发展研究院等单位联合编制。本指引提出 "1+1" 核心参考路径 (一套建设方法 + 一套运营体系),构建覆盖全流程、贯
一、核心概念与底层共生定位 高质量数据集:人工智能、产业数字化核心战略生产要素,严格满足完整性、准确性、一致性、时效性国家四性标准,经多源汇聚、清洗脱敏、标准化标注、合规确权、质量校验的政务 / 行业 / AI 基准数据资源,是数据价值产出、模型赋能、业务智能的核心内核。 可信数据空间:国家顶层布局
🔥 1. Meta 开源 Llama 4 Ultra:1.2 万亿参数,全面超越 GPT-4o — 486 pts Meta 于 5 月 5 日发布 Llama 4 Ultra,1.2 万亿参数的开源模型,在多项编程和推理基准上超越 GPT-4o。采用自定义商业许可证,是迄今能力最强的开源模型,有
🔥 1. DeepSeek-TUI 五一期间 GitHub Star 突破 7000 — 350 pts 2026年五一假期期间,一款名为 DeepSeek-TUI 的开源项目在开发者社区中迅速走红。该项目由开发者 Hmbown 于2026年1月创建,使用 Rust 语言编写,截至5月初已获得超过
传言南京南站俄罗斯方块的电扶梯,如图证实,具有十足美感,独具创意特色。
🔥 1. Anthropic 发布 Claude 4 Opus:内置 Agent 模式,刷新 SWE-bench 纪录 — 512 pts Anthropic 于 5 月 5 日推出 Claude 4 Opus,深度集成 Agent 工作流——可直接调用工具、编写执行代码、自主浏览网页并自我纠错。
🔥 1. 豆包推出三档付费订阅 — 320 pts 5月4日,字节跳动旗下AI助手豆包在App Store页面新增付费版本服务声明,将在免费版基础上推出三档付费订阅:标准版68元/月、进阶版200元/月、专业版500元/月。付费功能将集中于PPT生成、数据分析等高阶生产力场景,免费版服务继续面向日
上一页 下一页