微软发布 Windows Agent Arena 基准框架,评估 AI Agents 运行主流 Windows 应用性能

科技媒体 NeoWin 9 月 14 日发布博文,报道称微软官方推出了 Windows Agent Arena 基准框架,用于评估生成式 AI Agents 在 Windows PC 上的性能

Windows Agent Arena 基准框架

微软表示该基准框架 AI Agents 使用主流 Windows 应用方面的能力和速度,其中包括 Microsoft Edge 和谷歌 Chrome 浏览器,Visual Studio Code 等编程应用,记事本、时钟和画图等预装 Windows 应用,VLC 等主流媒体播放器。

图表 描述已自动生成

图形用户界面, 应用程序, Word 描述已自动生成

图形用户界面 中度可信度描述已自动生成

翻译部分微软官方博文内容如下:

我们采用 OSWorld 框架,构建了横跨代表性领域的 150 多项多样化 Windows 任务,这些任务要求代理具备规划、屏幕理解和工具使用的能力。

我们的基准测试同样具有可扩展性,能够在 Azure 上无缝并行化,从而在最短 20 分钟内完成全面评估。

Navi

微软研究院也打造了自己的多模态 Agents Navi,并在 Windows Agent Arena 基准测试中对其进行了试验。

图形用户界面, 应用程序, Word 描述已自动生成

它被要求根据特定文本提示执行任务,例如:“你能将我正在浏览的网页转换成 PDF 文件并放置在我的主屏幕上吗,就是那个桌面?”结果显示,Navi 的平均任务成功率为 19.5%,相较于人类 74.5% 的表现评分,这一成绩仍显偏低。

表格 描述已自动生成

附上参考地址

本文转自IT之家: https://www.ithome.com

网信办发布《人工智能生成合成内容标识办法(征求意见稿)》

为规范人工智能生成合成内容标识,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,根据《中华人民共和国网络安全法》、《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》等法律法规,国家互联网信息办公室起草了《人工智能生成合成内容标识办法(征求意见稿)》,现向社会公开征求意见。公众可通过以下途径和方式提出反馈意见:

1.通过电子邮件方式发送至:biaoshi@cac.gov.cn。

2.通过信函方式将意见寄至:北京市西城区车公庄大街11号国家互联网信息办公室网络管理技术局,邮编100044,并在信封上注明“人工智能生成合成内容标识办法征求意见”。

意见反馈截止时间为2024年10月14日。

附件:人工智能生成合成内容标识办法(征求意见稿)

 

国家互联网信息办公室

2024年9月14日

 

人工智能生成合成内容标识办法

(征求意见稿)

第一条 为促进人工智能健康发展,规范人工智能生成合成内容标识,保护公民、法人和其他组织合法权益,维护社会公共利益,根据《中华人民共和国网络安全法》、《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》等法律、行政法规和部门规章,制定本办法。

第二条 符合《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》规定情形的网络信息服务提供者(以下简称“服务提供者”)开展人工智能生成合成内容标识的,适用本办法。

 

行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等研发、应用人工智能生成合成技术,未向境内公众提供服务的,不适用本办法的规定。

 

第三条 人工智能生成合成内容是指利用人工智能技术制作、生成、合成的文本、图片、音频、视频等信息。

人工智能生成合成内容标识包括显式标识和隐式标识。

显式标识是指在生成合成内容或者交互场景界面中添加的,以文字、声音、图形等方式呈现并可被用户明显感知到的标识。

隐式标识是指采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识。

 

第四条 服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识。

(一)在文本的起始、末尾、中间适当位置添加文字提示或通用符号提示等标识,或在交互场景界面或文字周边添加显著的提示标识;

(二)在音频的起始、末尾或中间适当位置添加语音提示或音频节奏提示等标识,或在交互场景界面中添加显著的提示标识;

(三)在图片的适当位置添加显著的提示标识;

(四)在视频起始画面和视频播放周边的适当位置添加显著的提示标识,可在视频末尾和中间适当位置添加显著的提示标识;

(五)呈现虚拟场景时,应当在起始画面的适当位置添加显著的提示标识,可在虚拟场景持续服务过程中的适当位置添加显著的提示标识;

(六)其他生成合成服务场景应当根据自身应用特点添加具有显著提示效果的显式标识。

服务提供者提供生成合成内容下载、复制、导出等方式时,应当确保文件中含有满足要求的显式标识。

 

第五条 服务提供者应当按照《互联网信息服务深度合成管理规定》第十六条的规定,在生成合成内容的文件元数据中添加隐式标识,隐式标识包含生成合成内容属性信息、服务提供者名称或编码、内容编号等制作要素信息。

鼓励服务提供者在生成合成内容中添加数字水印等形式的隐式标识。

文件元数据是指按照特定编码格式嵌入到文件头部的描述性信息,用于记录文件来源、属性、用途、版权等信息内容。

 

第六条 提供网络信息内容传播平台服务的服务提供者应当采取措施,规范生成合成内容传播活动。

(一)应当核验文件元数据中是否含有隐式标识,对于含有隐式标识的,应当采取适当方式在发布内容周边添加显著的提示标识,明确提醒用户该内容属于生成合成内容;

(二)文件元数据中未核验到隐式标识,但用户声明为生成合成内容的,应当采取适当方式在发布内容周边添加显著的提示标识,提醒用户该内容可能为生成合成内容;

(三)文件元数据中未核验到隐式标识,用户也未声明为生成合成内容,但提供网络信息内容传播平台服务的服务提供者检测到显式标识或其他生成合成痕迹的,可识别为疑似生成合成内容,应当采取适当方式在发布内容周边添加显著的提示标识,提醒用户该内容疑似为生成合成内容;

(四)对于确为、可能和疑似生成合成内容的,应当在文件元数据中添加生成合成内容属性信息、传播平台名称或编码、内容编号等传播要素信息;

(五)提供必要的标识功能,并提醒用户主动声明发布内容中是否包含生成合成内容。

 

第七条 互联网应用程序分发平台在应用程序上架或上线审核时,应当核验服务提供者是否按要求提供生成合成内容标识功能。

 

第八条 服务提供者应当在用户服务协议中明确说明生成合成内容标识的方法、样式等规范内容,并提示用户仔细阅读并理解相关的标识管理要求。

 

第九条 如用户需要服务提供者提供没有添加显式标识的生成合成内容,可在通过用户协议明确用户的标识义务和使用责任后,提供不含显式标识的生成合成内容,并留存相关日志不少于六个月。

 

第十条 用户向提供网络信息内容传播平台服务的服务提供者上传生成合成内容时,应当主动声明并使用平台提供的标识功能进行标识。

任何组织和个人不得恶意删除、篡改、伪造、隐匿本办法规定的生成合成内容标识,不得为他人实施上述恶意行为提供工具或服务,不得通过不正当标识手段损害他人合法权益。

 

第十一条 服务提供者应当按照有关强制性国家标准的要求进行标识。

 

第十二条 服务提供者在履行算法备案、安全评估等手续时,应当按照本办法提供生成合成内容标识相关材料,并加强标识信息共享,为防范打击相关违法犯罪活动提供支持和帮助。

 

第十三条 违反本办法规定,未对生成合成内容进行标识造成严重后果的,由网信等有关主管部门按照有关法律、行政法规、部门规章的规定予以处罚。

 

第十四条 本办法自2024年 月 日起施行。

 

本文转自网信办官网:https://www.cac.gov.cn

马斯克盯上了盲人,Neuralink 下一代脑机接口产品获批

后天视力受损 or 先天失明,都有机会重获光明了?!

就在刚刚,马斯克宣布旗下 Neuralink 的大脑植入芯片 Blindsight,正式获得 FDA(美国食品药品监督管理局)“突破性设备认定”。

图形用户界面, 文本, 应用程序, 电子邮件 描述已自动生成

据了解,该认定通常在以下情况被授予:

初步临床证据表明,该药物 / 器械与现有治疗方法相比,在临床显著性方面表现出实质性改善

一旦有了该认证,Blindsight 可以获得优先审查

拥有该认证的设备,将获得 FDA 优先审查并加强与 FDA 的沟通。

目标通常是将审批时间缩短至 6 个月或更短,具体取决于数据质量和提交准备情况。

图片

▲ 来自 FDA 官网

而且,Blindsight 设定了两个阶段目标

视觉首先会是低分辨率的,就像 Atari 图形(像素风)一样。

手机屏幕截图 中度可信度描述已自动生成

最终像 Geordi La Forge(星际迷航中的盲人角色,通过佩戴装置拥有远超常人的视力),能够在红外线、紫外线甚至雷达波长下看到东西。

图形用户界面, 应用程序 描述已自动生成

消息公布后,2000 多万网友赶来围观,大家直呼不可思议!

incredible!

图表 中度可信度描述已自动生成

甚至有人调侃,上一个治愈盲人的还是耶稣。

屏幕上有个人 描述已自动生成

大脑植入芯片 Blindsight:让盲人重获光明

早在今年 3 月,马斯克就宣布 Blindsight 将是继“心灵感应(Telepathy)”后的下一代产品。

文本, 应用程序 中度可信度描述已自动生成

按老马的话说,Blindsight 能够实现:

让那些失去双眼和视神经的人看到东西。

如果视觉皮层完好无损,甚至可以让那些生来失明的人第一次看到东西。

当时他就称,Blindsight 植入物已经在猴子身上发挥了作用。

图形用户界面, 应用程序 描述已自动生成

一般来说,眼球成像的原理主要是:

当光线进入眼球时,首先穿过角膜和晶状体,正是眼睛的外层和中间层,而当光线到达眼睛后部的视网膜时,被称为光感受器的细胞将其转换为电信号。

再通过视神经传播到大脑,大脑就将这些电信号解析为看到的图像,而视障都是因为视网膜或视神经的损坏

而 Blindsight 通过侵入式的方式植入大脑,通过外部电信号直接刺激视觉皮层,使盲人产生光感(感知光在视野中的具体位置)。

在患者将光感位置信息反馈给研究人员后,研究人员会再次释放设计组合好的电刺激信号,从而在患者视野范围内形成影像图形。

按老马的说法,这种方式完全绕过眼睛和视神经,将信息直接发送给了大脑,因此只要视觉皮层完好无损,哪怕先天失明的人也能“治”。

图形用户界面, 文本, 应用程序, Teams 描述已自动生成

获 FDA“突破性设备认定”≠能治疗失明?

事实果真如老马宣传吗?

国外媒体 TechCrunch 直接在一篇报道中评价:

无论马斯克怎么说,即便 Blindsight 获得相关认定,也并不意味 Neuralink 已经开发出了治疗失明的方法。

文本 描述已自动生成

先来看 FDA 的“突破性设备认定”到底是个啥?

据了解,“突破性设备认定”(Breakthrough Device Designation)是 FDA 为某些具有潜在突破性医疗治疗、诊断或监测功能的医疗器械提供的一种特殊认证。

要想获得该认证,必须满足以下标准之一:

该设备为治疗或诊断严重疾病或无法治愈的人类疾病或状况提供了更有效的治疗或诊断

该设备代表了突破性技术,没有已批准或获批的替代方案,或在减少住院、改善患者生活质量、促进患者自我护理能力等方面具有显著优势;

图形用户界面, 文本, 应用程序, 电子邮件 描述已自动生成

当然了,该认定还提供了一些额外好处,例如优先审查和其他便利措施。

提供几种不同的选项,来和 FDA 专家进行交流,以有效解决上市前审查阶段出现的问题;

安排了 FDA 优先审查;

资料显示,“突破性设备认定”是一项自愿计划,从 2015 年推出以来,已经有近 1,000 种医疗器械获得授权,单去年就有 145 种。

而 Blindsight 虽然最新获得了认定,但在 TechCrunch 看来:

现在说这种设备可以让盲人重见光明还为时过早

问题主要在两个方面:

首要挑战是电极密度较低

虽然 Blindsight 提高了微电极阵列的密度,但仍然存在根本缺陷。

因为电极阵列的密度较低,导致“看到”的图像没有可辨别的模式。

此外,有观点认为,出生时失明的人不会发展出通过眼睛看东西的生物能力,因此他们不会有视力正常的人理解的视觉概念。

不过大部分人还是持乐观态度,认为完全恢复视力目前还处于早期阶段。

文本 描述已自动生成

面对媒体相关置评请求,无论是马斯克还是 Neuralink,目前均未回复。

最后,Neuralink 又打了一波广告,继续招募起了参与脑机接口试验的患者。

图形用户界面, 文本 描述已自动生成

对此,你怎么看这项新设备呢?

本文转自IT之家: https://www.ithome.com

我国完成备案并上线、能为公众提供服务的生成式 AI 服务大模型达 180 多个

8 月 12 日消息,据“工信微报”消息,在日前召开的第十二届互联网安全大会上,中央网络安全和信息化委员会办公室副主任、国家互联网信息办公室副主任王京涛介绍,截至目前,我国已经完成备案并上线、能为公众提供服务的生成式人工智能服务大模型达 180 多个,注册用户数已突破 5.64 亿

图片包含 图示 描述已自动生成

据介绍,近年来我国人工智能发展取得显著成效。一方面,初步构建了较为全面的人工智能技术产业体系,相关企业超过 4500 家,产业规模持续扩大;另一方面,人工智能与实体经济融合不断深化,人工智能应用加速探索,建成 2500 多个数字化车间和智能工厂,经过人工智能改造,研发周期平均缩短 20%,生产效率提升 35%。同时,人工智能也在加速政务、金融、能源等领域的数字化进程。

《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。

截至今年 6 月,国家互联网信息办公室已经发布六批深度合成服务算法备案信息。具体信息可通过互联网信息服务算法备案系统(https://beian.cac.gov.cn)进行查询。

本文转自IT之家:https://www.ithome.com/

微软发布 Windows 10 八月累积更新:14 项优化和改进,修复 142 个漏洞

背景图案 描述已自动生成

8 月 14 日消息,在本月补丁星期二活动日中,微软公司面向 Windows 10 系统发布了累积更新,包含 14 项改进和安全更新,并修复了 142 个漏洞。

图形用户界面, 文本, 应用程序, 电子邮件 描述已自动生成

微软公司发布了适用于 Windows 10 的 8 月累积更新 KB5041580,21H2 用户安装后版本号升至 Build 19044.4780,22H2 用户安装后版本号升至 Build 19045.4780。

附上适用于 Windows 10 系统的 8 月更新如下:

VersionKBBuild下载支持
1809KB504157817763.6189Update CatalogLong-Term Servicing Channel (LTSC)
1607KB504177314393.7259Update Catalog
1507KB504178210240.20751Update Catalog
本次更新内容和适用于 Windows 11 系统的更新相同,内容如下:

改进:提高了 Windows 系统的安全性。

[PPL 保护]

用户可以绕过相关设置。

Protected Process Light (PPL) 是 Windows 10 引入的一种安全机制,用于增强进程的安全性,以抵御恶意代码攻击和数据泄露。PPL 是一种进程保护技术,它将进程的可信度划分为四个级别,每个级别都有相应的安全特性和限制。

[Windows 内核漏洞驱动程序阻止列表文件 (DriverSiPolicy.p7b)]

更新驱动程序列表,新增存在自带漏洞驱动程序(BYOVD)攻击风险的文件名单。

[BitLocker(已知问题)]

启动设备时会显示 BitLocker 恢复屏幕。安装 2024 年 7 月 9 日更新后会出现这种情况。如果设备加密已打开,则更有可能出现此问题。

[锁屏]

此更新解决了 CVE-2024-38143 的问题:“使用我的 Windows 用户账户”复选框在锁屏连接 Wi-Fi 时不可用。

[NetJoinLegacyAccountReuse]

此更新删除了此注册表键值。

[SBAT 和 EFI]

此更新将安全启动高级定位 (SBAT) 应用于运行 Windows 的系统。这将阻止易受攻击的 Linux EFI(Shim 引导加载程序)运行。

此 SBAT 更新不适用于 Windows 和 Linux 双启动的系统。应用 SBAT 更新后,旧版 Linux ISO 镜像可能无法启动。如果出现这种情况,用户需要联系 Linux 供应商,获取最新 ISO 镜像。

本文转自51CTO:https://www.51cto.com

Omdia:微软 ARM 芯片架构 AI 笔记本电脑明年出货增长高达 534%

8 月 19 日消息,根据 Omdia 最新人工智能笔记本电脑(AI Notebook PC)出货预测数据显示,微软 ARM 芯片架构(ARM-base)的 AI 笔记本电脑出货量将从 2024 年的八十万台跃升至 2029 年的五千八百八十万台,预计年复合成长率(CAGR)从 2024 年至 2029 年将高达 136%

特别值得注意的是,微软 ARM 芯片架构的 AI 笔记本电脑在 2025 年出货年增长率将达到 534%

图片

根据报告分析,推动微软 ARM 芯片 AI 笔记本电脑快速出货增长的原因有两个,IT之家汇总如下:

原因 1:生成式 AI 技术将降低使用者进入创作者市场的障碍

生成式 AI 技术(Generative AI Technology)不仅让用户可以轻松生成文字,声音,图片与影像,也让彼此(文字 / 声音 / 图片 / 影像)可以快速转换。这崭新的技术突破将可大幅度降低创作者市场(Content Creator Market)的进入障碍,让原本不具备图片 / 影音创作知识的用户(例如:年轻学生与老人),可以通过使用 AI 笔记本电脑或是 AI 平板计算机,轻松且省时地进行图片 / 影音创作。

除此之外,生成式 AI 技术也将改变教育市场,因为教师平时就有编制教材的任务,通过使用 AI 笔记本电脑,可以协助教师以更短的时间创作生动且具有互动性的图片 / 影音教材。

原因 2:具备与苹果产品竞争的相同条件

在生成式 AI 技术推出之前,创作者市场需求主要是被苹果所掌握;且在苹果这几年的推广之下,苹果 Mac 系列产品搭配 ARM 芯片架构所带来的轻、薄、高运算效能与长待机表现,已经追上甚至超过以往苹果 X86 芯片 Mac 产品的表现。

因此当生成式 AI 技术开始改变创作者市场时,微软势必要准备好操作系统软件支持 ARM 芯片架构,才能让 PC 品牌具备与苹果产品竞争的相同条件,并进一步抢下过往由苹果主导的创作者市场份额。

桌子上放着电脑 描述已自动生成

▲微软 Surface Laptop 第 7 版 15 英寸首发图赏

在与苹果产品竞争的大趋势下,Omdia 预见将来会有两种竞争情境出现:

情境 1:微软通过 ARM 芯片外接独立显示适配器设计来重新定义高端游戏 / 创作者 PC 市场

为了符合苹果 MacBook 轻、薄与长待机的设计理念,Apple M 系列芯片是采用 ARM 单芯片系统架构(System on a Chip),并设定芯片热设计功耗(Thermal Design Power)在 30 瓦以下。

根据 Omdia 的分析,苹果 M 系列芯片受限于单芯片系统架构与低热设计功耗要求,无法提供强大绘图显示适配器运算效能。如果微软推出 45-80 瓦热设计功耗的 ARM 芯片搭配独立显示适配器(Discrete-GPU)的 AI 电竞或 AI 创作者笔记本电脑,并通过 OLED 显示器的轻薄功能将笔记本电脑的厚度压缩到接近苹果 MacBook Pro 的机构厚度(16 公厘以内),历时将造成苹果 MacBook Pro 销售上的危机。

为了避免潜在的竞争危机,Omdia 推测苹果未来 M 系列芯片势必通过更先进的半导体制程并搭配全新绘图显示适配器设计,来维持苹果 MacBook 产品的竞争力。

情境 2:微软 ARM 芯片产品将全面对齐苹果 Mac 系列产品

苹果 M 系列芯片除了应用在 MacBook 产品系列,也应用在小型桌面计算机(Mac Pro / Mac Mini)与一体机(iMac)产品。

根据 Omdia 消费电子研究高级首席分析师林信良的分析推测:“假若微软产品策略是全面对齐苹果 Mac 产品系列进行竞争,微软 ARM 芯片 AI 笔记本电脑将只是个开始,未来可预期会有更多微软产品开始采用 ARM 芯片架构。”

本文转自IT之家:https://www.ithome.com

CrowdStrike 回应全球多地 Windows 电脑蓝屏:与“内容部署”有关

7 月 19 日,据《卫报》报道,网络安全软件公司 CrowdStrike 在其支持平台发布消息称,公司收到大量关于 Windows 电脑出现蓝屏的报告,公司工程部已确定该问题与“内容部署(content deployment)”有关,目前已恢复了这些更改。

今天下午,CrowdStrike 官方人员在相关 Reddit 频道为受到影响的用户提供了解决方案。

CrowdStrike 工程团队已确认此问题与内容部署有关,并已恢复这些更改。

临时解决步骤:

  • 将 Windows 启动到安全模式或 Windows 恢复环境
  • 导航到 C:\Windows\System32\drivers\CrowdStrike 目录
  • 找到匹配“C-00000291*.sys”的文件,并将其删除
  • 正常启动电脑
图形用户界面, 文本, 应用程序, 电子邮件 描述已自动生成

当天, “微软蓝屏”一度登顶微博热搜,大量网友晒图展示电脑蓝屏画面,其中不少出现了“csagent.sys”错误。这一问题也影响到了全球多个地区的 Windows 用户,有网络工程师表示是杀毒平台 CrowdStrike 出现了问题,导致新西兰、澳大利亚、日本、印度等地区均出现了蓝屏现象。

原文转自IT之家: https://www.ithome.com/

“最强文生图开源 AI 模型”,Stable Diffusion 3 Medium 发布:可在消费级显卡上运行

6 月 13 ,Stability AI 发布了 Stable Diffusion 3 Medium(下文简称 SD3 Medium),官方声称是“迄今为止最先进的开源模型”,其性能甚至超过了 Midjourney 6。

手机截图图人的照片上写着字 中度可信度描述已自动生成

Stability AI 公司表示 SD3 Medium 可以根据用户输入的文本描述,重点克服了文生图模型中手部和脸部的挑战,生成足以乱真的的图像。

SD3 Medium 还利用其底层的 Diffusion Transformer 架构,高精度地整合了文字元素。

SD3 Medium 的另一个特点是易于使用。相比较一些资源密集型 AI 模型,SD3 Medium 可以在消费级显卡上运行,可以加速普及适配。

Stability AI 在非商业许可下提供 SD3 Medium,供免费使用。对于商业应用,可为艺术家、设计师和开发人员提供创作者许可证;对于大型商业用户,可以直接联系 Stability AI 了解授权详情。

Stability AI 还表示计划在未来将其产品扩展到视频和音频生成领域。提示词如下:

A photograph of an 18-year-old Japanese woman hitchhiking, holding a cardboard sign that reads ' 東京駅まで ' (To Tokyo Station). She is standing by the roadside with a hopeful expression, wearing casual clothing and a backpack. The background shows a bustling urban street with cars passing by and city buildings. The scene is lively and vibrant, capturing the energy of Tokyo. Cinematic composition, trending on artstation.

街道边手里拿着手机的女子 描述已自动生成

附上生成的相关图片如下:

电视上的卡通人物 描述已自动生成

图形用户界面, 应用程序, Teams 描述已自动生成

人站在街道上走 描述已自动生成

以上图源:Yas@BizDev

原文转自IT之家: https://www.ithome.com/

中国信通院公布 AI 代码大模型评估,阿里云、华为、商汤等首批通过

6 月 11 日,中国信息通信研究院公布了可信 AI 代码大模型评估的首轮评估名单,阿里云通义灵码、华为云盘古、智谱 codegeex 等国产 AI 大模型均入选并首批通过。 此次大模型评估以《智能化软件工程技术和应用要求 第 1 部分:代码大模型》标准为依据,围绕通用能力、专用场景能力、应用成熟度,为模型能力提升和企业选型提供规范性参考。 图片 IT之家注:《智能化软件工程技术和应用要求 第 1 部分:代码大模型》(标准编号 AIIA / PG 0110-2023)标准于 2024 年 1 月 25 日正式发布,该标准由中国信通院与中国工商银行联合牵头发起,涵盖通用能力、专用场景能力和应用成熟度三大部分,包括 100 多个能力要求。 此次验证,依据标准开展,评价指标覆盖 6 大通用能力场景、7 大专用能力场景、3 大服务成熟度,多维度验证研发大模型在研发场景能力和人效优化效果方面的场景丰富度,重点考察研发大模型在代码理解、代码生成和补全、研发问答、单元测试用例生成等方面的能力支持度,全方位评估研发大模型在数据合规性、模型成熟度、服务成熟度方面的应用成熟度。 图片 目前,华为云盘古大模型、智谱 CodeGeeX 代码大模型、阿里云 AI 编程助手通义灵码、中国电信星辰政务大模型等首批通过评估,并在全部 100 多个能力评估中表现优秀,获得 4 + 评级图片 图片 以阿里云通义灵码为例,信通院评测结果显示:
  • 在通用能力方面,通义灵码在代码转换、代码检查及修复、代码优化等方面表现突出;
  • 在专用场景方面,通义灵码提供网站开发、数据库开发、大数据开发、嵌入式开发等多个场景支持能力;
  • 在应用成熟度方面,通义灵码具备较完善的数据合规及数据分类分级机制,且模型稳定性及可维护性表现优异,在模型推理性能、模型服务风险可控性等方面均表现优秀。
公开资料显示,AI 代码大模型首轮评估于今年 3 月启动,主要面向适用于金融、科技、互联网、电信、软件等各行业,生产、使用或计划使用代码大模型的企业,评估结果旨在为模型厂商提供代码大模型能力的评价和指导标准,以及为模型应用方提供有效衡量其能力水平的标准依据。

原文转自IT之家: https://www.ithome.com/0/774/571.htm

Microsoft AI Day:支持开放合作,普及技术应用, 推进行业企业智慧化创新

2024年6月14日,北京 —— 微软在北京举办以“共创AI创新,智启无限可能”为主题的Microsoft AI Day活动,集中展示了在生成式智能技术加速发展普及的过程中,微软取得的最新技术突破与进展,并同步更新了在Microsoft Build 2024全球开发者大会上发布的一系列Azure AI新服务与新功能、加速壮大的Microsoft Copilot智能副驾驶® 技术栈,以及用以帮助企业开发者打造专属Copilot智能副驾驶®的Microsoft Copilot Studio等一系列开发工具与平台服务等。Microsoft AI Day提供了丰富多彩的线下现场活动,包括数十场主题演讲、技术专题课程,以及围绕最新Azure AI及Copilot智能副驾驶®功能、服务、开发工具展开的动手实验营和现场小课堂等,并以线上直播的方式提供了全程视频直播及在线互动交流。

微软亚洲区Microsoft Azure策略运营总经理康容表示:“以生成式智能为代表的新一代AI技术创新正在加速演进,在今天的‘规模法则(Scaling Laws)’下,AI技术的能力大约每六个月内就会翻倍增长。与此同时,如何让技术成果对齐行业、企业的实际业务需求,加速技术能力的落地转化,助力更多客户加速智能化转型与创新,成为当前微软最关注的业务领域。在今年的Build全球开发者大会上,微软围绕Azure AI和Copilot智能副驾驶®发布了60多项产品、服务、解决方案,通过在北京举办Microsoft AI Day,我们希望将全球最新的技术创新和发展趋势,同步更新给更多的开发者、客户、合作伙伴,以开放合作的态度推进创新技术的普及应用,为更多企业的智慧化转型注入创新活力。“

支持开放合作,为AI创新提供更加灵活多样的技术服务与开发平台

面对由生成式智能引领的新一轮技术变革,微软始终致力于通过开放合作推进技术的发展与普及。从云到边缘,从AI基础设施、基础大模型、数据智能平台到AI开发平台与工具链,再到可由企业快速定制的Copilot智能副驾驶®及扩展功能,微软在全球范围内与软硬件合作伙伴、大模型开发者、开源社区等生态伙伴展开了广泛合作,希望以此为行业、企业、合作伙伴和开发者,提供更为广阔的平台和尽可能灵活多样的选择。

在Build 2024全球开发者大会上,微软宣布与AMD、英伟达等合作伙伴深化合作,为用户提供多样化的高性能云基础设施服务。作为首个将AMD MI300X AI加速器芯片用于客户AI训练和AI推理的云服务商,微软正式发布针对Azure OpenAI Service的高性能计算(HPC)工作负载进行优化的Azure ND MI300X v5虚拟机系列。微软将英伟达Omniverse Cloud、DGX Cloud与微软云服务、Fabric数据服务深度集成,让开发者第一次得以在Azure云端调用Omniverse的API开发AI解决方案。

在大模型领域,OpenAI是微软最重要的战略合作伙伴,OpenAI的旗舰模型GPT-4o在Azure平台上开发训练,现已加入Azure AI Studio,同时也可作为API服务调用。与此同时,Azure AI服务还在不断拓展“模型即服务(Model as a Service)”的覆盖范围,提供了对Coherence、Databricks、Deci、Meta、Mistral AI、Snowflake等大模型服务的支持。微软还宣布进一步加强与开源社区Hugging Face合作,将更多来自开源库的优秀语言模型引入Azure AI服务和Azure AI Studio开发工具。

微软开发的小语言模型Phi-3发布全新多模态模型Phi-3-vision,这个42亿参数模型可提供语言和图像处理能力,实现基于照片的推理,并优化了对图表内容的理解能力。Phi-3小语言模型能够同时满足云端运行,及面向网页、移动端和边缘设备的本地部署的需求。

过去两年,GitHub Copilot 智能副驾驶®已成为应用最广泛的AI开发者工具,拥有超过180万付费用户[1],得到90%“财富100强”企业的信任[2]。2023年初,好未来教育集团率先为上千位研发人员配备了GitHub Copilot 智能副驾驶®。据统计,其开发人员与Copilot 智能副驾驶®的月均交互接近2万次,AI辅助编写代码的平均采纳率达到33%,每月总采纳代码总数大约有25万行。好未来在研发教育千亿级“九章大模型”的过程中,借助Azure AI服务,将数据标注的效率提升了35%,实现了客观题评估、主观题评估等多个任务的自动化评估。此外,好未来基于九章大模型研发的AI Tutor产品中,广泛采用了微软Azure提供的高精准ASR和超拟人TTS技术。

Microsoft Copilot智能副驾驶® 技术栈持续发展壮大,定制化开发加速生产力变革

2024年度《工作趋势指数报告(WTI)》显示,AI正在成为现代生产力必不可少的组成部分。在全球范围内,75%的受访劳动者称其已经将AI用于日常工作,其中近半数的人在最近6个月内开始使用AI。与此同时,AI技能正成为用人单位招聘时的考量之一,71%的受访管理者表示,在有经验而缺乏AI技能,与经验略有欠缺但AI技能扎实的候选人之间,他们更倾向于选择后者。在中国市场,这两个数据的特征更为突出——91%的受访劳动者已经将AI用于日常工作,82%的管理者表示更看中求职者的AI技能

作为加速企业与员工生产力变革的核心服务,Microsoft Copilot智能副驾驶®上线一年多来,便已推出了超过150项更新,成为贯穿于微软各项主要产品、服务中的智能助理,并且针对日常办公、客户服务、销售、财务与数据分析、安全分析、IT开发等角色和场景,推出了各有专长的解决方案。

在Build 2024大会上,微软正式推出Team Copilot智能副驾驶®,将Copilot智能副驾驶® for Microsoft 365从个人AI助理,升级为工作团队中的一员。Team Copilot智能副驾驶® 可在Teams、Loop、Planner 等协作工具中调用,担任会议主持人,管理会议议程、跟踪会议时间并记录会议要点;也可以在聊天中作为协作者,提供重要信息、跟踪行动项目并解决未决问题;或者是担任项目经理,帮助确保各个项目顺利推进,并及时通知团队适时采取行动。

Microsoft Copilot Studio 推出全新的Agent代理功能,让开发者能够根据特定任务和功能,构建出可以针对数据或事件做出主动响应的Copilot智能副驾驶®。定制化的Copilot智能副驾驶®可通过记忆和知识了解上下文背景、推理需要进行的操作和行动,基于用户反馈进行学习,并在不知道如何处理时寻求帮助,从而独立管理复杂、长期运行的业务流程。从IT设备采购到销售和客户服务,用户可以从不同场景和自身业务需求出发,量身定制Copilot智能副驾驶®。通过插件和连接器等Copilot 智能副驾驶®扩展,可以连接到不同的数据源和应用程序,来进一步拓展Copilot 智能副驾驶®的适用性和功能。

作为全球汽车电子与电子安全领先供应商,均胜电子在亚洲、北美、欧洲等地拥有生产基地,70%以上销售额来自海外市场,员工也分布在全球各地,企业运作高度依赖于全球协作。作为Copilot智能副驾驶® for Microsoft 365 国际版的首批12家企业用户之一,均胜电子提供了积极的用户反馈:70%的员工认为Copilot智能副驾驶®提高了他们的工作效率,完成搜索、写作、总结提炼等任务速度提高了29%,用户能以近4倍的速度迅速了解和跟进错过的会议内容,并且减少了64%用户的处理邮件时间。

助力AI落地应用,推进行业企业智慧化创新

目前,全球有超过5万家企业和组织采用微软Azure AI服务,作为引领技术创新的先行者,微软始终坚信,大力推动技术成果与行业企业现实需求的结合,是发挥AI最大潜能的用武之地。微软大中华区首席运营官陶然表示:“AI的落地从来不只是技术问题,而是思想问题。在当前技术范式转移的关键时刻,最能体现微软价值的工作,就是充分发挥我们的技术资源与生态优势,将大模型服务与企业的商业场景更好地链接起来。”

微软植根中国市场三十余年,拥有一个熟悉中国各个行业、不同市场需求的庞大的合作伙伴生态系统,同时也积累了推动不同行业客户数字化转型、智能化创新的丰富的成功经验,因此能够更好地根据不同行业的业务场景、千差万别的企业需求,为其量身定制“接地气”的技术落地和解决方案。特别是针对中国企业面向海外市场提供产品和服务的需求,微软凭借覆盖全球的服务能力和先进技术实力,能够更好为中国企业拓展全球市场保驾护航。

携程作为全球领先的一站式旅游服务商,采用Azure OpenAI服务为旗下Trip.com海外网站提供面向海外39个国家的多语言服务,为海外旅行者打造自动化客服机器人和邮件咨询系统,快速响应客户需求并提升用户体验。在此基础上,携程进一步借助Azure OpenAI服务开发了高质量的智能旅行对话机器人TripGenie,它能够自动搜索、整合Trip.com海外平台上的实时旅行线路、航班、酒店等信息,根据境外客户提出的旅行需求和预算,自动设计出最佳行程计划。在微软技术团队的大力支持下,TripGenie的构建周期仅用时两个月,目前可提供英、日、韩及繁体中文服务,客户满意度已经达到了70%。

全球领先的智能手机品牌OPPO与微软合作,为其即将面世的海外手机新品上的AI功能提供智能语音服务支持。其中包括运用Azure AI 服务中的ASR(自动语音识别)与TTS(文本到语音)开发的AI录音摘要和AI文章朗读功能。相关功能通过直接调用Azure API即可面向全球用户提供服务,其中语音相关特性开发和调试用时仅一个月,帮助OPPO大大降低了人力与物力的支出,而且可以更好满足海外市场对于安全隐私与合规的严格要求。

联想作为全球领先的技术解决方案服务商,其产品服务行销全球180多个市场。在推动智能化转型的过程中,联想选择引入Dynamics 365 Sales作为全球统一的销售管理系统。Dynamics 365 Sales能够整合不同来源的新老业务系统与业务流程,并集成了销售协作与AI功能,让全球70%的联想销售团队得以实时记录客户互动活动、即时共享销售信息,为客户提供更加主动、个性化的服务体验。通过深度优化销售体系,Dynamics 365为联想带来了可观的受益:全球潜在年度销售额增长13亿美元; 通过整合、淘汰52个第三方应用程序,每年节省400万美元的许可成本。

在中国市场运营近6000家餐厅的麦当劳中国选择微软作为首个智能化深度创新伙伴。微软为麦当劳中国量身定制了整套智能化创新解决方案,包括由Azure云平台提供自然语言交互、生成式智能、机器学习等企业级的智能化服务;以融入Copilot智能副驾驶®的Microsoft 365为基础,构建高效的员工协作平台;通过GitHub Copilot智能副驾驶®加速IT开发和系统运维,提升IT系统及业务应用开发迭代效率等。麦当劳中国南京创新中心成立“AI-Lab”,将智能技术引入麦当劳中国“汉堡大学”,为20万名员工提供职业发展与技术技能培训。

原文转自微软官网: https://news.microsoft.com/zh-cn