Leiphone雷峰网

翁荔为华人科学家，自加入 OpenAI 以来，曾在多个关键领域做出贡献。她在 2017 年初加入，参与了机器人技术和深度强化学习的研究，并为后来的 GPT-4 以及安全系统的奠定了基础。她领导应用人工智能研究团队，致力于提升 OpenAI API 的实用性和安全性。特别是在 GPT-4 发布后，她主导了 OpenAI 安全系统的愿景，致力于提升 OpenAI API 的实用性和安全性。她表示，团队在模型安全、对抗性以及越狱防御等方面取得了进展，为行业树立了新的标准。

而就在前不久，她还刚刚现身 2024 Bilibili 超级科学晚活动，发表了《 AI 安全与“培养”之道》的主题演讲，引发全网热议。一时之间，翁荔离开后是否会选择回国，也成为了大家关注的重点。（IT之家、量子位）

国内资讯

DOMESTIC NEWS

著名AI学者、天工智能首席科学家颜水成离开昆仑万维

AI科技评论独家获悉，AI领域国际顶尖学者颜水成又有新动态，已经于近日离开昆仑万维。 2023年9月1日，昆仑万维正式宣布，颜水成将担任昆仑万维及天工智能首席科学家。颜水成加入昆仑万维之际，昆仑万维曾表示，颜水成将推动公司在新加坡、伦敦和硅谷三地建立2050全球研究中心。

2015年，颜水成进入工业界，担任360集团副总裁、人工智能研究院院长和首席科学家。2019年，他加入依图科技，担任首席技术官。2021年，他返回新加坡加入Sea集团，创立Sea AI Lab，于2023年年初离职。

颜水成加入昆仑万维前，在机器学习、计算机视觉和多媒体等领域有丰富的成果积累。他是新加坡工程院院士，同时当选AAAI Fellow、ACM Fellow、IEEE Fellow和IAPR Fellow，八次入选「汤森路透全球高被引学者」，是中国计算机视觉领域的佼佼者。

他的本科、硕士与博士均就读于北京大学（1995年-2004年），自 2001 年博士期间进入微软亚洲研究院（MSRA）实习、跟随张宏江博士从事人工智能研究以来，持续在该领域投入了多年精力，取得卓越成果。（更多内容请点击独家丨著名AI学者、天工智能首席科学家颜水成离开昆仑万维）

优化短剧爽点生成能力，昆仑万维 SkyReels AI 短剧平台 12 月 10 日在美国上线

11 月 10 日消息，昆仑万维宣布，旗下 AI 短剧平台 SkyReels 将于 12 月 10 日在美国上线。官方介绍称，在剧本生成方面，SkyReels 丰富了爆款创意模板。其中剧本大模型生成能力大幅提升，尤其是优化了短剧的爽点生成能力，当前生成效果平均在人工剧本评级中可达到 A 甚至 S 的评级。在角色生成方面，研发团队增加了 AI 演员库。同时构建了演员属性标签，基于多模态大模型能力，智能帮助用户找到最适合剧本人物的形象。

在视频生成方面，SkyReels 视频生成成功率提升 21%；在 BGM 和 TTS 匹配方面，SkyReels 构建了带情感的演员音色库以及短剧 BGM 库，让匹配精准度提升了 35%。 SkyReels 团队表示，实现了 10 分钟可以完成一键从剧本到角色、到分镜生成和完整的两分钟短剧生成。（IT之家）

国内首份关注科技行业 AI 创新自律与治理的白皮书发布，呼吁发展“人本智能”

11 月 10 日消息，联想集团、上海交通大学人工智能研究院、ESG30 等联合撰写的国内首份聚焦科技行业 AI 创新自律与治理的《人本智能：人机共生时代的科技发展观》报告，在第十五届财新峰会 ESG 专场上发布。会上，由财新智库、ESG30、联想集团、上海交大人工智能研究院、腾讯研究院、联合国工发组织联合发起的《人本智能发展与治理倡议》启动。

商汤科技、西门子医疗、平安健康、科大讯飞、蚂蚁数科、天弘基金、第四范式、壁仞科技、小马智行等 25 家企业和机构作为首批成员加入倡议。该倡议旨在推动各行业领军机构共同推动 AI 技术朝着以人为中心、更负责任与更可持续的方向发展。（钛媒体APP）

60 秒生成 5 秒 AI 视频，字节自研视频生成模型 Seaweed 开放使用

字节跳动旗下的 AI 内容平台即梦 AI 宣布，由字节跳动自研的视频生成模型 Seaweed 面向平台用户正式开放。用户登录后，在“视频生成”功能下，视频模型选择“视频 S2.0”即可体验。

9 月底，字节跳动正式宣布向 AI 视频领域进军，发布豆包模型家族的两款视频生成模型 Seaweed 和 Pixeldance，并通过即梦 AI、火山引擎分别面向创作者和企业客户小范围邀测。

本次开放使用的豆包视频生成模型 Seaweed 是该款模型的标准版，60s 能生成时长 5s 的高质量 AI 视频。即梦 AI 官方透露，近期 Seaweed 和 Pixeldance 两款视频生成模型的 Pro 版也将开放使用。Pro 版模型能实现自然连贯的多拍动作与多主体复杂交互，攻克了多镜头切换的一致性难题，在镜头切换时可同时保持主体、风格、氛围的一致性；适配电影、电视、电脑、手机等各种设备的比例。（IT之家）

告别“默片”：智谱发布新清影，可生成 10 秒 4K60 帧 / 自带音效视频

11 月 8 日消息，智谱技术团队发布并开源最新版本的视频模型 CogVideoX v1.5，相比于原有模型，CogVideoX v1.5 将包含 5/10 秒、768P、16 帧的视频生成能力，I2V 模型支持任意尺寸比例，大幅提升图生视频质量及复杂语义理解。

官方介绍，CogVideoX v1.5 也将同步上线到“清影”平台，并与新推出的 CogSound 音效模型结合，“新清影”将具备如下特性：

质量提升：在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。
超高清分辨率：支持生成 10s、4K、60 帧超高清视频。
可变比例：支持任意比例，从而适应不同的播放场景。
多通道输出：同一指令 / 图片可以一次性生成 4 个视频。
带声效的 AI 视频：新清影可以生成与画面匹配的音效。（IT之家）

消息称百度或推出内置 AI 助手的智能眼镜

日前有消息显示，百度方面或将推出一款内置小度助手的智能眼镜产品，并计划于 11 月 12 日举行的 2024 百度世界大会上进行展示。随后官方宣布，将在此次活动中发布“ AI 新物种”，因此也被外界认为极有可能正是传言中的智能眼镜。

据知情人士透露，小度方面即将推出的这款智能眼镜将内置摄像头、可拍摄照片和视频，并支持基于百度文心基础模型构建的语音交互功能。同时这款产品的成本或将会低于 Ray-Ban Meta 智能眼镜的 299 美元（约合人民币 2139 元），并有望最早于明年年初上市。（三易生活）

快手“可灵 AI”独立应用上线苹果 App Store，支持生成视频与图片

快手公司近期在苹果 App Store 上线了独立的“可灵 AI”应用，进一步加强其在移动端的 AI 内容创作布局。目前，“可灵 AI”已形成了多平台的产品矩阵，包括网页版、App、小程序以及海外版本。根据官方介绍，“可灵 AI”是一款新一代的创意生产力平台，基于快手自主研发的“可灵大模型”与“可图大模型”，为用户提供视频与图片的生成和编辑功能。

目前，“可灵 AI”支持的视频长度分为 5 秒和 10 秒，最长为 10 秒，与同类产品相近。相比之下，抖音的“即梦 AI”提供更多的时长选项，包括 3 秒、6 秒、9 秒和 12 秒，并加入了运镜功能，给用户更大的创作灵活性。（IT之家）

专家：“ AI+量子计算”是未来计算领域重要分支

11 月 9 日消息，欧洲科学院院士、欧洲人文和自然科学院外籍院士金石在重庆介绍，面向未来的计算领域，AI 与量子计算相结合是重要分支，现在已有国家进行布局。“量子计算是运用量子力学原理设计的，人工智能( AI )则是靠学习大量数据资源，量子计算作为一种新范式可解决 AI 资源消耗量大的难题。”

“当前，以量子计算机、量子云平台为基础开展的应用场景探索，逐渐成为业界研究热点。”金石表示，依托量子计算，可为金融科技、大数据、气象预测、生物医药、能源交通等行业提供更高效的解决方案。他以金融领域为例，量子计算能为金融公司开发评估与优化解决方案，对股票资产等进行最佳投资组合优化，同时对期权的风险进行评估。（中新网）

大模型小爱能力升级，多端设备支持“音乐问答”功能

近期，小米官方发文宣布，大模型小爱音乐能力升级，多端设备支持“音乐问答”功能。据介绍，该功能基于 AI 能力升级，支持歌曲信息追问、搜索专业音乐知识等内容。用户将小爱同学大模型升级至最新版本后，可在手机、车载端体验新功能。

小米小爱同学在今年 7 月末迎来大版本更新，全量升级“大模型小爱”，支持自然问答、图片编辑、车外唤醒防御等功能，覆盖手机、平板、电视、音箱、汽车等核心品类设备。，在今年 10 月的小米 15 系列暨小米澎湃 OS 2 新品发布会中，超级小爱正式亮相。全新超级小爱支持帮助用户“记证照”、“记日程”，实现屏幕智能提取，本地存储可删除，号称“复杂流程一步直达，还可跨设备使用”。（IT之家）

权威中文大模型 10 月榜单出炉，商汤“日日新”金牌

近日，中文大模型测评基准 SuperCLUE 发布了《中文大模型基准测评 2024 年 10 月报告》。在这次测评中，商汤的日日新·商量大模型表现出色，总得分位列国内大模型第一梯队，荣获金牌。

此次测评覆盖了 23 个国内大模型，从三个维度进行综合评估：文科、理科和 Hard 附加任务，共涉及 2900 多道题目。商汤 SenseChat5.5 在多个评测任务中均表现优异，尤其在语言理解和安全方面表现突出，同时在逻辑推理和代码学科也表现出色。更值得一提的是，它在 Hard 任务中的精确指令遵循和高阶推理两项任务中均位于国内第一梯队，展现了其强大的复杂推理能力。（新智讯）

国际资讯

FOREIGN NEWS

AI 内容博弈：OpenAI 在和新闻机构版权纠纷案中赢得首轮胜利

11 月 9 日消息，有报道称 OpenAI 在与 Raw Story 和 AlterNet 的版权纠纷案件中，赢得首轮胜利。

此前，Raw Story、The Intercept 和 AlterNet 三家美国新闻网站起诉微软和 OpenAI 公司，指控其聊天机器人抄袭新闻网站文章用于训练 AI。这些新闻网站均表示，OpenAI 的聊天机器人 ChatGPT（微软的 Copilot 也使用该技术）在训练过程中抄袭了他们网站上的文章，并且在生成内容时没有显示“作者、标题、版权或使用条款信息”。

纽约联邦法官科琳・麦克马洪（Colleen McMahon）驳回了 Raw Story 和 AlterNet 提起的诉讼，理由是原告未能证明其遭受了可认知的伤害。Raw Story 和 AlterNet 提起的诉讼并没有像其他出版物那样，主张 OpenAI 侵犯了他们的版权，而是指控 OpenAI 违反了《数字千年版权法》（DMCA）条款上。法官认为：“ChatGPT 输出来自 [他们] 文章的抄袭内容的可能性似乎很小”，并认为原告主张的不应该是删除版权相关信息，而是应该主张开发 ChatGPT 时调用其内容资源的赔偿。

尽管诉讼被驳回，Raw Story 和 AlterNet 并未打算放弃，其律师马特・托皮克表示，他们有信心通过修订投诉来解决法庭提出的担忧，继续追求合法权益。（IT之家）

黄仁勋：AI 算力集群扩展至 100 万芯片的可能性与未来展望

近期，黄仁勋在接受采访时透露：未来 AI 算力集群将可能扩展到 100 万颗芯片的概念，他表示：“没有任何物理定律能够阻止这一目标的实现。”

黄仁勋提到“超级摩尔定律”，意味着未来 AI 的计算能力将以每年翻两到三倍的速度增长，远超传统摩尔定律所描述的每两年翻倍。这一突破不仅将在硬件上引发革命性的变化，更可能在算法和应用层面带来颠覆性影响。

黄仁勋强调了软硬件协同设计的重要性。他认为在 AI 的发展历程中，单一的技术突破已难以满足日益增长的算力需求，协同设计将成为关键。一方面，机器学习和 AI 的发展已经显著改变了我们的计算模式，另一方面，数据中心的设计也需要进行全面的创新与优化。黄仁勋也提到了英伟达在与 xAI 合作中取得的进展，仅用 19 天就完成了 10 万卡 H100 超级集群的建设。

面对资本、能源和供应链等挑战，黄仁勋坚信这些挑战都是可以克服的。再过两三年，利用 AI 产生的每一项科学突破和技术进展，都将以 AI 为核心，这是未来科技发展的趋势所在。（搜狐网）

谷歌 Gemini 2.0 或将在不久后发布，具备更快响应速度

据报道，谷歌正计划发布旗下大语言模型 Gemini 的2.0版本更新。据悉，已经有用户在AI 模型选择界面中看到了标记为 Gemini 2.0 的新模型，并进行了初步测试。和当前的 Gemini 1.5 Pro 版本相比，Gemini 2.0 模型具备更快的响应速度。但该模型似乎尚未完全成熟，初步报告指出它未能通过基本的“草莓测试”，而其他模型则轻松通过。不过谷歌目前并未对此消息发表回应，具体发布日期尚未确定。（品玩快讯）

哈佛全新类 ChatGPT 癌症诊断 AI 登上 Nature，准确率最高 96%

近日，来自哈佛医学院等机构的科学家们开发了一种名为 CHIEF（Clinical Histopathology Imaging Evaluation Foundation，临床组织病理学成像评估基础）的多功能 AI 癌症诊断模型，并于 9 月 4 日登上 Nature。值得一提的是，CHIEF 是第一个能够预测患者预后并在多个国际患者群体中验证的模型。

全新的 CHIEF 模型则具有类似于 ChatGPT 的灵活性 —— 不仅能够执行多种任务，而且还能识别不同癌症类型需要特别关注的区域。通过读取肿瘤组织的数字切片，它可以检测癌细胞并根据图像中观察到的细胞特征分析肿瘤的基因特征。此外，还可以预测多种癌症类型的患者生存率，并精确定位肿瘤周围组织的特征，即肿瘤微环境。这些特征与患者对手术、化疗、放疗和免疫治疗等标准治疗的反应有关。更进一步的，CHIEF 还具有生成新见解的潜力 —— 它发现了此前未被认为与患者生存相关的特定肿瘤特征。

研究团队指出，这些发现进一步证明了 AI 可以帮助临床医生高效、准确评估癌症，包括识别可能对标准癌症疗法反应不佳的患者。（新智元）

Mistral 发布内容审核 API：支持中文等 11 种语言，可分类仇恨言论等 9 大类目

11 月 9 日消息，有报道称 Mistral AI 公司推出了全新的内容审核 API，满足日益增长的安全在线环境需求。该内容审核 API 基于微调的 Ministral 8B 模型，可以将内容分类到仇恨言论、暴力和个人数据泄露等 9 个类别。

该内容审核 API 支持中文、阿拉伯语、英语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语和西班牙语这 11 种语言，可以处理原始文本和分析对话内容。Mistral 还推出了 Mistral Batch API，专为需要处理大量数据的公司设计。该功能允许异步内容处理，Mistral 声称可将处理成本降低 25%。这一功能吸引了希望优化运营的企业，进一步巩固了 Mistral 在市场中的竞争力。（IT之家）

Outlook 将推出 AI 个性化动态主题

据报道，微软的 Outlook 电子邮件客户端现在为订阅 Copilot 的用户提供人工智能生成的自定义主题。这项新功能名为 “Copilot 主题”，适用于 Windows 版 Outlook、macOS 版 Outlook、移动版 Outlook 和 Web 版 Outlook，Copilot Pro 或 Microsoft 365 Copilot 用户均可使用。

要创建自定义主题，Outlook 用户可以使用地点或天气类型作为起点，然后选择艺术风格。在选择地点时，Outlook 用户既可以选择自己的地点，也可以从 100 多个精心策划的目的地中进行选择。还可以让主题在特定时间间隔内自动刷新。

Copilot 主题可以在 Outlook 的外观设置中使用，它们与 Outlook 中的其他 Copilot 功能一样，包括电子邮件摘要和用于起草电子邮件或创建会议邀请的人工智能辅助功能。（品玩快讯）

谷歌 DeepMind 研究再登 Nature 封面，隐形水印让 AI 无所遁形

近日，谷歌 DeepMind 发表的一项研究登上了 Nature 期刊的封面，研究人员开发了一种名为 SynthID-Text 的水印方案，已经在自家的 Gemini 上投入使用，跟踪 AI 生成的文本内容，使其无所遁形。为了不影响 LLM 生成文本的质量，SynthID-Text 使用了一种新颖的采样算法（Tournament sampling）。与现有方法相比，检测率更高，并且能够通过配置来平衡文本质量与水印的可检测性。（新智元）

谷歌 AI 视频编辑应用 Google Vids 上线：帮你写脚本、剪片、找素材等

11 月 9 日消息，谷歌发布博文，宣布正式面向 Google Workspace 用户推出 Google Vids 应用。Google Vids 集成了 Gemini 大模型，可以帮助用户创建幻灯片、编写视频脚本，并从 Shutterstock 寻找素材，还可以为整个视频制作分镜头脚本。Vids 利用 Gemini 的强大功能，用户只需输入提示词，便可生成初步故事板。用户选择样式和风格后，Gemini 将自动拼接视频草稿，包括推荐的场景、文本、脚本和背景音乐。

此外，用户还可以从多种模板中开始创作，添加动画、过渡和效果，使用无版权内容库或直接从 Google Drive 和 Google Photos 中导入媒体。（IT之家）

英国明年将立法防范 AI 风险，主要面向 ChatGPT 等“前沿模型”

11 月 8 日消息，据外媒报道，英国计划明年通过立法，加强对 AI 潜在风险的防范。该国科技大臣彼得・凯尔表示，英国现行的 AI 自愿测试协议“行之有效，是一个良好框架”，但即将出台的 AI 法案将把这种与主要开发商的协议变为法律义务，同时政府还将投资于支持 AI 行业发展的基础设施。

该法案将在当前议会提交，并将使英国的 AI 安全研究所（ AI Safety Institute ）成为一个独立于政府的机构，从而“完全从英国民众的利益出发”来行事。

据报道，该立法将主要针对 ChatGPT 式的“前沿”模型 —— 这些是少数公司开发的最先进系统，能够生成文本、图像和视频内容。

凯尔还承诺，将投资先进计算技术，以帮助英国自主开发本土的 AI 和大语言模型（ LLM ）。此前，英国政府因取消爱丁堡大学“百亿级超算”项目的资金支持而受到批评，但该项目原本获得了政府承诺的 8 亿英镑（当前约 74.21 亿元人民币）支持。（IT之家）

吊打人类艺术家？人形机器人 Ai-Da 首幅画作拍卖成交价超 100 万美元

在纽约的一场苏富比拍卖会上，一幅由人形机器人 Ai-Da 创作的画作《 A.I. God. Portrait of Alan Turing 》以 108 万美元的价格成功拍出，远超拍卖前 12 万至 18 万美元的预期。这幅高达 2.2 米（ 7.5 英尺）的画作描绘了著名数学家阿兰·图灵，他是二战期间破解纳粹密码的重要人物，也是早期计算机科学的先驱。

Ai-Da 是世界上首款超真实的机器人艺术家，具备发声能力。她在拍卖会上表示，自己的作品旨在激发关于新兴技术的对话，特别是人工智能和计算机带来的伦理和社会影响。图灵的肖像不仅展现了技术的神秘性，还引发了观众对技术进步背后深层次问题的思考。（新智讯）

Meta 开源小语言 AI 模型 MobileLLM 家族：适用智能手机、提供 125M-1B 版本

11 月 8 日消息，Meta 宣布正式开源可在智能手机上运行的小语言模型 MobileLLM 家族，并同时为系列模型新增 600M、1B 和 1.5B 三种不同参数版本。

Meta 研究人员表示，MobileLLM 模型家族专为智能手机打造，该模型号称采用了精简架构，并引入了“SwiGLU 激活函数”、“分组查询注意力（grouped-query attention）”机制，能够在兼顾效率与表现成果。此外，MobileLLM 模型据称训练速度较快，Meta 研究人员声称他们在 32 颗 Nvidia A100 80G GPU 的服务器环境下，以 1 万亿词（tokens）训练不同参数量的 MobileLLM 模型时，1.5B 版本只需 18 天，而 125M 版本仅需 3 天。

而从结果来看，MobileLLM 125M 和 350M 两款模型在零样本常识理解任务中的准确率比 Cerebras、OPT、BLOOM 等 State of the Art（SOTA）模型分别高出 2.7% 和 4.3%。（IT之家）

AI 重现披头士最后一首歌《 Now and Then 》：与碧昂斯等角逐格莱美

11 月 10 日消息，2025 年第 67 届格莱美提名名单揭晓，传奇乐队披头士（The Beatles）在解散近 50 年后，凭借 AI 的帮助，他们的最后一首歌《 Now and Then 》获得了两项格莱美奖提名。这首歌将与当代流行歌手碧昂斯、Charlie XCX、Billie Eilish 和泰勒·斯威夫特等人角逐年度最佳制作奖。同时还获得了最佳摇滚表演奖的提名，竞争对手包括 Green Day、Pearl Jam 和 The Black Keys。

据了解，《 Now and Then 》最初是约翰·列侬在 20 世纪 70 年代末录制的一个小样，但最终没有全部完成。列侬去世后其遗孀小野洋子于 1994 年将两盘磁带交给了保罗·麦卡特尼，其中一盘包括《 Grow Old With Me 》和《 Now And Then 》。其余三名披头士成员决定对《 Now And Then 》重新制作，但由于无法完美提取出约翰·列侬的人声，计划暂时搁置。2022 年，导演彼得·杰克逊和录音师借助机器学习算法，把约翰·列侬的声音从《 Now and Then 》的原始小样中分离，让乐队其他成员得以继续参与完成这首歌。

虽然《 Now and Then 》是通过机器学习完成的，但它仍然在格莱美人工智能规则的范围之内。目前的指导方针规定，"只有人类创作者才有资格提交格莱美奖的评审、提名或获奖"，但包含人工智能素材"元素"的作品有资格进入适用类别。（快科技）

AI “电子舌头”问世，可辨别味道、检测食品安全

宾州州立大学的研究人员开发出一种基于人工智能的“电子舌头”，能够准确识别食品的酸度、新鲜度，甚至检测出有害物质。

据了解，研究人员利用离子敏感场效应晶体管（ISFET）作为“舌头”，通过收集液体中的离子信息并将其转化为电信号，来感知味道。随后，人工智能（人工神经网络）扮演了味觉皮层的角色，对这些信号进行处理和解读。

这种“自主学习”的能力使得“电子舌头”能够区分相似软饮料或咖啡混合物、检测牛奶是否被稀释、识别变质果汁，甚至检测水中是否存在有害的全氟和多氟烷基物质（PFAS）。

此外，研究人员还利用了一种名为 Shapley Additive Explanations 的方法来分析神经网络的决策过程。这种方法有助于科学家更好地理解人工智能的决策机制，提高其透明度和可解释性。（IT之家）

今日热门视频

近期热门文章

腾讯 Robotics X 无战事

达摩院前传：那些帮淘宝赚过大钱的AI科学家们

3D 视觉派：斯坦福具身智能人物关系图

Leiphone雷峰网

最新精华更多

OpenAI 7年安全元老、华人高管官宣离职，或将回国；颜水成卸任昆仑万维研究院院长；字节自研视频生成模型开放使用丨AI情报局

最新有关Leiphone雷峰网的文章