News

作者介绍:本篇文章的作者团队来自美国四所知名高校:西北大学、乔治亚大学、新泽西理工学院和乔治梅森大学。第一作者束东与共同第一作者吴烜圣、赵海燕分别是上述高校的博士生,长期致力于大语言模型的可解释性研究,致力于揭示其内部机制与 “思维” ...
6月17日,MiniMax 发布了新模型MiniMax M1。 这是一个继续激进地使用线性注意力 Lightning Attention机制的模型,同时它还巧妙地找到一种方式,将这种激进的预训练机制带来的长文本能力用到后训练阶段,提出一种全新的强化学习技巧,从而大幅提高了模型的推理能力。
本站讯(生命科学学院供稿)甜味蛋白因其高甜度,低热量以及安全性高等优势,在食品和医药领域展现出广阔的应用前景。其中,单链monellinI(MNE)作为目前已知甜度最高的甜味蛋白,已成为该领域的研究热点。本实验室前期利用PyRosetta计算平台筛选 ...
据了解,“五用”机制推行以来,该旅高级军士专业贡献率明显提升,高技术人才资源配置更加精准合理。 前不久,某工区在施工中主要装备突然“趴窝”,因工区维修力量薄弱,旅机关及时选调修理骨干、一级军士长唐明钦前去支援。
模型拟合显示,SAW预测的潜变量激活与微跳发生存在显著关联,支持微跳存在触发机制的假说。 模型构建. SAW模型将生理性漂移定性为统计自回避随机游走,在100×100网格上模拟准连续运动。关键参数包括: 激活衰减速率γ(控制记忆持续时间) 步长分布参数r i ...
而随着ChatGPT等大语言模型的爆发式发展,一个问题引起科学家们的注意——这些大模型能否从语言和多模态数据中发展出类似人类的物体概念表征? 传统人工智能研究聚焦于物体识别准确率,却鲜少探讨模型是否真正“理解”物体含义。
记者6月9日从中国科学院自动化研究所获悉,该所与中国科学院脑科学与智能技术卓越创新中心的联合团队在《自然·机器智能》发表相关研究,首次证实多模态大语言模型能够自发形成与人类高度相似的物体概念表征系统,为人工智能认知科学提供了新路径,也为构建类人认知结构的人工智能系统 ...
奇瑞申请基于多数据融合感知的安全识别车辆控制方法及系统专利,可开启车辆安全保护机制 20 分钟 金融界2025年6月7日消息,国家知识产权局信息显示,奇瑞汽车股份有限公司申请一项名为“基于多数据融合感知的安全识别车辆控制方法及系统”的专利,公开号CN120096585A,申请日期为2025年04月。
IT之家 6 月 5 日消息,科技媒体 marktechpost 昨日(6 月 4 日)发布博文,报道称英伟达推出 ProRL 强化学习方法,并开发出全球最佳的 1.5B 参数推理模型 Nemotron-Research-Reasoning-Qwen-1.5B 。. 背景简介. 推理模型是一种专门的人工智能系统,通过详细的长链推理(Chain of Thought,CoT)过程生成最终答案。
本文来自“盘古Pro MoE大模型技术合集”,请登录“智能计算芯知识”获取昇腾大模型实践合集,合集内容:1、昇腾超大规模Pangu MoE模型全 ... 全面介绍 Pangu UltraMoE 面向超大规模参数与高稀疏比场景下所采用的关键技术方案,涵盖模型架构、训练方法 ...
本研究针对公共卫生应急响应机制(PHERM)在应对新发传染病时的效率瓶颈问题,通过整合Horn-Mitte模型与DEMATEL-ISM-MICMAC混合方法,系统解析了19项关键影响因素及其层级关系。研究发现,应急领导行动自觉性(X15)是深层驱动因素,决策指挥反馈能力(X8)为核心结果变量,为优化应急机制提供了 ...