News
作者介绍:本篇文章的作者团队来自美国四所知名高校:西北大学、乔治亚大学、新泽西理工学院和乔治梅森大学。第一作者束东与共同第一作者吴烜圣、赵海燕分别是上述高校的博士生,长期致力于大语言模型的可解释性研究,致力于揭示其内部机制与 “思维” ...
6月17日,MiniMax 发布了新模型MiniMax M1。 这是一个继续激进地使用线性注意力 Lightning Attention机制的模型,同时它还巧妙地找到一种方式,将这种激进的预训练机制带来的长文本能力用到后训练阶段,提出一种全新的强化学习技巧,从而大幅提高了模型的推理能力。
本站讯(生命科学学院供稿)甜味蛋白因其高甜度,低热量以及安全性高等优势,在食品和医药领域展现出广阔的应用前景。其中,单链monellinI(MNE)作为目前已知甜度最高的甜味蛋白,已成为该领域的研究热点。本实验室前期利用PyRosetta计算平台筛选 ...
现在的大推理模型(LRMs)已经展现出了非凡的推理能力。但是面对这样最简单的数学问题,现有的LRMs仍需要花费1400+的tokens来思考。 那么有办法让 ...
芯片表面缺陷检测对质量控制至关重要,但现有方法在鲁棒性、特征编码等方面存挑战。研究人员提出基于扩散模型和注意力机制的 DASeg-Net,引入 HiLo 等模块。在多数据集上 mIoU 表现优异,为缺陷检测提供新方案。
这篇综述阐述了药物性胆汁淤积(dic)的机制,介绍体外模型及预测方法,探讨未来方向。 引言 药物性肝损伤(Drug-induced liver injury,DILI)是对处方药和其他物质的一种复杂不良反应,在患者发病率、死亡率、医疗系统成本和药物研发方面都带来了严峻挑战。
首先,黑盒攻击的相关研究将逐步增多,黑盒攻击方法不依赖于对模型内部结构的访问,而是通过利用lvlm固有的能力,如光学字符识别(ocr)、逻辑 ...
新智元报道编辑:LRST【新智元导读】武汉大学等发布了一篇大型视觉语言模型(LVLMs)安全性的综述论文,提出了一个系统性的安全分类框架,涵盖 ...
这项方法没有完全脱离现在最主流的全注意力机制,而是设计了一套可以自由切换的方式,让这些模型可以在全注意力和稀疏注意力机制之间切换 ...
DeepSeek最新论文介绍新机制,可使AI模型进一步降本增效,2月18日,DeepSeek团队发布一篇论文介绍了新的注意力机制NSA(NativelySparseAttention,原生稀疏 ...
在深度学习领域,多头注意力机制一直是Transformer模型的核心组成部分,在自然语言处理和计算机视觉任务中取得了巨大成功。然而,研究表明并非所有 ...
Some results have been hidden because they may be inaccessible to you
Show inaccessible results