News

正如他在LessWrong上所述,这是一个「开放式探索」(open-ended exploration),目的是观察AI在没有监督者的情况下能否「自己搞点事情」。 这个实验由AI Digest落地执行:他们选择了四位AI「村民」(Claude 3.7 ...
谷歌 CEO Sundar Pichai 发推表示新推出的 Gemini 2.5 Flash-Lite 是目前性价比最高的 2.5 系列模型。 可以看到,谷歌对 2.5 Flash-Lite 的定位是适合用于「量大且注重成本效率的任务」。相较之下,2 ...
对此,卡耐基梅隆大学(CMU)Infini-Al-Lab 的研究人员拿出了「多元宇宙」Multiverse,这是一个全新的生成式建模框架,支持原生的并行生成。 该研究的一作 Xinyu Yang 表示,Multiverse 的原生并行生成不仅仅是加速 ...
刚刚Sam Altman 接受了一场特别的访谈,主持人是他的弟弟杰克·奥特曼(Jack ...
ALE-Agent为模拟退火算法设计了更高效的邻域搜索策略,通过引入更多样化的移动方式,扩展了解决方案空间的探索,最终将其排名从第82提升至第21(初始代码见此处,第304-342行;最终代码见此处,第492-771行)。
争议的火苗很快被一篇名为《The Illusion of The Illusion of Thinking》的反驳论文点燃,作者是一位名叫Alex Lawsen的独立研究员——以及,他的合作伙伴:大语言模型Claude Opus 4。
这种模块化架构的最大优势在于实现了「稳定核心,可变外围」的设计哲学。当需要适应新领域时,只需更换或添加相应的工作节点,而规划器和协调器可以保持不变,大大降低了系统迁移的复杂度和成本。
其中,MiniMax 启动了「MiniMax Week」,并在第一天开源了其最新的长上下文推理 LLM——MiniMax-M1。该模型支持全球最长的上下文窗口,包括 100 万 tokens 输入、8 万 tokens 输出。
而 GPT 每次“发言”都是基于之前的“语言提示”,并没有“内部记忆”去追踪棋盘状态。即使外部工程实现了记忆机制,它也会在多个回合后“混淆上下文”。这是因为它没有专门为棋类构建的“状态表达结构”,不像 Stockfish ...
这些发现非常重要,因为在商业AI领域,人们往往相信“越大越好”,即更大的数据、更大的算法和更多的标记。苹果的研究发现表明,超过一定点后,规模带来的好处就会消失,并最终崩溃。
5月数据显示,全球顶尖GenAI应用,每位活跃用户的日均使用时长中(基于安卓平台,过去28天的数据),ChatGPT、DeepSeek最高,而谷歌Gemini仅有17秒。 6月最新数据显示,过去一个月,不同应用总访问量,ChatGPT高达54.92亿 ...
2025年6月12日,谷歌云(Google Cloud)遭遇近年来最严重的服务中断事件,其API管理系统出现关键故障,导致全球数十项服务瘫痪长达七小时。此次事故源于服务控制(Service ...