最新文章
大型语言模型也能"快速阅读"?俄勒冈州立大学发现让AI既快又好的神奇组合拳

大型语言模型也能"快速阅读"?俄勒冈州立大学发现让AI既快又好的神奇组合拳

俄勒冈州立大学研究团队开发出滑动窗口注意力适应技术,通过五种方法的巧妙组合,让大型语言模型在处理长文本时既快又好。该技术受人类"粗读细思"启发,结合保留关键信息、混合处理层、思维链推理和专门训练等策略,在保持90%性能的同时将处理速度提升2-8倍,为AI模型的实用化部署提供了切实可行的解决方案。

北大团队让大模型瘦身94%却不失效:从复数魔法到极致压缩的AI新突破

北大团队让大模型瘦身94%却不失效:从复数魔法到极致压缩的AI新突破

北京大学研究团队提出FAIRY2I技术,通过复数表示和相位感知量化将大型语言模型压缩94%。该方法能将现有实数模型无损转换为复数形式,使用四个符号编码权重,并采用递归残差量化进一步优化。在LLaMA-2 7B测试中,压缩后模型保持了接近原始性能的表现,为AI模型的高效部署提供了新路径。

牛津大学研究突破:让死的物体瞬间"活"起来,AI竟能看懂任何东西的关节结构

牛津大学研究突破:让死的物体瞬间"活"起来,AI竟能看懂任何东西的关节结构

牛津大学与剑桥大学联合开发的PARTICULATE系统实现了重大突破,能够仅通过观察静态三维物体就完全理解其内部结构和运动机制。该系统采用transformer网络架构,可在10秒内精确识别物体的各个部件、运动关系和参数约束,显著超越现有方法。这项技术为机器人操作、游戏开发、工业设计等领域带来革命性改变。

德州大学达拉斯分校提出CosineGate:用余弦不兼容性实现深度神经网络的智能计算管控

德州大学达拉斯分校提出CosineGate:用余弦不兼容性实现深度神经网络的智能计算管控

德州大学达拉斯分校研究团队开发了CosineGate技术,通过余弦不兼容性比率(CIR)判断神经网络中每个处理单元是否需要工作,从而实现智能计算资源管控。该技术能在保持91.3%准确率的同时节省28.5%计算资源,特别适合在电池供电设备上部署AI应用,为解决边缘计算能耗问题提供了新思路。

大语言模型的记忆难题:斯坦福团队让AI在处理长文本时边学边忘,速度提升却效果不减

大语言模型的记忆难题:斯坦福团队让AI在处理长文本时边学边忘,速度提升却效果不减

斯坦福大学研究团队提出TTT-E2E方法,让大语言模型在处理长文本时采用"边读边学"策略,将理解的信息压缩存储到模型参数中而非逐字记忆。该方法在处理12.8万字文本时速度比传统全注意力机制快2.7倍,同时保持相同理解能力,为AI长文本处理提供了效率与性能并重的新解决方案。

浙江大学团队揭秘AI训练新发现:为什么主流的LoRA方法竟然不是最佳选择

浙江大学团队揭秘AI训练新发现:为什么主流的LoRA方法竟然不是最佳选择

这项由浙江大学等多所院校联合完成的研究首次系统评估了12种参数高效微调方法在强化学习环境下的表现,发现广泛使用的LoRA方法并非最佳选择。通过大规模实验,研究团队证明DoRA等结构变体方法表现更优,SVD初始化策略因机制冲突而失败,极端参数压缩存在表达能力瓶颈。

扩散模型遇上文字:当连续流遇到离散符号,新加坡南洋理工大学揭示语言生成的核心难题

扩散模型遇上文字:当连续流遇到离散符号,新加坡南洋理工大学揭示语言生成的核心难题

新加坡南洋理工大学研究团队深入分析了扩散模型在语言生成中的根本挑战。研究发现,现有扩散语言模型都无法同时满足扩散机制和语言特性的全部要求,存在信息分布不均匀的"频率坍塌"问题和多词依赖关系缺失的"边际陷阱"。研究为未来开发更完善的扩散语言模型指出了信息感知腐蚀和结构依赖建模等发展方向。

HPE Unix系统HP-UX正式终结42年历史

HPE Unix系统HP-UX正式终结42年历史

HPE旗下Unix系统HP-UX 11i v3最终版本已于去年底结束支持,标志着这一始于1982年的操作系统产品线正式终结。该系统经历了从HP FOCUS处理器到摩托罗拉68000,再到PA-RISC架构的演进历程。最后几个版本仅支持英特尔安腾处理器,随着2021年安腾处理器停产,HP-UX失去硬件支撑而走向终结。

AI基础设施革命:2026年数据中心发展预测

AI基础设施革命:2026年数据中心发展预测

AI正成为数据中心行业最具颠覆性的力量。2025年AI加剧了电力危机,代理AI技术进一步推高了数据中心需求,AWS和Cloudflare等大型服务商的重大故障凸显了基础设施韧性的重要性。展望2026年,液冷系统将加速普及,AI基础设施监管将趋严,边缘AI部署增长,量子-AI融合准备启动,现场电源投资将增加,这些趋势将持续重塑数据中心行业格局。

Vertiv斥资10亿美元收购PurgeRite布局液冷市场

Vertiv斥资10亿美元收购PurgeRite布局液冷市场

数字基础设施巨头Vertiv完成10亿美元收购休斯顿PurgeRite公司,该公司专门为数据中心提供机械冲洗、净化和过滤服务。这项收购旨在增强Vertiv的热管理服务能力,以应对不断增长的冷却需求和历史性的数据中心需求。液体冷却服务对维持AI应用和高性能计算中闭环液体冷却的效率和可靠性至关重要。据研究报告,液体冷却市场预计到2030年将达到177亿美元。

巴林如何构建区域领先的数字经济体系

巴林如何构建区域领先的数字经济体系

巴林过去十年致力于构建具有竞争力的数字经济基础设施,将技术和数字化转型置于国家愿景核心。该国率先在中东地区建立超大规模云区域,AWS于2018年在此设立数据中心。金融科技领域的早期监管创新使该行业在2022年超越石油成为GDP最大贡献者。巴林实现全国5G覆盖,互联网普及率达100%。通过"巴林团队"模式,投资者可直接对接监管机构和决策者,加速市场准入。

阿联酋阿布扎比发布Falcon大语言模型,构建国家AI治理新模式

阿联酋阿布扎比发布Falcon大语言模型,构建国家AI治理新模式

阿布扎比通过技术创新研究院打造了结构化的AI发展体系,将研究、治理与部署紧密结合。其自主研发的大语言模型Falcon于2023年发布,以开源形式获得国际关注。新成立的猎鹰基金会进一步推动生成式AI模型开源化,汇聚开发者、学术界和政策制定者协作。该模式在保持技术主权的同时促进创新,为全球负责任的AI发展提供了独特范例。

2025年Q3全球云基础设施支出达1026亿美元,AI应用推动增长

2025年Q3全球云基础设施支出达1026亿美元,AI应用推动增长

2025年第三季度全球云基础设施服务支出达1026亿美元,同比增长25%,这是连续第五个季度增长超过20%。AWS、微软Azure和谷歌云三大巨头占据66%市场份额,合计增长29%。云服务商竞争重点从AI模型性能转向平台级能力建设,支持多模型部署和AI智能体实际应用。AWS以32%市场份额领跑,微软Azure占22%,谷歌云占11%。

新加坡电信试点50Gbps光纤支持未来AI与云计算负载

新加坡电信试点50Gbps光纤支持未来AI与云计算负载

新加坡电信启动50Gbps光纤宽带技术试点,成为新加坡首家测试该技术的运营商。该试点基于10Gbps对称无源光网络技术,旨在为未来3至5年内主流的带宽密集型应用提供基础设施支持。随着人工智能、混合现实和高保真云计算的普及,网络吞吐量和延迟性能需求将大幅提升。该举措符合新加坡数字连接蓝图规划,将支持远程办公、医疗影像传输和VR理疗等应用场景。

Pioneer发布Sphera设备为现有汽车带来高端CarPlay功能

Pioneer发布Sphera设备为现有汽车带来高端CarPlay功能

先锋在CES 2026上发布新款Sphera车载后装接收器,首次将杜比全景声和空间音频功能引入普通汽车。该产品采用10.1英寸高清触控屏,通过"Pure Autotuning"技术优化4声道方案,充分利用现有前后扬声器。此前这些高端音频功能仅在少数特定车型中提供。Sphera售价1300美元起,将于2026年春季上市,为希望升级CarPlay的用户提供优质解决方案。

Twelve South推出Valet无线充电收纳托盘

Twelve South推出Valet无线充电收纳托盘

Twelve South发布了新款Valet产品,这是一款集Qi2无线充电与皮革收纳托盘于一体的配件。该产品支持最高15W无线充电,兼容iPhone和AirPods,还配备15W USB-C接口。产品采用Nappa真皮和金属框架制作,提供黑色和灰褐色两种皮革选择,外框可拆卸更换。具备Goodnight Glow充电指示功能,可通过脉冲光确认充电状态。售价179.99美元,现已开放预订。

苹果应该放弃自研模型,全面转向第三方AI服务

苹果应该放弃自研模型,全面转向第三方AI服务

最新报告显示,苹果可能放弃自研AI模型开发,转而采用谷歌Gemini等第三方模型作为Siri后端。经过两年等待,苹果AI进展缓慢,用户仍在期待更智能的Siri。分析认为,苹果应充分利用领先AI公司的最佳模型,在自家PCC服务器上运行以确保隐私保护。这种方法既能提供顶级AI性能,又能维持苹果的隐私承诺,比自研模型更具优势。

苹果设备新年优化指南:提升健康与工作效率

苹果设备新年优化指南:提升健康与工作效率

通过合理使用苹果设备可以轻松养成新年好习惯。建议利用Apple Watch进行睡眠追踪,在晨间例行公事时充电;移除耗时应用并关闭多数通知以改善心理健康;创建良好的文件夹结构整理桌面和下载文件夹;在邮件、备忘录和日历应用中建立分类系统;设置本地时间机器备份和云端存储确保数据安全;定期检查并取消不必要的订阅服务;审查应用权限特别是位置服务设置保护隐私。

Thine推出iPhone智能记录应用挑战AI硬件设备

Thine推出iPhone智能记录应用挑战AI硬件设备

Thine公司在CES 2026上展示了基于iPhone的AI笔记应用,CEO认为无需开发专用硬件设备,直接利用手机现有的麦克风和Siri功能即可实现对话记录和转录。该应用训练AI模型分析对话记录,用户可询问特定对话内容。目前月费200美元,主要面向高管用户,但随着技术改进和规模扩大,价格有望大幅下降。公司不存储音频文件,正在开发提供完整转录文本的新版本,长期存储和安全保护是主要成本。

DDN表示基于Lustre的EXAScaler仍是核心产品

DDN表示基于Lustre的EXAScaler仍是核心产品

尽管多名Lustre高级工程师从DDN离职成立咨询公司Lustre Collective,DDN仍坚持其基于Lustre的EXAScaler平行文件系统的核心地位。DDN表示,EXAScaler与对象存储软件Infinia是互补而非竞争关系。EXAScaler在高性能计算和AI训练中表现优异,速度比市场其他产品快17倍,是Google Managed Lustre服务的基础。Infinia专注于AI管道的数据管理,两者在统一控制平面下协同工作。