模型压缩 关键字列表
Refiant AI获500万美元融资,以"自然启发"算法大幅压缩模型能耗

Refiant AI获500万美元融资,以"自然启发"算法大幅压缩模型能耗

初创公司Refiant获500万美元种子轮融资。该公司研发出“受自然启发”的AI模型压缩算法,能在保持极高保真度的情况下,将模型能耗降低80%以上。其已成功让1200亿参数模型在普通笔记本上运行,旨在解决AI领域的能耗危机。

Multiverse Computing将压缩AI模型推向主流市场

Multiverse Computing将压缩AI模型推向主流市场

面对私人公司违约率高达9.2%的金融风险,多元宇宙计算提供了新的解决方案。这家西班牙初创公司推出CompactifAI应用和API门户,展示其量子启发压缩技术的能力。该技术可将OpenAI、Meta等主要AI实验室的模型进行压缩,使其能在用户设备上本地运行,无需依赖外部计算基础设施,从而消除对手方风险并提供更好的隐私保护。

西班牙准独角兽Multiverse Computing发布免费压缩AI模型

西班牙准独角兽Multiverse Computing发布免费压缩AI模型

西班牙初创公司Multiverse Computing发布了基于量子计算技术的AI模型压缩解决方案CompactifAI。该公司在Hugging Face平台免费开放HyperNova 60B模型,该模型仅32GB大小,约为OpenAI原始模型的一半,但保持了相近的性能和准确性,同时具备更低的内存使用率和延迟。公司正寻求5亿欧元融资,估值超15亿欧元,年经常性收入据报达1亿欧元,客户包括西门子博世、加拿大银行等大型企业。

欧洲AI明星公司发布全球最小高性能模型

欧洲AI明星公司发布全球最小高性能模型

西班牙AI初创公司Multiverse Computing发布两款超小型AI模型,分别命名为"鸡脑"和"苍蝇脑"。该公司声称这是全球最小的高性能模型,具备聊天、语音和推理能力。这些模型专为物联网设备、智能手机和平板电脑设计,可在无网络连接情况下本地运行。公司采用量子启发的CompactifAI压缩技术,在不牺牲性能的前提下大幅缩小模型体积。

AI系统现代架构优化的六大发展方向

AI系统现代架构优化的六大发展方向

随着AI模型参数达到数十亿甚至万亿级别,工程团队面临内存约束和计算负担等共同挑战。新兴技术正在帮助解决这些问题:输入和数据压缩技术可将模型压缩50-60%;稀疏性方法通过关注重要区域节省资源;调整上下文窗口减少系统资源消耗;动态模型和强推理系统通过自学习优化性能;扩散模型通过噪声分析生成新结果;边缘计算将数据处理转移到网络端点设备。这些创新方案为构建更高效的AI架构提供了可行路径。

Multiverse Computing获2.15亿美元融资,推进量子启发AI模型压缩技术

Multiverse Computing获2.15亿美元融资,推进量子启发AI模型压缩技术

Multiverse Computing宣布完成2.15亿美元B轮融资,用于加速部署其量子计算启发的AI模型压缩技术。该技术可将大语言模型体积缩小95%而不影响性能表现,大幅降低AI推理成本。公司的CompatifAI技术采用量子启发算法和先进张量网络,能识别并剔除AI模型中的冗余部分。压缩后的模型运行速度提升4-12倍,推理成本降低50%-80%,可在云端、本地数据中心甚至边缘设备上运行。

Microsoft研究人员称开发出可在 CPU 上运行的超高效 AI 模型

Microsoft研究人员称开发出可在 CPU 上运行的超高效 AI 模型

微软团队推出名为 BitNet b1.58 2B4T 的 2 亿参数 1 位模型,通过将权重量化为 -1、0、1,实现了内存和运算效率的显著提升,并能在 CPU(如苹果 M2)上运行,但目前仅支持特定硬件。