数学计算文章列表第1页

LIVE INDEX / 数学计算

2026-02-27

最新ORCA基准测试显示，当前主流AI模型在数学问题上表现依然不佳。500道实用数学题测试中，表现最佳的Gemini 3 Flash准确率仅达72.8%，相当于C级成绩。研究发现，AI模型本质上是预测引擎而非逻辑引擎，基...

2025-11-18

波兰研究团队开发ORCA数学基准测试，对五个主流大语言模型进行评估。结果显示ChatGPT-5、Gemini 2.5 Flash、Claude Sonnet 4.5、Grok 4和DeepSeek V3.2的准确率均低于...

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026