开放数据集文章列表第1页-至顶网频道

开放数据集关键字列表

哈佛大学与谷歌宣布将联合发布一个包含约100万册公版书籍的AI训练数据集，涵盖狄更斯、但丁、莎士比亚等经典作家作品，横跨多种语言与文学体裁。该数据集源自谷歌长期以来的图书扫描项目Google Books。哈佛早在今年3月便透露了"机构数据倡议"（IDI）计划，旨在为AI提供合法可信的训练数据，并获得微软与OpenAI的资金支持。IDI执行总监表示，此举旨在让更多研究机构和AI初创企业平等获取高质量训练数据。

人工智能

开源技术

开放数据集

2026-05-07

谷歌研究院：以开放科学与全球合作推动科学突破

谷歌研究院通过开放源代码软件与开放获取数据集，构建负责任、包容性的科研生态。其开放工具已服务全球逾25万名研究人员与开发者，合作机构涵盖基因组学、医学、气候等多个领域。从非洲能源需求分析到印度医疗分诊应用，开放科学理念正推动全球各地的科研突破。随着AI技术深入科研场景，谷歌将持续构建支持新一代科学发现的工具与基础设施。