英伟达发布名为Granary的大规模开源多语言音频数据集,包含超过100万小时音频、65万小时语音识别和35万小时语音翻译数据,涵盖25种欧洲语言。同时推出Canary-1b-v2和Parakeet-tdt-0.6b-v6两个AI模型,用于语音翻译和转录任务。该数据集在GitHub免费开放,可帮助开发者为小众语言创建更包容的语音技术。