提升人工智能
必要的训练数据
人工智能的质量依赖于强大的多样化训练数据。160 多年来,路透社一直致力于提供准确可靠、不偏不倚的信息,我们的新闻质量就是最好的证明。
路透社拥有 4,500 多万份可完全授权的新闻内容,其中包含复杂的元数据。无论您在进行什么项目,路透社的资料都是不可或缺的训练数据来源。
Be the first to know
Want to stay up to date on our machine learning & AI updates? Subscribe to our email updates and you’ll never miss a beat.
多样化功能
路透社新闻数据有何独到之处?
Rights: Reuters has the proprietary rights to our data corpus and visual assets
Trust & Accuracy: Over 2000 media companies rely on Reuters news to make editorial and business decisions every day. Guided by Reuters Trust principles, our news preserves integrity, independence and freedom from bias
Diversity: Broad coverage of major topics from over 200 global locations and 16 languages, including business, finance, politics, sports, entertainment, technology, and much more
Metadata: Our advanced metadata contains regional and category-specific codes, allowing for intelligent grouping
新闻数据用例
机器翻译
3,000 万篇文章、16 种语言。机器翻译可以通过搜索平行语句,将我们数量庞大的新闻报道翻译成多种语言。
训练
高级图像元数据便于对我们 1,300 多万张图像所组成的图像集中的动作和事件加快检测。
语音转文字
在 80 多万个视频素材中进行隐藏式字幕和视频脚本训练,并以此推进高级训练,以识别人物、场景和原声录音。
知识图谱
富含实体的数据不仅能提供语境价值,还有助于构建复杂的知识图谱。