欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智东西公开课
智东西
车东西
芯东西
公开课
公开课官网
公开课小程序
GTIC
快讯
头条
人工智能
芯东西
AIoT
云与智慧城市
机器人
VR/AR
活动
Facebook AI开源大型数据集CCMatrix
2020-02-07
机器之心
17
2月7日消息,Facebook AI近日开源数据集CCMatrix,据介绍,它是基于Web的bitexts的最大数据集,用于训练翻译模型。通过从CommonCrawl公共数据集的快照中提取的576种语言,CCMatrix比Facebook去年共享的WikiMatrix语料库大50倍以上。
分享至: