欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智东西公开课
Facebook AI开源大型数据集CCMatrix
2020-02-07
机器之心
17
2月7日消息,Facebook AI近日开源数据集CCMatrix,据介绍,它是基于Web的bitexts的最大数据集,用于训练翻译模型。通过从CommonCrawl公共数据集的快照中提取的576种语言,CCMatrix比Facebook去年共享的WikiMatrix语料库大50倍以上。