绑定手机号
获取验证码
确认绑定
欢迎来智东西
登录
免费注册
关注我们
智东西
车东西
芯东西
智东西公开课
订阅成功
扫码关注智东西Plus
接受订阅信息更新提醒
斯坦福发布全新NLP处理工具包

1月31日消息,Stanford NLP团队发布了包含 53 种语言预训练模型的自然语言处理工具包 StanfordNLP,该工具包支持 Python 3.6 及之后版本,并基于 PyTorch,支持多种语言的完整文本分析管道,包括分词、词性标注、词形归并和依存关系解析,此外它还提供了与 CoreNLP 的 Python 接口。StanfordNLP不仅提供 CoreNLP 的功能,还包含一系列工具,可将文本字符串转换为句子和单词列表,生成单词的基本形式、词性和形态特征,以及适用于70余种语言中的句法结构。

订阅
订阅NLP最新消息
订阅斯坦福最新消息
相关快讯
  • 07月29日 11:58
    LinkedIn开源NLP任务框架DeText

    7月28日,LinkedIn今日发布了DeText,一个用于与自然语言过程相关的排名,分类和语言生成任务的开源框架。它利用语义匹配,使用深度神经网络来了解搜索和推荐系统中的成员意图。作为一个通用框架,LinkedIn表示可以将其应用于一系列任务,包括搜索和推荐排名,多类别分类和查询理解。

    来源:机器之心
  • 07月06日 15:22
    前美团NLP部门负责人王仲远任脉脉CTO

    7月6日消息,前美团点评搜索与NLP(自然语言处理)部门负责人王仲远已于今日正式履新,加盟职场社交平台脉脉担任合伙人、CTO,负责内容、增长等业务,直接向脉脉创始人兼CEO林凡汇报。

    来源:36氪
  • 07月03日 19:41
    美团搜索与NLP部门负责人王仲远离职

    7月3日消息,美团点评“搜索与NLP(自然语言处理)”部门负责人王仲远近期离职。在今年年初的组织架构调整中,该部门被纳入新成立的AI平台,夏华夏为负责人,向王慧文汇报。据知情人士透露,王仲远的下一站可能是硅谷明星创业公司Newsbreak,也有可能是快手。

    来源:36氪
  • 06月18日 20:26
    艾伦人工智能研究所发布AllenNLP 1.0

    6月18日消息,艾伦人工智能研究所发布AllenNLP 1.0。AllenNLP的1.0版本包括超过500个GitHub提交成果。从文档到添加新的NLP组件到调整API,研究人员几乎对平台的每个角落都进行了改进,以便它们可以长期更好地为社区服务。AllenNLP库于2017年启动,提供可轻松组合以构建新颖模型的自然语言组件。AllenNLP平台旨在加速利用ELMo等通用模块以及此后开发的其他模块的新研究。

    来源:机器之心
  • 06月18日 20:13
    吴恩达NLP课程上线Coursera

    6月18日消息,吴恩达NLP课程上线Coursera。该课程目前已经开放免费注册,共分11周完成。课程主要包含四部分内容:利用分类和词向量做NLP;利用概率模型做NLP;利用序列模型做NLP;利用注意力模型做NLP。授课者包括斯坦福讲师Younes Bensouda Mourri、谷歌大脑科学家Łukasz Kaiser和DeepLearning.ai产品主管Eddy Shyu。

    来源:机器之心
  • 06月11日 18:14
    宗成庆将出任ACL-IJCNLP 2021主席

    6月11日消息,第59届ACL大会暨第十届自然语言处理国际联席会议(ACL-IJCNLP 2021)将于2021年8月1日至6日在泰国曼谷举行。中国科学院自动化研究所宗成庆研究员将担任大会总主席,他曾担任2015年ACL-IJCNLP大会的程序委员会主席。

    来源:智东西
  • 04月14日 14:34
    云知声3篇论文被NLP顶会ACL 2020收录

    4月14日消息,日前,自然语言处理领域国际顶级会议ACL 2020论文接收结果公布。大会共收到3429篇投稿论文,云知声-中科院自动化所“语言与知识计算联合实验室”共有3篇论文被收录,分别在医疗对话的自动信息抽取、国际疾病分类(ICD)自动编码,以及ICD自动编码可解释性等领域取得突破。据悉,这些最新的自然语言处理算法将为后续研究提供极具价值的经验和方向,已在云知声医疗业务率先应用。

    来源:智东西
  • 03月27日 18:42
    Nature:斯坦福团队利用ML筛查肺癌

    3月27日消息,在Nature近日发表的最新论文中,来自斯坦福大学的Maximilian Diehn及其同事,优化了一种现有的评估循环肿瘤DNA(ctDNA)的测序方法。他们改善了DNA的提取,鉴定出有望作为有效疾病标记的变化。研究人员用该方法表明,尽管ctDNA在早期肺癌患者体内水平很低,却是一个很有力的预后指标。

    研究人员随后用这些数据改进了一种机器学习方法,将其用来预测血样中存在的肺癌源性DNA。在由104例早期非小细胞肺癌患者和56例匹配对照组成的初期样本中,这种方法可以区分早期肺癌患者与风险匹配的对照;在另一个由46例病例和48例对照组成的独立验证队列中,研究人员确认了以上结果。

    来源:机器之心
  • 03月23日 18:52
    斯坦福开源Python版NLP库Stanza

    3月23日消息,近日,斯坦福开源Python版NLP库Stanza,该库有60多种语言的模型,可进行命名实体识别等NLP任务。目前,该项目可直接从pip进行安装。据悉,Stanza在Universal Dependencies v2.5数据集上进行了预训练,包括简体、繁体、古文中文,英语、法语、西班牙语、德语、日语、韩语、阿拉伯语等,甚至还有北萨米语等不太常见的语言。除了语言模型外,Stanza还支持了数十种语言的命名实体识别模型。

    来源:机器之心
  • 03月11日 21:53
    Google AI研发出更有效NLP预训练方法

    3月11日消息,Google AI发博表示,在其新论文《ELECTRA:将文本编码器作为标识符而不是生成器进行预训练》中,研究人员采用了另一种方法进行语言预训练,该方法保持了BERT的优点,但学习效率更高。ELECTRA是一种新的预训练方法,比如,ELECTRA使用仅四分之一的算力就可以在GLUE自然语言理解基准上达到RoBERTa和XLNet的性能,并在SQuAD问答基准上获得最优的结果。ELECTRA出色的效率意味着即使在小规模的情况下也能很好地运行。ELECTRA已作为TensorFlow之上的开源模型发布,其中包括许多易于使用的预训练语言表示模型。

    来源:机器之心
加载更多 ···