欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智东西公开课
DeepMind推新方法 验证符号替换稳健性
2019-09-12
机器之心
14
9月12日消息,来自DeepMind以及伦敦大学学院的研究团队近日发表了一篇名为《通过区间界限传播实现对符号替换的验证稳健性》的研究。据介绍,神经网络是许多当代NLP系统的一部分,但它们的经验成功是以对抗性攻击的脆弱性为代价的。该研究正式验证系统对预定义的一类对抗性攻击的鲁棒性,研究人员着眼于同义词替换或字符翻转扰动下的文本分类,并建议将这些输入扰动建模为单形,然后使用区间界限传播。
研究团队还修改了传统的对数似然训练目标,以训练可以有效验证的模型,否则这些模型将具有指数搜索复杂性。由此产生的模型在标称精度方面只显示出很小的差异,但是在扰动下已经大大提高了验证的准确性,并且在最坏对抗情况的对手中提供了有效的可计算的正式保证。
DeepMind