芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西11月6日报道,近日,AMD推出全新Alveo UL3422金融科技加速卡,专为超低时延电子交易应用打造,可助力全球对速度要求最严苛的交易执行。该加速卡正在量产中。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

Alveo UL3422还实现非常快的Tick-to-Trade交易反应速度,网络I/O时延低至13.9纳秒,可迅速进行全球交易。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

AMD自适应和嵌入式计算事业部的高级产品线经理Shyam Chander负责加速卡产品组合的硬件战略、路线图规划、产品管理。他分享了AMD如何应对各种算法交易用例。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

总体分成了三类:左边是时延低于20纳秒的超低时延FPGA,这类交易对速度要求高,算法非常简洁明了;中间是时延低于100纳秒的低时延FPGA,包括FPGA和自适应SoC,对时间要求相对宽松,算法复杂程度会有所提高,数据量也会更加大;第三类是传统的CPU交易,延时低于1000纳秒,在处理过程中数据主要通过CPU的主机来进行处理和计算,数据传输是通过NIC实现的。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

针对上述不同交易用例,AMD提供不同的算法交易产品组合。最左侧是新推出的Alveo UL3422和之前的Alveo UL3524产品;中间是更加标准化的产品,Alveo V80就能满足这方面的要求;最右侧Alveo X3522能支持低时延CPU交易,EPYC、锐龙均能满足相关工作负载和用例需求。

一、超低时延,高频交易服务器共置的关键

AMD通过高性能和自适应计算来推动金融领域数字转型。金融行业需要处理很多数据并进行即时交易。尤其是HFT(高频交易),堪称超低时延竞赛,每一纳秒都对交易执行至关重要,是降低成本和获得利润的关键。

高频交易主要有三大特点:

首先,要求超低时延,只差几微秒可能就是从盈利几百万美元到亏损之间的差别。

第二,基础设施成本非常关键,进行高频交易经常需要在交易所租用服务器,实现交易所服务器共置,需要考量基础设施、产品尺寸、机架上服务器数量等。巨额的市场数据对于提高速度也很重要,很多高频交易公司都是在交易所邻近处来部署基础设施。

第三,算法能够给高频交易带来优势,自适应计算还能帮助高频交易的交易商来实现监管合规、提高效率。

世界交易所联合会的研究显示,全球前25大交易所合计市值超过100万亿美元,交易所高频交易服务器共置非常关键的要求就是确保最低时延,同时能够获得非常丰富的市场数据。由于机架空间有限,对成本要求也很高,需要器件封装尺寸尽可能小,功耗、所需要调配网络的数量、服务器数量等都是关键因素。

二、解读Alveo UL3422架构,GTF收发器是“杀手锏”

AMD Alveo UL3422金融科技加速卡采用专门设计的芯片,基于Virtex UltraScale+ VU2P FPGA,有一个单插槽,带有GTF收发器,可降低应用门槛,搭配AMD开发工具来提升性能,并可以实现RTL流以及硬件的灵活性,进行生态化部署。

全新加速卡尺寸纤薄,全高半长,适用于1U服务器,能够优化机架空间、电力输送和主机共置开销,灵活适用于2U和4U服务器配置,可增加每台服务器卡的数量。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

与之前的Alveo UL3524加速卡相比,Alveo UL3422精简了功能集,减少了端口密度及板载内存,可实现更高的经济性。Alveo UL3422还有两个网络端口,分别连接10G和25G规格。它也能够实现和外部单元的交互,确保获得精准的时间戳记。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

Alveo UL3524的端口密度更高,能处理更多的数据交易和馈送,甚至可以实现QDR的内存,执行更加复杂的交易策略,来满足更多的用例需求,但封装尺寸也大一些。新发布的Alveo UL3422则能兼顾性能、超低时延和小尺寸的平衡,可实现更具性价比的部署。

Alveo UL3422可实现交易所主机共置,适用于很多系统,也就是在Tick-to-Trade基础设施中实现超低时延,而且能进行实时的数据送达和交易执行。其算法还支持交易前的风险检测,可减少错误发生,并更好地满足合规要求。

AMD主要通过GTF收发器来实现超低延时的目标,采用的GTF收发器比之前的GTY收发器性能提升约7倍。两种收发器的网络协议都是一样的,但GTF实现了最大的硬化,而Tick-to-Trade网络I/O时延能够降低40%-49%,相当于14纳秒(13.9纳秒)。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

Shyam Chander补充说,Virtex UltraScale+所有纳米级别的产品上有可以有GTY收发器,但专为超低时延市场开发的GTF收发器仅在Virtex UltraScale+ VU2P FPGA芯片上。

FPGA架构和DSP块能够针对不断演进的交易策略进行灵活加速,内置RAM也可以实现快速内存存取,DDR4可用于存储订单簿信息、历史定价数据。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

针对传统FPGA开发者来说,其硬件非常灵活,能够适应不断演进的交易、算法和监管要求。用户可以使用熟悉的FPGA工具流程,借助AMD的Vivado设计套件进行RTL设计。AMD还针对时延基准测试推出了参考设计,可评估时延并集成自定义算法。

Alveo UL3422搭配有丰富的IP工具包和生态系统解决方案,可支持高效部署。

AMD推出金融科技加速卡,时延不到20纳秒,满足高频交易刚需

结语:为高频交易带来性价比之选

在金融科技市场,算法、合规方面都在不断变化,具备灵活可编程性的FPGA能够快速适应这些变化,以实现利润最大化。

总体来看,Alveo UL3422金融科技加速卡支持超低时延交易执行,其网络I/O传输可支持超快交易反应速度,再加上纤薄尺寸规格、极具性价比的部署、配套丰富的工具与生态系统解决方案,有助于降低应用门槛,实现广泛采用。

Shyam Chander说,乍一看这款加速卡可能会觉得有点贵,但它能带给金融科技领域高频交易的客户非常大的价值,因为纳秒级差异就可能会导致几百万美元的损失或盈利。Alveo UL3422的设计充分考虑到交易所的机架空间、接头数量、网络配置等需求,能够有效节约资本支出和运营支出。

除了金融科技外,Alveo UL3422也可以用在需要超低时延的科研活动中。