《交易技术前沿》第56期(人工智能行业应用)

发布时间:2024-7-05 | 杂志分类:其他
免费制作
更多内容

《交易技术前沿》第56期(人工智能行业应用)

近年来,习近平总书记多次强调,面对新一轮科技革命和产业变革,必须抢抓机遇,加大创新力度。2024年《政府工作报告》首次将“大力开展‘人工智能+行动’”写入其中。面对人工智能新科技浪潮,行业不断深入探索人工智能应用,在智能投顾、智慧经纪、数字员工等方面不断培育新动能,促进行业新发展。本期《交易技术前沿》以“人工智能行业应用”为主题,精选行业关于人工智能技术探索与实践应用方面的优秀文章,为行业落地人工智能,推动数字化转型提供参考。国金证券的《证券行业大语言模型优化方法与应用示范》针对证券公司大规模使用大语言模型面临的数据治理、数据安全和技术集成等问题,提出了一种结合检索式问答生成模型、提示工程、以及Agent技术的综合技术路径。上交所的《基于人工智能的动态中点订单研究与建议》介绍了纳斯达克交易所基于AI的动态中点订单,对动态中点订单机制原理和演进历程进行综述,并提出加强相关证券市场微观机制研究的建议。中信建投证券的《知识图谱:驱动员工能力的引擎与机遇》聚焦证券公司财富管理机构的协同工作等问题,建立员工赋能平台项目,将知识图谱与大语言模型等相关技术结合,弥补了金融领域数据缺少组织结构、价值密... [收起]
[展开]
《交易技术前沿》第56期(人工智能行业应用)
粉丝: {{bookData.followerCount}}
文本内容
第1页

交易技术前沿

主题:人工智能行业应用

2024 年 第 2 期 总第 56 期

证券信息技术研究发展中心(上海)

内部资料 免费交流

《准印证》编号沪(K)0671

P16 知识图谱:驱动员工能力的引擎与机遇

中信建投证券 潘建东、王赵鹏、马张晖等

P21 人工智能大模型在证券行业应用路径与实践

招商证券 邓维、易卫东

P26 基于深度强化学习的客户资产均衡建模

申万宏源证券 王瑜、褚丽恒、刘敏慧等

P31 云原生GPU虚拟化在证券投行业务的创新实践

国泰君安证券 谢杨军、王一帆

P11 基于人工智能的动态中点订单研究与建议

上交所 丁逸俊、张伟、徐广斌等

P02 证券行业大语言模型优化方法与应用示范

国金证券 王洪涛

第2页

交易技术前沿

2024 年 第 2 期 总第 56 期

总编

邱 勇 蔡建春

副总编

王 泊

执行总编

薛 钧

责任编辑

徐广斌 徐 丹 陆 伟

王 昕 黄 淦

运营:

证券信息技术研究发展中心(上海)

主管、主办:

上海证券交易所

交易技术前沿

主题:人工智能行业应用

2024 年 第 2 期 总第 56 期

证券信息技术研究发展中心(上海)

内部资料 免费交流

《准印证》编号沪(K)0671

P16 知识图谱:驱动员工能力的引擎与机遇

中信建投证券 潘建东、王赵鹏、马张晖等

P21 人工智能大模型在证券行业应用路径与实践

招商证券 邓维、易卫东

P26 基于深度强化学习的客户资产均衡建模

申万宏源证券 王瑜、褚丽恒、刘敏慧等

P31 云原生GPU虚拟化在证券投行业务的创新实践

国泰君安证券 谢杨军、王一帆

P11 基于人工智能的动态中点订单研究与建议

上交所 丁逸俊、张伟、徐广斌等

P02 证券行业大语言模型优化方法与应用示范

国金证券 王洪涛

第3页

近年来,习近平总书记多次强调,面对新一轮科技革命和产业变革,必须抢抓机遇,加大创

新力度。2024年《政府工作报告》首次将“大力开展‘人工智能+行动’”写入其中。面对人工

智能新科技浪潮,行业不断深入探索人工智能应用,在智能投顾、智慧经纪、数字员工等方面不

断培育新动能,促进行业新发展。本期《交易技术前沿》以“人工智能行业应用”为主题,精选

行业关于人工智能技术探索与实践应用方面的优秀文章,为行业落地人工智能,推动数字化转型

提供参考。

国金证券的《证券行业大语言模型优化方法与应用示范》针对证券公司大规模使用大语言模

型面临的数据治理、数据安全和技术集成等问题,提出了一种结合检索式问答生成模型、提示工

程、以及Agent技术的综合技术路径。

上交所的《基于人工智能的动态中点订单研究与建议》介绍了纳斯达克交易所基于AI的动态

中点订单,对动态中点订单机制原理和演进历程进行综述,并提出加强相关证券市场微观机制研

究的建议。

中信建投证券的《知识图谱:驱动员工能力的引擎与机遇》聚焦证券公司财富管理机构的协

同工作等问题,建立员工赋能平台项目,将知识图谱与大语言模型等相关技术结合,弥补了金融

领域数据缺少组织结构、价值密度低、难使用的不足。

招商证券的《人工智能大模型在证券行业应用路径与实践》探讨了证券业如何借助大模型技

术进行“数智化”转型。文章分析了大模型的应用场景、实践案例和技术路径,并对国内外实践

案例进行梳理,展望了行业未来的挑战与趋势。

申万宏源证券的《基于深度强化学习的客户资产均衡建模》将人工智能技术与资产均衡理论

相结合,采用深度强化学习对客户资产均衡性进行建模,从客户兴趣、资产多样性、等多个维度

打通数据底座到智能化应用通路,为客户提供个性化投资建议。

刊首语

证券信息技术研究发展中心(上海)

2024年6月7日

第4页

目 录

P16 知识图谱:驱动员工能力的引擎与机遇

潘建东、王赵鹏、马张晖、刘国杨、孙冰、尹序鑫、訾顺遥、梁彬

/中信建投证券股份有限公司

P21 人工智能大模型在证券行业应用路径与实践

邓维、易卫东

/招商证券股份有限公司

P26 基于深度强化学习的客户资产均衡建模

王瑜、褚丽恒、刘敏慧、梁钥、侯立莎、邱子聪、石宏飞、李海英

/申万宏源证券有限公司

P31 云原生GPU虚拟化在证券投行业务的创新实践

谢杨军、王一帆

/国泰君安证券股份有限公司

P11 基于人工智能的动态中点订单研究与建议

丁逸俊、张伟、徐广斌、陆伟

/上海证券交易所

P02 证券行业大语言模型优化方法与应用示范

王洪涛

/国金证券股份有限公司

P46 基于《证券期货业信息系统压力测试指南》的

集中交易系统压力测试实践

王岐、王晓龙、李鑫、赵晓红、刘震、于召洋

/中信建投证券股份有限公司

P50 交易全链路追踪监控实践

应国力、李健舒、王海兵、张贺龙、刘军

/上海金融期货信息技术有限公司

P53 证券核心交易系统代码审计平台建设实践

华仁杰、唐淑艳、华焰、施爱博

/东吴证券股份有限公司

P42 业务流程治理体系探索及实践

徐鑫鑫、陈心亮、李军林

/中国证券登记结算有限责任公司上海分公司

P35 东方证券IT研发运营标准化探索与实践

李晨辉、赵泽、王国喜

/东方证券股份有限公司

P64 持续测试助力业务价值高质量交付

陈洪炎、吴鑫、屠栽镝、胡跟旺、徐子祺

/上交所技术有限责任公司

P58 基于eBPF技术的无侵入云原生可观测性系统研究

曾东明、沙烈宝、段苏隆、李银鹰

/国投证券股份有限公司

P69 监管科技全球追踪

《交易技术前沿》总第56期

第5页

02

王洪涛|国金证券股份有限公司|Email:wanghongtao@gjzq.com.cn

证券行业大语言模型优化方法与应用示范

大模型在证券行业的核心作用是充分的萃取数据中的信息和知识,提升证券公司的含智量,培养新质生产

力。然而,鉴于证券行业的业务独特性以及大模型自身的局限性,将这类模型在证券业中广泛应用面临不

少挑战。为了克服这些挑战并有效利用大模型的潜力,本文提出了一种结合检索式问答生成模型

(RAG)、提示工程、以及Agent技术的综合技术路径和应用模式。这种综合方案旨在帮助证券公司提高业

务效率、更好地控制风险,并优化客户体验。国金证券作为该领域的先行者,采用创新的应用模式不仅为

证券行业内大模型的广泛应用提供了实践案例,也展现了结合行业特定知识和先进技术的重要性,为证券

行业在大数据时代的转型和升级提供了有力的借鉴和启示。

新质生产力;大语言模型;搜索引擎;RAG;Agent

ChatGPT的出现打破了现有的人机交互模式,其展

现出的强大的语义理解和生成能力引发了人们对其背后

的 支 撑 技 术 的 广 泛 关 注 。 然 而 , 大 模 型 ( L a r g e

Language Model,LLM)在证券行业的应用尚处于起步

阶段,对于如何充分发挥大模型的潜力以及所面临的挑

战,业界尚未形成共识。由于金融市场的复杂性和动态

性,大模型需要实时更新和学习新的金融知识。其次,

大语言模型的性能受到训练数据的限制,如何提高证券

场景下大模型生成内容的质量仍有待探索。证券公司大

规模使用大语言模型具有以下挑战:

数据治理问题 在现阶段,许多证券公司的数据治理

体系尚未完全建立或优化。这意味着数据可能存在分

散、不一致或质量不高的问题。由于大型语言模型高度

依赖于数据质量和结构,这些问题可能导致模型性能不

佳或产生误导性的输出。

数据安全性 鉴于证券公司处理的是高度敏感和机密

的财务数据,数据安全成为一个重大关注点。大型语言

模型的应用可能涉及将数据传输至外部服务器进行处

理,这增加了数据泄露或被恶意利用的风险。

技术集成和兼容性问题 将语言模型集成到证券公司

现有的IT架构和工作流程中可能遇到技术挑战。这些挑战

包括系统兼容性问题、需要升级或更换现有系统的成本

和复杂性,以及确保新技术不会干扰现有工作流程的稳

定性和效率。

针对证券公司的业务特点,以及现有金融科技发展的

实际情况,我们提出了证券公司优化大语言模型的三种

方法:采用提示词工程优化证券业务流程、通过搜索引

擎与大模型结合加工实时财经资讯信息,以及通过Agent

的模式外挂证券业务算法。

我们认为上述方法比采用大量数据训练和微调通用

大语言模型更适合证券公司的实际情况。本方法具有以

下好处:

更高的效率与准确性 通过精准的提示词工程和特定

算法,能够更有效地理解和满足客户特定需求。这种方

法可以更直接地针对证券业务的特点,提供更准确的服

务,尤其是在处理复杂的金融信息和交易时。

实时信息获取 结合搜索引擎和大模型,使得证券公

司能够实时获取和分析市场动态和财经新闻。这种方式

比传统的大数据训练模型更灵活,能够快速适应市场变

化,为投资决策提供即时支持。

定制化服务与创新 通过Agent模式外挂专门的证券

业务算法,可以根据公司和客户的具体需求定制服务。

这种方法允许证券公司创新其服务和产品,为客户提供

更个性化、高度适应性的解决方案。

成本效益与风险控制 相比于传统的大规模数据训

练,这种方法可能更节省资源和时间,因为它专注于特

定的业务需求和场景。同时,通过更精确的算法和实时

信息,公司可以更有效地管理风险,避免依赖过时或不

精确的数据。

总得来说,本文阐述的大模型优化方法使证券公司

能够更有效地应对快速变化的市场环境,提供高质量的

客户服务,同时控制成本和风险。同时我们也看到大模

型的探索与发展又是一个开放的、不断优化前进的过

程,随着证券公司数据治理的推进,数据安全的发展,

以及交易系统技术兼容性的不断进步,大模型技术会随

着证券公司底层技术的进步而不断的向前发展。

摘 要:

关键词:

一、引言

ITRDC证券信息技术研究发展中心(上海)

第6页

03 当前,证券公司内部有广泛的知识检索需求,是大

模型落地的极佳场景。然而,作为一种新兴技术,大模

型自身仍有一定的局限性,包括事实错误(幻觉)、缺

乏领域知识、信息过时等问题[1]。因此,如何建设具备高

专业度、强时效性的证券大模型亟需探索。

2.1 通用大模型的问题

通用大模型基于海量高质量的语料进行预训练,将

所学习到的知识存储到模型参数中,展现出优异的内容

生成能力,已在多个领域得到广泛应用。但是,通用大

模型并不完美,仍存在诸多不足之处:

(1)知识记忆能力有限。大语言模型的“伸缩法

则”(Scaling Law)表明,随着参数规模、数据集大

小、训练计算量的不断增加,模型的性能将持续提升。

尽管如此,大模型无法记住训练语料中的所有知识,尤

其是出现频率较低的长尾知识。证券行业的数据安全要

求较高,还包含大量的长尾知识,而不同类型的客户有

差异化的需求,如何利用大模型提供多样化的服务至关

重要。

(2)知识时效性不足。通用大模型难以与外部世界

互动,由于知识的快速迭代,模型知识的时效性较差。

如果使用微调的方法频繁更新模型参数,其算力消耗仍

然不容忽视且容易出现灾难性遗忘问题,对于大部分证

券公司而言难以负担。

2.2 挂载知识库的大模型的问题

基于知识库的大模型能够与外部进行有效交互,获

取与用户提问有关的额外信息[2]。构建知识库时,首次提

交的文档通过非结构化加载器读取文本,根据预定义的

规则或语义信息进行文本切分,然后使用Embedding模

型将文本块向量化存储到向量数据库中。当用户提交问

题,通过向量相似度匹配召回与用户问题最相似的前k个

文本作为提示,大模型根据问题和提示做出响应生成回

答,如图1所示。

外部知识库能够进一步扩展通用大模型所拥有的知

识数量,通过本地化部署证券公司的数据安全性得以保

障,员工通过大模型可以针对内部规章制度、非公开研

究报告等信息进行提问。然而,多样的非结构化数据

(文档、图片、图形表格等)给知识库的构建带来极大

困难,并且知识库的时效性依然难以保证。多个存在重

复内容的文档构建的知识库,可能产生对大模型产生反

作用效果,这是因为特定领域知识被稀释以及文档间相

互有影响。

大型语言模型挂载文档库通常是历史数据,这可能

导致模型无法反映最新的市场信息和动态,对于快速变

化的证券市场来说是一个重大弱点。在证券行业,理解

市场趋势和预测未来走势至关重要。大型语言模型可能

无法完全捕捉到市场的微妙变化和潜在的投资机会。模

型的性能在很大程度上取决于其训练数据的质量和范

围。如果文档库中的数据不全面或存在偏差,模型的输

出可能会受到影响。

二、大模型在证券行业应用面临的问题

图1:基于外部知识库的大模型的响应流程

《交易技术前沿》总第56期

第7页

04

3.2 优化的技术方案

3.2.1 提示工程优化业务服务能力

提示工程的优化始于编写清晰的指令,以便于模型

可以理解和执行任务。同时,需要将复杂任务分解为更

简单的子任务,从而使模型可以对每个子任务做出正确

的响应。在这一过程中,给予大模型时间去思考是另一

项重要策略,这意味着让模型在生成回答之前有充分的

内部处理时间,模型更有可能成功执行任务。此外,设

定合理的评估体系是关键环节,系统地测试每次调整对

于性能的实际影响,保证提示工程的优化朝着指定方向

前进。

我们对针对金融证券领域的特性,重构了金融提示

的设计架构,整体架构如图3所示。

在进行金融大模型应用的过程中,首先需要进行目

标分析,以明确任务目标和评估相关形势、资源、风险

和局限性。紧接着是数据理解阶段,涉及对数据的存储

形式、量级、内容进行全面分析,并对初步解决方案进

行微调。基于这两个阶段的成果,接下来是提示设计阶

段,旨在针对特定任务场景创建有效的提示。评估阶段

主要通过指标测试(如精确率、召回率等)来评估提示

的性能,并分析模型输出是否满足目标要求,同时识别

存在的问题。最后是优化阶段,根据评估结果对提示进

行调整,以确保在正式部署前达到最佳状态。

3.1 优化的方向

在对大型语言模型进行性能优化的过程中,OpenAI

采用了一种综合性的优化流程。如图2所示,该流程横跨

了上下文优化(Context Optimization)与LLM优化两

个关键维度。上下文优化关注于模型需要了解的信息,

即为了成功执行任务,模型需要了解的背景知识。而LLM

优化则着重于模型的行为方式,即模型采取的方法和行

动来解决特定问题。

在证券行业,可以获取与问题相关的上下文,并进

一步通过提示工程、检索增强生成、智能体技术引导大

模型的推理方向,以显著提升回答的准确性和即时性。

下面分别对这三种技术进行概述。

提示工程(Prompt Engineering)是开始优化的

最佳起点,旨在设计和优化指示大模型在进行特定任务

时应该采取什么行动或生成什么输出的提示。针对证券

公司的业务,可以采用提示工程多次调用大模型的API,

并结合RPA等工具多次问答自动生成需要业务的报告,例

如:日报、研报摘要等场景。

检索增强生成(Retrieval-Augmented Generation,RAG)适合引入新的信息,以及通过控制内容来

减少幻觉。搜索引擎结合大语言模型可以在保证信息时

效性的同时,从海量的财经类新闻中抽取需要的信息更

加快速和高效。

智能体(Agent)可以视作一种能够自主理解、规

划和执行复杂任务的系统。通过利用Agent可以将不同业

务算法外挂、内嵌、整合到大模型中。

上述三种优化方法不是互斥的,可以联合使用,多

次迭代直至最优。表1总结了大模型优化方法及其适用证

券业务场景。

图2:OpenAI的大模型优化流程

表1:优化方法和业务场景总结

图3:金融提示工程整体架构

三、证券行业大模型性能提升的方法

ITRDC证券信息技术研究发展中心(上海)

第8页

05 3.2.2 搜索引擎增加实时信息获取能力

当模型需要引入大模型未知的特定信息以回答问题

时,无需进行大模型微调,而是通过搜索引擎、向量数

据库等外部工具来扩展模型的知识,以推理产生准确的

回答,这种方法称为检索增强生成[3]。RAG的工作流程如

图4所示。RAG最直接的优势就是能够让大模型利用自身

的逻辑推导能力,去理解公司的私有数据,实现问答能

力的拓展。尽管模型微调也可以实现类似的效果,但RAG

的技术路线更适用于大部分证券公司,这是由于考虑到

其特殊的场景需求,即外部的公开数据及其内部的私有

数据以一定的频率动态更新,GPU算力尚不充足,且通常

要求大模型的回答能够给出引用来源以保证可靠性。

在金融领域,RAG模块可用于增强大型语言模型进行

金融情绪分析的能力。金融情绪分析是提取、量化和研究

金融文本、新闻文章和社交媒体内容中的情感状态和主观

信息的重要工具,它可能有助于分析证券市场走势,并为

投资者的行为提供有价值的见解。

3.2.3 智能体链接业务算法

大语言模型的浪潮推动了AI Agent 相关研究快速发展,

AI Agent 是当前通往通用人工智能的主要探索路线。大模

型庞大的训练数据集中包含了大量人类行为数据,为模拟

类人的交互打下了坚实基础;另一方面,随着模型规模不

断增大,大模型涌现出了上下文学习能力、推理能力、思

维链等类似人类思考方式的多种能力。

一个基于大模型的AI Agent系统可以拆分为大模型、

规划、记忆与工具使用四个组件部分。AI Agent 可能会成

为新时代的开端,其基础架构可以简单划分为 Agent =

LLM + 规划技能 + 记忆 + 工具使用,其中大模型扮演了

Agent的“大脑”,在这个系统中提供推理、规划等能

力。图5展示了基于大模型的AI Agent系统的总体概念框

架,由大脑、感知、行动三个关键部分组成。

基于大模型的Agent可以理解人类的自然语言指令并

执行日常任务。在面向任务的部署中,Agent遵从用户的

高级指令,承担目标分解、子目标规划、环境交互探索等

任务,直至实现最终目标。为了探索Agent是否能够执行

基本任务,部分学者将它们部署到基于文本的游戏场景

中。在这类场景中,Agent完全使用自然语言与世界互

动。通过阅读周围环境的文字描述,并利用记忆、规划和

试错等技能,它们可以预测下一步行动。然而,由于基础

语言模型的局限性,Agent在实际执行过程中往往依赖于

强化学习。随着大模型的逐步发展,具备更强文本理解和

生成能力的Agent在通过自然语言执行任务方面展现出巨

大潜力。

4.1 国金FinGPT设计思路

图6展示了国金FinGPT的设计思路,以大模型规模化

应用为目标,面向业务人员、科技研发人员、AI算法人员

四、国金证券金融大语言模型实践案例

图4:RAG工作流程

图5:基于大模型的AI Agent系统总体框架

《交易技术前沿》总第56期

第9页

06

同一个问题同时问多个大模型,从中择优选择答案。如

图7所示,通过提示词工程,构建了不同办公场景的应用

助手,包括:技术类、角色类、翻译类、文本类、文案

类等,也支持用户根据需求进行个性化配置。

图8展示了AI员工助手2024年的使用次数统计,当前

工作日的调用平均超过2000次。AI回答的问题以证券业

务为主,通用问答,日常问答,科技类问题为辅。这将

有助于培养公司内部的数字化思维和创新氛围。

等不同角色,构建流程化大模型研发流水线,建立RAG的

大模型及解决方案,打造基于大模型的提示词中心,共

同形成大模型共享给共建的应用市场生态,快速赋能数

字国金建设。

4.2 国金AI员工助手:基于提示工程构建不

同办公场景的应用市场

国金证券科技团队基于大模型技术搭建AI员工助手于

2023年11月份全面上线,供公司所有员工使用,极大地

提升员工工作效率。AI员工助手集成了多种大模型,支持

图6:国金FinGPT设计思路

图7:基于提示工程构建不同场景的AI员工助手应用市场

图8:国金证券员工助手使用次数统计

ITRDC证券信息技术研究发展中心(上海)

第10页

07 图9:员工助手问题词云图

图10:员工助手问题类别统计

图11:文档撰写助手:提高文字加工和萃取的效率

图9所示,通过对员工问题进行词云分析,可以看出

在办公场景中大部分员工关注证券市场行情、合规风

险、客户满意度等方面的信息,国金的员工已经在使用

大模型提升工作中的信息和知识的萃取效率。

图10统计了最近一周员工助手问题不同类别,大部

分员工更关注证券业务,其次分别是通用知识、日常闲

聊、科学技术。

4.3 基于提示工程的文档撰写助手

利用具体的业务流程,优化提示词的文档撰写助手

提供可灵活配置报告模板,根据不同的需求自动化生成

定制报告。目前支持研报摘要、高客建议书、理财月

报、员工日报和周报等自动撰写,显著提升员工工作效

率和团队管理效能。

系统根据定制化模板自动生成标准报告,比如研报

摘要、高客建议书、理财月报、员工日报、周报等,目

前文档撰写助手已生成2.5万+份客户服务报告,预计节

省4000万页报告的人工撰写成本。而且系统1分钟内就可

生成人工需要2天的报告,显著提升员工办公效率。

4.4 基于提示工程和搜索引擎的产业链图谱

智能挖掘

大模型产业链挖掘是国金证券首先在业内提出的大模型

特色应用场景。国金证券研究所和科技团队充分合作,

进行了大模型自动生成产业链图谱的初步尝试,可以根

《交易技术前沿》总第56期

第11页

08

图12:大模型产业链图谱智能挖掘技术框架

图13:国金证券大模型产业链图谱挖掘对话界面

化,从而分析板块的轮动、舆情对产业链的扩散影响。

此外,对比较新的产业链,大模型掌握的相关知识较

少,可以基于检索增强生成为产业链智能体配置搜索引

擎。检索增强生成包含检索与生成两个步骤,1、寻找与

该产业链最相关的已有产业链的信息,2、将新型产业链

与已存在的产业链进行整合,基于最新的舆情信息推理

分析出最新的产业链,从而推理出新型产业链的上下游

以及标的关联度。

据最新舆情挖掘投资标的、产业链上下游、关联度等信

息,从而快速认知市场。

大语言模型与搜索引擎相结合,通过分析、整合、萃

取、推理新闻舆情中的标的与产业链的频率、频次、正

负面及关联关系,非常适合用于智能化挖掘新型的产业

链的上下游,并分析标的与产业链的关联度的标准化度

量。通过构造以大语言模型为核心的智能体和产业分析提

示工程,可以自动化完成产业链梳理和标的关联度分析。

针对较常见的产业链,还可以分析产业链的动态变

ITRDC证券信息技术研究发展中心(上海)

第12页

09 图14:量化投资助手架构

图15:国金证券量化投资助手代码生成示例

4.5 基于Agent的大模型量化投资助手

国金证券在大模型量化领域进行了分析和探索,通

过利用大模型的数学推理和代码生成能力,能够实现因

子代码的自动生成,并且策略代码生成的运行通过率较

高,这在一定程度上可以降低量化客户的编写量化策略

的门槛。

此外,通过使用大语言模型进行舆情情感分析,可

以更全面地理解市场情绪和投资标的表现,从而在量化

投资中能够做出更明智的决策。例如:近期国金证券利

用大模型的舆情分析能力,对负面股票进行风险提醒,

目前已经在影子账户荐股中得到了应用。大模型在量化

投资中的应用为投资者提供了一种新的工具和视角,可

帮助其更加科学地进行投资决策。

《交易技术前沿》总第56期

第13页

10

AI是将数据变为信息和知识的关键途径,是数字化

转型的最终形态。本文探讨了一种结合检索式问答生成

模型(RAG)、提示工程和Agent技术的先进应用模式。

这种综合性的技术路径旨在提高证券公司的业务效率,

同时优化客户体验并更加精准地控制风险。国金证券作

为该技术应用的先行者,不仅为证券行业内大模型的实

际运用提供了一个范例,还突显了将行业特定知识与尖

端技术相结合的重要性。这一实践案例为金融领域在大

数据时代的转型和升级提供了宝贵的借鉴和启发,展示

了金融科技在现代证券行业中的核心作用和广阔前景。

大型语言模型的发展之旅是持续不断、充满创新的

过程。随着证券公司在数据治理方面的不断进步、数据

安全技术的日益成熟,以及交易系统的技术兼容性持续

提升,这些底层技术的发展势必推动大模型技术向前迈

进,不断实现新的突破和优化。

五、总结 参考文献:

[1] 桑基韬,于剑.从ChatGPT看AI未来趋势和挑战[J].计算

机研究与发展,2023,60(06):1191-1201.

[2] 车万翔,窦志成,冯岩松等.大模型时代的自然语言处理:

挑战、机遇与发展[J].中国科学:信息科学,2023,53

(09):1645-1687.

[3] 张维佳.大模型VS搜索引擎:短期内共存[N].中国电子

报,2023-12-05(005).

ITRDC证券信息技术研究发展中心(上海)

第14页

11 * 1.报价稳定性衡量的是NBBO中点在执行前后1秒内没有变化的交易占比。丁逸俊、张伟、徐广斌、陆伟|上海证券交易所|Email:gbxu@sse.com.cn

基于人工智能的动态中点订单研究与建议

在资本市场领域,AI逐渐成为业务创新和科技监管的重要驱动力.2023年9月,纳斯达克交易所宣布获批推

出全球首个用于交易所的AI订单类型--动态中点延时订单,利用AI来实时调整订单的等待期,使得可以降低

交易的等待时间并改善结果。根据测试,新订单类型使得订单成交率提高了20%,并有效降低订单交易冲

击成本。本文系统回顾动态中点延时订单机制的历史演进,分析其机制原理和对AI模型的应用,并提出在

证券市场微观机制研究中加强对中点订单机制和人工智能应用的探索。

人工智能;中点订单;波动保护;冲击成本

伴随新一轮科技革命蓬勃发展,前沿技术和产业深

度交叉融合已成为推动数字化转型的重要动力。其中,

人工智能(AI)技术近年来不断加速迭代和创新,在诸多

应用场景取得了重要突破和进展,包括我们熟知的智能

驾驶、ChatGpt、Alpha Go、声像识别、自然语言处理

等等。在资本市场领域,AI也逐渐成为业务创新和科技监

管的重要驱动力。

2023年9月,纳斯达克交易所宣布,美证监会(SEC)

已批准其推出全球首个用于交易所的AI订单类型。这种订

单类型被称为动态中点延时订单(Dynamic Midpoint

Extended Life Order,或DM-ELO)。纳斯达克传统的

中点延时订单(M-ELO)使用固定的等待期(Holding

Period)来匹配买家和卖家,作为改进,DM-ELO订单利

用AI来实时调整订单的等待期,使得可以降低交易的等待

时间并改善结果。根据测试,新订单类型使得订单成交

率提高了20%,价格滑点减少了11%。Nasdaq还表示,

未来将会基于AI增强机制引入更多的动态市价订单类型。

1.1 美国证券市场结构与订单类型

根据SEC的分类标准,美国全国证券市场共含三类

交易平台:全国性证券交易所(纽交所、纳斯达克

等)、另类交易系统(ATS,包括ECN和暗池)以及经纪

商内部撮合平台。根据《国家市场系统管理规则》

(Regulation NMS),所有交易所采用统一的跨市场交

易互联,按照“最优执行”原则执行订单,并在交易时

向其客户提供全国最佳买入价和卖出价(NBBO)报价。

其中,NBBO是指在一个给定的时间段内每个证券在所有

交易平台上的最佳买价和最佳卖价,该价格由中央证券

信息处理中心(SIP)计算并对外发布。

美国证券交易所接受的最基本的订单类型为市价委托

和限价委托,在此基础上各大交易所提供了种类多样的

补充选项。比如,指定该委托所适用的时间,即当日有

效、立即成交否则撤销、集合竞价等;指定委托单的价

格或数量是否可见,即可见订单、保留订单(又称冰山

订单)、隐藏订单等;指定订单是否只能在某一交易所

成交或是可以传递(route)至其他市场成交,即路由订

单、非路由订单等。根据不同选项组合,美股市场形成

了多达几十种的丰富的委托单类型。

1.2 M-ELO订单的提出

2018年,纳斯达克创造性地推出了中点延时订单

(M-ELO),以吸引具有长期投资意愿的机构交易者。

M-ELO具有以下四点特征:1)是一种隐藏订单;2)挂

单价格为NBBO报价的中点,动态变化;3)仅能与反方

向的M-ELO订单成交,其成交信息给予披露;4)订单激

活前有一段500毫秒(ms)的等待期。随后,经过两年

的实际执行效果以及客户反馈,为了进一步提高该订单

的效率、降低对市场的影响,纳斯达克于2020年把等待

期的时间缩短为10ms。

最新数据表明,2023年10月,纳斯达克平均每天成

交2590万股M-ELO订单,环比增加3%。M-ELO订单执行

后一秒,NBBO在84%的时间内保持稳定。执行超过

1000股的情况下,在92%的时间内保持稳定。以上报价

稳定性1的数据均好于其他场内或场外成交的中点订单。

1.3 动态M-ELO订单的提出

在将等待期时间从500ms缩短为10ms后,纳斯达克

依然收到部分投资者反馈,认为10ms也可能超出了实现

M-ELO订单“提高订单效率、降低对市场影响”本意所

需的时长。为此,纳斯达克开始尝试进一步优化等待期

的持续时间。

一、背景介绍

摘 要:

关键词:

《交易技术前沿》总第56期

第15页

12

经过研究,纳斯达克发现较短的等待期可以为参与

者在交易成本上实现相同的甚至更好的结果。但在价格

波动加剧的时期,M-ELO面临更高的风险,较长的等待

期有利于保护M-ELO免受此类风险。最终,纳斯达克认

为,再次全面减少静态(即固定)10ms的等待期并不是

最佳选择。

为此,纳斯达克要求其人工智能和机器学习实验室

(AI Core Development Group)探索是否可以利用AI

技术来优化M-ELO订单在不同价格波动状态下的等待期

时长,根据结果实时动态改变M-ELO的等待期,DM-ELO

由此被提出。

长期投资者普遍采用拆单方式来为降低其交易成本,

减少对市场影响。为便利此类投资者的交易,NASDAQ

等交易所向投资者提供了中点订单、冰山订单等订单服

务。此类订单不仅可以降低投资者交易成本,而且可以

避免投资者暴露交易意图。然而,普通的中点价订单等

仍然难以避免长期投资者面临的市场波动和逆向选择风

险。对此,NASDAQ交易所推出M-ELO订单,在中点订

单的基础上通过增加等待机制来寻找合适的对手方,并

降低投资者面临的风险。

2.1 M-ELO订单工作机制

根据NASDAQ的研究,使用M-ELO订单可以较好的帮

助长期投资者匹配到相似的对手方并降低交易风险。其

具体的工作方式是:M-ELO订单包含一个计时器,该计

图1 :M-ELO订单交易工作机制

* 2. 其执行改变对手方最优报价的订单。

时器的触发条件是NBBO的中间价不高于M-ELO买单价

格,或者不低于M-ELO卖单价格。在计时器触发后,AI

计时器会自动给出一个等待期,例如10ms。经过10ms

等待时间后,该订单将进入独立的交易系统进行匹配撮

合。由于M-ELO订单仅与M-ELO订单进行匹配,所以

M-ELO订单不会与扫单2成交,而会选择在系统中等待对

手方M-ELO订单,当满足条件的对手方M-ELO订单也在

等待一段时间后进入系统后,买卖双方的M-ELO订单将

进行匹配,成交价格为当时NBBO的中点价。通过延迟交

易,一定程度上可以较好的区分出真正的长期投资者,

使得买卖双方寻找到合适的对手方进行交易。

2.2 DM-ELO订单工作机制

从实际运行效果看,等待期时长对订单的执行率(Fill

rate)和滑点(Markout)有较大影响。此前,NASDAQ

曾设置过两个固定长度等待时间,分别为500ms和

10ms。但在实践中发现,大部分通过M-ELO订单匹配对

手方的时间要小于10ms,过长的等待时间反而会导致投

资者因担心市场波动风险而撤单,进而降低了成交率。

但在少数市场极端波动的情形下,更长的等待时间又可

保护投资者避免波动风险。为此,NASDAQ引入了等待

时间的动态调节机制,由AI根据市场情形来给出当前最佳

的等待时间,从而使得买卖双方在更稳定的市场条件下

达成交易。举例来说,在静态等待时间设定下,有一个

买方M-ELO订单的等待时长为10ms,另一个卖方M-ELO

二、机制原理

图2 :M-ELO订单执行过程

ITRDC证券信息技术研究发展中心(上海)

第16页

13 订单的等待时长也为10ms,结果由于等待时长过长,导

致市场进入不稳定阶段,导致投资者成交结果与预期存

在较大偏差。同样,在动态等待时间设定下,AI认为当前

市场较为稳定,并给出2ms的等待时长,则买卖双方成

交在市场稳定阶段,其成交结果与预期接近。

2.3 AI动态计时器

NASDAQ使用强化学习方法来训练AI计时器,其学

习的目标为提高订单的成交率并降低成交价格的滑点,

同时采用深度Q网络来表示动作策略。在竞价阶段,AI机

器人会根据过去30秒内的行情(NASDAQ共选取142个特

征指标来评估市场情形,包括M-ELO历史订单、NBBO历

史行情、过去N秒买卖量等),对等待期在0.25ms至

2.5ms范围内进行0.25ms为步长的调节(每30秒调节一

次,全天共780次)。并且,会在市场发生极端波动时会

启动保护机制,进一步延长等待时间,例如延长至

12ms。NASDAQ在模拟环境中对AI计时器进行训练,并

使用真实市场数据进行回测,在实践中NASDAQ将定期

对深度Q网络进行重新训练以适应不断变化的市场。

从测试结果来看,DM-ELO与使用固定10毫秒等待期

的M-ELO相比,获得31.7%的每股加权平均综合效益提

升,其中包括20.3%的订单成交率提升,以及11.4%的价

格滑点下降,整体上也要优于使用其他固定等待时长以

及随机等待时长的M-ELO订单。如图4所示,使用AI对

M-ELO订单的等待时长进行动态优化,使得在指定时长

范围内M-ELO订单的综合执行效益均得到明显提升,在

整体上实现了更优的多目标帕累托边界,显示出AI应用在

求解最优化问题方面的巨大优势。

根据纳斯达克发布的白皮书,其采用了拥有超过

35000个参数的DDQN(Double Deep Q-Network)人

工智能模型,根据142个特征指标,每30秒动态计算并更

新一次等待时长。该等待时长的变化范围为0.25-2.5毫

秒,每次变化的幅度为[-0.5,-0.25,0,+0.25,+0.5]毫秒。

3.1 DDQN基本原理

DDQN算法脱胎于经典强化学习算法Q-learning。

强化学习是人工智能技术的一个重要分支,广泛应用于

需要根据环境变化做出不同决策的动态策略问题,例如

围棋机器人AlphaGo、自动驾驶等领域。其基本原理是

训练一个模型(也即agent),该模型通过环境状态

(state)做出决策(action)并得到一个奖励或惩罚反

馈(reward),通过不断地交互(训练),该模型就学

习到了在各类环境下如何做出恰当的决策以得到最大化

的奖励。

在Q-learning算法中,智能体建立一个表格(Q

table),通过不断地尝试,将不同环境状态下,做出不

同动作得到的Q值(可视为某种累计奖励)记录在表格中

以完成训练过程。之后就可以通过查表的方式,知道不

同环境状态下应该采取何种动作,从而得到最大奖励。

Q-learning算法的核心在于建立相应的表格,但在

围棋、股市等复杂场景下,由于参数量太大,构建此类

表格异常困难。一种改进方式是利用深度神经网络

(Deep Neural Network)来替代该表格,由此产生了

DQN(Deep Q-network)算法。深度神经网络是一种具

有大量参数和强大函数拟合能力的模型,亦是当前大部

分人工智能算法的基础。DDQN算法则是在DQN算法基

础上,通过两个结构相同而参数更新频率不同的

Q-network,改进了DQN算法的高估问题。

3.2 设计与实现

对于纳斯达克的DM-ELO机制,模型(agent)根据当

前市场状态判断如何更新动态等待时长(action),随

图4: 使用AI进行优化使M-ELO的执行质量得到整体提升

图3: 采用静态和动态等待期的风险比较

三、模型实现

《交易技术前沿》总第56期

第17页

14

3.3 稳定性与安全保护机制

为了应对特殊市场波动,纳斯达克还设计了一个独

立于DDQN模型的保护机制。当市场不稳定

(unstable)3 ,即NBBO价格异常波动并触发该保护机

制时,M-ELO等待时长将被固定为12毫秒,并在之后的

750毫秒时间内维持在12毫秒,不受DDQN模型输出结果

的影响。当750毫秒周期结束时,等待时长将被调整为当

前的DDQN模型输出结果。

NASDAQ的AI模型和交易系统相对独立,对交易系

统唯一的影响就是从AI模型处接收一个动态时长,且其范

围有限,对系统的改造较小。即使AI部分宕机,也就是动

态等待时长退化为固定时长,市场影响可控。

4.1 研究中点订单机制,便利中长期专业机

构交易需求

目前在盘中阶段,交易者需要通过券商下单并传输至

交易所,然后等待市场行情到达指定价格才能执行。如果

行情波动较大或市场状态发生变化,可能造成交易者以不

利的价格成交,这对希望在盘中进行大量头寸调整的基

金、保险等专业机构者来说具有不利,由此带来的价格冲

击也不利于市场的平稳运行。中点订单允许订单根据市场

情况实时调整报价,减少订单的价格冲击和执行成本,即

使市场行情突然变化,配合限价和保护期等机制可帮助降

低订单执行的价格风险,更好满足服务专业机构、大宗交

易者在连续竞价阶段的交易需求。

4.2 研究盘中波动保护机制

后在仿真环境中模拟市场交易行为可能产生的变化,并

向模型反馈奖励(reward)和下一个市场状态(next

state)。

此算法的一个关键在于设置合理的奖励函数,纳斯

达克采用的奖励函数计算方式如下:

该奖励函数可以认为是动态等待时长相对于固定10

毫秒在滑点和成交率指标上的边际优势。其中,T是单位

时间内的总交易数量;qi

是该时间内第i个交易的股票数

量;MOδ,agent,bps和MOδ,synthetic@10,bps分别是动态等待时长和

固定10毫秒情况下的滑点值;FRagent和FRsim@10是对应的

成交率;λ是加权因子,用于控制成交率和滑点在奖励函

数中的权重。

此算法的另一个关键在于设计DDQN采用的深度神

经网络。根据纳斯达克披露的信息,其深度神经网络拥

有超过35000个参数,但没有进一步披露其具体结构。而

该模型的输入为142个特征指标,包括历史统计信息,如

一天和五天的M-ELO订单、成交统计信息,历史NBBO价

格等,以及即时的成交率、滑点等。

纳斯达克利用2022年一季度的历史数据来训练DDQN

模型,并从该时段内6257个交易标的(symbol)中选取

了较为活跃的380个(约占使用M-ELO订单标的的67%)

进行模拟。同时在训练模型时,每个交易日被简化为780

个片段,每个片段代表30秒周期。以30秒为一个周期是

通过大量实验,综合模型训练可行性和潜在回报后确定

的。

另外,为了使DDQN模型更好适应最新的市场环

境,纳斯达克设计了一种基于迁移学习的再训练机制。

该机制可以简单理解为每周完整地训练并调整模型的

35000个参数,之后冻结其中部分参数,用每日数据训练

更新剩余的参数。通过这种方式,DDQN模型可以更好地

学习到市场的长期规律和短期趋势,同时得到针对某些

特殊市场日的特定模型。

图5: 训练DM-ELO等待时长的强化学习框架

图6: DM-ELO使用的DDQN改进算法

* 3. 根据Nasdaq相关资料披露,市场发生1%几率的极值波动被视为异常波动。

四、研究建议

ITRDC证券信息技术研究发展中心(上海)

第18页

15 程序化交易等新型交易方式在提升交易效率、增强市

场流动性等方面具有积极作用。但在特定市场环境下,譬

如市场发生大涨大跌时,由于可能采取趋同的止盈或止损

策略,而导致市场波动的加剧,如何及时、有效地实施干

预,是程序化交易趋利避害的关键。对无价格涨跌幅限制

的股票,盘中设置临停机制,而对于有涨跌幅限制的股

票,未设置其他盘中波动保护机制。参考M-ELO相关做

法,可以将盘中发生近期(前一日或一周)波动指标极值

的情况,可考虑在后续一段时间内对程序化交易采取限速

限流等各种限制措施,缓解特定市场环境下程序化交易对

市场的冲击。

4.3 探索把人工智能应用于动态复杂多因子

数字监管场景

传统模式下的一线监管和风险监测,大多采用“基于

规则的信息系统+专家人工处理”的模式,主要面向静态的

有限规则、固定阈值、小数据甚至是人工处理方式,随着市

场规模扩大、产品丰富、交易复杂、风险交叉以及数据激

增,新的现象、问题和风险不断涌现,对复杂多因子数据进

行快速、智能分析方面的需求大增。例如,对于交易监管,

可在现有手段上增加对标的的人工智能实时监测机制,对目

标标的构建人工智能模型,将近期订单簿、成交、监测指

标、异常交易或异常波动发生的特征数据作为经验输入模型

训练,在盘中并行对各个实时特征值训作为输出识别对应异

常交易或波动,并以之为基础实施报警或处置措施。对于风

险监测,利用人工智能的复杂多因子分析能力,可以把目标

指数或标的历史交易数据,相关的宏观、中观数据、舆情数

据,以及对应的风险指标数据进行训练,每日根据特征值动

态更新,对风险进行识别、预警和处置。

参考文献:

[1] Diana Kafkes et al., “Applying Artificial Intelligence

& Reinforcement Learning Methods Towards

Improving Execution Outcomes,” SSRN, October 19,

2022.

[2] SEC,SR-Nasdaq-2022-079 Amendment 2 ,July

18,2023.

[3] Hasselt, H. Deep Reinforcement Learning with

Double Q-Learning. Proceedings of the 30th AAAI

Conference on Artificial Intelligence (AAAI-16) 23,

2094-2100 (2016). 10.5555/3016100.3016191.

[4] Karpe M , Fang J , Ma Z ,et al.Multi-Agent

Reinforcement Learning in a Realistic Limit Order Book

Market Simulation[J].Papers,

2020.DOI:10.1145/3383455.3422570.

[5] Kochedykov D .\"Introduction to Reinforcement

learning with application for trade execution\"[J].

2017.

[6] 徐广斌等。个股动态涨跌幅限制机制:概念、实证及建

议。上证研报[2017]001号.2017年2月.

《交易技术前沿》总第56期

第19页

16

探索利用科技赋能,提升财富管理赋能能力。通过建设

员工赋能平台项目,降低知识生产门槛,实现知识数据

可视化、业务规则数字化和自动化,有效链接用户、产

品和知识等实体数据,打造开发出一套专业易用的专家

知识生产系统。

如何整合来自web端、文档、音视频等多源非结构化

数据,实现快速检索、多元互联等目标,利用大语言模

型构建高价值密度、高利用率的垂直领域知识库显得尤

为重要。中信建投证券团队通过建设员工赋能平台,利

用先进的实体识别、关系抽取算法构建知识图谱,再基

于实体对齐、链接预测技术对图谱进行补全和完善,得

到高质量、高可用的垂直领域知识图谱应用于下游任

务,助力一线员工和领域专家直接交互,辅助员工和专

图1: 员工赋能平台架构图

潘建东、王赵鹏、马张晖、刘国杨、孙冰、尹序鑫、訾顺遥、梁彬

中信建投证券股份有限公司|E-mail:mazhanghui@csc.com.cn

知识图谱:驱动员工能力的引擎与机遇

针对目前财富管理机构存在的一线员工学习压力大,客户服务针对性弱,专业人才流失,缺乏高效专业的

协同工作等问题,中信建投证券提出员工赋能平台项目,将知识图谱与大语言模型等相关技术结合,弥补

了金融领域数据缺少组织结构、价值密度低、难使用的缺点。员工赋能平台通过数据智能处理、专家生产

工具设计以及认证鼓励机制开发,为员工构建出一个顺畅的生产环境,通过灵活组队服务功能,让一线员

工可以随时提问专业信息,直接联系沟通到总部专家,快速响应客户需求。该系统大大提升了员工的工作

和合作效率,挖掘出更多的业务机会。

综合财富管理;人工智能;知识图谱;知识生产;知识应用

财富管理指以客户为中心,设计出一套全面的财务

规划,通过向客户提供现金、信用、保险、投资组合等

一系列的金融服务,将客户的资产、负债、流动性进行

管理,以满足客户不同阶段的财务需求,帮助客户达到

降低风险、实现财富保值、增值和传承等目的。经过四

十年改革开放,我国国民财富积累迅速增长,同时近年

来房地产吸引力下降、资管新规、权益市场吸引力不断

提高,居民财富增值的意愿达到了新高度,对金融机构

高质量财富管理的需求日益强烈。

当前,证券公司等金融机构在进行财富管理业务时,

普遍面临着庞大的客户群体与综合服务能力不匹配的问

题:一线员工学习压力大,客户服务针对性弱;个体经

验难以持续产生价值,出现专业人才流失现象;缺乏高

效专业的协同等。为解决这些问题,中信建投证券积极

摘 要:

关键词:

一、引言

二、基于知识图谱技术的员工赋能系统

ITRDC证券信息技术研究发展中心(上海)

第20页

17 家开展合作,实现对客户全方位的服务提升。

如下图1所示,平台整体划分为数据接入层,知识生

产层,知识应用层三个单元。数据接入层,负责接入并

整合大量分散在数据中心服务器、员工电脑本地的异构

非结构化文件等组织知识。知识生产层,进一步将数据

构建为知识图谱形式,依靠图谱良好的关联性和高信息

量特点,实现快速检索、推理等功能,满足员工作业需

求。随后,在知识应用层中,知识图谱数据与大语言模

型结合,拓展应用到员工赋能平台中的知识检索、问答

系统以及协同组队等功能模块中。通过这种方式,平台

将知识信息与专家信息录入知识图谱,以实体和关系的

形式进行联合。一线员工不仅可以随时提问所需的专业

知识、获取调用学习相关的服务文档、案例、经验等知

识内容,还可以根据不同业务通过企微互联直接联系对

应专家,灵活组队为客户提供高质量的综合性金融服务。

3.1 知识图谱数据处理

大量的组织知识分散在数据中心服务器和员工电脑

本地的Word、PPT、音频、视频、图片等格式的文件

中,平台需要能够兼容各种格式的数据类型,因此需要

人工智能技术将各种数据类型格式的非结构数据进行初

步的统一化、半结构化,然后才能支持后续精加工流程

的顺畅实现。

员工赋能平台不仅要能“兼收并蓄”,同时也要能

“多样绽放”。平台的重要任务之一是为基于高级算法

构建的应用提供优质输入(例如基于图计算的推荐任务

场景下,首先需要将客户数据生产为知识图谱,然后利

用图计算相关算法进行客户分类和推荐),应用场景和

算法的不同,要求输入的知识表示形式也不同。而多样

化的知识表示形式,要求平台尽可能集成和支持多样化

的人工智能算法模型,用于自动化地将数据生产为知

识。平台通过使用流处理技术和实时数据集成工具完成

实时数据集成,将不同数据源的数据实时整合到一个单

一的视图中。实时数据集成技术可以帮助企业更快地做

出决策,并提供更准确和实时的数据分析。集成后通过

自动化数据准备,使用机器学习和自然语言处理等技术

来自动识别、清理和转换数据,减少了手动劳动力,缩

短数据准备的时间,并提高数据的准确性和一致性。最

后通过无代码/低代码数据接入,使用可视化界面和图形

化工具来简化数据接入的过程。通过这种方式,减少对

技术专业知识的依赖,使更多人能够参与数据接入和分

析,从而提高企业的数据文化。

3.2 知识图谱生成

员工赋能平台通过知识生产层得到高质量的知识图

谱数据,用于下层知识应用。我们调研尝试了大量经典

基线模型算法,并进行了对比与改进,最终确定了平台

的算法实现方向。下表1罗列了经典算法与平台所用算法

的对比情况:

数据接入模块输出大量结构化、半结构化或非结构

化的数据,再统一利用实体抽取和关系抽取技术,将其

转化为生产结构化知识图谱数据,用于下游NLP任务。

实体抽取部分,团队使用BERT预训练模型

+BiLSTM+CRF的算法模型。经典的实体抽算法例如

Word2vec模型+LSTM+CRF,将实体抽取看作文本序列

标注问题,先通过Word2vec模型获得文本的初始嵌入向

量,再利用LSTM对向量进行小范围内的二次聚合,最后

用CRF替代Softmax,对标注结果进行规则上的限制。类

图2 :实体抽取模型结构

表1 :算法对比

三、面向员工赋能平台的知识图谱实践

《交易技术前沿》总第56期

第21页

18

似的这类经典算法存在一些问题。首先,Word2vec模型

生成的词向量均为静态词向量,扩展性不强,且生成速

度较慢。LSTM模型虽然在小范围内可以对文本向量进行

再次聚合,但聚合方向为单向,其能力也有待进一步提

升。其次,经典算法将实体对齐任务视为序列标注问

题,在面对小样本学习和可持续学习的任务上表现乏

力。然而,公司的数据在不同业务领域种类较多、流量

较大,需要实时更新、持续学习,部分领域还可能存在

数据量较小的情况,使用经典算法效果欠佳。

BERT预训练模型+BiLSTM+CRF的算法模型可以在

保持轻量级的同时克服上述问题,结构总览如图2所示。

首先使用BERT预训练模型替换Word2vec,可以生成句

子级别的表示,同时考虑了多个单词之间的语义关系。

此外BERT可以通过微调来适应不同的任务和数据集,从

而提高模型的性能和泛化能力。赋予了词特征向量灵活

性,并减小了系统开销。BiLSTM可以同时考虑前向和后

向的上下文信息,从而更好地捕捉序列中的依赖关系。

在财报、年报、财经新闻等自然语言信息中,前后文信

息对于理解信息的含义非常重要,因此双向性可以提高

模型的准确性和泛化能力。对照实验数据见表2,其中准

确率、召回率、F1值是考量模型表现的相关指标,越高

说明模型精度越好。

关系抽取部分,团队使用OpenAI开源的GPT2大语

言模型作训练和微调。GPT模型可以通过预训练和微调的

方式来完成关系抽取。预训练阶段,GPT模型通过大规模

的文本数据训练得到了广泛的语言知识和语义理解能

力,这些知识和能力可以在关系抽取任务中得到充分的

利用。微调阶段,GPT模型根据不同的关系抽取任务要

求,进行微调和优化,从而实现更加精准的关系抽取。

在具体实践中,GPT模型可以使用基于文本生成的方法来

完成关系抽取。团队首先使用大规模语料文本对GPT模型

进行预训练,为模型赋予语义理解、文本生成、结构生

成的能力。然后使用财经、金融领域数据集在预训练模

型上根据员工赋能平台的需要进行微调。

通过实体抽取和关系抽取,构建出结构化知识图谱数

据后,需要对数据进一步进行补全和过滤。通过NLP技术

构建的知识图谱,一方面可能存在遗漏的三元组,即两

个关联实体间缺少关系链接,另一方面由于汉语一义多

词的现象,可能存在重复的同义实体。以上情况都会影

响知识图谱的信息准确性,破坏知识图谱的结构化特

性,进而影响下游任务。为此团队通过链接预测和实体

对齐技术,对知识图谱进行对齐和补全。

实体对齐部分团队采用MuGNN算法,MuGNN

(Multi-Granularity Graph Neural Network)是一种用

于知识图谱中实体关系抽取的先进的多粒度图神经网络

模型。该模型的主要特点是使用了多粒度的图表示学

习,它将知识图谱中的实体和关系表示为多层次的图结

构。每个层次的图结构都对应一种不同的粒度,可以捕

捉不同层次上的语义信息和关系。

如图3所示,MuGNN模型的输入是员工赋能平台通

过实体抽取和关系抽取技术搭建的知识图谱,其中包含

实体和关系的信息,模型将知识图谱表示为一个多层次

的图结构,每个层次的图结构都对应一个不同的粒度。

在每个粒度上,MuGNN模型都使用MG-GCN进行特征提

取和表示学习。同时,MuGNN模型还使用自适应注意力

机制将不同粒度上的特征融合起来。团队通过使用多任

务学习策略训练MuGNN模型,提高模型的泛化能力和效

果。这个策略可以在多个任务之间共享模型参数,从而

使得模型可以同时处理多个任务。相较于传统的单粒度

图神经网络模型,MuGNN模型在员工赋能平台的知识图

谱实体对齐任务中表现出色。表3展示了经典算法和团队

采取的算法在相关数据集上的测试结果,MRR、Hits@1

和Hits@10都高于基线经典算法。

团队在链接预测的三元组分类问题上使用了

T5-large模型和prompt技术,通过将这个问题转化为文

本生成问题,使用T5-large模型+prompt模版来进行训

练和推理,如图4所示。T5-large模型是一种由Google开

发的大型预训练语言模型,可以用于多种NLP任务,包括

文本生成、问答系统等。而prompt技术是一种将任务描

述(prompt)嵌入到模型输入中的技术,可以帮助模型

图3: MuGNN实体对齐模型结构

表2 :实体抽取实验数据表

表3: 实体对齐实验数据表

ITRDC证券信息技术研究发展中心(上海)

第22页

19 更好地理解任务要求。

团队采用编码器-解码器结构,采用T5模型的编码器

作为输入层,将输入的实体和关系表示为向量形式。T5

编码器是一个具有多层自注意力机制的神经网络,可以

将输入的序列编码为固定长度的向量。使用T5模型的解

码器作为输出层,将生成的实体和关系表示为向量形

式。T5解码器是一个具有多层自注意力和交叉注意力机

制的神经网络,可以根据输入的向量生成文本序列。除

了编、解码器,为了更好地表示实体的语义信息,团队

使用了实体嵌入层和关系嵌入层。该层将每个实体和关

系映射到一个低维向量空间中,以便于模型学习实体、

关系之间的关联信息。表4中展示了赋能平台在链接预测

任务上采用的算法和经典算法在相关数据集上的实验对

比,相比于传统的链接预测算法,T5+prompt方法具有

更好的扩展性和适应性,能够更好地应对不同领域和数

据量的链接预测任务。此外,赋能平台所使用的改进算

法还显著降低了参数量,节省资源开销的前提下提升了模

型泛化能力和精度,这使得该算法具有很高的实用价值。

3.3 知识图谱应用

精准检索是知识应用的基础应用,是指在文本检索

任务中,通过各种技术手段,提高检索结果的准确性和

相关性,以满足用户的信息需求。在赋能平台的实际应

用中,精准检索可以帮助员工快速找到所需的专业信息

或文档,协助员工完成、理解任务,并作为基础应用服

务于知识问答。团队使用大模型+知识图谱的架构实现精

准检索。该方法利用大型语言模型的强大语义理解能力

和知识图谱的结构化知识,实现对复杂自然语言查询的

准确解析和精准匹配。

赋能平台首先使用清华大学开源的预训练大语言模

型ChatGLM对自然语言查询进行编码,得到查询的向量

表示。然后,利用知识图谱中的实体和关系信息,对查

询进行语义解析,得到查询所涉及的实体和关系。接

着,利用知识图谱中实体和关系的语义信息,对查询向

量进行扩展,得到更加丰富的语义表示。最后,将扩展

后的查询向量与知识图谱中的实体和关系向量进行匹

配,得到与查询相关的实体和关系。

此外,该方法还可以支持多种查询类型,包括实体查

询、关系查询、属性查询等,具有较好的可扩展性和适

应性。知识图谱的结构化数据对于大语言模型对文本的

理解和映射有着莫大的帮助,相对于直接使用非结构化

文本,知识图谱的结构化数据对大模型的检索速度和精

度均有一定程度的提升。

3.4 知识图谱的更新和维护

知识图谱的自动化定期更新和维护主要通过不断从各

种网络资源和结构化数据源中抽取新信息来实现。具体

来说包括:从日新月异的网络内容中抽取出新的实体、概

念、关系和属性,将它们纳入知识图谱;分析新文本中已

有实体之间的交集和联系,更新他们之间的关系。利用相

似性计算、上下文分析等方法,识别出相同或新的关系,完

善知识图谱结构;将抽取出的相似实体进行合并,利用现

有知识和规则,对新抽取的信息进行验证和推理,判断其真

实性和完整性,从中不断积累新的规则和知识。由于金融

信息的时效性和安全性特性,团队使用以下技术对知识

图谱进行更新和维护,保证信息有效安全:

1.数据抓取和清洗:在知识图谱的自动化更新和维

护中,数据抓取和清洗是非常重要的步骤。团队使用网

络爬虫技术从各种数据源中抓取新的数据,并使用数据

清洗技术进行数据处理和转换,使其符合知识图谱的格

式和要求。数据清洗包括数据去重、数据标准化、数据

转换等多个步骤,以确保知识图谱中的数据质量和准确

性。

2.知识生成:对于抓取和清洗的新信息,团队使用

上文提到的知识生成技术扩展和补充知识图谱中的实体

和关系。并对通过实体抽取、关系抽取构建的新知识图

谱做质量监控和修正,以保证知识图谱的高质量。

3.定期删除:在知识图谱中,一些信息可能会随着

时间的推移而失效或过期,因此需要对这些信息进行删

除或标识。但是,并不是所有的信息都可以自动删除,

需要根据具体情况进行判断和处理。对于一些时间敏感

的信息,例如新闻、股票价格等,可以设置过期时间,

超过该时间后自动删除。对于一些长期有效的信息,例

如历史事件、基础知识等,应该保留在知识图谱中,以

便后续的查询和分析。在员工赋能系统中,团队通过人

工审核和自动化模型等方式进行信息删除和标识。使用

ARIMA模型,利用时间序列分析技术对某些信息的变化

趋势进行预测,从而判断其是否已经过期。该模型可以

用于分析时间序列数据的趋势、季节性和周期性等规

律,利用已有的时间序列数据,预测未来的趋势。如果

发现某些信息的趋势已经不再变化,则可以判断该信息

已经过期。

4.可视化和查询接口:为了让用户更加方便地使用和

查询知识图谱中的信息和知识,可以使用图形化界面和

查询接口。通过图形化界面,用户可以直观地浏览和操

表4 :链接预测实验数据表

图4: KGT5模型(T5+prompt)推理过程

《交易技术前沿》总第56期

第23页

20

四、建设成效与总结

作知识图谱中的实体和关系;通过查询接口,用户可以

根据自己的需求查询知识图谱中的信息和知识。同时,

也可以通过用户的反馈来自动更新和维护知识图谱,以

不断提高知识图谱的质量和价值。

中信建投证券目前已经完成知识图谱构建及应用的算

法设计和落地,实现了无结构化文档自动构建知识图

谱,以此作为外部知识库增强大语言模型的下游任务,

嵌入到员工赋能平台中,为员工提供出开放接口。目前

平台优化完善已迭代3个版本,未来员工赋能平台2-3年

的规划目标是:打造证券行业垂直领域的“知乎”,基

于时序知识图谱技术和强化学习算法完成实时事件分析

系统,针对国内外突发事件开展业务分析并及时响应客

户的投资需求变化,挖掘重大事件背后的商机,协助员

工展业。

中信建投证券正在以智能化为主导思想,不断深入推

进智慧营销平台的建设,旨在打造全周期数字化智能营

销服务,以数据驱动为客户提供适宜的服务和产品,从

而实现高效、合规、精细的服务。这种以数据为核心构

建的智能化体系将成为支撑未来券商发展的关键要素。

在金融行业,智能化建设具有广阔前景,并将对未来证

券业态发展产生深远影响。

ITRDC证券信息技术研究发展中心(上海)

第24页

21 邓维、易卫东|招商证券股份有限公司|E-mail :foreverdengwei@163.com

人工智能大模型在证券行业应用路径与实践

2023年中央金融工作会议提出要做好数字金融这篇大文章,2024年政府工作报告提出要开展“人工智能

+”行动。大模型人工智能技术作为新质生产力,证券行业应当积极拥抱大模型进行数智变革。本文详细分

析了国内外证券大模型的应用场景、实践案例和技术路径,希望为国内金融机构应用大模型提供借鉴参

考。首先,本文简介了国内外通用大模型和金融垂类大模型发展概况;然后,本文基于证券行业场景分

类,分别阐述了大模型在外部服务、内部提效和监管科技三类10大业务场景的模式变革和应用路线图;其

次,本文梳理了国内外Bloomberg、金融科技企业Broadridge和投行J.P.Morgan等金融机构各类主体在

智能客服、智能营销、智能投顾、智能投研、智能风控、智能运营、AI助手等各方面的实践案例;最后,

本文对比分析了金融大模型落地的通用VS垂类、开源VS商业、私有VS公开等三种技术路径和系统架构,并

对未来挑战与趋势作出简要总结,期待证券行业共同努力建立体系化的大模型建设蓝图,共赴数智金融新

时代。

大模型;智能投顾;智能投研;智能投资;智能风控;智能运营

2022年底OpenAI发布基于大模型、大数据、大算力

的 C h a t G P T , 意 味 着 人 工 智 能 ( A r t i fi c i a l

Intelligence,AI)的发展到了从“弱AI”向“强AI”跃

迁的分水岭。

国外通用大模型发展现状。国外基本上是OpenAI和

Google等公司主导,顶尖的资本、技术、人才较为集

中。尤其是微软所投资的OpenAI每隔几个月就更新产

品,2023年3月发布万亿参数多模态大模型GPT4、2023

年11月发布GPT4升级版GPT4-turbo、2024年1月发布

GPT4应用商城GPT Store、2024年2月发布文生视频大

模型Sora,持续引领着大模型发展方向。虽然开源大模

型在实力上相较于商业公司还存在一定差距,但是对于

大模型生态具有重要意义。尤其是2023年7月Meta开源

最新大模型Llama 2、2024年3月马斯克旗下xAI发布旗舰

大模型Grok-1,加速大模型生态构建和繁荣。

国内通用大模型发展现状。国内大模型还处在“千

模大战”状态,商业和开源群雄并起,目前没有拉开显

著差距。2023年3月百度发布“文心一言”,4月阿里巴

巴发布“通义千问”,5月科大讯飞发布“星火”,7月

华为发布“盘古”大模型,9月腾讯发布“混元”大模

型;创业公司智谱和Moonshot也拿到了入场券......但当

前技术仍未达到国外顶尖水平。

国内外金融垂类大模型发展现状。金融行业一直是数

字化技术最早实践者。金融大模型始于2023年3月

BloombergGPT。Bloomberg沉淀了大量高质量数据,

利用大模型分析处理,大幅提高金融服务效果,比如可

以分析市场情绪和金融资讯,提供精准投资服务。

Morgan Stanley等知名金融机构均发布大模型应用。与

此同时,中国机构也不甘落后,迅速推动金融大模型的

应用实践,而且更加贴近产业端。而国产金融大模型也

已分出了明显的两个“流派”,一派来自于券商等传统

金融机构,另一派来自于金融科技企业,如恒生电子

LightGPT和蚂蚁金融大模型。

证券行业天然具有数据属性和良好数字化基础,强

烈的数智化转型需求与多样化的业务需求,以及对新兴

技术的较高接受度与资金支持度,使得金融行业是大模

型最佳应用场景之一。

大模型重塑证券业务场景的分为外部服务、内部提效

和监管科技三大类:外部服务包括智能投行、智能投

一、全球人工智能大语言模型发展现状

二、大模型重塑证券行业十大业务场景

摘 要:

关键词:

图1:大模型重塑证券业务场景一览

《交易技术前沿》总第56期

第25页

22

顾、智能投研、智能投资、智能营销、智能客服等6项业

务场景;内部提效包括智能风控、智慧运营、智能办公

(含IT研发)等3项场景;监管科技这些场景涉及身份识

别、监管数据支撑、风险监测等内容。当然这些场景并

非全面,仅以点带面作为示例说明,见图1。当前十大场

景都存在一些数据不全面、泛化能力弱、人工效率低等

问题,大模型AI凭借多模态、泛化性、通用性、生成能

力,将重塑现有业务模式,参见表1。

当然这些场景并不都是一蹴而就齐步实现。从技术

成熟度和场景价值度维度分析,智能营销、智能客服、

智能办公、智能开发运维等场景是相对技术最成熟和容

易落地的场景(见图2)。智能投研、投顾、风控是证券

业务高需求的价值场景,是大模型有希望尽快落地下来

放大业务的场景。而智能投资、智能投行、产品设计这

些场景相对技术成熟度较低,未来落地需要一点时间。

未来智能代理Agent将独立能够感知环境、进行决策和执

行任务,成为大模型的新载体,不断重构金融业态。

图2:大模型金融行业应用路线图分析

表1: 大模型重塑证券行业十大业务模式

ITRDC证券信息技术研究发展中心(上海)

第26页

23 正如上文分析,国内外金融机构正围绕着这些业务

场景链条,大力推动大模型技术与传统证券业务的融合

落地,推出不下上百项创新应用。

3.1 国外金融大模型应用

国外金融大模型应用早于国内,三类机构纷纷布局,

以传统金融机构为主:(1)传统投行等金融机构,以摩

根大通为代表,其优势是投入资金充足、金融业务理解

力强和高质量数据标注能力;(2)金融资讯公司,以

Bloomberg为代表,其 IT 能力和积累的海量数据库具有

核 心 优 势 ; ( 3 ) 金 融 科 技 公 司 , 以 推 出

FinChat/BondGPT等代表性产品的科技公司为代表,其

优势是创新动能较强,并加速推出开源模型。

从案例上分析,一部分机构是自主研发垂类GPT大

模型应用,一部分机构是基于通用ChatGPT等开展应

用,场景上则涵盖了智能营销、智能客服、智能投研、

智能投顾和智能办公等各方面(见表2)。

具体以摩根大通的智能投顾场景进行说明。摩根大通

AI成熟度全球排名第一(询公司Evident Insights),拥

有1000多名数据管理人员,900多名数据科学家,600多

名机器学习工程师,200多名一流AI研究人员。2023年4

月摩根创制一个解码央行的AI模型“鹰鸽指数”

Robo-Fedwatchers模型,以25年以来的美联储声明和

央行官员们的讲话为训练材料,使其可以预测到潜在的

市场变动,进行鹰鸽等级评分,再将具体评分与一系列

资产表现挂钩,用于预测政策的变化,并发出可交易的

信号。2023年5月摩根注册“IndexGPT”,该系统加载

了30年来所关注的所有公司的专有数据,通过分析客户

需求并利用人工智能技术,提供更加智能化和个性化符

合客户投资需求的证券推荐(见图3),IndexGPT采用

的GPT模型在生成关键词数量上是以往软件的2倍多,使

得主题的投资代表性更强。

三、 全球证券行业大模型百项应用案例

表2:国外金融大模型应用案例一览

《交易技术前沿》总第56期

第27页

24

图3:摩根大通AI大模型应用情况

表3:国内金融大模型应用案例一览

销三大环节工作,而海通证券“泛海言道”、国泰君安

“灵犀布道”、东吴证券“东吴秀财GPT”均在探索智能

投顾、智能投研、智能运营、智能风控和办公等场景应

用。幻方、兴证、工银瑞信等基金研制GPT大模型用在数

字人问答、数据分析师、AI交易员等领域。其中,招商证

券在智能运营、智能研究、智能投顾、智能办公和编码

助手等多个场景都在探索应用,例如托管大模型客服准

确率高于90%,并且支持至少3轮上下文和事后标签自动

分析,客户体验大幅提升。

3.2 国内金融大模型应用

国内布局金融大模型的机构与国外类似,主要是金融

资讯公司如同花顺、金融科技公司如恒生和传统券商等

金融机构(见表3)。智能客服、智能投研、智能运营、

数字员工、AI助手是最常见的主要应用方向。银河证券与

百度合作打造场外衍生品交易服务大模型,广发证券合

作研发大模型率先应用于智能客服场景,中信证券债券

助手Bond Copilot缓解投行债券全链条承揽、承做、承

ITRDC证券信息技术研究发展中心(上海)

第28页

25 图4:常见金融大模型技术架构

当前金融行业应用大模型主要有两种模型类型:一

是通用大模型,如GPT4,二是金融垂类大模型,如

FinGPT。大模型常见的合作路线包括开源大模型应用、

商用大模型采购合作、产学研联合创新大模型研制、完全

自主研制大模型等几种方式。大模型部署方式分为私有化

部署、行业云部署和公有云部署等。

从上述应用案例和业务趋势可以看出,不同的金融

机构选择了不同的技术路径:有的使用通用大模型,有的

使用金融垂直大模型,有的应用开源模型,有个与商业模

型合作,有的应用部署在公有云上,而大多数采用私有化

部署。证券行业大模型技术路径选型可以从三方面进行

分析:

(1) 企业规模大小:大型企业通常采用多种模式并行

的混合路径。既会投入人力物力自主研发私有化部署的垂

类金融大模型,也会商业化采购垂类大模型进行本地化合

作,还会使用云端的开源的通用大模型进行尝试探索。中

小企业由于缺乏大算力硬件和大算法人才,所以普遍会先

采用使用公有云的开源通用大模型和垂类大模型进行探索

试用。

(2) 数据敏感程度:数据敏感场景适合采用私有化部

署模式,自研更可靠。数据不敏感场景可以采用公有云或

者行业专用云模式,可以使用开源和通用大模型。

(3) 业务场景价值:业务价值高场景适合金融垂类模

型,私有化部署更适合,自研或商业化合作更有保障。而

价值一般通用场景可以采用通用大模型云端模式。

这里也分析一下金融行业大模型落地常见技术架构和

路径(见图4)。最底层是基础设施,包括强大的计算和

存储的硬件,以及完善的金融大数据语料和数据平台,这

是应用落地的一个重要基础。中间层是模型层和平台层,

模型层可能既有通用大模型、行业大模型,也会有本地化

商业大模型和开源大模型,而平台层包括数据标注、模型

机器学习的框架、模型训练和模型调度等能力。应用层则

是面向证券业务场景、面向内部员工、面向监管机构的各

类赋能场景。

尽管大模型在证券行业的应用前景广阔,但目前还

处于起步阶段,面临诸多挑战:既有技术方面挑战,大模

型在训练过程中存在的大硬件算力、海量内存和高效通信

的挑战,以及机器幻觉问题在容错率较低的金融领域可能

会影响分析结果的可信度;也有业务方面挑战,金融行业

应用场景缺少通用范式、欠缺高质量金融训练数据;还有

监管方面的难题,由于金融行业合规要求高,严格保护数

据安全和隐私,金融机构和监管机构需要投入大量资源以

满足合规要求。为了应对这些挑战,未来金融行业还有一

系列工作要做,包括协同共筑AI算力基础设施以及完善算

法优化与风险管控,加强数据治理工作和积极构建高质量

金融数据集,加强金融应用的最佳实践指导与监督管理

等。那么,随着大模型技术不断升级、金融业务场景不断

落地探索、监管的不断完善,大模型落地能力更强、场景

更广、应用更深、价值更高,重塑金融行业基础设施、组

织架构、业务模式、经营模式,金融行业共赴数智金融新

时代。

参考文献:

[1]12世纪资管研究院. 大模型重塑金融业态报告

[R],2024-2-5.

[2]林建明. AIGC重塑金融:AI大模型驱动的金融变革与实

践[M]. 机械工业出版社出版,2024年2月.

[3]中国银保传媒、腾讯研究院、毕马威. 2023金融业大模

型应用报告[R].2023-11-9.

[4]吴一凡. 海外AIGC金融有哪些落地进展[R]. 长江证券,

2024-2-2.

[5]清华大学、度小满、MIT科技评论.2024年金融业生成

式AI应用报告[R]. 2024-1-24.

[6]潘玉蓉. 机构争分夺秒抢滩 金融大模型落地为时尚早

[N]. 证券时报网, 2023-11-30.

[7]苏仪. 券商大模型应用进展几何[R]. 中泰证券,

2024-2-21.

[8]北京金融信息化研究所. 大模型金融应用实践及发展建

议[R]. 2023-11.

[9]参见《境外金融机构AI大模型应用案例:投行券商、

资讯公司、金科公司各显神通》,微信公众号:资管业务

与科技.最后访问日期:2024年5月25日, 网址:

https://mp.weixin.qq.com/s/OXiuXeR5S6BQ8Sx7VIai

1g.

四、证券行业大模型落地三大技术路径

五、证券行业大模型应用挑战以及趋势 《交易技术前沿》总第56期

第29页

26

如图1所示,一方面,基于完备的客户相关数据实现

对客户全面了解,有效识别客户偏好,为客户提供千人

千面服务。另一方面,证券公司拥丰富的产品池。客户

资产均衡模型解决的问题就是如何在综合考虑多维因素

的前提下,对资产均衡性进行多维有效评估,帮助客户

实现长期收益最大化。

2.2 建模总体思路

客户资产均衡模型旨在为金融产品精准营销提供智

能化、专业化、个性化模型指引。金融产品精准营销倡

导理性投资,追求符合投资者预期的资产收益。互联网个

性化推荐模型倾向于迎合客户偏好,客户资产均衡模型

的目标是客户长期收益最大化,二者存在本质差异。建

构客户资产均衡模型时,需要建立完备的数据支撑和理论

指导,除考虑客户偏好外,还需对其资产分布、风险能力

及投资舆情进行建模。

基于以上差异,选择用深度强化学习技术进行客户资

产均衡建模,进而解决精准营销问题,主要有三点原

因:第一,强化学习具有长远眼光,注重长期回报,与

客户资产均衡模型目标匹配;第二,强化学习解决序列

图1:客户资产均衡建模问题定义

王瑜、褚丽恒、刘敏慧、梁钥、侯立莎、邱子聪、石宏飞、李海英

申万宏源证券有限公司|E-mail:wangyu4@swhysc.com

基于深度强化学习的客户资产均衡建模

财富管理业务在我国迅猛发展,证券行业积极进行财富管理转型,以客户为中心的服务体系基本建立。但

目前,主要依靠客户经理提供一对一的投资建议,服务成本高且覆盖有限。为此,申万宏源证券有限公司

将人工智能技术与资产均衡理论深度融合,采用深度强化学习对客户资产均衡性进行全方位建模,从客户

兴趣、客群挖掘、资产多样性、资产分布、投资组合理论、资讯舆情等多个维度建立个性化、专业化的模

型,为每位客户提供智能化、针对性的投资建议,提升客户服务质量。本研究基于证券行业现状及客户数

据,打通从数据底座到数据智能化应用通路,为客户提供“千人千面”贴身服务。目前已取得初步业务成

果,助力产品销售额达到15.1万,客户购买转化率提升约2倍,客户资产均衡性向良性方向发展。

资产均衡建模;深度强化学习;数据智能化

随着中国财富管理市场的迅速发展,截至2020年

末,中国的个人金融资产已达205万亿,互联网财富管理

市场达8.2万,同时客户人群也在持续年轻化,互联网财

富管理的主要客群为21-35岁,精准营销成为证券公司的

重要增长点。为了做好精准营销,证券公司需要关注三

大关键要素:1)以服务客户为中心;2)提供丰富优质

的金融产品和内容服务;3)利用人工智能技术实现最合

适的产品推荐。同时,内容服务已经成为券商APP的重要

业务,通过自动化实时获取客户偏好和有效的舆情信

息,纳入资产均衡模型,提高资产均衡评估的精准度,

是该模型优于已有资产均衡评估方法的重要维度。这些

举措有助于建立良性健康的合作模式,增强证券公司的

流量能力、顾问和陪伴能力,以及产品与投资能力,为

客户实现财富管理目标提供更好的支持。

2.1 客户资产均衡建模问题

资产配置是以投资者的风险偏好为基础,通过定义

并选择各类资产类别、评估资产类别的历史和未来表

现,来决定各类资产在投资组合中的比重,以提高投资

组合的收益-风险比。资产配置的核心,是资产种类和具

体投资的多元化,即资产配置均衡。客户资产均衡建模

就是从客户需求出发,为客户提供专业化、智能化、个

性化的投资顾问服务。

摘 要:

关键词:

一、我国财富管理市场现状

二、客户资产均衡模型

ITRDC证券信息技术研究发展中心(上海)

第30页

27 图2:资产均衡模型核心框架

行动的决策优化问题,会从训练数据中不断获得反馈,

持续加强对当前环境的精准反应,客户投资组合策略的

持续变化就是一个序列决策问题;第三,Model-Free深

度强化学习(如DQN)无需建模环境,无需大量标注数据,

用Action试错进行自学习。在客户资产均衡建模时,证

券市场环境复杂,变幻莫测,难以建模,强化学习可巧

妙解决此问题。

为解决精准营销问题,构建如图2的资产均衡模型核

心框架。首先,对客户兴趣偏好进行建模,采用树模

型、蒸馏学习建模客户偏好,学习客户产品浏览购买倾

向,以此加深对客户的理解。其次,对客户的资产分布

进行建模,资产分布的平衡性是客户资产均衡性的重要

评估指标,这也是金融产品精准营销场景与互联网推荐

产品的核心差异之一。再次,需要探索客户的潜在兴

趣,探索对客户而言不在其之前偏好范围内的优质产品。

基于这三个维度的建模,应用深度强化学习DQN网

络进行多维度因子融合参数自适应学习。DQN强化学习

的目标是客户长期资产收益率,以该目标为导向进行持

续应用探索、反馈强化,最终通过融合因子和融合参数

的结合,进行最终排序,形成客户资产均衡的结果集合

推送给业务端。

2.3 客户资产均衡模型详解

客户资产均衡模型主要包括客户兴趣偏好建模、客

户资产分布建模、客户潜在兴趣探索三个部分。

2.3.1 客户兴趣偏好建模

不同客户产品偏好不同,传统基于产品维度的营销

已经无法满足客户的个性化需求,精准识别客户兴趣成

为关键。该问题的解决思路是区分新老客户。首先,对

于行为较多的活跃客户,数据基础足够支撑进行GBDT建

模,学习活跃客户的点击偏好、购买偏好、风险偏好。

另一方面,对于新客户而言,也就是非理财客户,行为

和购买信息非常少,需采用蒸馏学习方法。在图3中左侧

的Teacher Mode中,训练的是活跃客户的相似度,数据

是最底层全部的数据特征,这样进行训练会得到较高的

学习精度,计算结果也是所有理财老客户相似度。进而

通过蒸馏萃取,输入到中部的Student Model,左侧是一

个新客户,右侧是一个活跃客户。这时Student Model并

不会采用客户购买行为等数据作为特征,蒸馏萃取以当

前新客户为基础,找到与其最相似的老客户,用老客户

偏好间接表示新客户偏好,提升对新客推荐精准度。

2.3.2 客户资产分布建模

客户资产分布学习是客户资产均衡模型的核心评估指

标。根据资产组合平衡模型理论,投资者根据自身投资

偏好,按照风险收益原则将财富分配给各种可供选择的

资产,形成最佳资产组合。一方面通过人工智能算法进

行客户资产分布学习,基于KL-Calibration的资产分布学

习是以客户历史数据为基础,挖掘判断客群中表现优秀

的产品组合,使用客户投资组合的夏普比率来引入对风

险的考量,形成理想产品投资分布。另一方面,在进行

产品推荐时,在符合客户兴趣偏好前提下,呈现更多与

其持仓产品差异大的产品可提升资产均衡性,采用DPP

《交易技术前沿》总第56期

第31页

28

图3:客户兴趣偏好模型

集合选优算法实现此目标。一般有两种提高多样性的方

法:1)使用规则控制;2)使用算法控制。常见的算法

模型包括有界贪心选择策略(Bounded Greedy

Selection Strategy, BGS)、最大边际相关性方法

(Maximal Marginal Relevance, MMR)和行列式点过

程方法(Determinantal Point Process, DPP),基于

DPP具有能兼顾相关性和多样性且效率高的特点。

2.3.3 客户潜在兴趣探索

建设客户资产均衡模型需对客户潜在兴趣进行探

索。客户兴趣偏好和资产均衡建模基于客户已有数据进

行,客户资产均衡模型需要探索功能对客户未知兴趣进

行探索,防止信息茧房。

如图4所示,通过Look-alike算法,用业绩优秀金融

产品对客户进行试探展示。使用业绩优秀的金融产品进

行探索,是因为即使客户并不感兴趣,也会被认为是一

个好的产品,不会引起客户强烈的反感。首先,找到业

绩优秀产品池,通过客户对产品的点击购买行为采用

Look-alike算法找到产品的“种子”客户表示。面对某

一客户,根据当前客户表示,找到与他距离最相近的种

子客户所对应的产品进行兴趣探索。为客户推荐与他相

似的人所偏好的优秀产品来作为他的探索产品,探索客

户的潜在兴趣,客户兴趣探索是在不同时间、不同场景

下,进行的不同力度的探索。

2.3.4基于深度强化学习的多维因子精准融合

完成对客户兴趣偏好、资产分布以及兴趣探索建模

后,可得到客户对不同产品的多维度评分,需对资产均

衡性评估的多维度因子进行有效融合,才能最终为客户

提供符合资产均衡性的资产配置建议,此模型的核心部

分为最终采用深度强化学习的DQN技术对多目标得分进

行自适应融合,得到客户资产均衡性全面评估。DQN融

合技术在图5算法中,S代表当前客户的场景属性以及资

产现状等,A代表多个融合因子参数的离散值的结合,R

代表客户购买产品后对短期的收益。客户购买产品后,

其获得的长期收益就是整个强化学习去学习的目标Q*

(S,A)。

2.4 智能内容理解模型

客户的资产购买意愿除了对各类资产的直接行为以

外,也可以从其他方面得以体现,如客户在APP内对各类

资讯的阅读偏好。实时对舆情信息进行智能内容理解,

能有效捕获对投资决策有价值信息,辅助客户投资决

策。通过建立智能内容理解模型获取客户对资讯文章的

偏好,进而发掘客户未购买的偏好产品,增强客户购买

意向,一定程度上达到使客户资产趋向均衡的目的。

智能内容理解模型的建设主要包括内容理解和模型建

设两部分。内容理解以对资讯内容的打标签、去重和情

感分析为主;模型建设通过机器学习和深度学习模型等

对客户进行智能推荐,推荐该客户可能感兴趣的资讯内

容,智能理解客户需求,辅助客户进行投资决策。

图4:客户潜在兴趣探索模型

图5:基于深度强化学习的多维因子融合

ITRDC证券信息技术研究发展中心(上海)

第32页

29 在对客户进行资讯等内容智能服务时主要用到

Xgboost和Wide&Deep等机器学习模型和深度模型。

Xgboost模型由多棵树模型组成,原理是通过不断添加新

的树模型拟合前一树模型预测的残差值来提升模型训练

的精度。树模型对特征特别是缺失值的处理具有天然优

势,Xgboost在智能内容理解模型中的使用主要集中在特

征选择阶段,筛选出重要度前100的特征,再将特征引入

深度模型进行训练和预测。客户资产均衡建模场景和互

联网场景不同,需要较高的模型可解释性。纯互联网场

景的推荐排序模型目前大多使用如ESSM或MMOE等深度

模型,层层网络迭代使推荐越来越精准,但纯向量化的

输入和计算也让模型越来越复杂,可解释性不强。结合

互联网和金融两类场景的不同特色,资讯智能推荐的模

型使用的是Wide&Deep排序模型,此模型结构上由线性

模型(Wide)和DNN深度模型(Deep)两部分构成,

Wide部分的让模型具有较强的“记忆能力”,Deep部分

的让模型具有“泛化能力”,使模型兼具逻辑回归和深

度神经网络的优点,除了能够快速处理记忆模型特征

外,更重要的是具有较强的表达能力。

2.5 模型业务应用架构

客户均衡模型涉及多类建模方法和不同外部数据源,

在架构建设上需要灵活应用不同的场景架构,并支持高

并发高可用的服务场景。架构设计理念包含以下两方

面:算法驱动,以人工智能算法为核心,给客户推送有

价值、高相关并符合资产均衡模型的产品等。高性能稳

定架构具备低时延、高可用性(99.9%)、服务自愈、弹性

扩缩容特性,同时包括完备的服务容灾、降级、应急方

案。离线服务保证数据低丢失率、样本熔断、数据容

错、自动恢复等特性。整体架构如图6所示,包括内容架

构、客户架构、召回架构、模型架构、融合架构。

此架构共包含两条数据流,请示数据流和反馈流。

1)请示数据流:客户请求精准营销服务,经过一层容灾

进入推荐主服务,主服务调用历史服务和客户服务获取

客户下发历史、ID映射、客户画像等数据。第二步请求

召回服务进行个性化召回,获取客户最可能感兴趣、对

客户有价值的内容列表和信息,通过去重服务进行去

重。第三步根据内容列表请求模型服务得到模型打分进

行排序,利用融合技术强插运营干预内容,最终返回给

客户进行展现。最后,主服务记录下发数据,防止刷到

重复内容。2)反馈流:反馈流技术是应用资产均衡模型

建设精准营销系统的核心,决定精准营销效果上限。客

户点击、停留、收藏等反馈信息通过APP埋点技术进行反

馈日志上传,在系统后端形成反馈数据。一方面,基于

反馈数据进行特征建设,包括内容维度的统计;另一方

面,反馈数据和客户请求数据结合,按照不同模型建设

目标,形成不同正负样本,进行模型训练,建设基于点

展行为的CTR模型和基于时长的多目标模型。

图6:基于资产均衡模型精准营销主服务架构

《交易技术前沿》总第56期

第33页

30

申万宏源的业务应用模式是创新性的,采用线上和

线下相结合、人工运营和智能算法相结合的方式。线上

场景主要依托智能算法,基于海量数据建模的客户资产

均衡模型提供精准营销服务,将产品等精准触达到客

户。线下场景主要包括营销人员通过营销平台对客户推

荐的产品进行配置和营销。同时,为客户展现的推荐产

品列表也是资产均衡模型推荐产品和运营产品结合产生

的。最后,收集客户反馈数据,基于客户画像和产品画

像等数据进行综合分析形成营销分析报告。营销人员获

取数据和分析结果加深对客户的理解,进一步通过线下

电话或者微信推广方式联系客户。

目前基于资产均衡模型的智能产品精准营销应用模块

已经在申万宏源客户APP的首页和理财商城上线,经过多

次策略升级迭代,精准营销产品和内容的平均点击率提

升20%以上,产品购买转化率提升近2倍,产品成交金额

达到15.1亿。此外,C端业务把精准营销的结果进一步扩

展到PC端理财商城、企业微信以及APP资讯推荐等模

块。智能内容理解模块目前已经在APP资讯相关模块上

线,线上点击率提升约20%。智能精准产品营销应用模

块目前共上线场景13个,包括APP端和PC端,不同场景

均基于客户资产均衡模型预估结果,在金融产品候选集

和个性化推荐策略上会存在差异。

同时重点打造B端亮点业务,例如对流失预警客户进

行挽留产品推荐、对资产发生异动的客户进行相应产品

推荐。通过资产均衡性建模,把股票投资客户向理财客

户进行转化,帮助客户实现资产均衡性配置。同时,通

过引入业界前沿人工智能技术带来更多年轻群体客户开

户。通过对客户持续深入了解,提升客户服务满意度,

为公司的财富管理转型提供强有力的技术支持。

基于深度强化学习的客户资产均衡模型,能在金融

行业有效智能化建模客户资产均衡性,综合考虑客户偏

好、资产分布、潜在兴趣探索、舆情内容理解等维度,

个性化评估客户资产,并提供客户资产配置建议。在技

术规划上,客户资产均衡模型未来将进行更精准建模,

提升客户资产均衡性评估精度,进而提升业务应用效

果:第一,采用DDPG升级DQN,由于DQN仅支持离散

Action,而目标融合是一个连续的过程,因此后续会升

级用DDPG这种更复杂的深度强化学习模型来提升融合精

度;第二,采用DNN升级GBDT,随着对业务理解的持续

加深采用非线性表达能力更强的DNN深度网络进行客户

偏好学习;第三,采用分布学习替代KL-Calibration,即

不同客户的理想资产分布是有差异的,升级为采用分布

学习进行自适应学习。

三、业务应用效果 四、总结及未来工作展望

ITRDC证券信息技术研究发展中心(上海)

第34页

31 谢杨军、王一帆|国泰君安证券股份有限公司|Email:xieyangjun@gtjas.com

云原生GPU虚拟化在证券投行业务

的创新实践

随着越来越多的新型容器化应用,例如高性能、深度学习应用,开始依靠GPU,有效支撑GPU在容器云中

变得至关重要。同时也更好地支持AI/ML业务的快速发展,虽然 GPU 虚拟化已经广泛,特别是在VM进行了

较深研究,而在容器做了有限的工作,现有很多场景停留在使用单一特定的 GPU 虚拟化技术来部署容器,

例如GPU直通或API转发,不仅缺乏远程GPU虚拟化优化。且没有释放 GPU 的全部能力。因此本文实践方

案采用云原生容器云GPU虚拟化,实现多业务共享,充分利用GPU算力、显存等资源,在资源调度层面可

以提供渲染混布和编解码混布,实现了AI 算力、渲染算力、编解码器等 GPU 全部资源的统一调度。

GPU虚拟化;云原生;容器;投行

1.1 GPU共享技术浅谈

GPU虚拟化与OS虚拟化是完全正交,通常我们指的

虚拟化为,CPU 虚拟化由 VT-x/SVM 解决,内存虚拟化

由 EPT/NPT 解决,而GPU属于PCIe设备,那么GPU虚拟

化即是PCIe设备虚拟化。GPU虚拟方案很多:

PCIe 设备直通。虚机等完整使用这个 PCIe 设备,

物理机上一样。这种方案,我们称之为 PCIe 直通(PCIe

Pass-Through)。很显然,PCIe 直通只能支持 1:1 的场

景,无法满足 1:N 的需求,其实并不能算真正的虚拟

化,也没有超卖的可能性。

SR-IOV: revisited,要实现 SR-IOV,需要满足两点:

硬件资源要容易partition和无状态(至少要接近无状

态)。但这类技术适合于网卡等设备,因GPU硬件复杂

度极高,远远超出网卡和NVMe设备,GPU 的 SR-IOV 利

用封装了 PCIe TLP 层的 VF 路由标识以及类似MPF技术

来实现虚拟化。

API 转发,API 层的 GPU 虚拟化是目前业界应用最

广泛的 GPU 虚拟化方案。它可以屏蔽底层硬件,灵活,

但也面临着其复杂结构带来的弊端。

MPT/MDEV/vGPU,这种方案本质是PCIe的虚拟

化,典型就是nVidia GRID vGPU、Intel GVT-g方案,而

且必须有一个 pGPU 驱动,负责 vGPU 的模拟和调度工

作。驱动也是强依赖不同厂家。

本文讲述的容器GPU虚拟化都是基于NVIDIA 生产的

GPU、且只考虑 CUDA 计算场景,GPU天然适合向量计

算。加速AI/ML场景落地。

如图用户是完全有可能绕过中间的限制,去直接触

达原生CUDA的,进而霸占整个物理GPU。很多业内技术

已实现“静态”与“动态”两种分配形式分配,静态很

好理解;所谓“动态”,就是在这个容器的生命周期当

中,虚拟GPU是可以被调节大小与数量的,一旦任务运

行结束(CUDA指令发送完成),那么被占用的虚拟GPU

资源立即释放,动态很适合云原生场景下,体现敏捷、

灵活等特点。

1.2 GPU虚拟化技术行业浅析

GPU虚拟化近些年在各行业均有发展,GPU并行计

算技术以其强大的计算能力,迅速在证券行业的多个领

域推广落地,特别是在量化策略交易、人工智能等应用。

阿里的cGPU(container GPU)[1]是最早提出的通过

内核劫持来实现容器级GPU共享的方案,向社区贡献了

一、GPU虚拟化技术及行业该领域浅谈

摘 要:

关键词:

图1: CUDA与NVIDIA driver关系

《交易技术前沿》总第56期

第35页

32

device plugin[2]和调度器[3]。,通过限制每个容器可下发

kernel的时间片来隔离算力资源,2017年收入使用阿里

GPUshare技术。但仅仅从显存切片,从而提高整卡利用

率。

腾讯提供了两种GPU共享方案。基于CUDA劫持,提

供了一套GPU共享解决方案GaiaGPU[4],GaiaGPU也提

供了Device plugin GPU manager[5]和调度器 GPU

admission[6]。基于内核劫持,提供了资源隔离方案

qGPU[7]方案。

百度的MPS+CUDA Hook的GPU隔离方案也是一种

CUDA劫持显存,使用MPS隔离算力。爱奇艺也适用

C U D A 劫 持 显 存 , 但 其 算 力 使 用 了 空 分 限 制 。 A W S

aws-virtual-gpu使用了Tensorflow框架隔离显存,MPS

隔离算力,但仅仅用于Tensorflow领域。 OrionX有别与

以上几家方案,最为出色特点为提供GPU池化类解决方

案,而且对Device plugin和调度器均有改动。

1.3 落地实践经验

在公司容器云GPU虚拟化落地实践前需要具备一定

前置条件:使用NVIDIA vGPU功能需要提前准备以下工作:

(1) 确保物理GPU型号支持虚拟化切割。

(2) 确保物理机BIOS中开启Intel VT-d / AMD

IOMMU功能,且物理机内核已开启IOMMU支持。

(3) 确 保 物 理 机 B I O S 中 开 启 S R - I O V 和 M e m o r y

Mapped I/O above 4GB功能。

(4) 确保已获取物理GPU驱动和vGPU驱动。相关网

卡驱动以及安装方法请联系网卡提供厂商获取帮助。

(5) NVIDIA vGPU功能与操作系统内核存在依赖关

系,确保物理机使用h76c、h79c及更高版本ISO。

(6) NVIDIA A系列vGPU需额外确保物理机操作系统

Kernel版本升级至4.18,GCC版本升级至8.3.1。

(7)PCI设备热插拔开关:用于设置是否允许云主机

热插拔GPU设备,默认为true。若热插拔时出现硬件兼

容性错误,或不支持该硬件设备时,建议关闭此功能

(设置为false)。

2.1 投行智能刷报

随着债券业务的市场不断扩大,监管提出了更严

格、更全面、更深入、更精准的信息披露要求,在尽职

调查、价值识别、持续跟踪、监管沟通等各方面对债承

业务部门都提出了许多务实的要求。监管强调压实中介

机构的主体责任,在此背景下,急需快速、高效、专业

的项目质量和风控体系建设。时至今日,人工智能等新

兴技术为代表的新一轮金融科技革命驱动着投行业务开

启新一轮的数字化与数智化变革浪潮,头部券商及部分

银行、基金等机构均已早早布局智能撰写系统。利用人

工智能技术来对投行文档进行智能撰写、刷数,不仅提

升了投行部门的工作效率、解放人力,还有效提高了对

外公开信息披露文件的质量,通过技术赋能投行业务,

提高执业质量的同时也降低合规的风险。

智能刷报撰写系统作为智能投行建设规划的一部

分,主要用于债券业务及财务类数据刷新。国内债券业

务排名靠前的大券商投行部门都已采用,极大提升了投

图2: GPU虚拟化

图3 :云原生业务GPU虚拟化部署yaml样例

二、投行业务云原生GPU共享实践

ITRDC证券信息技术研究发展中心(上海)

第36页

33 图4:云原生业务GPU虚拟化部署yaml样例

行债券文档的处理效率和信息披露质量,防范了合规风 险。智能刷报撰写系统,旨在加快推进公司投行业务转

型升级,打造智能化、数字化投行工作平台。运用行业

领先的人工智能、自然语言处理、深度学习等技术,搭

建一套投行智能撰写系统。以技术赋能、解放人力,系

统性提升投行业务效能,加强尽调手段与能力,提高信

息披露材料质量,降低合规风险。

业务系统中每一个微服务模块都是可以冗余部署

的,全栈容器化形式部署,支持各模块支持水平扩展。

系统所需的硬件配置与用户对性能与高可用等需求相

关,各个微服务模块都需要 CPU 算力与 GPU 算力,应用

层与AI层会打包到容器镜像中。

2.2 投行银行流水核查

随着科技的发展和数字化转型进程的加速,银行流

水核查也在不断地发生着变化。传统的银行流水核查方

式主要是人工审核,费时费力,且容易出现疏漏。而现

在,越来越多的金融机构开始采用自动化银行流水核查

技术,如人工智能、大数据分析等,以提高效率和准确

性。这些技术的应用使得银行流水核查更加快速、高

效、精准,同时也降低了人为因素所带来的风险和不确

定性。

银行流水核查对于证券行业投行业务的重要性不言自

明。它不仅能够帮助投行更好地了解客户的资金流动情

况,还可以帮助客户更好地管理自己的财务状况。同

时,银行流水核查也可以提高投行的信用评级和风险控

制能力,为金融市场的稳定和发展做出贡献。因此,银

行流水核查在证券行业投行业务中的作用和影响是不可

忽视的。利用云原生容器云GPU虚拟化技术,不仅提高

了GPU利用率,同时能在短时间内完成大量银行流水的

核查工作,并且可以实现自动化处理。这不仅提高了效

率和准确度,还降低了人工成本,最终为投行部门提供

了更加高效、准确、安全的金融服务,同时也促进了证

券行业的规范化和标准化。

图5:投行业务逻辑架构

《交易技术前沿》总第56期

第37页

34

三、结论与展望

目前GPU共享已经逐渐开始进入工业落地的阶段

了,云原生GPU虚拟化是未来云原生中台能力模块,在

解决解决GPU池化能力输出,同时提供其性能,而GPU

内存、带宽和延迟等豆影响着整体性能,未来可以尝试

从以下方向提高性能:

(1) 能够提供稳定的服务,运维便捷。比如MPS的

错误影响是不能被接受的,另外对于带有预测的实现,

也需要更高的稳定性。共享工作负载尽量降低。

(2) 更低的JCT时延,最好具有保障部分任务QoS的

能力。对于一个已有的GPU集群进行改造时,需要尽量

减少对已有的用户和任务的影响。

(3) 不打扰用户,尽量不对用户的代码和框架等做修

改,另外也需要考虑框架和其他库的更新问题。

参考文献:

[1]https://www.alibabacloud.com/help/zh/elastic-gp

u-service/latest/use-docker-to-install-and-use-cgpu

[2]https://github.com/AliyunContainerService/gpus

hare-device-plugin

[3]https://github.com/AliyunContainerService/gpus

hare-scheduler-extender

[4]https://github.com/librabyte/paper-reading/issues/1

[5]https://github.com/tkestack/gpu-manager

[6]https://github.com/tkestack/gpu-admission

[7]https://cloud.tencent.com/developer/article/183

1090

ITRDC证券信息技术研究发展中心(上海)

第38页

35 李晨辉、赵泽、王国喜|东方证券股份有限公司|E-mail:zhaoze@orientsec.com.cn

东方证券IT研发运营标准化探索与实践

数字化转型对于业务运营和精益管理的优化作用日益凸显,已成为企业降本增效的核心驱动力。在这场浪

潮中,金融科技却因其信息化起步早、业务场景多元化、监管隔离要求严等原因,使得数字化转型之路尤

为复杂和尴尬。多年来券商业务模式不断革新、技术持续演进,IT部门存量技术架构杂、数据孤岛多等现

实因素严重制约了IT项目标准化管理有效实施,历史工作惯性已成为数字化建设的沉重包袱。东方证券研

发总部在“一窗口,两平台”的IT数字化系统建设基础上,落地IT标准化管理、实现项目生命周期流程一

体化,向公司及业务部门输出需求跟踪和项目数字运营的可视化能力,取得了较好反响。

标准化;流程一体化;数字化;DevOps

IT研发运营标准化建设的目标是在安全合规的前提

下,以获得IT组织资源最优分配、最佳效率为目的,通过

项目管理规范的制订、管理系统建设、管理流程一体化

等一系列措施,建立统一IT管理标准的实践过程。知易行

难,建立一个可以切实落地的,面向全公司的、适合于

各条业务线的标准管理是充满难度和挑战的:

首先是规范和效率的博弈。规范的建立会利于组织

的效率提升,但流程的细致化可能会影响个体成员的效

率。证券行业线上化服务自90年代开始提供并延续至

今,IT各团队与各业务部门间已形成了多种协作模式。推

动统一的IT项目规范建设过程中,无论是需求的细化评

估,还是交付规范化等要求,都不可避免的破坏原有交

付习惯,让业务方产生麻烦、不灵活的感受。

其次是组织建设与职责范围的明确划分。项目生命

周期自需求评估与商务采购开始,经过研发、测试、部

署,到进入监控运营为止,涉及合规、商务、研发、运

行多部门多岗位协同工作。证券IT标准化建设的任务不单

单是将原以邮件和OA审批为主的协作手段进行线上化改

造,更重要的是通过切分工作流,建立各环节权责清晰

的标准化流程,把合规风控和管理要求落实在一体化流

程中,并推动完成新模式落地。

第三是团队和技术的复杂性。证券行业信息化起步较

早,早期以运维为主的环境下往往忽视基础工具的统一

和技术更新,存量项目中有复杂的历史架构、陈旧的技

术栈和各种烟囱式的定制化工具。想要交付过程规范

化,就要先从统一基础工具链建设入手,先具备开放性

去满足不同团队、不同项目的技术需求,再通过统一的

技术管理要求,作为度量和标准化的抓手。

尽管研发运营标准化工作面临艰巨的挑战,但缺乏

标准框架的IT项目管理会因为流程混乱造成沟通不畅、

权责不明、质量不稳定等问题。交付团队各行其是的后

果是IT部门既无法打通交付上下游流程,更因缺乏一致

性的衡量数据而难以定义团队效率。在业务需求和技术

人员日益增长的今天,IT部门无法通过项目数据驱动管

理决策就会承受混乱带来的成本增加。因此,东方证券

研发总部力求通过落地研发运营标准化推动项目技术能

力和管理能力的数字化升级,实现部门降本增效,从而

更好地去满足各方需求,帮助公司快速发展。

2.1 顶层设计

标准化体系设计首先要确定范围、内容和方法,保

证可操作性和成果的可衡量性。因此,实践设计以解决

现实问题为入手点,着力解决当前项目交付过程中IT外

部、IT管理、IT内部三个主要矛盾:

1)IT外部矛盾来源于业务部门与IT部门的认知差

异。一方面是前台与后台部门间对于成本与收益的权衡

角度不同,另一方面技术壁垒与业务复杂性增加了部门

间沟通难度。双方对需求价值和技术工作量间的认识差

异更会随着项目进度情况的不透明而逐步放大。

2)IT管理矛盾在于行政管理和技术管理的关注点不

同。行政管理重视整体,为所有项目提供稳定的运营环

境和合规保障,关注部门的整体运营、资源分配;技术

管理重视细节,关注项目开发任务的完成度,强调技术

架构的合理性。当前双方仅交汇于简单的OA更新上线

流程,会让管理人员无法看到项目过程中的问题和风

险,失去早期洞察和介入调整的能力。

3)IT内部矛盾在于研发与运维的诉求不同。运维团队

摘 要:

关键词:

一、背景

二、顶层设计与实践方案

《交易技术前沿》总第56期

第39页

36

需要更多的标准化和确定性,如功能、非功能需求,配

置管理、故障响应计划等来保障系统的安全性和可维护

性。而研发团队要不断的面对新需求的拆解与功能开

发,更加关注交付效率。缺乏自动化工具和流程混乱,

会在交接时产生大量文档对接和人工操作,随着迭代频

率的增加,目标不同会让双方产生对立情绪。

基于上述分析,研发运营标准化设计如图1所示:整

个体系应具备工作量化和进度可视化能力,通过各项目

价值流数据改善IT与业务部门沟通问题;拥有标准化和高

效的协作流程,兼顾可规模性管理的项目共性和下钻到

具体项目的技术特性,以全局化的管理视角解决IT内部管

理问题;通过建设自动化的工具和工作流水线减少重复

劳动,提高效率和安全性,解决研发、运维间协作问

题。所以,研发运营标准化体系要满足自动化、标准化、

可视化三个核心要求,通过流程一体化设计搭建既统一又

灵活,可以在实践中快速反馈及不断迭代的体系。

2.2 实践方案

研发运营标准化建设方案是“以统一平台为承载,以

管理规范为指导,以流程一体化为抓手”。如图2所示,

管理规范是外部监管与部门管理的集中体现,为流程建设

制定规则。流程一体化则通过重新整合岗位权责,以流程

推动管理规范落地,两者相辅相成。平台建设是一切的基

础,按业务功能划分成“一窗口,两平台”统一向内、向

外提供IT全流程管理和自动化服务。

标准化体系落地会涉及组织、流程等多方变革,让

所有项目遵循统一规范是一个长期的过程。因此,建设

方案遵循两个原则:

1.“统一开放”。所有项目和岗位应使用统一平

台,在流程交接节点执行统一标准,以质量门禁形式保

证提交数据、信息一致性。对节点以外的工作形式暂时

开放用以兼容历史存续,提高灵活性。

2.“持续反馈”。在实践中解决历史遗留问题,逐步

规范非标操作,根据现实状况不断增加规范化管理程度。

在“统一开放,持续反馈”的原则下,研发运营标准

化体系的整体架构设计采用服务化的形式。对已有的研发

运维工具和历史应用进行整合,将其下沉为服务后封装到

所属平台。平台间通过流程传递信息和数据,该架构既兼

容了历史工具和工作方式,又可以在未来对工具进行灵活

替换,避免了大量硬性切换系统造成的震荡和浪费。

3.1 平台服务架构

如图3所示,完整系统以三个平台间松耦合形式组

成,需求平台作为对外窗口,接受和评估业务需求,并对

业务方提供需求交付状态;IT数字化平台作为项目规划管

理平台,从项目里程碑维度对商务、人力、运营等方面执

行行政管理;研发运行一体化平台作为交付管理平台,将

项目管理能力下钻到研发、测试、运维监控等细节。平台

间遵循使用统一的命名规则、数据字典、项目系统表等要

求,交互时以项目和版本两个维度为锚点进行关联。统一

的流程引擎、待办管理、Jira等工具支撑平台间以流程形

式完成任务交接、审批等工作,实现系统的流程一体化。

3.1.1 需求管理平台

该平台以业务部门需求为关注点,对外提供需求发起

入口,支持公司级部门间的审批要求,对内增加需求分

三、 技术实现

图1:顶层设计

图3:服务架构

图2:建设方案

ITRDC证券信息技术研究发展中心(上海)

第40页

37 析、需求拆解等环节,以开发任务维度串连IT管理和开发

数据。平台提供数据统计功能,按业务部门的角度生成

统计报表,实现需求成本,工作量和交付过程数据可查

询,结束交付过程黑盒子的情况,极大增强IT工作可视化

能力,是部门间沟通和协作的重要窗口。

3.1.2 IT数字化平台

IT数字化平台作为部门管理维度的数字化系统,负

责项目里程碑级别管理和IT部门各维度的规划管理工作。

商务管理:预算填报、采购申请、招投标、公司级

合同、合同验收、合同支付。

项目管理:项目前评估、立项、更新/上线、项目验

收、项目后运营。

人力管理:实习生/外包员工的入职、离职、分摊、

系统交接。

部门管理:系统管理、奖项管理、数字化驾驶舱、

软件管理。

3.1.3 研发运行一体化平台

该平台从技术维度上管理从需求到生产发布的整个交

付过程。平台以流水线形式实现持续集成和持续交付的

职能,将交付标准化通过平台的流程管控落地,并以流

水线形式提供给研发、测试、运维等不同角色所需的自

动化能力。架构如图6所示,研发运行一体化平台以三层

架构设计分离工具、功能与操作,通过版本管理流程贯

通项目交付全流程的数据链路为目的,通过提测单、变

更单等交付节点链接软件开发生命周期中涉及的多个阶

段和不同岗位工作【1】。

3.2 技术架构

整个体系在技术实现上均以云原生架构为主,采用

微服务形式保障工具和功能可以灵活调整变化的需求。

以服务治理框架构维护服务调用关系及拓扑结构,提供

服务注册发现、负载均衡、黑白名单等功能。服务均以

镜像形式通过研发运行一体化平台部署于公司信创容器

平台/云管平台,提供服务的敏捷迭代、动态伸缩等能力。

标准化体系自身服务也使用研发运行一体化平台管

理交付,如图8所示,该平台基于DevOps方法论,整合

研发运维工具链,提供一站式的自动化工具管理和完整

的交付审批流程。

图4:需求平台架构

图6:研发运行一体化平台架构图

图7:云原生架构

图8:技术架构

图5:IT数字化平台架构图

《交易技术前沿》总第56期

第41页

38

实践至今,部门通过统一平台和流程一体化建设逐

步实现项目管理规范化目标。如图9所示,三个平台各自

聚焦其业务重点,通过流程一体化实现平台间数据交

互,覆盖项目由需求立项到交付全周期,从而获得落地

标准化和全局可视化能力。进一步的,为实现数字化运

营,抽象项目前、项目中、项目后三个环节作为数据的

交汇点,用以追踪需求、项目过程数据,以数据辅助部

门项目管理。

4.1 管理规范

管理为先,建设为要,研发运营标准化体系以部门

管理要求为指导。通过《软件项目管理规范》制订项目

管理要求,确保软件项目管理工作流程具有一致性。对

各环节准入准出工作的内容、成果、文档格式等进行明

确,规范了软件项目实施工作中的管理流程,从质量管

理的宏观角度对软件项目生命周期进行节点把控。

技术方面以《架构决策》建设体系化及分层次的架

构评审机制,对项目技术向如数据、工具、中间件等方

面分别实行立项前评审和上线前评估。通过架构组织完

成企业架构的标准化及规范化落地工作,掌控架构、系

统细节,具备遵循架构标准进行研发的能力【2】。

4.2流程一体化

流程一体化是指通过重新梳理业务流程、审批流

程、数据传输流程等,打造从业务的最前端完整延伸到

业务结束的全周期流程,是部门规范管理的应用和体

现。研发运营标准化体系通过需求、交付、项目三条业

务流设计,以流程覆盖项目管理全生命周期,以自动化

工具获取数据,又通过流程要求推动项目管理规范落地。

4.2.1需求全周期管理

需求管理以需求接受-评估-拆分-跟踪-验收等环节组

成完整链路。在流程中遵循证券行业“合规先行,保持

风险意识的原则”,需求接受和上线审批流要经过相关

部门以确保符合监管要求。在工具上提供看板、版本跟

踪等功能实时展示需求状态、工作量、排期等信息。在

数据上记录需求评估的价值、工作量、实际交付等信

息,作为项目交付后运营和年终复盘的数据依据。

四、实践成果

图9:数据与业务流

图11:架构决策示例

图10:项目生命周期规范管理视图

图12:需求接受及处理

图13:需求立项

ITRDC证券信息技术研究发展中心(上海)

第42页

39 4.2.2 交付全周期管理

项目交付作为IT部门的核心工作,涉及技术、人

员、硬件、软件多方面工作,包含复杂的细节。同时,

证券行业上到机房建设、网络安全,下到系统更新、配

置更改都有严格的合规风控要求。因此,交付管理不但

要提供自动化工具满足技术要求,更要通过流程设计保

证工作按照既定的管理要求执行,从而实现项目交付过

程的完整留痕和有效合规。

1)工具自动化

研发运行一体化平台通过纳管工具链,将散落独立

的工具重新组织,以流水线形式提供交付过程中所需的

功能。通过唯一可信源和制品晋级制度,管理多网络环

境下多机器集群的部署和运维白屏操作。在提高效率的

同时,通过逐步引导交付团队使用统一工具来标准化交

付过程数据。

2)流程管理

交付管理以需求-版本任务-提测单-变更单-管理审批

-生产部署等流程建立自动化交付全流程,串连研发、测

试、质控、运维等岗位交接工作。通过版本管理、质量

门禁、制品管理晋级制度等保障合规等管理标准化监督

落地,也为工作量化提供坚实的基础。

图14:需求交付状态可视化 图17:制品管理

图18:多环境一键CICD

图19:版本管理

图20:提测管理

图15:可配置的自动化功能

图16:自动化流水线

《交易技术前沿》总第56期

第43页

40

4.2.3 项目全周期管理

项目管理以立项-评审-商务-质控-上线更新-验收等

流程,流程上在项目里程碑维度进行行政管理,通过流

程审批要求落实管理工作。工具上结合部门商务、人力

等数据建立项目前评估-项目中跟踪-项目后运营的数字模

型,可通过项目流程下钻查看历次交付数据细节,强化

部门数字化和可视化能力。

4.3 数字化运营

随着研发运营标准化建设的推进,项目管理逐步规

范化。不同项目在需求-评估-执行-交付;立项-评审-更新

-验收;研发-测试-质控-运维等多个维度的数据有较高程

度的完整性和一致性,基本具备通过数字描述项目过程

和状态的条件。当前部门已将成本、价值、质量、交付

效率、业务需求历史成功率等数据用于项目前评估和项

目后运营,作为部门盘点和效能的参考依据。未来计划

建设数据中台汇聚形成部门运营的数据统计。逐步通过

提高数据质量和展示能力实现以价值为导向可视化洞悉

问题,从而改善局部环节,优化整体管理。

图21:变更管理

图25:项目交付审批记录

图26:更新审批质量门禁

图27:项目后满意度调查

图22:项目里程碑管理

图23:商务流程

图24:人力资源池

ITRDC证券信息技术研究发展中心(上海)

第44页

41 图28:团队效能数据测试环境

图29:项目交付数字化

图30:部门管理数字化运营测试环境

图3: 项目后运营测试环境图1

图32:项目后运营测试环境图2

东方证券系统研发总部经过多年的规范建设,通过

对部门管理的规划和内部流程的重新设计成功的将零散

的IT业务串联起来。以工具自动化提高技术效率,以制度

标准化规范IT管理行为,基于一体化流程落地研发运营的

标准化管理,初步搭建了IT数字化管理体系。在未来,会

进行以下几个领域的进一步工作:

1.以数据驱动决策。利用已经建立的数字化研发运

营体系,进一步挖掘和分析数据,通过数据驱动,发现IT

部门的交付瓶颈,从而有针对性的改进

2.持续流程优化创新。一方面当前一体化流程为了

兼容历史遗留问题,随着这些问题的不断标准化可以进

一步完善流程。另一方面随着业务和技术环境的不断变

化,也要定期审视和更新流程。

3.拓展数字化应用场景。结合我司已有的“东方大

脑”、“RPA”、“繁微”等智能服务、数据分析平台,

进一步拓展数字化体系的功能和价值。

东方证券将继续秉承开放共享、合作共赢为原则,

以金融科技规划为引领,通过IT数字化管理转型驱动创

新,以科技为业务赋能,不断助力公司数字化转型与行

业创新发展!

参考文献:

[1]樊建、赵泽. 《东方证券研发运行一体化平台探索与实

践》 .交易技术前沿,Vol.50,2022.12

[2]樊建、严伟富. 《企业级证券业务中台探索与实践 》.

交易技术前沿,Vol.49,2022.09

五、总结及展望

《交易技术前沿》总第56期

第45页

42

徐鑫鑫、陈心亮、李军林|中国证券登记结算有限责任公司上海分公司

E-mail:xinxinxu@chinaclear.com.cn

业务流程治理体系探索及实践

业务流程管理(BPM)系统在中国结算上海分公司具有多年发展历程,承载着登记结算业务的办理入口和

业务流转职能,是业务与技术融合的典型应用。随着公司数字化转型进程的不断加速,中国结算上海分公

司紧随行业发展趋势,积极开展新一代BPM系统建设,围绕BPM系统探索建立符合司情的流程治理体系,

在业务实践中加强经验总结,将数字化、智能化理念融入日常业务流程中,持续加强技术创新引领、激活

数字化经营动能,不断提高组织效率,提升运营质量。

流程治理;标准建设;数字化;智能化

1.1 数字化转型要求

2023年中央金融工作会议指出,要做好科技金融、

绿色金融、普惠金融、养老金融、数字金融五篇大文

章,推动我国金融高质量发展。数字金融是现阶段金融

通过数字化转型发展起来的新金融业态,是金融在社

会、经济、科技发展潮流下的大趋势。中国证监会组织

相关单位编制了《证券期货业“十四五”科技发展规

划》,阐明了“十四五”时期证券期货业科技监管工作

和行业数字化转型的指导思想、工作原则。在行业数字

化从多点突破迈入深化发展新形式下,作为资本市场重

要基础设施,我司积极拥抱数字化变革浪潮,驱动业务

转型升级,是时代发展的必然要求。

业务流程管理(BPM)系统是职工业务办理的窗口

和工作站,处在用户感知的第一线。运行于BPM系统上

的各类业务流程,从最初的线上化、电子化逐步向数字

化、智能化发展,推动业务办理模式不断优化升级,伴

随着公司数字化转型的深入开展,如何进一步开展业务

流程改进优化,更好的支持新一代登记结算系统建设,

是在工作实践中值得深入研究的重要课题。

1.2 流程治理的意义

业务流程治理,是一种包含理论方法、演进规则、

评价手段、使用工具和管理实践的结构性方法,确保企

业建立起长期有效的流程管理规则和运营机制,保证流

程体系的有效执行和持续改进,从而实现企业战略目

标,提升业务能力。流程治理可以提高组织的效率和质

量,降低成本和风险,加强组织内部的沟通和协作效率。

中国结算上海分公司BPM系统的建设工作于2009年开

展实施,累计部署200多个流程,基本覆盖所有操作类业

务,有效提升了业务办理的电子化水平和安全性,成为

公司业务办理中不可或缺的一部分。但BPM1.0主要实现

业务流程的线上化改造,存在流程环节多、流转时间

长、办理效率低等问题,重平台、轻标准,流程优化和

流程管理手段较为缺失。中国结算上海分公司于2020年

启动新一代BPM系统(BPM2.0)研究和建设工作,结合

RPA(Robotic Process Automation,机器人流程自动

化)、OCR(Optical Character Recognition,字符文

本识别)等相关技术,将数字化、智能化理念融入日常

业务办理过程,逐步探索建立具有登记结算特色的流程

治理体系,以期实现对流程改进和治理能力全方位、系

统性重塑,推动业务场景中技术、数据和管理有机协同。

中国结算上海分公司业务流程的范围包括登记、回

售类等发行人相关业务,结算、账户类等结算参与人相

关业务,开户、过户类等投资者相关业务,以及内部财

务、管理类等业务,业务办理模式正逐步由电子化向数

字化、智能化方向转变。

在BPM系统建设之前,业务办理的每一步都需要由人

工进行操作,业务材料以纸质材料形式进行传递,以完

一、研究背景及意义

二、流程办理模式发展变迁

摘 要:

关键词:

图1:中国结算上海分公司流程办理模式发展变迁

ITRDC证券信息技术研究发展中心(上海)

第46页

43 图2:BPM流程治理体系架构图

成具体单一的某一任务为目标,业务办理效率低、风险

高,管理不便。BPM1.0系统的建立,为业务流程线上化

打下了基础,流程办理的工作步骤设为独立环节,多个

环节串联形成了线上流程,初步实现流转记录和业务统

计,解决了流转和时效性问题。伴随着流程线上化工作

的深入开展以及BPM1.0系统的不断完善,实现了流程设

计、流程建设、流程推行、流程运营全线电子化,目前

分公司大部分BPM流程处于电子化阶段,这种模式能够

达到业务办理闭环,缺点是办理环节多,对平台模型依

赖较重。近几年,分公司流程处理模式逐步开发出了自

助式办理和智能化办理等新的形态:自助式流程办理以

数据驱动代替业务驱动,自动完成委托受理并实时反馈

查看,给予业务申报人更大的自主权;智能化办理是将

RPA、OCR等新兴金融科技技术融入流程办理过程,简化

用户操作,为业务流程办理模式注入智慧基因。

业务规模扩大化、业务规则复杂化、业务数据多元

化不断考验着技术与业务的融合能力。单纯的流程由线

下搬至线上已无法满足发展需要,围绕BPM系统建立流

程治理体系是数字化转型的必然要求。中国结算上海分

公司流程治理体系,是在实际工作中逐步提炼深化,以

业务需求为牵引,以流程标准化建设+平台技术支撑+金

融科技赋能+数字化生态建设为主要内容,锚定“三提两

强一防”目标,打造技术引领、业务-数据双驱动运行体系。

3.1 流程标准化建设

流程的标准化,是流程治理体系建设的基础,有了流程

标准化,才能更好的实现业务的规范化和自动化管理,更好

的助力流程优化反馈和改进。

流程标准化建设,实质上是建立一套业务场景流程化的

方法论,以统一的标准、统一的要求实现对各类流程的

规范、改进和提升,从而获得更高效更优质的运营效

果。中国结算上海分公司结合多年实践经验,建立起流

程治理“五步法”,按照流程识别、流程分类、流程设

计、流程实施、流程改进步骤对业务场景进行锁定分

析,实现场景流程化全生命周期管理,确保流程所经过

的每个管理过程都按照标准化要求执行。

流程识别,用于确定各种业务流程,并对其进行起

底评估。目前流程识别主要有两个来源,一是业务主办

部门制定和发布业务流程,根据发布的规章转化为电子

流程;二是在日常工作发现的操作制约点和瓶颈,通过

试点流程挖掘,确认是否需要进行流程化处理。对于不

适用流程办理的业务,建议直接实施系统改造对接,适

用流程化改造的业务场景,还要进一步进行流程分类。

流程分类,用于确定流程实施对应的模式,根据流

程分类实施标准,对于不同的业务场景采用不同的设计

模式:对操作步骤较少、操作环节明确、风险性较高的

业务场景,建议采用流程电子化模式;对有外部参与

人、数据量大、实时性要求高的业务场景,建议采用自

助式流程处理模式;对规则明确、重复性操作多、办理

频次高的业务场景,建议采用智能化流程处理模式。

流程设计,对已经识别和分类的业务流程,按照不

同设计模式进行设计开发。电子类流程,依据流程梳理

表,采用统一标准进行技术建模,在编码开发前使用

BPM系统开发工具实现流程数字化设计,流程的设计需

要遵从BPM系统架构要求,采用标准化工作交付件,如

流程图、流程展示样式、表单排版等,按照统一要求完

成和实现;自助式处理类流程,建立样式统一的申报界

面和模式统一的系统校验改造规则,以确保其可行、高

效和规范;智能化流程则充分借助RPA、OCR系统开发工

具和设计规范,确保开发、测试过程不走样、不变形。

流程实施,将完成建模和设计的流程上线,实现业

务数据和业务材料线上操作,确保每个环节都能按照规

定执行。在流程执行层面,同一业务场景下业务流程只

有一个,不管发起人、执行者具体人员是谁,都按照既

定流程执行,所有角色参与人员都按照同样标准执行。

流程改进,BPM系统提供多渠道全方位监控手段,

通过作业监控、指标统计等方式对流程的执行情况进行

跟踪。对流程发起、流转、运行、办理过程等多维度数

据进行分析,将系统数据接入大数据平台进行深度分

析。建立流程反馈渠道,收集业务人员在流程办理过程

中对流程的感受、意见和建议。根据监控结果和用户反

馈,对流程进行不断改进和优化,形成流程优化闭环。

三、流程治理体系初探

《交易技术前沿》总第56期

第47页

44

3.2 平台技术支撑

3.2.1 新一代BPM系统建设

BPM系统是流程建设和运营的支撑平台。中国结算

上海分公司新一代BPM系统建设项目搭建了适配国产化

软硬件环境、自主可控新型BPM平台,通过微服务化实

现核心引擎应用与业务分离,能够快速推广部署于相关

业务领域;业务流程运行于一套平台之上,支持业务流

程竖井化开发和部署,形成结构化、一体化、系统化流

程管理和运营工具,实现工具和方法论的有机统一。

3.2.2 完善监控及数据分析手段

流程治理是一个持续的过程,需要对BPM流程运行情

况不断进行监测和改进,以适应业务的变化和发展需

求。健全的监控方式和数据分析手段是促进治理水平持

续提升的有力抓手。新一代BPM系统实现业务办理多维

度深层次监控,建立合理高效监控模块,包括作业监

控、部门流程查询、流程办理统计等,提供对流程的查

询、管理和监控统计,如任务运行日志查询、异常任务

处理、全部流程实例查询、流程使用统计等,建立起

BPM流程完整的监控功能体系。

在数据分析层面,新一代BPM系统将业务数据从

BPM流程数据库中分拆,业务办理主数据、办理明细数

据、原始明细数据将存储到业务数据库,实现业务数据

和流程数据相分离,进行数据分析统计时更加安全、高

效,推动BPM流程数据治理、数据流动、数据共享技术

实现,形成多层次、多维度的数据治理机制,充分发挥

数据的核心要素积极作用。

3.3 金融科技赋能

技术的价值,更多体现在为业务赋能。中国结算上

海分公司坚持业技融合创新,通过研究-试点-推广模式,

不断推动金融科技在业务领域的深度应用。根据业务实

际需要,将RPA、OCR等技术引入到业务办理中,取得了

较好的应用效果,为流程治理体系的发展注入充沛动力。

表1:流程治理环节相应标准

图3:智能BPM系统应用架构图

表2:BPM2.0系统监控功能模块

ITRDC证券信息技术研究发展中心(上海)

第48页

45 RPA是一种根据预先设定的业务规则操纵多个不同

系统、自动完成特定功能和任务的软件,在处理大批

量、重复性业务操作上具有天然优势。RPA业务在实施上

具有“短、平、快”特点,不侵入系统数据,对办理效

率带来立竿见影的效果,RPA与BPM系统结合,能够有

效减轻业务人员操作量,实现跨系统、跨角色、跨时序

的业务灵活定制与编排。例如某开户业务,RPA机器人每

日可替代人工处理30余笔业务,每半小时自动进行开户

业务的接单、审核、流程处理操作,单笔操作时长在3分

钟以内,相比人工操作,耗时降低80%以上,同时业务

处理更加及时,有效提升客户满意度。

OCR技术能够有效进行文本识别和转换为可编辑、

可搜索文字,替代人工识别转换、比对文档中的业务数

据,既减轻了业务人员的工作压力,也能提高业务办理

效率。例如某对账业务,该业务场景需要从外部系统下

载电子单据,将进行分类,根据不同类别的电子单,提

取不同业务要素并录入到系统中,用于系统对账。该业

务工作量大,准确性要求高,在RPA与OCR协同作用后,

办理工作时间由2小时缩减至30分钟左右,业务人员只需

要最后阶段确认数据的准确性,有效降低劳动负荷。

聪者听于无声,明者见于未行。金融科技作为技术

驱动的金融创新,是系统不断发展向前重要引擎。通过

加强对生成式AI、数字原生、隐私计算等新兴金融科技的

的研究,不断引入新技术、新路径,借助外脑推动中国

结算上海分公司流程治理体系高质量发展。

3.4 流程数字化生态建设

3.4.1 探索引入流程挖掘

流程挖掘核心原理是从信息系统的事件日志中提取

有价值的信息,用数据驱动的方式自下而上来发现、

监控、仿真和改进实际流程。流程挖掘技术有效扩充了

流程识别体系,为流程治理提供更科学、智能化的工具

和方法。新一代BPM系统建设过程中,建立了统计指标

体系,其中流程维度指标包括流程办理时长、流程参与

部门数、流程参与角色数等;任务维度指标包括任务等

待时长(从到达到领取)、任务办理时长(从领取到提

交)、任务打回/回收次数等指标;岗位维度指标包括人

员参与流程数、办理环节数、环节办理峰值等,同时提

供指标的按月比对数据,呈现业务的发展情况,以期辨

识业务流程慢点堵点,为业务流程的进一步优化提供数

据支持,稳妥推进业务由经验决策型向数据决策型转变。

3.4.2 营造流程持续改进氛围

目前中国结算内部已经建立良好的流程使用氛围,无

论是通过业务主办部门制定和发布业务流程还是日常工

作的流程发掘,越来越多的业务人员愿意通过使用流程

来改进工作过程,提升工作效率。

流程治理不仅仅是一次性的流程标准制定和系统建

设,还需保障流程的持续性和灵活性,因此,需要不断

强化数字思维、培育数字文化,提升全员数字素养。一

是进一步在公司内部树立流程的权威性,打造“重视流

程、使用流程、管理流程”的氛围,确保流程得到有效

执行,避免出现绕开、避开流程的现象,形成按流程执

行的操作习惯。二是建立流程改进机制,及时发现实际

业务需求和线上流程之间的偏差,消除可能存在的业务

流程与实际执行不符的潜在风险,协助流程主办部门进

行端到端流程分析,形成业务人员和技术人员联动机

制,积极听取一线流程办理人员反馈意见,根据意见和

建议进行流程迭代改进,消除操作堵点和瓶颈,循序渐

进培养分公司持续改进的BPM流程机制和流程文化。

中国结算上海分公司通过标准化、搭平台、引技

术、建生态四驾马车带动流程治理体系的发展,随着业

务规模不断扩展,系统数字化迭代进程加快,流程治理

体系也紧随趋势不断调整、优化、创新。基于业务实践

的流程治理探索取得了一定的成果,重塑了证券登记结

算业务流程,建设经验可复制、可推广,形成了一套业

务流程数字化转型标准体系和规范,夯实了数字根基。

对业务流程的严格管理和监控措施也有助于预防和减少

潜在的风险隐患。

下一步,中国结算上海分公司将持续推进流程治理

体系建设,充分进行金融科技的前沿探索,不断深化流

程挖掘技术的研究和应用,采用流程自动发现、复杂事

件处理等技术和工具,开展流程挖掘和流程再造,发挥

基础技术能力对于推动业务办理高水平运转的核心支撑

作用,为公司及行业数字化转型持续贡献力量。

参考文献:

[1]权国志.BPM业务流程平台通用化研究[J].信息与电脑

(理论版),2021,33(13):114-116.

[2]张春阳,李晓丹.以数字化流程再造为突破,打造中小银

行科技管理新生态[J].中国金融电脑,2023,(12):11-13.

[3]曹善文.基于流程挖掘视角下的数据要素利用研究[J].

信息通信技术与政策,2023,49(04):59-64.

[4]戎力.机械性重复劳动可交给机器人[J].《计算机与网

络》.2018,44(07):32-33

四、总结与展望

《交易技术前沿》总第56期

第49页

46

王岐、王晓龙、李鑫、赵晓红、刘震、于召洋|中信建投证券股份有限公司

E-mail:wangqixx@csc.com.cn

基于《证券期货业信息系统压力测试指南》

的集中交易系统压力测试实践

近年来证券期货行业交易系统宕机事件时有发生,究其根本原因其中多数为系统性能问题。压力测试作为

信息系统性能保障最重要的环节,越来越受到监管机构和证券期货公司的重视。中信建投证券股份有限公

司交易系统压力测试工作开展多年来,对标2023年《证券期货业信息系统压力测试指南》(意见征求稿)

中各项要求,提出“补短板、锻长板”的改进要求,经过半年多的完善,相关工作效果取得明显提升。本

文通过对中信建投证券集中交易系统压力测试工作的介绍,使读者对相关工作有全面的了解。同时,本文

阐述了如何通过对标“指南”中的要求,使公司信息系统压力测试工作的规范性、标准性和科学性得以进

一步完善。

交易系统性能;压力测试指南;压力测试指标

2023年中国证券监督管理委员会科技监管司、上海

证券交易所、上交所技术有限责任公司、深圳证券交易

所、大连商品交易所、上海期货交易所、中国证券登记

结算有限责任公司上海分公司及多家证券、基金、期货

公司,交易系统软件开发商共同编写了《证券期货业信

息系统压力测试指南》(意见征求稿)(以下简称“指

南”)。指南对证券期货业信息系统压力测试的原则、

内容、目标、流程等几个方面进行了详细的阐述,旨在

对证券期货业压力测试进行全面规范,提升行业信息系

统压力测试能力,提高压力测试质量,控制压力测试实

施风险,从而提升行业信息系统运行的稳定性和可靠性。

中信建投证券股份有限公司自交易系统大集中以来,

由于客户数量合并增多,交易行为趋于活跃,单个交易

节点吞吐量成倍增加。根据《证券期货业网络和信息安

全管理办法》第四十八条之规定,证券期货业关键信息

基础设施运营者应当对关键信息基础设施的安全运行进

行持续监测,定期开展压力测试,发现系统性能和网络

容量不足的,应当及时采取系统升级、扩容等处置措

施,确保系统性能容量在历史峰值的三倍以上,交易时

段相关网络带宽应当在近一年使用峰值的两倍以上。鉴

于此,中信建投自主开发了压力测试工具,实现模拟客

户发送不同业务请求的功能,并能够对业务处理的延

时、吞吐率、CPU等指标进行实时统计和展示。压测目

标主要是针对综合处理性能进行评估,业务样本取自生

产系统实际运行过程中占比较大、排名靠前的若干功能

号,并依据实际占比控制各功能号每秒发送请求的数

量,达到与生产运行状态基本一致的效果。客户样本是

脱敏系统内实际持仓的客户,随机抽取,保证客户样本

的可用性和随机性。综合性能评估以来,在实际升级变更

过程中确实提前发现过一些功能号耗时过大的系统问题。

但是由于近年来系统复杂度增加,客户使用程序化

交易等因素影响,交易系统瞬时并发量突增的情况越来

越多。跨系统调用、爆款产品定时销售等突发事件导致

的系统综合性能下降情况时有发生,当前系统性能容量

方面的风险逐渐显现。原有的综合性能压力测试方案存

在测试环境、工具配置、功能号入参、报告编制等方面

的不足,对压力测试工作的效率和结果造成了一定的影

响。“指南”基于证券期货业信息系统技术特点和业务

类型、监管要求等因素考量,对交易系统压力测试工作

进行了全面指导,在测试流程、测试管理方面提出要求

并给出落实方法。尤其在压力测试指标及度量方面提出

统一标准,使行业信息系统压力测试工作有据可依。

本文将结合中信建投证券压力测试工作实践,在组

织架构、测试环境、测试工具、测试流程、测试内容、

测试报告六个方面进行说明。

2.1 压力测试工作组织架构

中信建投为支撑及保障压力测试有效开展,进行了合

理的职能设置并建设了完善的治理架构。在组织架构方

面,压力测试相关团队包括基础架构组、交易系统运维

组和交易系统开发组。基础架构组组织牵头并负责维护

测试环境、压力测试工具、落实具体压测工作,交易系

一、引言

二、中信建投证券交易系统压力测试工作

摘 要:

关键词:

ITRDC证券信息技术研究发展中心(上海)

第50页

47 统运维组对压力测试报告进行确认并依此评估交易系统

升级变更风险,交易系统开发组提供应用系统和数据库

升级变更的技术支持。

在交易系统升级变更之前,由系统开发组发起压力

测试申请并提供应用程序、数据库升级变更脚本给基础

架构组,后者准备压力测试环境进行多场景压力测试,

形成压力测试报告后评估升级风险并反馈给开发组和运

维组。交易系统升级窗口期,运维组会在生产环境进行

最后的验证测试,确保性能没有问题后留存相关资料并

正式投产。

2.2 压力测试环境管理

为确保压力测试的有效性和准确性,需要对压力测

试环境进行有效规划、配置、维护和管理。中信建投证

券压力测试环境对标生产环境,全部使用物理机部署。

数据库采用4路服务器,应用中间件采用2路服务器。根

据系统各组成模块对于硬件资源的不同要求,分配不同

配置的机器,如交易中间件一般配置主频高服务器、通

讯中间件配置低延迟服务器。考虑到降本增效,压力测

试环境服务器硬件基本来自生产环境利旧的服务器,在

计算能力方面略低于生产环境。此外,为了更好的与生

产环境对标,压测环境网络均为万兆接入。

压力测试环境由专人维护,如日常的监控、巡检

等。在发现故障时可以及时响应和处理,避免影响压力

测试相关工作。此环境被定义为敏感测试环境,与其他

开发测试环境网络物理隔离。访问压力测试环境通过双

因素认证的虚拟桌面进行,有效防止非授权访问、数据

隐私泄露、网络攻击等。

2.3 测试工具

基于交易系统高吞吐量、低延迟、注重稳定性等要

求,中信建投证券自研了交易系统压力测试工具。该工

具可以对交易系统进行全链路压力测试和评估,评判交

易系统在高负载条件下的性能和稳定性,用于系统变更

或者升级后上线前的检测,提前发现潜在的问题和风险

并及时反馈,减少业务中断风险。

2.4 测试流程

“指南”对压力测试流程提出了明确的要求,中信

建投证券交易系统压力测试可以从测试规划、测试设

计、测试执行、测试总结四个方面说明。

2.4.1 测试规划

首先分析测试需求,根据升级变更文档明确测试对

象、测试指标、测试方法、测试资源、测试风险等。根

据测试需求制定测试计划,并通过DEVOPS工具分配测试

任务,明确任务负责人、时间要求,并通过流程审批跟

踪任务进度和结果。

2.4.2 测试设计

压力测试设计主要包括业务场景设计,如业务场景

有混合压测、基准压测、专项压测等;测试环境设计,

如扩容应用中间件数量、应用新硬件新驱动、更新操作

系统补丁等;压力参数设计,如增大某个功能号占比、

调整并发数等。根据每次升级变更内容,针对可能影响

性能的业务变化,需要设计补充新的测试用例。

2.4.3 测试执行

根据测试方案执行测试用例,记录测试结果进行实时

分析。基线压力测试通常运行20分钟左右,对交易系统

整体性能进行观测和评估;摸高压力测试将并发和吞吐

量调整到测试环境的上限,运行5到10分钟左右,观察系

统承压能力;稳定性测试在固定压力情况下运行2小时以

图2:压力测试环境 上;写入压力测试则是选取包括委托、成交、登录等写

图1:压力测试工作组织架构

《交易技术前沿》总第56期

百万用户使用云展网进行电子书本制作,只要您有文档,即可一键上传,自动生成链接和二维码(独立电子书),支持分享到微信和网站!
收藏
转发
下载
免费制作
其他案例
更多案例
免费制作
x
{{item.desc}}
下载
{{item.title}}
{{toast}}