在智能金融时代浪潮下,以技术为驱动力的度小满坚持将科技与金融相结合,致力于通过以人工智能为代表的新技术为金融行业赋能。前不久,度小满在自然语言处理和计算机视觉等人工智能前沿领域的研究获得重大突破,度小满金融数据智能应用部AI-Lab的两篇论文分别入选ACM MM和CIKM国际顶级会议,获得了国际的认可。

两篇论文分别就多模态和预训练排序等多个热门话题提出了新颖的算法,并在相关任务上达到了国际顶尖水平,获得了审稿人的一致好评并最终录用。其中具有实体对齐网格的位置增强Transformer被ACM MM录用(Position-Augmented Transformers with Entity-Aligned Mesh for TextVQA)。

该论文主要研究基于文本的视觉问答任务,这项任务要求机器可以理解图像场景并阅读图像中的文本来回答相应的问题。为了直观有效地构建图像中视觉实体和文本之间的位置关系,度小满提出了具有实体对齐网格的位置增强Transformer。在不需要复杂规则的情况下,显式地引入了目标检测和OCR识别的视觉实体的连续相对位置信息。同时根据物体与OCR实体映射关系,用直观的实体对齐网格代替复杂的图形结构。在该网格中,不同位置的离散实体和图像的区块信息可以充分交互。

该模型能够整合目标检测、OCR以及基于Transformer的文本表示等多种方法的优势,增强算法对于图像中场景信息的理解,更精准的融合图像与文本多模态的信息,进一步助力证件识别、人脸与活体检测等业务场景,提升度小满在视觉风控方面的技术能力。

另外一篇基于BERT的动态多粒度排序模型被CIKM录用(Dynamic Multi-Granularity Learning for BERT-Based Document Reranking)。

该论文重点研究了基于BERT的文档重排序任务,开创性地提出了动态多粒度学习方法。该种方法能够让不同文档的权重根据预测概率动态变化,从而减弱不正确的文档标签带来的负面影响。此外,该方法还同时考虑了文档粒度和实例粒度来平衡候选文档的相对关系和绝对分数。在相关基准数据收集上的实验进一步验证了模型的有效性。该模型有效地提升了长文本理解与排序任务的性能,特别是其中所用到的预训练语言模型已经成为度小满在自然语言处理方面的基础架构,在获客、信贷等业务场景被广泛地使用,为业务模型提供了更加丰富的文本表示和精准的文本特征,在保障业务稳健发展中起到了十分重要的作用。

业内人士表示,通过科技为金融服务赋能,不断提升金融服务水平和质量,度小满金融这两项人工智能技术的落地应用,能够让广大消费者享受到更优质的金融服务。