解密AI算法赋能平台核心技术 ——特斯联半监督CV自训练学习算法-爱云资讯

7月，特斯联“九章人工智能算法赋能平台”计算机视觉基础模型核心算法，在国际顶级会议——2021国际计算机视觉大会(ICCV 2021)赛事中，击败众多强敌，跻身赛事排名前10%。竞逐者包括：字节跳动人工智能实验室、中国移动研究院、日本最大移动通信运营商NNT DOCOMO，以及清华大学、武汉大学、中国科技大学、墨尔本大学等69家国际大型企业、顶尖高校及研究机构。

坚持深耕、不断开拓人工智能最前沿算法，是特斯联斩落豪强，载誉而归的秘笈。本期“先锋科技场”将首次揭秘该行业领先算法。

大势所趋

随着全球人工智能产业高速发展，人工智能(AI)近年被抽象成多种算法应用于不同领域。AI已全面进入机器学习时代。AI未来发展将是关键技术与产业的深入结合——单纯算法已无法满足更细分领域及行业对AI的需求，尤其在万物互联的AIoT（人工智能+物联网）时代，越来越多的订制化AI需求亟需解决。

原有开发模式实际已成为新形势下AI发展的瓶颈。当前，用户AI订制通常遵循“找公司-对需求-交付研究-算法产品化编码-上线使用”流程。这往往导致研发周期长、研发成本高，难以满足AIoT时代各行业用户AI产品开发需求。

对此，AI开放平台应运而生。其能集成AI算法、算力与开发工具，通过接口调用，使企业、个人或开发者高效使用平台AI能力，实现AI产品开发及赋能。随着大量AI厂商高速崛起，中国在技术平台领域已逐渐摆脱对海外厂商的依赖，涌现出多家AI开放平台。

虽然我国目前AI开放平台发展势头良好，但现有平台在用户规模、使用场景、用户技术基础等多个方面，仍然受限。这些平台均主要针对专业AI开发者设计，对AI零基础用户开发人工智能产品“不甚友好”。

此背景下，特斯联核心算法研究团队开发出普适性AI算法开放平台——“九章AI算法赋能平台”。它力克半监督、标签内容以及“联邦学习”(Federated Learning)等方面的核心技术难点，实现了CV（计算机视觉）、NLP（自然语言处理）、推荐预测、知识图谱算法的自训练。

九章平台可针对多场景及各规模用户（尤其可针对AI零基础用户），进行零代码、低代码自有算法孵化，颠覆已有AI研发人员开发模式，显著降低AI研发成本及周期。

在业界备受瞩目的校企合作方面，近年来各方努力已获成效，但仍有较大提升空间。目前，企业对高校研究成果颇感兴趣，需求较大；高校亦希望其研究能够解决实际行业问题，故十分渴望行业课题导入。但是，高校研究成果进行行业落地时，往往水土不服；高校产学研课题亦往往随着学生毕业被迫中断，持续性堪忧。

特斯联“九章AI算法赋能平台“可在弱监督体系下，能够实现平台和训练模型算法有效对接。使基于训练算法模式的校企需求对接，取代“向企业提供推理算法代码”这一传统模式。不仅如此，该平台可实现算法积累与深化。

本期“先锋科技场”就将揭秘九章AI算法赋能平台的核心技术之一——基于半监督的CV自训练学习算法。

甄选模型

监督学习技术通过学习大量训练样本，构建预测模型。其中每一训练样本均被贴上明确标签，显示其真值输出。尽管当前技术已取得巨大成功，高数据标注成本常导致诸多任务无法获得强监督信息（如“全部真值标签”等）。因此，采用半监督学习，通常是执行实际任务的更佳方案。

半监督分为三类——不完全监督、不确切监督、不准确监督。特斯联九章AI赋能平台致力于让AI能力偏弱或“贫乏”用户，也能拥有AI算法孵化服务能力。因此，弱化人工参与算法训练尤为重要。

但不同半监督类型亦存在自身短板。不完全监督若只拥有少量被标注数据，不足以训练出优秀模型。不确切监督仅能满足已给定监督信息、但信息不够精确的场景。不准确监督在监督过程中，会出现被标注数据存在错误监督信息的情形。三类半监督模式人工干预较大，无法形成自训练学习算法体系，无法达到普适性AI算法开放平台需求。

为构建基于半监督的自训练学习算法，特斯联核心算法研究团队主要采用基于Transformer模型的Swin Transformer作为骨干模型，以此搭建特征学习基础算法，进而构建自训练体系。此外，团队通过参加国际计算机视觉大会(ICCV)等国际顶级会议，有效验证了基于半监督的CV自训练学习算法在实际产业应用中的贴合度，并载誉而归。

深耕算法

特斯联核心算法团队针对上述三大半监督类型难题，将主动学习、半监督学习、多示例学习、带噪学习等技术引入自训练体系，最大限度从已知标签样本特征中，挖掘潜在内嵌信息，反哺至未知标签数据，从而减少人工干预。

特斯联以Swin Transformer为骨干模型，针对半监督，设计可学习样本全局及局部“特征学习模块”。

而选用Transformer为骨干网络，则可使输出的全局特征信息更为丰富，使“全局特征相似度学习模块”从样本特征中挖掘出更多信息。此外，“局部特征细粒度学习模块”聚焦样本局部特征，可与Transformer形成互补，统一对外提供基准骨干网络。

特征学习模块方面，特斯联基于BNNeck，采用“全局+局部”模式展开研究。全局层面，通过度量学习(Circle Loss + Center Loss）提取全局特征。局部细粒度特征学习层面，则首先计算每一局部模型间相关性，随后交叉融合局部模块相关性较高的特征，输入至各局部细粒度分类器，学习相应局部细粒度特征。如图所示，交叉融合可分为如下四种：

接下来的重点，为构建自训练体系。其主要分为两个阶段。第一阶段——强监督训练：利用少部分数据，对以上特征学习算法作初步强监督训练，降低后期自训练难度，提高自训练性能。第二阶段——标签内容生成：通过主动学习、半监督学习、带噪学习等技术，充分利用余下的大部分数据。

在此，将不再赘述强监督训练。标签内容生成工作，则会从主动学习/无监督学习、半监督学习两个方面展开。

主动学习/无监督学习分为四个步骤。旨在通过“挖掘小部分数据，带动大部分数据”，解决半监督下不完全监督短板。在有限的平台资源上，令大部分未标注数据高效得到相应标签。

半监督学习方面，通过以上无监督学习能够获得可靠性强，且具有标签的Query子集和Gallery子集G*。但两者均仅有缺少局部细粒度标签的弱标签信息。通过半监督学习实现L、G*，以及带有局部细粒度标签的训练集数据T，可对特征学习模型作全量调优。随后，在S=[L,G*,T]上寻找更优局部细粒度学习器；并利用训练集数据分布上的局部细粒度子模型，建立多个局部细粒度学习器，对未标签样例加注标签。局部细粒度学习器可基于其未更新前对L、G*所生成的局部细粒度标签，以及更新后所预测的结果，计算损失值进行学习。这一方面使L、G*在某种层面上，补充了T可能缺失的潜在信息；另一方面可通过学习器，帮助模型在L、G*上挖掘局部特征。

多轮、细致的实验结果证明：主动学习、半监督学习在解决半监督下的不完全监督问题中，表现稳定；多示例学习方法在不确切监督问题中表现稳定；带噪学习方法在不精确监督问题中表现稳定。

解密AI算法赋能平台核心技术 ——特斯联半监督CV自训练学习算法

相关文章

人工智能技术

人工智能公司

人工智能硬件

人工智能产业