提升信用卡广告转化率：自适应信息迁移多任务框架(AITM)在美团联名信用卡业务中的应用

aizixun8 · 发表于 2024-12-28 16:32:49

大多数大型应用通常需要有针对性的展示广告来获取客户。对于信用卡广告来说，由于用户的转化环节较长，持续有效的获客比传统广告更具挑战性。本文结合美团联名信用卡业务的具体实践以及今年论文发表的论文，介绍了一种自适应信息迁移多任务（AITM）框架，对用户多步转换之间的顺序依赖关系进行建模，以提高最终结果-最终客户获取转化率。希望对从事相关研究的同学有所帮助或启发。

论文链接：

源代码：

1. 摘要

大多数大型应用通常需要有针对性的展示广告来获取客户，例如电子商务平台或金融应用。随着此类应用的爆炸式增长，持续有效的获客已成为这些大规模应用在现实世界中面临的最大挑战之一。在这些应用中，客户获取通常是一个多步骤的用户转换过程。例如，在电商平台中，用户转化通常表现为曝光->点击->购买的过程。在金融广告中，比如信用卡业务，用户转化通常是一个曝光->点击->申请->卡验证->激活的过程。信用卡广告获取客户比传统广告更具挑战性：

· 用户多步转换过程中的路径顺序依赖性较长。

· 在多步变换的长序列依赖中，正反馈（正样本）逐渐稀疏，类不平衡越来越严重。

在我们的信用卡业务中，我们通常希望用户能够完成最后两个转化阶段（即曝光->卡审批、曝光->激活）才算有效转化。因此，需要利用之前任务中丰富的正样本信息来缓解后续任务中的类别不平衡问题。在这个方向上，多任务学习是提高端到端获客转化率的典型解决方案。

2. 背景介绍

在我们的信用卡业务中，

·（）：表示广告展示给特定的用户**，这些用户是根据一些排序指标（如CTR、CVR等）来选择的。

·点击：如果用户对广告内容感兴趣，就会点击广告。点击后，就会进入申请表页面。

·申请（）：进入申请表页面后，用户可以填写申请表并点击申请按钮申请信用卡。

·核卡（）：又称信用，是指用户信用良好，申请通过，获得一定的信用卡额度。在我们的系统中，大多数情况下这也是系统实时判断的一个过程。

·()：用户授信并收到邮件中的信用卡后，即可激活信用卡并使用。激活标签通常很难获得，因为邮寄信用卡需要一定的时间，而且用户主动激活也需要一定的履约期，所以这里品类不平衡比较严重。这里，我们通常会看用户是否会在验证后的14天内激活信用卡。

上述转换步骤是顺序相关的，这意味着只有上一步发生后，下一步才能发生。基于这个限制，一个用户只能有5个不同的转换阶段，如下图所示。

图1 5个不同的转换阶段

在工业界和学术界，多任务学习是提高端到端获客转化率的典型解决方案。近年来，多任务学习中任务间关系建模的研究取得了很大进展。我们将这些主要研究分为两大类：

1.控制多任务模型底部的专家模块如何在任务[1,2,3]之间共享参数，顶部的多塔模块单独处理每个任务，如图3(a)所示，我们称这种类别为底（-）模式。然而，专家底层模型只能在任务之间传递浅层表示，但往往在靠近输出层的网络中包含更丰富、更有用的表示[4, 5]，这已被证明可以带来更多收益[6]。此外，由于基于专家的模式不是专门为具有序列依赖性的任务而设计的，因此这些具有基于专家的模式的模型无法显式地对序列依赖性进行建模。

2. 在不同任务的输出层迁移概率[7,8,9,10]，如图3(b)所示，我们称之为概率迁移(-)模式。概率传递模式只能通过标量积传递简单的概率信息，却忽略了向量空间中更丰富、更有用的表示，导致信息丢失。如果其中任何一个概率没有被准确预测，多个任务都会受到影响。

本文提出了一种针对序列相关任务的自适应信息传输多任务（AITM）框架，该框架通过自适应信息传输（AIT）模块对用户多步转换之间的序列依赖关系进行建模。 AIT模块可以自适应地学习在不同的转换阶段需要传输什么信息以及多少信息。此外，通过将行为期望校准器纳入损失函数中，AITM 框架可以更准确地识别端到端转换。该框架部署在美团APP中，用于向美团联名卡转化率较高的用户实时展示联名卡广告。

三、系统概述

图2 美团App多任务排序系统

上图给出了多任务排序系统的示意图。在我们的信用卡业务中，除了被动曝光步骤之外，我们还对四个任务进行建模。其中，卡验证和激活是主要任务，点击和申请是辅助任务。这是因为，如果用户只完成了点击和申请步骤，而没有完成卡验证步骤，则不是有效的转化，会造成资源（如计算和流量资源）的浪费。因此，我们主要关注最后两个端到端的转换任务，即曝光->核心卡和曝光->激活。由于后两个任务的正样本数量较少且激活是延迟反馈，而前两个辅助任务的正样本数量较大，因此后两个任务的类不平衡问题可以通过前两个任务得到缓解任务。。

此外，美团联名信用卡还与不同银行合作发行。不同银行处于不同的业务发展阶段，对卡的审批和激活有不同的要求。信用卡业务刚刚起步的银行往往希望发行更多的信用卡来快速占领市场，而成熟的银行则希望提高激活率以实现快速盈利。因此，我们的系统中有一个选择器，可以针对不同的银行输出不同的转换目标，多任务框架可以很好地处理不同的业务需求。

另外，由于美团的不同业务各自的业务都需要流量来获客，而不同的用户对不同的业务有不同的兴趣，因此不能简单地将流量划分到不同的业务中。我们需要多业务排序机制来分配流量，以实现整体效益最大化。

4.型号介绍

图 3：(a) 专家底层模型 (b) 概率转移模型 (c) AITM 框架。

我们提出的 AITM 框架如上面的 (c) 所示。该框架利用 AIT 模块对用户多步骤转换过程中的序列依赖性进行建模。该模型图显示了两个相邻的任务：t-1 和 t。

首先，输入特征通过任务共享输出到多个Tower网络。通过共享模块，一方面可以利用之前任务的丰富正样本信息来学习表示，从而缓解后续任务中的类别不平衡问题，另一方面可以减少模型参数。 Tower网络可以根据您自己的需求进行定制。这里我们只使用一个简单的MLP。然后，AIT模块使用当前任务Tower输出的向量和前一个任务的信息来学习如何融合任务之间的信息。 AIT模块定义如下：

这里，实际上使用了一种专门设计的注意力机制来自动为传输的信息和原始信息分配权重。传输的信息是通过函数学习的，函数可以是一个简单的全连接层，用于学习两个相邻任务之间应该传输哪些信息。该函数的输入是上一个任务的AIT模块的输出。

具体来说，AIT模块中的注意力机制设计如下：

其中，为自动学习的传递信息的权重。 , ,使用前馈神经网络将输入投影到新的向量空间中。

最后，我们通过在损失函数中应用校准器来尽可能地限制概率的输出以满足序列依赖性。损失函数为交叉熵+校准器约束，其中校准器约束强度定义为：

具体来说，交叉熵定义如下：

校准器约束定义如下：

如果大于，校准器将输出正惩罚项，否则输出0。

5 实验分析

在本节中，我们对工业和公共现实世界数据集进行实验，以根据各种基线模型评估我们提出的 AITM 框架。接下来，我们将首先介绍所使用的数据集，然后是离线和在线实验结果，最后是进一步的实验分析（包括消融实验、超参数实验和案例研究）。

5.1 数据集

我们使用两个数据集进行了离线实验。行业数据集都是美团联名卡广告曝光的样本，我们采样了一段时间。该数据集有4个任务，分别是点击、申请、验证卡、激活。在我们的业务中，我们只关注验证和激活的转化指标。这两个步骤的转换是有效的转换。公开数据集使用阿里巴巴的点击转化估算数据集[9, 11]。这个数据集有两个任务：点击和购买。

表 1：数据集统计数据。其中，“%”表示采样后训练集中每个任务的正样本所占的比例。

5.2 离线和在线实验

表 2：工业和公共数据集上的 AUC 平均标准差性能。

Gain表示与模型相比AUC的改进，下划线表示最佳基线模型。 “*”表示与最佳基线模型相比，配对样本 t 检验的 AITM p 值

表3：在线A/B实验

我们进行了离线和在线实验。随着业务的发展，我们线上部署了三种模型：MLP、MLP、AITM。离线和在线实验都证明了 AITM 的卓越性能。

5.3 消融实验

我们设计了 AIT 模块来对用户多步转换过程中的序列依赖性进行建模。为了证明AIT模块的有效性，我们对AIT模块进行了消融研究。我们首先随机选择 500 个正负激活样本，然后对它们的激活任务预测分数进行排序。 TOP 预测分数越高，模型预测这些用户激活联名卡的可能性就越大。然后我们使用t-SNE绘制了原始信息、转移+原始信息以及AIT模块在激活任务上学到的信息的二维图。

从下图中我们可以看到，当用户激活更容易预测时（即激活得分TOP0%-TOP50%），这三个模块都可以更好地区分正样本和负样本。但当用户激活难以预测时（即激活分数为TOP50%-%），无论是原始信息还是迁移+原始信息+都不能很好地区分正负样本，而AIT模块明显更好在 TOP50%-% 预测分数中。在另外两部分中，解释了AIT模块的有效性。

图 4：AIT 中不同模块的 t-SNE 可视化

5.4 超参数实验

此外，为了研究AITM框架的稳定性及其对超参数的依赖性，我们进行了超参数研究。我们对向量维度、校准器强度、正样本比例和任务数量的不同值进行了多次实验，发现如下：

· 前两个超参数实验表明，AITM模块在向量维度和校准器强度的超参数下表现相对稳定。

· 第三个超参数实验表明，适当的下采样比例是缓解类别不平衡的重要措施。

· 最后一张图表明，更多的任务可以带来更多有用的信息，进一步提高端到端的转化率。

图 5：不同超参数设置下的平均 AUC 表现，阴影代表多次实验的标准差 5.5 案例分析

最后，为了了解AIT模块在不同阶段迁移什么信息以及迁移多少信息，我们进行了案例研究。下图中，Wu是迁移信息的权重。我们首先随机抽取 40,000 个测试样本，然后根据两个相邻任务的标签将其分为 3 组：00/10/11（分别对应图中的红、蓝、绿线），并且在每组中样本按照排序，TOP样本越多意味着预测越准确。

· 首先，看红线。由于序列依赖性，当前一个任务的标签为0时，后一个任务的标签只能为0。所以我们看到前一个任务向后一个任务传递了很强的信息（权重几乎为1）。

· 然后，看蓝色和绿色的线。当前一个任务标签为1时，后一个任务标签不确定。随着，传递的信息的权重逐渐增加，表明后一个任务的预测结果可能会被前一个任务误导。

· 另外，看绿线，当后一个任务的标签为1时，前一个任务传递的信息非常少（权重很小），这说明后一个任务主要是根据自己的任务来识别正样本本身。

· 从上面的结果中，我们可以看到AIT模块可以学习在两个相邻任务之间传递多少信息。

图6：不同转换阶段迁移信息的平均权重，阴影代表标准差

六、总结

本文提出了一种自适应信息传输多任务（AITM）框架来对用户多步骤转换之间的顺序依赖关系进行建模。本文提出的自适应信息传输（AIT）模块，与行为期望校准器相结合，可以学习在不同的转换阶段需要传输哪些信息以及多少信息，以提高序列依赖的多任务学习的性能。离线和在线实验结果表明，与最新的基线模型相比，该框架取得了显着的改进。该框架部署在美团APP中，用于向美团联名卡转化率较高的用户实时展示联名卡广告。欲了解更多详细信息，请参阅我们的论文。

关于作者

奚东波、陈真、严鹏、陈宇：

美团财智应用团队

张颖儿：

美团实习生，浙江大学本科生

朱永春：

中国科学院计算技术研究所直接博士研究生

庄福珍：

北京航空航天大学人工智能研究院研究员

参考

[1] 马嘉琪，赵哲，易，陈吉林，洪，Ed H Chi。 2018.具有多门-of-的多任务中的任务。在KDD。 1930 年至 1939 年。

[2] 秦臻，程，赵哲，陈哲，，秦。 2020. 为用户 .在KDD。 3083–3091。

[3]唐，刘，赵明，龚。 2020.（PLE）：一种新颖的多任务（MTL）模型。在。 269–278。

[4] Li, Jason, Jeff Clune, Hod, and John E. 2016.：学到同样的东西吗？在 ICLR 中。

[5] D 和罗布。 2014 年。和。在ECCV中。 818–833。

[6] 曾志伟，朱迪，张宁，凯特，和。 2014. 深：对于 . arXiv arXiv：1412.3474（2014）。

[7] 高陈，何，甘大华，陈，冯富丽，李勇，蔡达成，金。 2019.来自多数据的多任务。在ICDE。 1554–1557。

[8] 陈高，何，甘，陈，冯富丽，李勇，蔡达成，姚丽娜，杨松，金。 2019. 与 . TKDE（2019）。

[9] 马晓，赵立勤，黄冠，胡泽林，朱，盖坤。 2018.空间多任务模型：点击后率的一个。在西吉尔。 1137–1140。

[10] 文宏，张静，王远，吕富玉，鲍，林泉，杨。 2020.通过点击后进行速率的空间多任务。在西吉尔。 2377–2386。

[11]

来自哎哟！

-结局-

《AI技术流》原创提交方案

是由江门创投（）成立的AI学习社区。社区在线有330+谈话视频和900+技术文章，涵盖CV/NLP/ML/等；每月定期举办峰会等线上交流活动，不定期举办技术人员线下聚会交流活动。我们正在努力成为人工智能人才青睐的高品质、知识型交流平台。我们希望为人工智能人才创造更专业的服务和体验，加速并陪伴他们的成长。

投稿内容

// 最新技术解读/系统知识分享//

//前沿资讯讲解/经验讲述//

提交说明

稿件必须是原创文章并注明作者信息。

我们会选择一些在深入的技术分析方向和科研经验的人。

给用户更多启发、创造原创内容奖励的文章

提交方式

发送电子邮件至

> 提交时请添加工作人员微信！

扫码观看！

本周新品！

关于我“门”

江门是一家专注于发现、加速和投资科技驱动型初创企业的新型风险投资机构。涵盖江门创新服务、江门科技社区、江门创业投资基金。

江门成立于2015年底，创始团队由微软创投中国区原创始团队组成。已为微软精选并深度孵化126家创新科技初创企业。

如果您是科技领域的初创企业，不仅想获得投资，还想获得一系列持续且有价值的投后服务，欢迎您向我的“门口”发送或推荐项目：

		自动登录	找回密码
密码			立即注册

提升信用卡广告转化率：自适应信息迁移多任务框架(AITM)在美团联名信用卡业务中的应用

浏览过的版块