基于对比学习的多阶段粗到细模型训练方案
使用大量的对话数据,将同一对话的连续话语作为正样本对通过对比学习方式进行预训练。如下图示例,模型在训练过程中会隐式地学习了I am looking forrestaurants和Find me somerestaurants的相似表示,因为它们的下一句都是What type of food doyou like?
连续对话正样本对构造
使用与比赛数据同一领域且带有意图标签的数据,将每个样本与其相邻的样本或具有相同意图的样本作为正样本对,通过对比学习的方式对第一阶段获得的预训练模型进行微调。