金融情报局网_中国金融门户网站 让金融财经离的更近

【深度学习6】对比学习(Contrastive Learning)入门

当前位置:金融情报局网_中国金融门户网站 让金融财经离的更近>各地 > 各地 > 正文  2023-08-06 00:30:35 来源:个人图书馆-新用户33382503
主要内容:

1. 何为对比

2. 如何构造正负样本

3. 对比学习loss


【资料图】

4. 对比学习loss代码

1. 何为对比

「对比学习」属于无监督学习的一种,即给一堆数据,没有标签,自己学习出一种特征表示。

我们知道的无监督方法有聚类(迭代地更新聚类中心,让属于同一类的样本更近,不同类的样本更远),自编码器(输入x->特征隐层编码->解码恢复出x",让x"和x接近),那对比学习又是怎么个操作,怎么构建loss反向传播呢?

对比学习,关键是「对比」,根据聚类和自编码器的思想,对比应该也是有A和B更近,A和C更远这种比较性的思想的。所以关键在于如何拿到B和C。(其实聚类也算是一种对比)

何为对比?

2. 如何构造正负样本

深度学习时代万物皆可创造,没有数据也能造出来数据,最简单的构造样本的方式是这样的:

先来看B,B和A是更近的样本,学名叫“正样本”,怎么造B?只要跟A很像就行了呀,这不就是数据增强吗?拿图片来说,图片旋转、剪切等增加方式都可以往上堆了。文本也有很多增强方式,比如回译(英文-翻译成中文-再翻译回英文),相似词替换等等。

图像正样本构造方法(来自文献[1])

C是和A不像的样本,学名叫“负样本”,最简单粗暴直接的方式就是其他样本都是负样本,因为其他样本和它长的不一样。

3. 对比学习loss

那loss函数其实和聚类思想一样了,A的特征和正样本的距离近,和其他样本的距离远。训练的时候一般会用两个encoder(如ResNet)分别对样本A和它的正负样本提取特征,再分布映射到新的表示空间(比如采用MLP层),在这个空间里根据对比loss训练模型参数。

end-to-end对比学习方式[2]

对比学习常用loss——InfoNCE [2]

其中q就是我们的样本A的特征,k+是正样本,k_i是其他样本。

具体使用的时候,最直接最简单粗暴的训练方式是:以采用一种数据扩增为例,一个batch为N的训练样本,通过数据扩增,变成了2N个样本,其中有1个正样本,2N-2个负样本。

常用的loss:

NT-Xent loss,全称为Normalized Temperature-scaled Cross Entropy Loss

来自[1]simCLR

一个batch 有N 个样本,两条分支就有2N个samples。对于一个anchor样本i,除了对应的augmented image和自己,其余2N-2个都是负样本。分子是正样本之间的相似度,分母是负样本之间相似度。

最终的Loss是每个batch里所有样本对的loss和求平均。

代码实现:

对比损失的PyTorch实现详解_Adenialzz的博客-CSDN博客_对比损失

对比学习Python实现_Reacubeth的博客-CSDN博客_python 对比学习

关键词: