从离线笔记迁移学习到签名鉴定


Learning Representations from Persian Handwriting for Off-line Signature Verification,a Deep Transfer Learning Approach(利用深度迁移学习,从波斯笔迹中学习用于离线签名验证的表示)

1.摘要

  • 离线签名验证(OSV)是一项具有挑战性的模式识别任务,特别是当它有望很好地推广到培训期间无法使用的熟练伪造品上时。它的挑战还包括小的训练样本和大的变化。考虑到这些局限性,我们提出了一种从波斯语手写域到多语言OSV域的迁移学习方法。基于词分类和作者识别两个不同的任务,我们分别在源域上训练两个剩余CNN
    • 深度残差网络(Deep residual network, Res-Net):深度残差网络的设计就是为了克服这种由于网络深度加深而产生的学习效率变低,准确率无法有效提升的问题(也称为网络退化)。甚至在一些场景下,网络层数的增加反而会降低正确率。这种本质问题是由于出现了信息丢失而产生的过拟合问(over-fitting,所建的机器学习模型或者是深度学习模型在训练样本中表现的过于优越,导致在验证数据集及测试数据集中表现不佳,即为了得到一致假设而使假设变得过度复杂)。解决思路是尝试着使他们引入这些刺激的差异性和解决泛化能力为主。
  • 由于识别一个人的签名类似于识别一个人的笔迹,因此在特征学习阶段使用笔迹似乎非常方便。在更加多样化和丰富的手写数据集上学习的表示可以弥补原始任务(即OSV)中训练数据的不足,而不会牺牲通用性。我们提出的OSV系统包括两个步骤:表示学习验证输入签名。第一步,将特征图像输入训练后的残差神经网络。然后使用输出表示训练支持向量机进行验证。我们在三个不同的签名数据集上测试OSV系统,包括MCYT(一个西班牙签名数据集)、UTSig(一个波斯签名数据集)和GPDS合成(一个人工数据集)。在UT上-SIG,我们实现了9.80%的等错误率(EER),与文献中最好的EER(17.45%)相比有了实质性的改善。我们提出的方法比最先进的方法高出6%在GPDS合成上,达到6.81%。在MCYT,EER为3.98%获得的结果与之前报告的最佳结果相当。
    • 表示学习,又称学习表示。在深度学习领域内,表示是指通过模型的参数,采用何种形式、何种方式来表示模型的输入观测样本X。表示学习指学习对观测样本X有效的表示。表示学习有很多种形式,比如CNN参数的有监督训练是一种有监督的表示学习形式,对自动编码器和限制玻尔兹曼机参数的无监督预训练是一种无监督的表示学习形式,对DBN参数-先进行无监督预训练,再进行有监督fine-tuning-是一种半监督的共享表示学习形式。

2.介绍

3.方法

A.使用迁移学习生成特征

  • 源域:波斯语手写笔迹数据集,有115个单词,每个单词有标签,有500多个不同的书写人
  • 目标域:手写签名。
  • 特征生成器的训练过程

B.签名验证

  • 为每个签名人训练分类器。分类器依据神经网络输入数据中提取的特征进行训练。利用支持向量机作为分类器

C.论文的方法

  • OSV两个步骤:特征生成和最终验证。
    • 特征生成:CNN
    • 验证:用SVM验证与真实样本的距离

总结:

  • 数据集的预处理
  • 将数据集划分为训练集和测试集
  • 特征生成网络的训练:
    • 在源任务上训练特征生成器网络
    • 测试经过训练的网络以分析其性能
    • 通过微调或不微调将网络权重传输到目标任务
  • 分类器的训练:
    • 每个用户类生成一个SVM
    • 为每个签名类生成一组随机伪造
    • 根据特定用户的真实签名和其他用户的随机伪造签名训练SVM

利用CNN训练出特征。为每个签名的书写人训练SVM分类器。 最后计算想要的数据是否分类正确


文章作者: 小冷同学
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 小冷同学 !
用户交流区

温馨提示: 遵纪守法, 友善评论!