专利名称:一种抠图方法、装置、电子设备及存储介质
专利类型:实用新型专利
专利申请号:cn202210515100.2
专利申请(专利权)人:北京字节跳动网络技术有限公司
权利人地址:北京市石景山区实兴大街30号院3号楼2层b-0035房间
专利发明(设计)人:高宇康,焦少慧,杜绪晗,程京
专利摘要:本公开实施例公开了一种抠图方法、装置、电子设备及存储介质。该方法包括:将待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像,输入到预先训练完成的目标抠图模型,得到与待抠图图像中的目标前景图像对应的目标透明图;其中,目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、第二样本图像对应的第二背景图像及与第二样本图像中的第二前景图像对应的标注分割图。本公开实施例的技术方案,可以实现精细化抠图。
主权利要求:
1.一种抠图方法,其特征在于,包括:
获取已训练完成的目标抠图模型、待抠图图像以及与所述待抠图图像中的目标背景图像对应的先验背景图像;
将所述待抠图图像和所述先验背景图像输入到所述目标抠图模型中,得到与所述待抠图图像中的目标前景图像对应的目标透明图;
其中,所述目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,所述第一训练样本包括第一样本图像、与所述第一样本图像中的样本背景图像对应的第一背景图像及与所述第一样本图像中的第一前景图像对应的第一透明图,所述第二训练样本包括第二样本图像、与所述第二样本图像对应的第二背景图像及与所述第二样本图像中的第二前景图像对应的标注分割图。
2.根据权利要求1所述的方法,其特征在于,所述目标抠图模型通过如下步骤预先训练得到:获取待训练的原始抠图模型、所述第一训练样本和所述第二训练样本;
基于多组所述第一训练样本和多组所述第二训练样本对所述原始抠图模型进行训练,得到所述目标抠图模型。
3.根据权利要求2所述的方法,其特征在于,还包括:
获取第三训练样本,其中,所述第三训练样本包括第三样本图像、与所述第三样本图像对应的第三背景图像以及与所述第三样本图像中的第三前景图像对应的第二透明图;
所述基于多组所述第一训练样本和多组所述第二训练样本对所述原始抠图模型进行训练,包括:基于多组所述第一训练样本、多组所述第二训练样本、以及多组所述第三训练样本,对所述原始抠图模型进行训练。
4.根据权利要求3所述的方法,其特征在于,所述第二前景图像中的前景目标和所述第三前景图像中的前景目标均对应于第一类型,并且多组所述第一训练样本中存在包括对应于所述第一类型的所述第一前景图像的所述第一训练样本以及包括对应于第二类型的所述第一前景图像的所述第一训练样本,所述第一类型和所述第二类型不同。
5.根据权利要求2所述的方法,其特征在于,所述基于多组所述第一训练样本和多组所述第二训练样本对所述原始抠图模型进行训练,得到所述目标抠图模型,包括:获取抠图损失函数,并基于所述抠图损失函数和多组所述第一训练样本对所述原始抠图模型进行抠图训练;
获取分割损失函数,并基于所述分割损失函数和多组所述第二训练样本对所述原始抠图模型进行分割训练;
得到所述目标抠图模型。
6.根据权利要求5所述的方法,其特征在于,所述基于所述抠图损失函数和多组所述第一训练样本对所述原始抠图模型进行抠图训练,包括:针对每组所述第一训练样本,将所述第一训练样本中的所述第一样本图像和所述第一背景图像输入到所述原始抠图模型中,得到预测透明图;
根据所述预测透明图、所述第一训练样本中的所述第一透明图及所述抠图损失函数,调整所述原始抠图模型中的网络参数;
所述基于所述分割损失函数和多组所述第二训练样本对所述原始抠图模型进行分割训练,包括:针对每组所述第二训练样本,将所述第二训练样本中的所述第二样本图像和所述第二背景图像输入到所述原始抠图模型中,得到预测分割图;
根据所述预测分割图、所述第二训练样本中的所述标注分割图及所述分割损失函数,调整所述网络参数;
所述得到所述目标抠图模型,包括:
根据所述网络参数的调整结果,得到所述目标抠图模型。
7.根据权利要求5所述的方法,其特征在于,所述抠图损失函数包括拉普拉斯损失函数、l1损失函数、边缘损失函数及前景目标损失函数中的至少一个,所述边缘损失函数是根据预测透明图、所述第一透明图和膨胀腐蚀结果构建得到的损失函数,所述膨胀腐蚀结果包括对所述第一透明图分别进行膨胀和腐蚀后得到的结果,所述前景目标损失函数是根据所述预测透明图、所述第一透明图以及膨胀结果构建得到的损失函数,所述膨胀结果是对所述第一透明图进行膨胀后得到的结果。
8.根据权利要求2所述的方法,其特征在于,还包括:
对所述第一背景图像进行数据增广,得到第四背景图像,将所述第一样本图像、所述第四背景图像以及所述第一透明图作为一组第四训练样本;
所述基于多组所述第一训练样本和多组所述第二训练样本对所述原始抠图模型进行训练,包括:基于多组所述第一训练样本、多组所述第二训练样本、以及多组所述第四训练样本,对所述原始抠图模型进行训练。
9.根据权利要求8所述的方法,其特征在于,所述对所述第一背景图像进行数据增广,包括下述操作中的至少一项:对所述第一背景图像进行旋转和/或平移;
对所述第一背景图像的环境参数进行调整,其中,所述环境参数包括亮度参数、色调参数以及对比度参数中的至少一个;
对所述第一背景图像进行高斯模糊和/或运动模糊;
在所述第一背景图像中生成阴影和/或伪影。
10.根据权利要求2所述的方法,其特征在于,还包括:
获取所述第二样本图像;
根据所述第二样本图像中各像素点的像素值,生成所述第二背景图像。
11.根据权利要求2所述的方法,其特征在于,还包括:
所述样本背景图像和所述第一背景图像相同,获取已采集图像和所述第一透明图,并根据所述第一透明图从所述已采集图像中提取出所述第一前景图像;
获取所述第一背景图像,并将所述第一背景图像和所述第一前景图像进行合成,得到所述第一样本图像。
12.根据权利要求2所述的方法,其特征在于,所述原始抠图模型包括依次连接的编码层和解码层;其中,所述编码层包括第一编码层和第二编码层,所述第一编码层是用于对所述第一样本图像和所述第二样本图像进行编码,且所述第二编码层是用于对所述第一背景图像和所述第二背景图像进行编码;
和/或,
所述解码层的输出通道包括用于输出所述编码层和所述解码层对所述第二样本图像和所述第二背景图像进行处理后得到的预测分割图的分割输出通道;
和/或,
针对于各层所述解码层中的当前层,所述当前层的输入特征包括拼接特征,所述拼接特征是对所述当前层的上一层所述解码层的上一输出特征、各层所述编码层的中间输出特征中与所述上一输出特征尺度相同的所述中间输出特征、以及尺寸被调整至所述尺度的所述第一样本图像进行拼接后得到的特征。
13.一种抠图装置,其特征在于,包括:
图像获取模块,用于获取已训练完成的目标抠图模型、待抠图图像以及与所述待抠图图像中的目标背景图像对应的先验背景图像;
抠图模块,用于将所述待抠图图像和所述先验背景图像输入到所述目标抠图模型中,得到与所述待抠图图像中的目标前景图像对应的目标透明图;
其中,所述目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,所述第一训练样本包括第一样本图像、与所述第一样本图像中的样本背景图像对应的第一背景图像及与所述第一样本图像中的第一前景图像对应的第一透明图,所述第二训练样本包括第二样本图像、与所述第二样本图像对应的第二背景图像及与所述第二样本图像中的第二前景图像对应的标注分割图。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1‑12中任一所述的抠图方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1‑12中任一所述的抠图方法。 说明书 : 一种抠图方法、装置、电子设备及存储介质技术领域[0001] 本公开实施例涉及图像处理领域,尤其涉及一种抠图方法、装置、电子设备及存储介质。背景技术[0002] 随着互联网技术的发展,抠图技术也取得了越来越广泛的应用,如在制作影视剧以及后期处理宣传照等过程中经常应用到抠图技术。[0003] 但是,现有的抠图方案存在抠图精细度不高的问题。发明内容[0004] 本公开实施例提供了一种抠图方法、装置、电子设备及存储介质,以实现精细化抠图的效果。[0005] 第一方面,本公开实施例提供了一种抠图方法,可以包括:[0006] 获取已训练完成的目标抠图模型、待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像;[0007] 将待抠图图像和先验背景图像输入到目标抠图模型中,得到与待抠图图像中的目标前景图像对应的目标透明图;[0008] 其中,目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图。[0009] 第二方面,本公开实施例还提供了一种抠图装置,可以包括:[0010] 图像获取模块,用于获取已训练完成的目标抠图模型、待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像;[0011] 抠图模块,用于将待抠图图像和先验背景图像输入到目标抠图模型,得到与待抠图图像中的目标前景图像对应的目标透明图;[0012] 其中,目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图。[0013] 第三方面,本公开实施例还提供了一种电子设备,可以包括:[0014] 一个或多个处理器;[0015] 存储器,用于存储一个或多个程序,[0016] 当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本公开任意实施例所提供的抠图方法。[0017] 第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本公开任意实施例提供的抠图方法。[0018] 本公开实施例的技术方案,通过将待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像输入到已训练完成的目标抠图模型中,由此可以根据目标抠图模型的输出结果得到与待抠图图像中的目标前景图像对应的目标透明图。上述技术方案,由于目标抠图模型是基于多组第一训练样本以及多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像以及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像及与第二样本图像中的第二前景图像对应的标注分割图,即目标抠图模型是将基于多组第一训练样本进行的基于背景先验的前景抠图训练以及基于多组第二训练样本进行的前景分割训练相结合训练得到的抠图模型,由此保证了抠图精细度,尤其是保证了前景目标的边缘处的抠图精细度。附图说明[0019] 结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。[0020] 图1是本公开实施例一中的一种抠图方法的流程图;[0021] 图2a是本公开实施例一中的一种抠图方法中的第一训练样本的示意图;[0022] 图2b是本公开实施例一中的一种抠图方法中的第二训练样本的示意图;[0023] 图3是本公开实施例一中的一种抠图方法中的抠图效果图;[0024] 图4是本公开实施例二中的一种抠图方法的流程图;[0025] 图5是本公开实施例二中的一种抠图方法中的第三训练样本的示意图;[0026] 图6是本公开实施例三中的一种抠图方法的流程图;[0027] 图7是本公开实施例四中的一种抠图方法的流程图;[0028] 图8是本公开实施例四中的一种抠图方法中的原始抠图模型的结构示意图;[0029] 图9是本公开实施例五中的一种抠图装置的结构框图;[0030] 图10是本公开实施例六中的一种电子设备的结构示意图。具体实施方式[0031] 下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。[0032] 应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。[0033] 本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。[0034] 需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。[0035] 需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。[0036] 本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。[0037] 下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。[0038] 实施例一[0039] 图1是本公开实施例一中提供的一种抠图方法的流程图。本实施例可适用于精细化抠图的情况,尤其适用于基于目标抠图模型实现精细化抠图的情况,该目标抠图模型是将前景分割训练和基于背景先验的前景抠图训练相结合训练得到的抠图模型。该方法可以由本公开实施例提供的抠图装置来执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成在电子设备上。[0040] 参见图1,本公开实施例的方法具体包括如下步骤:[0041] s110、获取已训练完成的目标抠图模型、待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像,其中,目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像及与第二样本图像中的第二前景图像对应的标注分割图。[0042] 其中,第一样本图像可以认为是由样本背景图像和第一前景图像这两部分组成的样本图像,第一背景图像可以是与样本背景图像相对应的背景图像,如预先采集得到的与样本背景图像相同或相似的背影图像;第一透明图可以是与第一前景图像相对应(即用于从第一样本图像中提取出第一前景图像)的预先标注出的透明图,具体来说可以是尺寸与第一样本图像的尺寸相同并且像素值位于0~1之间的浮点型矩阵。示例性的,参见图2a,其从左到右依次展示出了第一样本图像、第一背景图像和第一透明图。将第一样本图像(其也可被称为第一样本原图)、第一背景图像以及第一透明图作为一组第一训练样本。[0043] 第二样本图像可以认为是由某某背景图像和第二前景图像这两部分组成的样本图像,第二背景图像可以是与第二样本图像对应的背景图像,如根据第二样本图像或某某背景图像中的各像素点的像素值生成的背景图像;标注分割图可以是与第二前景图像相对应(即用于从第二样本图像中分割出第二前景图像)的预先标注出的分割图,具体来说可以是尺寸与第二样本图像的尺寸相同并且像素值是0或是1的二值型矩阵。示例性的,参见图2b,其从左到右依次展示出了第二样本图像、第二背景图像和标注分割图。将第二样本图像、第二背景图像以及标注分割图作为一组第二训练样本。[0044] 在此基础上,可以基于多组第一训练样本以及多组第二训练样本训练得到目标抠图模型,具体说是将基于多组第一训练样本进行的基于背景先验的前景抠图训练以及基于多组第二训练样本进行的前景分割训练相结合,通过二者的混合进行训练得到目标抠图模型。由于基于前者可以学习到抠图目标是什么,并且基于后者可以提升抠图精细度,二者相互配合,由此训练得到的目标抠图模型可以较好地保证抠图的准确度和精细度。[0045] 特别地,样本背景图像和第一背景图像是同一背景图像时,第一样本图像可以认为是第一前景图像和第一背景图像的合成图像,那么如果只是基于由此得到的第一训练样本进行模型训练,应用时容易出现合成图像和真实场景存在差异而导致抠图边缘不精细的问题。因此,本公开实施例将前景分割训练混合到基于背景先验的前景抠图训练中,由此有效解决了抠图边缘不精细的问题。[0046] 待抠图图像可以认为是由目标前景图像和目标背景图像这两部分组成的待进行前景抠图的图像,先验背景图像可以是与目标背景图像相对应的作为先验知识的背景图像,如预先采集得到的与目标背景图像相同或相似的背影图像。[0047] s120、将待抠图图像以及先验背景图像输入到目标抠图模型中,得到与待抠图图像中的目标前景图像对应的目标透明图。[0048] 其中,将待抠图图像以及先验背景图像输入到目标抠图模型中,然后根据目标抠图模型的输出结果,可以得到与目标前景图像相对应的目标透明图,即用于从待抠图图像中提取出目标前景图像的透明图。[0049] 为了验证上述方法的有效性,示例性的,参见图3,将左侧的待抠图图像和中间的先验背景图像输入到目标抠图模型中,然后根据目标抠图模型的输出结果可以得到右侧的目标透明图。根据图3可知,上述方法可以准确提取出待抠图图像中的前景目标,并且在前景目标的边缘处的抠图精细度较高。在实际应用中,可选的,上述方法可以应用在拍摄机位固定的直播点播场景(如教育、电商、电视节目等),可以用于目标背景图像的去除和/或替换。[0050] 本公开实施例的技术方案,通过将待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像输入到已训练完成的目标抠图模型中,由此可以根据目标抠图模型的输出结果得到与待抠图图像中的目标前景图像对应的目标透明图。上述技术方案,由于目标抠图模型是基于多组第一训练样本以及多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像以及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像及与第二样本图像中的第二前景图像对应的标注分割图,即目标抠图模型是将基于多组第一训练样本进行的基于背景先验的前景抠图训练以及基于多组第二训练样本进行的前景分割训练相结合训练得到的抠图模型,由此保证了抠图精细度,尤其是保证了前景目标的边缘处的抠图精细度。[0051] 实施例二[0052] 图4是本公开实施例二中提供的一种抠图方法的流程图。本实施例以上述实施例中各个可选方案为基础进行优化。本实施例中,可选的,目标抠图模型可通过如下步骤预先训练得到:获取待训练的原始抠图模型、第一训练样本和第二训练样本;基于多组第一训练样本以及多组第二训练样本对原始抠图模型进行训练,得到目标抠图模型。其中,与上述各实施例相同或是相应的术语的解释在此不再赘述。[0053] 相应的,如图4所示,本实施例的方法具体可以包括如下步骤:[0054] s210、获取待训练的原始抠图模型、第一训练样本和第二训练样本,其中,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图。[0055] 其中,原始抠图模型可以是待进行训练的抠图模型。[0056] 在实际应用中,可选的,针对于第一训练样本,其中的第一样本图像可以通过如下步骤获取:获取已采集图像和第一透明图,根据第一透明图从已采集图像中提取出第一前景图像;获取第一背景图像,将第一背景图像和第一前景图像进行合成,得到第一样本图像。其中,已采集图像可以是预先采集得到的包括第一前景图像的图像,第一透明图可以是对应于该第一前景图像的透明图,因此可以基于第一透明图从已采集图像中提取出该第一前景图像。然后,第一背景图像可以是预先采集到的用于作为先验知识的背景图像,可以将第一背景图像和第一前景图像进行合成,得到第一样本图像。上述技术方案,可以有效解决第一训练样本的收集难度较大的问题。[0057] 再可选的,第二背景图像可通过如下步骤生成:获取第二样本图像,根据第二样本图像中各像素点的像素值生成第二背景图像,如根据各像素值的均值生成第二背景图像,由此得到的第二背景图像可以是灰度图像,从而有效得到了与第二样本图像对应的第二背景图像。[0058] s220、基于多组第一训练样本以及多组第二训练样本对原始抠图模型进行训练,得到目标抠图模型。[0059] 其中,基于多组第一训练样本对原始抠图模型进行训练,由此可以让原始抠图模型学习到抠图目标是什么;并且基于多组第二训练样本对原始抠图模型进行训练,由此可以让原始抠图模型扣除更精细的抠图目标。因此,经过这两个训练过程训练得到的目标抠图模型有效保证了抠图精细度,尤其是保证了前景目标的边缘处的抠图精细度。需要说明的是,两个训练过程可以先后执行,也可以同时执行,在此未做具体限定。[0060] s230、获取待抠图图像及与待抠图图像中的目标背景图像对应的先验背景图像,并将待抠图图像和先验背景图像输入到目标抠图模型中,得到与待抠图图像中的目标前景图像对应的目标透明图。[0061] 本公开实施例的技术方案,获取待训练的原始抠图模型、第一训练样本和第二训练样本,并基于多组第一训练样本和多组第二训练样本对原始抠图模型进行训练,由此可以得到能够保证抠图精细度,尤其是可以保证前景目标的边缘处的抠图精细度的目标抠图模型。[0062] 一种可选的技术方案,在实施例二的基础上,上述抠图方法,还可以包括:获取第三训练样本,其中,第三训练样本包括第三样本图像、与第三样本图像对应的第三背景图像以及与第三样本图像中的第三前景图像对应的第二透明图;基于多组第一训练样本和多组第二训练样本对原始抠图模型进行训练,包括:基于多组第一训练样本、多组第二训练样本、以及多组第三训练样本,对原始抠图模型进行训练。其中,第三样本图像可以认为是由某某背景图像以及第三前景图像这两部分组成的样本图像,第三背景图像可以是与第三样本图像对应的背景图像,如根据第三样本图像或某某背景图像中的各像素点的像素值生成的背景图像,该背景图像可以是灰度图像;第二透明图可以是与第三前景图像对应(即用于从第三样本图像中提取出第三前景图像)的预先标注出的透明图。示例性的,参见图5,其从左到右依次展示出了第三样本图像、第三背景图像和第二透明图。将第三样本图像、第三背景图像以及第二透明图作为一组第三训练样本,然后可以基于多组第一训练样本、多组第二训练样本以及多组第三训练样本,共同对原始抠图模型进行训练。上述技术方案,在模型训练阶段,将基于多组第三训练样本进行的前景抠图训练加入其中,由此可以让原始抠图模型更好地学习到前景目标的边缘处以及细节处的相关信息,由此进一步提升了由此训练得到的目标抠图模型的抠图精细度。[0063] 在此基础上,可选的,第二前景图像中的前景目标和第三前景图像中的前景目标均对应于第一类型,并且多组第一训练样本中存在包括对应于第一类型的第一前景图像的第一训练样本及包括对应于第二类型的第一前景图像的第一训练样本,第一类型和第二类型不同。其中,第一类型可以是第二前景图像中的前景目标和第三前景图像中的前景目标的类型,如人、房子、马路、树木等,其可以理解为目标抠图模型主要应用的抠图目标。在此基础上,为了保证目标抠图模型的通用性,多组第一训练样本中既可以包括对应于这样的前景目标的第一训练样本(即该第一训练样本中的前景目标的类型是第一类型),又可以包括对应于其余的前景目标的第一训练样本(即该第一训练样本中的前景目标的类型是第二类型),由此训练得到的目标抠图模型可以同时实现前景目标和除前景目标之外的通用目标的精细化抠图的效果。[0064] 另一种可选的技术方案,在实施例二的基础上,基于多组第一训练样本和多组第二训练样本对原始抠图模型进行训练,得到目标抠图模型,可以包括:获取抠图损失函数,并基于抠图损失函数和多组第一训练样本对原始抠图模型进行抠图训练;获取分割损失函数,并基于分割损失函数和多组第二训练样本对原始抠图模型进行分割训练;得到目标抠图模型。[0065] 其中,抠图损失函数可以是适用于基于多组第一训练样本对原始抠图模型进行抠图训练时的损失函数,当然,也可以是适用于基于多组第三训练样本对原始抠图模型进行抠图训练时的损失函数。实际应用中,可选的,该抠图损失函数可以包括拉普拉斯损失函数、l1损失函数、边缘损失函数和前景目标损失函数中的至少一个。具体的,该拉普拉斯损失函数可以是用于增强细节学习的损失函数llap,在实际应用中,可选的,其可以通过如下式子进行表示: 其中a是将第一样本图像和第一背景图像输入到原始抠图模型后得到的预测透明图,lpha_gt是第一透明图。该l1损失函数可以是用于全局监督a的准确性的损失函数ll1,实际应用中,可选的,其可以通过如下式子进行表示:ll1=mean(|a‑alpha_gt|)。该边缘损失函数可以是为了增强边缘部分细节学习而设置的损失函数ledge,在其中通过设置膨胀腐蚀结果edge_region来增加边缘部分的权重,由此可以让边缘更加稳定和清晰,实际应用中,可选的,其可以通过如下式子进行表示:ledge=mean(|a‑alpha_gt|*edge_region),其中edge_region可以是对第一透明图分别进行膨胀和腐蚀后得到的结果,如将dilate(alpha_gt)-erode(alpha_gt)作为edge_region。该前景目标损失函数可以是为了增加分割的前景部分的完整性而设置的损失函数lobj,具体说可以是通过在其中增加膨胀结果dilate_region这一项来增加前景部分的权重而实现的。在实际应用中,可选的,其可以通过如下式子进行表示:lobj=mean(|a‑alpha_gt|*dilate_region),其中dilate_region可以是对第一透明图进行膨胀后得到的结果,如将dilate(alpha_gt)作为edge_region。抠图损失函数以及多组第一训练样本相互配合,可以有效实现原始抠图模型的抠图训练。[0066] 分割损失函数可以包括适用于基于多组第二训练样本对原始抠图模型进行分割训练时的损失函数lseg,在实际应用中,可选的,其可以通过如下式子进行表示lseg=bce(seg,seg_label),其中,bce是交叉熵(binarycrossentropy),seg是将第二样本图像及第二背景图像输入到原始抠图模型后得到的预测分割图,seg_label可以是标注分割图。再可选的,seg_label可以是人为设置的,也可以是根据alpha_gt转换得到的,如seg_label=(alphagt>thr),其中thr是预先设置的阈值,换言之,可以将alpha_gt中大于阈值的像素点置1,并且将小于或等于阈值的像素点置0,由此得到seg_label。分割损失函数以及多组第二训练样本相互配合,可以有效实现原始分割模型的分割训练。[0067] 上述两部分相互配合,可以得到目标抠图模型,由此实现了目标抠图模型的有效训练的效果。[0068] 在此基础上,可选的,基于抠图损失函数和多组第一训练样本对原始抠图模型进行抠图训练,可以包括:针对每组第一训练样本,将第一训练样本中的第一样本图像和第一背景图像输入到原始抠图模型中,得到预测透明图;根据预测透明图、第一训练样本中的第一透明图及抠图损失函数,调整原始抠图模型中的网络参数;基于分割损失函数和多组第二训练样本对原始抠图模型进行分割训练,可以包括:针对每组第二训练样本,将第二训练样本中的第二样本图像和第二背景图像输入到原始抠图模型中,得到预测分割图;根据预测分割图、第二训练样本中的标注分割图及分割损失函数,调整网络参数;得到目标抠图模型,可以包括:根据网络参数的调整结果,得到目标抠图模型。换言之,抠图损失函数以及多组第一训练样本相互配合,可以将原始抠图模型中的网络参数向着能够带来更好的抠图效果的方向进行调整;类似的,分割损失函数及多组第二训练样本相互配合,可以将网络参数向着能够带来更好的分割效果的方向进行调整。上述两部分相互配合,在对网络参数进行调整之后,可以得到目标抠图模型,由此实现了目标抠图模型的有效训练的效果。[0069] 实施例三[0070] 图6是本公开实施例三中提供的一种抠图方法的流程图。本实施例以上述实施例二中的各个可选方案为基础进行优化。本实施例中,可选的,上述抠图方法,还可包括:获取第一背景图像,并对第一背景图像进行数据增广,得到第四背景图像,将第一样本图像、第四背景图像以及第一透明图作为一组第四训练样本;基于多组第一训练样本以及多组第二训练样本对原始抠图模型进行训练,包括:基于多组第一训练样本、多组第二训练样本、以及多组第四训练样本,对原始抠图模型进行训练。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。[0071] 相应的,如图6所示,本实施例的方法具体可以包括如下步骤:[0072] s310、获取待训练的原始抠图模型、第一训练样本和第二训练样本,其中,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图。[0073] s320、对第一背景图像进行数据增广,得到第四背景图像,并将第一样本图像、第四背景图像以及第一透明图作为一组第四训练样本。[0074] 其中,在实际应用中,考虑到先验背景图像是预先采集到的背景图像,而待抠图图像是后来采集到的图像,这就意味着先验背景图像和待抠图图像中的目标背景图像可能存在差异,如因为阴影、伪影、摄像机晃动和光照变化等而带来的差异,这些差异可能影响到目标透明图的预测精细度。因此,为了保证目标抠图模型应用的鲁棒性,可以对第一背景图像进行数据增广,由此得到的第四背景图像可以用于模拟在模型应用阶段因为某些因素变换而导致先验背景图像和目标背景图像间存在差异的情况,即通过第四背景图像和样本背景图像间的差异来模拟先验背景图像和目标背景图像间的差异的情况。进而,将第一样本图像、第四背景图像及第一透明图作为一组第四训练样本,以便后续结合多组第一训练样本和多组第二训练样本,共同对原始抠图模型进行训练。[0075] s330、基于多组第一训练样本、多组第二训练样本、及多组第四训练样本,对原始抠图模型进行训练。[0076] s340、获取待抠图图像及与待抠图图像中的目标背景图像对应的先验背景图像,并将待抠图图像和先验背景图像输入到目标抠图模型中,得到与待抠图图像中的目标前景图像对应的目标透明图。[0077] 本公开实施例的技术方案,通过对第一背景图像进行数据增广,得到用于模拟先验背景图像和目标背景图像间的差异的第四背景图像,后续在模型训练阶段,可以将第一样本图像、第四背景图像和第一透明图组成的第四训练样本加入到模型训练过程中,由此保证了训练得到的目标抠图模型的鲁棒性。[0078] 一种可选的技术方案,在实施例三基础上,对第一背景图像进行数据增广,包括下述操作中的至少一项:对第一背景图像进行旋转和/或平移;对第一背景图像的环境参数进行调整,其中,环境参数包括亮度参数、色调参数以及对比度参数中的至少一个;对第一背景图像进行高斯模糊和/或是运动模糊;在第一背景图像中生成阴影和/或伪影。其中,通过对第一背景图像进行旋转和/或平移来模拟摄像机轻微晃动的情况,如以一定概率对第一背景图像随机旋转(‑10度~10度)和/或随机平移(‑50px~50px)。通过对第一背景图像的环境参数进行调整、高斯模糊和运动模糊中的至少一个,由此模拟拍摄环境变化的情况,如以一定概率对第一背景图像进行随机亮度、色调和对比度调整,及随机高斯/运动模糊。通过在在第一背景图像中生成阴影和/或伪影来模拟阴影和/或的情况。上述技术方案与其余技术特征相互配合,由此可以有效降低阴影、伪影和拍摄条件变化等对目标透明图的预测精细度造成的干扰。[0079] 实施例四[0080] 图7是本公开实施例四中提供的一种抠图方法的流程图。本实施例以上述实施例二和实施例三中各个可选方案为基础进行优化。本实施例中,可选的,原始抠图模型包括依次连接的编码层和解码层;其中,编码层包括第一编码层和第二编码层,第一编码层是用于对第一样本图像和第二样本图像进行编码,且第二编码层是用于对第一背景图像和第二背景图像进行编码;和/或,解码层的输出通道包括用于输出编码层和解码层对第二样本图像和第二背景图像进行处理之后得到的预测分割图的分割输出通道;和/或,针对各层解码层中的当前层,当前层的输入特征包括拼接特征,拼接特征是对当前层的上一层解码层的上一输出特征、各层编码层的中间输出特征中与上一输出特征尺度相同的中间输出特征、及尺寸被调整至尺度的第一样本图像进行拼接后得到的特征。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。[0081] 相应的,如图7所示,本实施例的方法具体可以包括如下步骤:[0082] s410、获取待训练的原始抠图模型,其中,原始抠图模型包括依次连接的编码层和解码层,编码层包括第一编码层和第二编码层,第一编码层是用于对第一样本图像和第二样本图像进行编码,且第二编码层是用于对第一背景图像和第二背景图像进行编码;解码层的输出通道包括用于输出编码层和解码层对第二样本图像和第二背景图像进行处理后得到的预测分割图的分割输出通道;针对于各层解码层中的当前层,当前层的输入特征包括拼接特征,拼接特征是对当前层的上一层解码层的上一输出特征、各层编码层的中间输出特征中与上一输出特征尺度相同的中间输出特征、以及尺寸被调整至尺度的第一样本图像进行拼接后得到的特征。[0083] 其中,这里以第一样本图像和第一背景图像为例,基于第一编码层和第二编码层对这二者分别进行编码的好处在于:让二者间不再具有强依赖关系(即实现二者的解耦),这样即使因为某些因素变化而导致样本背景图像和第一背景图像存在差异,也能够得到较好的抠图效果,这在模型应用阶段依然适用;另外,当第二背景图像是灰度图像时,未进行分离的编码层无法处理这样的第二样本图像和第二背景图像。为了实现基于多组第二训练样本所进行的前景分割训练,在解码层的输出通道中可以设置有用于输出预测分割图的分割输出通道。针对于各层解码层中的当前层,当前层的输入特征包括拼接特征,拼接特征是对当前层的上一层解码层的上一输出特征、各层编码层的中间输出特征中的与上一输出特征尺度相同的中间输出特征、以及尺寸被调整至该尺度的第一样本图像进行拼接后得到的特征,这里将尺寸被调整至该尺度的第一样本图像作为拼接特征中的一部分的好处在于,在第一样本图像和解码层中增加了一个skip连接,从而使得解码层的输入特征能获取更low‑level的信息,进而使得multilevel的特征相融合,由此提升了模型训练的精细度。[0084] s420、获取第一训练样本和第二训练样本,其中,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图。[0085] s430、基于多组第一训练样本以及多组第二训练样本对原始抠图模型进行训练,得到目标抠图模型。[0086] s440、获取待抠图图像及与待抠图图像中的目标背景图像对应的先验背景图像,并将待抠图图像和先验背景图像输入到目标抠图模型中,得到与待抠图图像中的目标前景图像对应的目标透明图。[0087] 本公开实施例的技术方案,通过分离解码层实现第一样本图像和第一背景图像(亦是第二样本图像和第二背景图像)间的解耦,从而保证由此训练得到的目标抠图模型的鲁棒性,并且通过分离编码层来更好地处理属于灰度图像的第二背景图像和第二样本图像的编码;通过在解码层的输出通道中新增分割输出通道来保证目标分割训练的有效进行;通过将尺寸被调整的第一样本图像作为解码层的输入特征中的一部分,此提升了模型训练的精细度。[0088] 为了从整体上更好地理解上述原始抠图模型,下面结合具体示例对其进行示例性说明。示例性的,参见图8,原始抠图模型包括输入层(input)、编码层(encoder)、解码层(decoder)、优化层(refiner)和输出层(output)。具体的,[0089] input:这里以第一样本图像i和第一背景图像b为例,i的尺寸(shape)为(3,h,w),b的shape为(3,h,w)。[0090] encoder包括第一编码层(encoder1)、第二编码层(encoder2)和第三编码层(encoder3),其中,encoder1和encoder2结构可以为常见backbone(如resnet、vggnet、mobilenet等)的前半部分,encoder3用于聚合并进一步提取i和b的特征,结构可以为一层1x1卷积降维 常见backbone的后半部分。[0091] decoder可以由四层卷积层 上采样层组成,其输出shape为(1,h/2,w/2)的中间的预测透明图a_sm,(1,h/2,w/2)的预测分割图seg、以及(32,h/2,w/2)的中间特征hid,用于作为refiner的输入特征。[0092] refiner可以由一层上采样层和三层卷积层组成,输出高分辨率(1,h,w)和高质量的最终的预测透明图a_lg。refiner还可以称为优化器或是优化网络。[0093] 在实际应用中,可选的,结合到上文中的抠图损失函数,其可同时应用于a_sm和a_lg,即上述公式中的a即可以是a_sm,又可以是a_lg。[0094] 实施例五[0095] 图9为本公开实施例五提供的抠图装置的结构框图,该装置用于执行上述任意实施例所提供的抠图方法。该装置与上述各实施例的抠图方法属于同一个构思,在抠图装置的实施例中未详尽描述的细节内容,可以参考上述抠图方法的实施例。参见图9,该装置具体可包括:图像获取模块510和抠图模块520。[0096] 其中,图像获取模块510,用于获取已训练完成的目标抠图模型、待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像;[0097] 抠图模块520,用于将待抠图图像和先验背景图像输入到目标抠图模型中,得到与待抠图图像中的目标前景图像对应的目标透明图;[0098] 其中,目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图。[0099] 本公开实施例五提供的抠图装置,通过图像获取模块和抠图模块相互配合,将待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像输入到已训练完成的目标抠图模型中,由此可以根据目标抠图模型的输出结果得到与待抠图图像中的目标前景图像相对应的目标透明图。上述装置,由于目标抠图模型是基于多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图,即目标抠图模型是将基于多组第一训练样本进行的基于背景先验的前景抠图训练及基于多组第二训练样本进行的前景分割训练相结合训练得到的抠图模型,由此保证了抠图精细度,尤其是保证了前景目标的边缘处的抠图精细度。[0100] 本公开实施例所提供的抠图装置可执行本公开任意实施例所提供的抠图方法,具备执行方法相应的功能模块和有益效果。[0101] 值得注意的是,上述抠图装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开的保护范围。[0102] 实施例六[0103] 下面参考图10,其示出了适于用来实现本公开实施例的电子设备(例如图10中的终端设备或服务器)600的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。[0104] 如图10所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储装置608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。[0105] 通常,以下装置可以连接至i/o接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图10中示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。[0106] 实施例七[0107] 特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从rom602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。[0108] 需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd‑rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。[0109] 在一些实施方式中,客户端、服务器可以利用诸如http(hypertexttransferprotocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“lan”),广域网(“wan”),网际网(例如,互联网)以及端对端网络(例如,adhoc端对端网络),以及任何当前已知或未来研发的网络。[0110] 上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。[0111] 上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:[0112] 获取已训练完成的目标抠图模型、待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像;[0113] 将待抠图图像和先验背景图像输入到目标抠图模型中,得到与待抠图图像中的目标前景图像对应的目标透明图;[0114] 其中,目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图。[0115] 可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如java、smalltalk、c ,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。[0116] 附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。[0117] 描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,图像获取模块还可被描述为“获取已训练完成的目标抠图模型、待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像的模块”。[0118] 本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。[0119] 在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd‑rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。[0120] 根据本公开的一个或多个实施例,【示例一】提供了一种抠图方法,该方法可以包括:[0121] 获取已训练完成的目标抠图模型、待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像;[0122] 将待抠图图像和先验背景图像输入到目标抠图模型中,得到与待抠图图像中的目标前景图像对应的目标透明图;[0123] 其中,目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、与第二样本图像对应的第二背景图像以及与第二样本图像中的第二前景图像对应的标注分割图。[0124] 根据本公开的一个或是多个实施例,【示例二】提供了示例一的方法,目标抠图模型可以通过如下步骤预先训练得到:[0125] 获取待训练的原始抠图模型、第一训练样本和第二训练样本;[0126] 基于多组第一训练样本以及多组第二训练样本对原始抠图模型进行训练,得到目标抠图模型。[0127] 根据本公开的一个或是多个实施例,【示例三】提供了示例二的方法,上述抠图方法,还可以包括:[0128] 获取第三训练样本,该第三训练样本包括第三样本图像、与第三样本图像对应的第三背景图像及与第三样本图像中的第三前景图像对应的第二透明图;[0129] 基于多组第一训练样本和多组第二训练样本对原始抠图模型进行训练,可包括:[0130] 基于多组第一训练样本、多组第二训练样本、以及多组第三训练样本,对原始抠图模型进行训练。[0131] 根据本公开的一个或是多个实施例,【示例四】提供了示例三的方法,第二前景图像中的前景目标和第三前景图像中的前景目标均对应于第一类型,并且多组第一训练样本中存在包括对应于第一类型的第一前景图像的第一训练样本及包括对应于第二类型的第一前景图像的第一训练样本,第一类型和第二类型不同。[0132] 根据本公开的一个或是多个实施例,【示例五】提供了示例二的方法,基于多组第一训练样本和多组第二训练样本对原始抠图模型进行训练,得到目标抠图模型,可以包括:[0133] 获取抠图损失函数,并基于抠图损失函数和多组第一训练样本对原始抠图模型进行抠图训练;[0134] 获取分割损失函数,并基于分割损失函数和多组第二训练样本对原始抠图模型进行分割训练;[0135] 得到目标抠图模型。[0136] 根据本公开的一个或是多个实施例,【示例六】提供了示例五的方法,基于抠图损失函数和多组第一训练样本对原始抠图模型进行抠图训练,可以包括:[0137] 针对每组第一训练样本,将第一训练样本中的第一样本图像以及第一背景图像输入到原始抠图模型中,得到预测透明图;[0138] 根据预测透明图、第一训练样本中的第一透明图以及抠图损失函数,调整原始抠图模型中的网络参数;[0139] 基于分割损失函数和多组第二训练样本对原始抠图模型进行分割训练,可包括:[0140] 针对每组第二训练样本,将第二训练样本中的第二样本图像以及第二背景图像输入到原始抠图模型中,得到预测分割图;[0141] 根据预测分割图、第二训练样本中的标注分割图以及分割损失函数,调整网络参数;[0142] 得到目标抠图模型,可以包括:[0143] 根据网络参数的调整结果,得到目标抠图模型。[0144] 根据本公开的一个或是多个实施例,【示例七】提供了示例五的方法,抠图损失函数包括拉普拉斯损失函数、l1损失函数、边缘损失函数和前景目标损失函数中的至少一个,边缘损失函数是根据预测透明图、第一透明图和膨胀腐蚀结果构建得到的损失函数,膨胀腐蚀结果是对第一透明图分别进行膨胀和腐蚀后得到的结果,前景目标损失函数是根据预测透明图、第一透明图和膨胀结果构建得到的损失函数,膨胀结果是对第一透明图进行膨胀后得到的结果。[0145] 根据本公开的一个或是多个实施例,【示例八】提供了示例二的方法,上述抠图方法,还可以包括:[0146] 对第一背景图像进行数据增广,得到第四背景图像,并将第一样本图像、第四背景图像以及第一透明图作为一组第四训练样本;[0147] 基于多组第一训练样本和多组第二训练样本对原始抠图模型进行训练,可包括:[0148] 基于多组第一训练样本、多组第二训练样本、以及多组第四训练样本,对原始抠图模型进行训练。[0149] 根据本公开的一个或多个实施例,【示例九】提供了示例八的方法,对第一背景图像进行数据增广,包括下述操作中的至少一项:[0150] 对第一背景图像进行旋转和/或平移;[0151] 对第一背景图像的环境参数进行调整,其中环境参数包括亮度参数、色调参数以及对比度参数中的至少一个;[0152] 对第一背景图像进行高斯模糊和/或运动模糊;[0153] 在第一背景图像中生成阴影和/或伪影。[0154] 根据本公开的一个或是多个实施例,【示例十】提供了示例二的方法,上述抠图方法,还可以包括:[0155] 获取第二样本图像;[0156] 根据第二样本图像中各像素点的像素值,生成第二背景图像。[0157] 根据本公开的一个或多个实施例,【示例十一】提供了示例二的方法,上述抠图方法,还可以包括:[0158] 样本背景图像和第一背景图像相同,获取已采集图像和第一透明图,根据第一透明图从已采集图像中提取出第一前景图像;[0159] 获取第一背景图像,将第一背景图像和第一前景图像进行合成,得到第一样本图像。[0160] 根据本公开的一个或多个实施例,【示例十二】提供了示例二的方法,原始抠图模型包括依次连接的编码层和解码层;其中,[0161] 编码层包括第一编码层和第二编码层,第一编码层是用于对第一样本图像和第二样本图像进行编码,第二编码层是用于对第一背景图像和第二背景图像进行编码;[0162] 和/或,[0163] 解码层的输出通道包括用于输出编码层以及解码层对第二样本图像和第二背景图像进行处理后得到的预测分割图的分割输出通道;[0164] 和/或,[0165] 针对各层解码层中的当前层,当前层的输入特征包括拼接特征,拼接特征是对当前层的上一层解码层的上一输出特征、各层编码层的中间输出特征中与上一输出特征尺度相同的中间输出特征、及尺寸被调整至尺度的第一样本图像进行拼接后得到的特征。[0166] 根据本公开的一个或是多个实施例,【示例十三】提供了一种抠图装置,该装置可以包括:[0167] 图像获取模块,用于获取已训练完成的目标抠图模型、待抠图图像以及与待抠图图像中的目标背景图像对应的先验背景图像;[0168] 抠图模块,用于将待抠图图像和先验背景图像输入到目标抠图模型,得到与待抠图图像中的目标前景图像对应的目标透明图;[0169] 其中,目标抠图模型通过多组第一训练样本和多组第二训练样本训练得到的,第一训练样本包括第一样本图像、与第一样本图像中的样本背景图像对应的第一背景图像及与第一样本图像中的第一前景图像对应的第一透明图,第二训练样本包括第二样本图像、以与第二样本图像对应的第二背景图像及与第二样本图像中的第二前景图像对应的标注分割图。[0170] 根据本公开的一个或是多个实施例,【示例十四】提供了示例十三的装置,目标抠图模型可以通过如下模块预先训练得到:[0171] 样本第一获取模块,用于获取待训练的原始抠图模型、第一训练样本以及第二训练样本;[0172] 目标抠图模型得到模块,用于基于多组第一训练样本以及多组第二训练样本对原始抠图模型进行训练,得到目标抠图模型。[0173] 根据本公开的一个或是多个实施例,【示例十五】提供了示例十四的装置,上述抠图装置,还可以包括:[0174] 样本第二获取模块,用于获取第三训练样本,其中第三训练样本包括第三样本图像、与第三样本图像对应的第三背景图像以及与第三样本图像中的第三前景图像对应的第二透明图;[0175] 模型训练模块,可以包括:[0176] 模型第一训练单元,用于基于多组第一训练样本、多组第二训练样本、以及多组第三训练样本,对原始抠图模型进行训练。[0177] 根据本公开的一个或是多个实施例,【示例十六】提供了示例十五的装置,第二前景图像中的前景目标和第三前景图像中的前景目标均对应于第一类型,并且多组第一训练样本中存在包括对应于第一类型的第一前景图像的第一训练样本及包括对应于第二类型的第一前景图像的第一训练样本,第一类型和第二类型不同。[0178] 根据本公开的一个或是多个实施例,【示例十七】提供了示例十四的装置,目标抠图模型得到模块,可以包括:[0179] 抠图训练单元,用于获取抠图损失函数,并基于抠图损失函数和多组第一训练样本对原始抠图模型进行抠图训练;[0180] 分割训练单元,用于获取分割损失函数,并基于分割损失函数和多组第二训练样本对原始抠图模型进行分割训练;[0181] 目标抠图模型得到单元,用于得到目标抠图模型。[0182] 根据本公开的一个或是多个实施例,【示例十八】提供了示例十七的装置,抠图训练单元,可以包括:[0183] 预测透明图得到子单元,用于针对每组第一训练样本,将第一训练样本中的第一样本图像和第一背景图像输入到原始抠图模型中,得到预测透明图;[0184] 网络参数第一调整子单元,用于根据预测透明图、第一训练样本中的第一透明图及抠图损失函数,调整原始抠图模型中的网络参数;[0185] 抠图训练单元,可以包括:[0186] 预测分割图得到子单元,用于针对每组第二训练样本,将第二训练样本中的第二样本图像和第二背景图像输入到原始抠图模型中,得到预测分割图;[0187] 网络参数第二调整子单元,用于根据预测分割图、第二训练样本中的标注分割图及分割损失函数,调整网络参数;[0188] 目标抠图模型得到单元,具体可以用于:[0189] 根据网络参数的调整结果,得到目标抠图模型。[0190] 根据本公开的一个或是多个实施例,【示例十九】提供了示例十七的装置,抠图损失函数包括拉普拉斯损失函数、l1损失函数、边缘损失函数及前景目标损失函数中的至少一个,边缘损失函数是根据预测透明图、第一透明图和膨胀腐蚀结果构建得到的损失函数,膨胀腐蚀结果是对第一透明图分别进行膨胀和腐蚀后得到的结果,前景目标损失函数是根据预测透明图、第一透明图及膨胀结果构建得到的损失函数,膨胀结果是对第一透明图进行膨胀后得到的结果。[0191] 根据本公开的一个或是多个实施例,【示例二十】提供了示例十四的装置,上述抠图装置,还可以包括:[0192] 数据增广模块,用于对第一背景图像进行数据增广,得到第四背景图像,并将第一样本图像、第四背景图像以及第一透明图作为一组第四训练样本;[0193] 模型训练模块,可以包括:[0194] 模型第三训练单元,用于基于多组第一训练样本、多组第二训练样本、以及多组第四训练样本,对原始抠图模型进行训练。[0195] 根据本公开的一个或是多个实施例,【示例二十一】提供了示例二十的装置,数据增广模块,可以包括下述单元中的至少一项:[0196] 旋转平移单元,用于对第一背景图像进行旋转和/或平移;[0197] 环境参数调整单元,用于对第一背景图像的环境参数进行调整,其中环境参数包括亮度参数、色调参数以及对比度参数中的至少一个;[0198] 模糊处理单元,用于对第一背景图像进行高斯模糊和/或运动模糊;[0199] 阴影伪影生成单元,用于在第一背景图像中生成阴影和/或伪影。[0200] 根据本公开的一个或是多个实施例,【示例二十二】提供了示例十四的装置,上述抠图装置,还可以包括:[0201] 图像再获取模块,用于获取第二样本图像;[0202] 第二背景图像生成模块,用于根据第二样本图像中的各像素点的像素值,生成第二背景图像。[0203] 根据本公开的一个或是多个实施例,【示例二十三】提供了示例十四的装置,上述抠图装置,还可以包括:[0204] 第一前景图像提取模块,用于样本背景图像和第一背景图像相同,获取已采集图像和第一透明图,根据第一透明图从已采集图像中提取出第一前景图像;[0205] 第一样本图像得到模块,用于获取第一背景图像,将第一背景图像和第一前景图像进行合成,得到第一样本图像。[0206] 根据本公开的一个或是多个实施例,【示例二十四】提供了示例十四的装置,原始抠图模型包括依次连接的编码层和解码层;其中,[0207] 编码层包括第一编码层和第二编码层,第一编码层是用于对第一样本图像和第二样本图像进行编码,第二编码层是用于对第一背景图像和第二背景图像进行编码;[0208] 和/或,[0209] 解码层的输出通道包括用于输出编码层以及解码层对第二样本图像和第二背景图像进行处理后得到的预测分割图的分割输出通道;[0210] 和/或,[0211] 针对各层解码层中的当前层,当前层的输入特征包括拼接特征,拼接特征是对当前层的上一层解码层的上一输出特征、各层编码层的中间输出特征中与上一输出特征尺度相同的中间输出特征、及尺寸被调整至尺度的第一样本图像进行拼接后得到的特征。[0212] 以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。[0213] 此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。[0214] 尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
专利地区:北京
专利申请日期:2022-05-11
专利公开日期:2024-07-09
专利公告号:cn114926491b