剑客网

  |  手机版

收藏网站

剑客网,汇聚专业声音 解析IT潮流

软件

首页 > 软件 >

谷歌发布新的人工智能照片升级技术

浏览:出处:剑客网2021-08-31 17:59

  剑客网8月31日消息 据外媒报道 Michael Zhang 通过 PetaPixel 表示:在Google AI 博客上发表的一篇题​​为“使用扩散模型生成高保真图像”(并被 DPR 发现)的帖子中,谷歌公司大脑团队的研究人员分享了他们在图像超分辨率方面取得的新突破。[...] 第一种方法称为SR3,或通过重复细化的超分辨率。

  这是技术解释:“SR3 是一种超分辨率扩散模型,它将低分辨率图像作为输入,并从纯噪声中构建相应的高分辨率图像,”谷歌写道。

  “该模型接受了图像损坏过程的训练,其中噪声逐渐添加到高分辨率图像中,直到只剩下纯噪声为止。” “然后它学会了逆转这个过程,从纯噪声开始,并通过输入低分辨率图像的引导逐步去除噪声以达到目标分布。” 已发现 SR3 在放大肖像和自然图像方面效果很好。当用于对人脸进行 8 倍放大时,它的“混淆率”接近 50%,而现有方法仅达到 34%,

  谷歌看到 SR3 在放大照片方面的效果后,该公司更进一步,采用了第二种方法,称为CDM,一个类条件扩散模型。“CDM 是一种基于 ImageNet 数据训练的类条件扩散模型,用于生成高分辨率的自然图像,”谷歌写道。“由于 ImageNet 是一个困难的高熵数据集,我们将 CDM 构建为多个扩散模型的级联。

  这种级联方法涉及将多个空间分辨率的多个生成模型链接在一起:一个扩散模型以低分辨率生成数据,然后是一系列 SR3 超分辨率扩散模型,逐渐将生成的图像的分辨率提高到最高分辨率。” “通过 SR3 和 CDM,我们已经将扩散模型的性能推到了超分辨率和类条件 ImageNet 生成基准的最先进水平,”谷歌研究人员写道。”

相关文章

最新新闻

网警备案