图像生成共6篇
Flow Matching的数学原理-MuQYY的博客

Flow Matching的数学原理

这篇文章介绍了Flow Matching作为一种生成模型训练方法,将其视为扩散模型的更通用形式。其核心思想是将数据视为在流场中运动的粒子,通过学习一个与时间相关的向量场来引导粒子从先验分布移动...
MuQYY的头像-MuQYY的博客钻石会员MuQYY4个月前
0337
具有ID信息的文本图像对数据集制作-MuQYY的博客

具有ID信息的文本图像对数据集制作

1. 图像下载(Image Downloading): 首先,列出了一个名人名单,这些名单可以从VoxCeleb和VGGFace等公开的名人面部数据集中获取。 根据名单,使用搜索引擎爬取数据,大约为每个名字下载100张图...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
0890
论文笔记②Adding Conditional Control to Text-to-Image Diffusion Models-MuQYY的博客

论文笔记②Adding Conditional Control to Text-to-Image Diffusion Models

文献基本信息 文献名称: Adding Conditional Control to Text-to-Image Diffusion Models 期刊杂志: ICCV 2023 研究类型 类型: Research Article 文献基本内容 研究背景: 文本到图像的扩散模型...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01360
论文笔记①High-Resolution Image Synthesis with Latent Diffusion Models-MuQYY的博客

论文笔记①High-Resolution Image Synthesis with Latent Diffusion Models

文献基本信息 文献名称: High-Resolution Image Synthesis with Latent Diffusion Models 期刊杂志: CVPR 2022 研究类型 类型: Research Article 文献基本内容 研究背景: 图像合成是计算机视觉...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01270
浅谈Diffusion ①理解 Latent Diffusion Model-MuQYY的博客

浅谈Diffusion ①理解 Latent Diffusion Model

Paper :High-Resolution Image Synthesis with Latent Diffusion Models 这篇文章是Stable Diffuion的开山之作了,接下来让我带大家看看这篇文章讲了些什么吧~ 1、研究背景 However, since thes...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01510
为什么在VAE中,损失函数往往是最大化ELBO-MuQYY的博客

为什么在VAE中,损失函数往往是最大化ELBO

因为 $$ KL = -ELBO + p_\theta(z|x_i) $$ 则有 $$ KL + ELBO = p_\theta(z|x_i) $$ 其中$p_\theta(z|x_i)$为一个常量 因此最大化ELBO实际上就是最小化$KL$散度
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
0660