深度学习共25篇
学习算法的一些记录~
Flow Matching的数学原理-MuQYY的博客

Flow Matching的数学原理

这篇文章介绍了Flow Matching作为一种生成模型训练方法,将其视为扩散模型的更通用形式。其核心思想是将数据视为在流场中运动的粒子,通过学习一个与时间相关的向量场来引导粒子从先验分布移动...
MuQYY的头像-MuQYY的博客钻石会员MuQYY4个月前
0337
Transformer详解-MuQYY的博客

Transformer详解

Transformer 模型详解 1. Transformer 概览 2017 年,Google 在论文 Attention is All You Need 中提出了 Transformer 模型。Transformer 使用了 Self-Attention(自注意力) 机制,取代了在 NL...
MuQYY的头像-MuQYY的博客钻石会员MuQYY12个月前
0880
具有ID信息的文本图像对数据集制作-MuQYY的博客

具有ID信息的文本图像对数据集制作

1. 图像下载(Image Downloading): 首先,列出了一个名人名单,这些名单可以从VoxCeleb和VGGFace等公开的名人面部数据集中获取。 根据名单,使用搜索引擎爬取数据,大约为每个名字下载100张图...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
0890
论文笔记④DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation-MuQYY的博客

论文笔记④DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

文献基本信息 文献名称: DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation 期刊杂志: CVPR 2023 研究类型 类型: Research Article 文献基本内容 研究背...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01350
论文笔记⑥Imagic: Text-Based Real Image Editing with Diffusion Models-MuQYY的博客

论文笔记⑥Imagic: Text-Based Real Image Editing with Diffusion Models

文献基本信息 文献名称: Imagic: Text-Based Real Image Editing with Diffusion Models 期刊杂志: CVPR 2023 研究类型 类型: Research Article 文献基本内容 研究背景: 大规模文本到图像模型展...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01530
论文笔记⑤SDEdit: Guided Image Synthesis and Editing with Stochastic Differential Equations-MuQYY的博客

论文笔记⑤SDEdit: Guided Image Synthesis and Editing with Stochastic Differential Equations

文献基本信息 文献名称: SDEdit: Guided Image Synthesis and Editing with Stochastic Differential Equations 研究类型 类型: 研究文章 文献基本内容 研究背景: 生成模型可以从随机噪声中创建...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01350
论文笔记③T2I-Adapter: Learning Adapters to Dig Out More Controllable Ability for Text-to-Image Diffusion Models-MuQYY的博客

论文笔记③T2I-Adapter: Learning Adapters to Dig Out More Controllable Ability for Text-to-Image Diffusion Models

文献基本信息 文献名称: T2I-Adapter: Learning Adapters to Dig Out More Controllable Ability for Text-to-Image Diffusion Models 期刊杂志: AAAI 研究类型 类型: Research Article 文献基...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01250
论文笔记②Adding Conditional Control to Text-to-Image Diffusion Models-MuQYY的博客

论文笔记②Adding Conditional Control to Text-to-Image Diffusion Models

文献基本信息 文献名称: Adding Conditional Control to Text-to-Image Diffusion Models 期刊杂志: ICCV 2023 研究类型 类型: Research Article 文献基本内容 研究背景: 文本到图像的扩散模型...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01360
论文笔记①High-Resolution Image Synthesis with Latent Diffusion Models-MuQYY的博客

论文笔记①High-Resolution Image Synthesis with Latent Diffusion Models

文献基本信息 文献名称: High-Resolution Image Synthesis with Latent Diffusion Models 期刊杂志: CVPR 2022 研究类型 类型: Research Article 文献基本内容 研究背景: 图像合成是计算机视觉...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01270
Deep Learning Note 29 自然语言统计与读取长序列数据-MuQYY的博客

Deep Learning Note 29 自然语言统计与读取长序列数据

1、自然语言统计 import random import torch from d2l import torch as d2l tokens = d2l.tokenize(d2l.read_time_machine()) # 因为每个文本行不一定是一个句子或者一个段落,所以必须将所有...
MuQYY的头像-MuQYY的博客钻石会员MuQYY1年前
01200