[置顶]你好呀，欢迎来到Palind的博客！😊

VAE（变分自编码器，Variational Auto-encoder）。VAE 通过编码器将输入数据映射到潜在变量$z$的潜在空间（latent space），再用解码器重建原始输入。
输入$x$对应的真实后验分布$p(z∣x)$是潜在变量$z$的分布，是一个连续的多维概率分布，人们常常假设它为高斯分布（因此，人们设置训练的近似分布$q_ϕ(z∣x)$是高斯分布）。编码器想学习出来的，就是这个分布，或者说，就是输入对应的潜在变量$z$的分布参数（高斯分布的均值、方差），而不是$z$自己。我的学习笔记是VAE学习笔记 | Palind’s Blog

为什么不是$z$自己？因为如果学习的是$z$自己，模型就退化为了一个常见的 Auto-encoder，潜在空间是不连续的。
VAE 名字中的“Variational”来自变分推断（Variational Inference），通过训练变分分布$q_ϕ(z∣x)$来接近真实的$p(z∣x)$后验。
学习后验分布，使得模型的潜在空间是连续的。模型泛化能力更强，编码器输出的是分布，那我们就可以从中采样$z$输入解码器，使模型生成多样性的输出。此外，还可以进行插值变换。

阅读全文 »

VAE学习笔记

发表于 2025-07-13 分类于学习笔记，生成式模型
本文字数： 11k 阅读时长 ≈ 10 分钟

参考

我的学习资料：

ML Lecture 18: Unsupervised Learning - Deep Generative Model (Part II) - YouTube

From Autoencoder to Beta-VAE | Lil’Log

[1312.6114] Auto-Encoding Variational Bayes

我的学习笔记中引用的截图出处都在上面的资料里。

笔记

概念与名词

先回顾一下 auto-encoder。auto-encoder 是一个以无监督的方式自学压缩和还原数据的神经网络结构，用于从数据中学习其本质特征，发掘更高效的压缩表示。

阅读全文 »

Flow-based Generative Model学习笔记

发表于 2025-07-13 分类于学习笔记，生成式模型
本文字数： 7.9k 阅读时长 ≈ 7 分钟

参考

Flow-based Generative Model - YouTube

How I Understand Flow Matching

Flow-based Deep Generative Models | Lil’Log

[1605.08803] Density estimation using Real NVP

笔记中的截图、部分公式来自以上资源。

笔记

数学回顾

雅可比行列式

上学期，我刷高等数学题目时，常常利用雅可比行列式，对重积分的变量进行换元。

我的理解是把一个坐标系下的小方块变形成另一个坐标系下的小方块时，雅可比行列式告诉我们新的小方块体积是原来小方块的多少倍。

阅读全文 »

KL散度（KL Divergence）学习笔记

发表于 2025-07-11 更新于 2025-07-13 分类于学习笔记
本文字数： 2.8k 阅读时长 ≈ 3 分钟

参考

Fantastic KL Divergence and How to (Actually) Compute It

笔记

我们用欧几里得距离衡量两个点之间的远近，那如何衡量两个概率分布的相似程度呢？

概率分布（Probability Distribution） 是用于描述随机变量 在各个可能取值上出现概率的数学函数或规则。对于离散随机变量，概率分布由概率质量函数（PMF）给出；对于连续随机变量，概率分布由概率密度函数（PDF）给出，其在全体定义域上的积分等于 1。

这两种分布都可以用 KL 散度来衡量：

阅读全文 »