libreliu's blog

论文阅读 | Neural Radiance Caching 2022-07-03

简介

本篇文章主要介绍了用于实时渲染的神经辐射度缓存。

论文阅读 | ReSTIR GI 2022-07-03

简介

本篇文章主要将 ReSTIR 这种采样增强方法扩展到了间接光照上。

论文阅读 | ReSTIR 2022-07-03

简介

本篇文章主要介绍了 ReSTIR 这种用于实时渲染的采样增强方法，该方法可以处理交互式渲染中对大量光源 (>= 1k) 的直接光进行采样的问题，也可以用于实时渲染。

注：本篇文章的官方 Slides 我感觉做的很不错，可以在他们的项目主页下载到。

背景

BSDF 适用的渲染方程

$$ \begin{aligned} L_o(x, \omega_o) &= \int_\Omega f(x, \omega_i, \omega_o) L_i(x, \omega_i) \cos \theta^x_i d \omega_i \\ &= \int_\mathcal{A_i} f(x, \omega_i, \omega_o) L_o(x', \omega_i) \frac{\cos \theta^x_i \cos \theta^{x'}_{o} }{| x - x' |^2} dA \qquad \text{(with light from } x' \text{)} \\ &= \int_\mathcal{A_i} f(x, \omega_i, \omega_o) V(x, x') L_o(x', \omega_i) \frac{\cos \theta^x_i \cos \theta^{x'}_{o} }{| x - x' |^2} dA \\ \end{aligned} $$

其中 $\theta^x_i$ 为 $x$ 处入射光线与 $x$ 所在表面位置法线所成角度，$\theta^{x’}_o$ 为 $x’$ 处出射光线与 $x’$ 所在表面位置法线所成角度。

$$ V(x, x') := \left\{ \begin{aligned} &1 ,& x' \text{ is visible from } x \\ &0 ,& \text{otherwise} \end{aligned} \right. $$

对于上面的积分，我们希望用一些离散的采样构成的一个估计量来进行原积分的估计。采样方式和利用采样得到的值进行运算从而构造估计量的方式被称为一种估计方法。

数理统计告诉我们，估计量也是满足一个分布的，在绝大多数时候我们通过估计量的期望和方差来衡量一个估计的好坏。

既然本篇论文是关于采样方法的改进，那么就首先回顾一下 Monte Carlo 求解渲染方程时会使用到的估计方法。

简单随机抽样

假设我们需要估计

$$ I := \int_\Omega f(x) dx $$

的值，并且我们可以等概率且独立的从 $\Omega$ 中抽取样本 ${x_i}_{i=1}^n$，那么我们就可以构造估计量 $\bar I$

$$ \bar I := \frac{|\Omega|}{N} \sum_{i=1}^n f(x_i) $$

既然 $X_i$ 是随机变量，那么我们的估计量自然也是个随机变量，它的期望 $\operatorname{E}[\bar I]$ 是

$$ \begin{aligned} \operatorname{E}[\bar I] &= \frac{|\Omega|}{N} \sum_{i=1}^n \operatorname{E}[f(X_i)] \\ &= |\Omega| \operatorname{E}[f(x_1)] & \text{(} \{X_i\} \text{ satisfy i.i.d.)} \\ &= |\Omega| \int_\Omega f(x) d \mu(x) \\ &= |\Omega| \int_\Omega f(x) \mu(x) dx \\ &= |\Omega| \int_\Omega f(x) \frac{1}{|\Omega|} dx \\ &= I \end{aligned} $$

Note: 形如
$$ \int_\Omega f(x) d\mu(x) $$
的积分中，$\mu(x)$ 是随机变量 $X$ 所对应的概率密度函数，在这里是均匀分布所以 $\mu(x) = 1/|\Omega|$ 。期望的本质就是 “$\sum x \times p(x)$”

所以积分最终会收敛，但是估计量 $\bar I$ 的方差依赖于 $f(x)$ 本身的性质：

$$ \begin{aligned} \operatorname{Var}[\bar I] &= \frac{|\Omega|^2}{N^2} \operatorname{Var} \left[ \sum_{i=1}^{n} f(x_i) \right] \\ &= \frac{|\Omega|^2}{N} \operatorname{Var}[f(x)] \\ &= \frac{|\Omega|^2}{N} \left( \operatorname{E}[f(x)^2] - \operatorname{E}[f(x)]^2 \right) \\ &= \frac{|\Omega|^2}{N} \left[ \int_\Omega f(x)^2 \mu(x) dx - \left( \int_\Omega f(x) \mu(x) dx \right)^2 \right] \\ &= \frac{1}{N} \left[ |\Omega| \int_\Omega f(x)^2 dx - \left( \int_\Omega f(x) dx \right)^2 \right] \end{aligned} $$

我们观察到，后面的方括号中的内容和抽样次数 N 无关，所以只要 $\operatorname{Var}[f(X_i)]$ 有限，即可说明增加抽样次数，估计量最终可以在方差意义上收敛到原函数。

Note:

$\operatorname{Var}[X] = \operatorname{E}[(X-\operatorname{E}[X])^2] = \operatorname{E}[X^2-2 \cdot X \cdot \operatorname{E}[X] + (\operatorname{E}[X])^2] = \operatorname{E}[X^2]-(\operatorname{E}[X])^2$

$\operatorname{Var}[aX+bY] = a^2\operatorname{Var}[X] + b^2\operatorname{Var}[Y] + 2ab \operatorname{Cov}[X, Y]$

如果很严谨，还应该讨论函数具有何种性质时，方差意义上收敛的两个函数是同一个函数。（~~不过我不会~~）

重要性采样 (Importance Sampling)

仍然假设我们需要估计

$$ I := \int_\Omega f(x) dx $$

但是这次，我们选择一个连续分布，记其概率密度函数为 $p(x)$，并且我们从该分布中抽样得到样本 ${x_i}_{i=1}^N$，我们用这些样本构造估计量 $\bar I$

$$ \bar I := \frac{1}{N} \sum_{i=1}^n \frac{f(x_i)}{p(x_i)} $$

那么，

$$ \begin{aligned} \operatorname{E}[\bar I] &= \operatorname{E}\left[\frac{f(x_1)}{p(x_1)}\right] \\ &= \int_\Omega \frac{f(x)}{p(x)} p(x) dx \\ &= \int_\Omega f(x) dx \\ &= I \end{aligned} $$

此处的推导隐含 $p(x)$ 在 $\Omega$ 上的值非零，考虑到 $p(x)$ 是概率密度函数，$p(x) > 0$

不过事实上我们只需要 $p(x) > 0$ 在 $\operatorname{supp}(f)$ 成立即可。

方差：

$$ \begin{aligned} \operatorname{Var}[\bar I] &= \frac{1}{N^2} \operatorname{Var}\left[ \sum_{i=1}^n \frac{f(x_i)}{p(x_i)} \right] \\ &= \frac{1}{N} \operatorname{Var}\left[ \frac{f(x)}{p(x)} \right] \\ &= \frac{1}{N} \left( \operatorname{E}\left[\left[\frac{f(x)}{p(x)}\right]^2\right] - \operatorname{E}\left[\frac{f(x)}{p(x)}\right]^2 \right) \\ &= \frac{1}{N} \left[ \int_\Omega \left(\frac{f(x)}{p(x)}\right)^2 p(x) dx - \left( \int_\Omega \frac{f(x)}{p(x)} p(x) dx \right)^2 \right] \\ &= \frac{1}{N} \left[ \int_\Omega \frac{f(x)^2}{p(x)} dx - \left( \int_\Omega f(x) dx \right)^2 \right] \\ \end{aligned} $$

则加大 N 后方差可以渐进趋于 0。

如果我们可以找到概率密度函数 $p(x)$ 满足

$$ p(x) = \frac{f(x)}{\int_\Omega f(t) \, dt} $$

的话，带入上面的式子可以得到

$$ \begin{aligned} \operatorname{Var}[\bar I] &= \frac{1}{N} \left[ \left(\int_\Omega f(x) dx\right)^2 - \left( \int_\Omega f(x) dx \right)^2 \right] = 0 \end{aligned} $$

一般的，由 $p(x)$ 决定的分布对 $f(x)$ 近似的越好，相同样本数量下估计量的方差就会越低。

重采样重要性采样 (Resampled Importance Sampling)

从前面的重要性采样方法中我们了解到，我们采样的 $p(x)$ 的形状越接近 $f(x)$，那么采样的效果就越好。

所谓形状接近，就是函数贴近 ${f(x)}/{\int_\Omega f(t) , dt}$。

如果我们有一个很棒的分布 $\hat p(x)$，他比较接近 $f(x)$ 的形状，但是我们没法直接采样出符合 $\hat p(x)$ 分布的样本。

(1-sample RIS) 假设我们此时还可以找到一个分布 $p(x)$，其与 $\hat p(x)$ 比较接近，那么此时，我们可以采用如下方法，采样出符合 $ \hat p(x)$ 分布的样本：

从 $p(x)$ 分布中抽样得到集合 $ X = {x_1, …, x_M } $
按如下所给的条件概率抽样一个索引 $ z \in {1, …, M} $$$ p(z \, | \, x_1, ..., x_M) = \frac{w(x_z)}{\sum_{i=1}^M w(x_i)} \quad \text{with} \quad w(x) = \frac{\hat p(x)}{p(x)} $$
按下式计算估计量$$ \begin{aligned} \bar I^{1, M}_{ris}(z, x_1, ..., x_M) = \frac{f(x_z)}{\hat p(x_z)} \cdot \left( \frac{1}{M} \sum^M_{j=1} w(x_j) \right) \end{aligned} $$

首先，我们需要证明这个方法正确。证明的核心在于计算两步抽样最终抽到 $ x_z $ 的概率。记

$$ p(z_0, x_z) := \lim_{\epsilon \to 0} P(z = z_0, x_z \le x \le x_z + \epsilon) / \epsilon $$

则

$$ p(z, x_1, ..., x_M) = p(z \, | \, x_1, ..., x_M) \prod_{i=1}^M p(x_i) = \frac{ {\hat p(x_z)}/{p(x_z)} }{\sum_{i=1}^M \left({\hat p(x_i)}/{p(x_i)}\right)} \prod_{j=1}^M p(x_j) $$

则

$$ \begin{aligned} \operatorname{E}\left[\bar I^{1, M}_{ris}\right] &= \int_{x_1, ..., x_M} \sum_{z=1}^M \bar I^{1, M}_{ris}(z, x_1, ..., x_M) \, p(z \, | \, x_1, ..., x_M) \left( \prod_{i=1}^M p(x_i) \right) \, dx_1 ... dx_M \\ &= \int_{x_1, ..., x_M} \sum_{z=1}^M \frac{f(x_z)}{\hat p(x_z)} \cdot \left( \frac{1}{M} \sum^M_{j=1} w(x_j) \right) \frac{ {\hat p(x_z)}/{p(x_z)} }{\sum_{j=1}^M w(x_j)} \left( \prod_{i=1}^M p(x_i) \right) \, dx_1 ... dx_M \\ &= \frac{1}{M} \int_{x_1, ..., x_M} \sum_{z=1}^M \frac{f(x_z)}{p(x_z)} \left( \prod_{i=1}^M p(x_i) \right) \, dx_1 ... dx_M \\ &= \frac{1}{M} \operatorname{E}\left[ \sum_{z=1}^{M} \frac{f(x_z)}{p(x_z)} \right] \\ &= \operatorname{E}\left[ \frac{f(x)}{p(x)} \right] \qquad \text{(} \because x_i \text{ i.i.d.)} \\ &= \int_\Omega f(x) \, dx \end{aligned} $$

NOTE:

$ \int_{x_1, ..., x_M} $ 和 $ \int_{\mathcal{\Omega}^M} $ 是一样的，是他们各自的空间 $ \Omega $ 的直积。

$ \operatorname{E}[X+Y] = \operatorname{E}[X] + \operatorname{E}[Y] $ 不依赖于 $ X $ 和 $ Y $ 独立。

方差也可以相应计算如下：

$$ \begin{aligned} \operatorname{Var}\left[\bar I^{1, M}_{ris}\right] &= \frac{1}{M^2} \operatorname{Var}\left[ \frac{f(x_z)}{\hat p(x_z)} \cdot \left( \sum^M_{j=1} w(x_j) \right) \right] \\ &= ? \end{aligned} $$

带权蓄水池抽样 (Weighted Reservoir Sampling)

前面提到，重采样重要性采样需要先抽 $ M $ 个样本，然后从中再抽样出最终的值。

经过仔细观察，拥有如下结构的抽样问题可以用带权蓄水池抽样 (Weighted Reservoir Sampling) 来解决：

$$ p(z \, | \, x_1, ..., x_M) = \frac{w(x_z)}{\sum_{i=1}^M w(x_i)} $$

(WRS) 假设对于序列 $ {x_1, …, x_m} $，我们希望按上述概率抽样得到样本 $x_z$

维护一个当前总权重 $ w_\text{sum} $，当前总样本数 $ M $ 和最终样本 $ y $
初始化 $ y:=x_1; , M:=1; , w_\text{sum}:=w(x_1) $
对于每个新样本 $x_i$
- 以 $ w(x_i) / w_\text{sum} $ 概率：$ y:=x_i; , M:=M+1; , w_\text{sum} := w_\text{sum}+w(x_i) $
- 以 $ 1 - w(x_i) / w_\text{sum} $ 概率：$ M:=M+1; , w_\text{sum} := w_\text{sum}+w(x_i) $

这样对于某个样本 $ x_k $，经过这个过程最后被选中的概率为 P(第 k 次被选中) * P(第 k 次之后都没有被换掉)，乘起来很容易证明正确性。

WRS 方法的优势在于，不需要完成存储 $ {x_i} $ 序列本身，而是线性扫描一遍这个序列就可以得出结果，非常适合和前面的 RIS 方法搭配使用。

蓄水池合并 (Reservoir Merging)

博客复活！ 2022-07-02

之前的博客已经有一段时间没更新了，以至于竟然连之前的源文件都找不到了。

这次将博客的源文件放到 GitHub 上，并且把之前的文章收集整理一下，进行一下重构。

用什么博客框架？

在 Hexo 和 Pelican 中选择了 Hexo，主要社区和主题的维护者都更活跃一些。

常用命令

生成 & 测试

1 2	./node_modules/.bin/hexo generate ./node_modules/.bin/hexo server

也可以考虑 npm run build 和 npm run server。

新文章

hexo new "My new post"

修改主题

主题基于 BlairOS 这个 Hexo 主题，我裁减了其中的统计代码，更改了 Logo 和相关的 Stylus 代码。

已知问题

计划在将来把对 cdn.mathjax.org 的依赖也去掉，变成完全服务端渲染
这个模板对 ul 嵌套的情况渲染不正确

USTC Verilog OJ | 设计、实现、剩下的坑 2022-02-08

(Remark 2022-07-07): 本文原发于知乎，现在在博客这边补个档。

夜深人静的时候有些难以入眠（实际上可能是早上起太迟了），于是开一篇文章大略记叙一下部署在 https://verilogoj.ustc.edu.cn/ 处的 USTC Verilog OJ 的设计实现和留下的坑。

设计一个 Verilog OJ 的想法源于 2020 春的《软件工程》课程，课程伊始要求同学们以 10 人为一组提交一个大作业。正好，当时 lluckydog 提到了这个点子，我们就去找实验中心的老师协商，老师也感觉不错。

设计之初，考虑到 Verilog 作为硬件描述（和仿真）语言的地位，我们认为 Verilog OJ 本身应该与其它程序设计语言的 OJ 有所不同。这种不同主要是来源于电路这种设计产出与程序这种产出之间的差异。

电路可以从功能和性能两方面来进行评价。对于功能，用行为级仿真就可以解决，而对于性能，则要将其放到后端当中去，从占用的资源，完成功能所需要的时钟周期和可以达到的最高时钟频率，以及使用到的资源等来综合的进行评价。这就意味着，OJ 在执行架构上需要兼容各种不同的评价任务，并且可以灵活配置。

针对这一点，我们认为应该将每个判题任务配置为 shell 脚本，在脚本中读取用户输入的文件，并且进行输出操作，这样就可以比较灵活的进行不同评测任务的配置了。

我们当时还调研了前端和后端评测任务的一些可能方向，比如使用 OpenTimer 进行静态时序分析，使用 Yosys 进行综合并且判断电路综合后有没有 latch 等等。

架构

前端方面我们是从 LPOJ 的代码基础上开始修改的，所以也沿用了 Element UI + Vue.js 的组合；编辑代码采用 CodeMirror，显示波形采用 Wavedrom。

后端采用 Django + Django RESTful Framework，Django 赋予的快速原型能力我们整体还是比较满意的。

后端和判题机通过消息队列 Celery 实现解耦，为增加新的判题机留出空间，同时将两个过程掰开。判题机提交判题结果的方法就是把 SubmissionResult 对象进行 HTTP PATCH。

判题机本身会在每个新的判题请求到来时，从后端拉下来所有需要的文件，同时新启动一个 Docker 容器用来判题，判题完成时会将容器中分数、日志、波形（app_data）拷出并上传，之后销毁容器。容器本身有时间和内存限制。

大多数判题任务就是在参考答案和用户提交答案上面跑一个 testbench 并且 dump vcd，然后做一个波形比较。vcd 文件解析使用的是 pyDigitalWaveTools。

使用 Nginx 做反代，方便调整一些请求头之类的，上面所有的部分都打包为容器，并且用 docker-compose 进行部署。

题目

软工课程答辩前，我们设计了几道简单的题目来验证 Verilog OJ 的功能。这些题目包括输出 0，输出 1，3-8 译码器和三个数的比较器等。前面几道题目是行为级的仿真，最后一题用到了 Yosys 进行综合，并且对综合后结果进行仿真（大概就是 yosys -p "read_verilog ./submit/code.v; synth -top top_module; write_verilog code_synthed.v" -v 3）

不过软工结束之后，由于鸽子们鸽来鸽去，想搞的计算机组成原理实验自动评测一直没有动静，助教们最后也还是决定手工检查，所以系统就有派上用场。

2021 年署假的时候，老师决定先翻译一些 HDLBits 上面的题目，作为下学期数字电路实验的一小部分，来帮助 Verilog 的学习。

在这学期出题和同学们做题的过程中，也发现并且修复了一些脚本上的问题，主要是 VCD 的一些 corner case。

剩下的坑

使用过程中同学们提了很多意见，这些意见基本都以 Issue 的形式放到了仓库当中去。不过不少问题都被我们一直鸽着，也缺乏感兴趣的新同学加入进来。

远期来说，我个人希望这个平台可以帮助希望做硬件开发的同学们更贴近 IC 业界考虑的问题，并且对硬件设计本身有更好的理解——当然鉴于我本人是个硬件菜鸡，这还需要很多大佬的支持才能办到。

就我个人从前辈处了解到的一些信息来说，IC 的验证和后端的流程普通的同学还是很难接触到的，可能在平台中有关于验证和后端设计需要关心的问题进行设计并包装成为题目是值得尝试的一些方向。

比如说，SystemVerilog / UMD 通用验证方法学的超快速入门，调教时序问题的小实战等

另一个可能值得尝试的坑是对接 USTC FPGAOL 平台，将片上的表现作为评估和设计迭代的依据。

（不过听着就是大坑.jpg）

结语

赶紧来个大佬填坑吧！（x）

希望有更多感兴趣的同学加入到我们的开发（和提 Issue）的工作当中ww