深度学习中静态图动态图

Pytorch中的动态图

动态图的初步推导：

计算图是用来描述运算的有向无环图
计算图有两个主要元素：结点（Node）和边（Edge）；
结点表示数据，如向量、矩阵、张量;
边表示运算，如加减乘除卷积等；

运算逻辑

上图是用计算图表示：

y = ( x + w ) ∗ ( w + 1 )

其中, a=x+w,b=w+1,y=a∗b，(a和b是中间变量)，Pytorch在计算的时候，就会把计算过程用上面那样的动态图存储起来。现在我们计算一下y关于w的梯度：∂y/∂w = ∂y/∂a * ∂a/∂w + ∂y/∂b * ∂b/∂w = b * 1 + a * 1 = b + a = x + w + w + 1 = 2w + x + 1。

用Pytorch的代码来实现这个过程：

w = torch.tensor([1.],requires_grad = True)
x = torch.tensor([2.],requires_grad = True)

a = w+x
b = w+1
y = a*b

y.backward()
print(w.grad)

'''
输出：
tensor([5.])
'''

图中的叶子节点，是w和x，是整个计算图的根基。之所以用叶子节点的概念，是为了减少内存，在反向传播结束之后，非叶子节点的梯度会被释放掉，我们依然用上面的例子解释：

w = torch.tensor([1.],requires_grad = True)
x = torch.tensor([2.],requires_grad = True)

a = w+x
b = w+1
y = a*b

y.backward()
print(w.is_leaf,x.is_leaf,a.is_leaf,b.is_leaf,y.is_leaf)
print(w.grad,x.grad,a.grad,b.grad,y.grad)

'''
输出：
True True False False False
tensor([5.]) tensor([2.]) None None None
'''

可以看到只有x和w是叶子节点，然后反向传播计算完梯度后（.backward()之后），只有叶子节点的梯度保存下来了。

当然也可以通过.retain_grad()来保留非任意节点的梯度值：

w = torch.tensor([1.],requires_grad = True)
x = torch.tensor([2.],requires_grad = True)

a = w+x
a.retain_grad()
b = w+1
y = a*b

y.backward()
print(w.is_leaf,x.is_leaf,a.is_leaf,b.is_leaf,y.is_leaf)
print(w.grad,x.grad,a.grad,b.grad,y.grad)

'''
输出：
True True False False False
tensor([5.]) tensor([2.]) tensor([2.]) None None
'''

torch.tensor有一个属性grad_fn,grad_fn的作用是记录创建该张量时所用的函数，这个属性反向传播的时候会用到。例如在上面的例子中，y.grad_fn=MulBackward0,表示y是通过乘法得到的。所以求导的时候就是用乘法的求导法则。同样的，a.grad=AddBackward0表示a是通过加法得到的，使用加法的求导法则。

w = torch.tensor([1.],requires_grad = True)
x = torch.tensor([2.],requires_grad = True)

a = w+x
a.retain_grad()
b = w+1
y = a*b

y.backward()
print(y.grad_fn)
print(a.grad_fn)
print(w.grad_fn)

'''
<MulBackward0 object at 0x7f95016326d8>
<AddBackward0 object at 0x7f96b832d3c8>
None
'''

结尾

本文章摘抄于头歌教学平台中深度学习课程中静态图动态图的设计一节。

觉得写的很好，故保留下来用于复习。

DeepLearning

#DL

深度学习中静态图动态图

https://jiahhhao.github.io/jiahhhao/2023/12/11/深度学习中静态图动态图/

作者

Zeng Jiahao

发布于

2023年12月11日

许可协议

数模心得之数维杯上一篇

东门之杨下一篇

深度学习中静态图动态图

相关知识

Pytorch中的动态图

结尾