torch.scatter看图理解

2024-07-15 23:22| 来源: 网络整理| 查看: 265

torch.Tensor.scatter 有 4 个参数：

scatter(dim, index, src, reduce=None)

先忽略 Reduce，最后再解释。先从最简单的开始。我们有一个 (2,4) 形状的张量，里面填充了 1：

粉红色的符号表示张量结构

并且我们传入相应的参数并得到输出：

注意index张量结构

现在我们增加index张量的第二个值，并比较输出：

观察数字 6 在output张量中的移动情况

好的，数字 6 由index张量内的第二个值控制。但是，如何控制呢？

以下是幕后发生的事情。

首先，我们将index形状扩展为与 src 相同的形状：

它实际上不需要扩展。但这将有助于我们理解

如果 index 中有值，则从 src 中提取相应的值。如果没有值，则不执行任何操作。

这里有 0 和 3，因此提取 5 和 6：

这意味着index的结构必须是 src 的子结构。否则，你将收到错误：

蓝色数字是提取的数字

你可以从官方文档中找到此属性的介绍：

# scatter self[index[i][j][k]][j][k] = src[i][j][k] # if dim == 0 self[i][index[i][j][k]][k] = src[i][j][k] # if dim == 1 self[i][j][index[i][j][k]] = src[i][j][k] # if dim == 2

请注意， [i][j][k] 用于对 index 和 src 进行切片。

现在，回到原始示例，我们提取了 5 和 6。5 和 6 放在哪里？答案是：0 和 3。

将 5 放到 0，将 6 放到 3

“放入 0” 和 “放入 3” 是什么意思？ dim 参数会告诉我们。在我们的例子中， dim=1 ，表示索引将用于切分张量的列，即上图中的蓝色箭头。

那么行呢？与 5 和 6 相同：

你可以这样想：

我们从 src 中得到 5 和 6。5 在 src 中的位置为 (0,0)。6 在 src 中的位置为 (0,1)。dim=1 ，因此将使用 0 和 3 分别替换 (0,0) 和 (0,1) 的“第零”值。将 5 的 (0,0) 替换为 (0,0)。将 6 的 (0,1) 替换为 (0,3)。5 在 tensor 中的位置为 (0,0)。6 在 tensor 中的位置为 (0,3)。tensor[0][0] = src[0][0] , tensor[0][3] = src[0][1]

因此，你可以想象为什么当索引为 [[0,0]] 时我们只得到一个 6。该单元格更新了两次，从 1 到 5，从 5 到 6：

tensor[0][0] = src[0][0] , tensor[0][0] = src[0][1]

如果 dim=0 会怎么样？我们来试试。

我们从 src 中得到 5 和 6。5 在 src 中的位置为 (0,0)。6 在 src 中的位置为 (0,1)。dim=0，因此 0 和 3（来自索引）将分别用于替换 (0,0) 和 (0,1) 的“第零”值。将 5 的 (0,0) 替换为 (0,0)。将 6 的 (0,1) 替换为 (3,1)。5 在张量中位于 (0,0)。6 在张量中位于 (3,1)。tensor[0][0] = src[0][0] , tensor[3][1] = src[0][1]tensor[3][1] 出现越界错误。

看下面的图，提取的箭头解释了它是如何工作的。