在自注意力机制中,每个输入元素都可以被视为一个向量。对于每个向量,都可以通过一个矩阵变换来生成三个新向量:查询向量、键向量和值向量。这些新向量可以表示不同的信息,例如查询向量可以表示要查询的内容,键向量可以表示文本中的单词,值向量可以表示单词的嵌入表示。