\parinterval 此外是否有更有效的方法,将句法信息融入到编码器呢?如图\ref{fig:15-22}(a)所示,对于英语句子“I love dogs”,可以得到如图\ref{fig:15-22}(a)所示的句法树。这里,使用$w_i$表示第$i$个单词,如图\ref{fig:15-22}(b)所示。使用$l_j$表示句法解析树中第$j$个语法标签({\color{red}$l$是不是在前面也用到过?而且怎么定义$j$?怎么遍历的树?}),如图\ref{fig:15-22}(c)所示。通过观察句法树的结构可以看出,对一个单词来说,句法树中该单词的父节点({\color{red} 祖先节点及路径?})代表了描述该单词最准确的句法信息。因此可以单词祖先节点及路径信息与原始的词信息构造出新的融合表示${\mathbi{h}'}_i$,并使用这种新的表示计算上下文向量$\mathbi{C}$,即:
\parinterval 此外是否有更有效的方法,将句法信息融入到编码端呢?如图\ref{fig:15-22}(a)所示,对于英文“I love dogs”,有如下句法解析树: