1.fix table & pic title;2.fix table;
This commit is contained in:
@@ -731,7 +731,7 @@ HyCAM 特有的超参数设置如下:Gumbel-Softmax 温度系数 $\tau$ 设置
|
||||
|
||||
\begin{table}[!htbp]
|
||||
\centering
|
||||
\caption[不同任务上的细粒度结果分析(骨干模型:Llama2-7B)]{不同任务上的细粒度结果分析(骨干模型:Llama2-7B)。最优结果加粗,次优结果加下划线。}
|
||||
\caption[不同任务上的细粒度结果分析(骨干模型:Llama2-7B)]{不同任务上的细粒度结果分析(骨干模型:Llama2-7B)。\\ 最优结果加粗,次优结果加下划线。}
|
||||
\label{tab:ch3_cross_task}
|
||||
|
||||
\begin{tabular}{llccc}
|
||||
@@ -879,7 +879,7 @@ HyCAM 特有的超参数设置如下:Gumbel-Softmax 温度系数 $\tau$ 设置
|
||||
\begin{figure}[htp]
|
||||
\centering
|
||||
\includegraphics[width=0.72\linewidth]{assets/3_tsne.pdf}
|
||||
\caption[注意力表示空间的可视化结果]{注意力表示空间的可视化结果。上方为未施加 CAM 调制的基线表示,下方为经 HyCAM 调制后的表示。经调制后表示呈现更紧凑的簇结构与更高的区分度。}
|
||||
\caption[注意力表示空间的可视化结果]{注意力表示空间的可视化结果。\\ 上方为未施加 CAM 调制的基线表示,下方为经 HyCAM 调制后的表示。\\ 经调制后表示呈现更紧凑的簇结构与更高的区分度。}
|
||||
\label{fig:ch3_tsne}
|
||||
\end{figure}
|
||||
|
||||
@@ -892,7 +892,7 @@ HyCAM 特有的超参数设置如下:Gumbel-Softmax 温度系数 $\tau$ 设置
|
||||
\begin{figure}[htp]
|
||||
\centering
|
||||
\includegraphics[width=0.72\linewidth]{assets/3_ht.pdf}
|
||||
\caption[HyCAM 调制权重矩阵的可视化]{HyCAM 调制权重矩阵的可视化。不同 token 与维度上的调制强度呈现明显差异,说明 HyCAM 实现了细粒度的上下文感知调制。}
|
||||
\caption[HyCAM 调制权重矩阵的可视化]{HyCAM 调制权重矩阵的可视化。\\ 不同 token 与维度上的调制强度呈现明显差异,说明 HyCAM 实现了细粒度的上下文感知调制。}
|
||||
\label{fig:ch3_weights}
|
||||
\end{figure}
|
||||
|
||||
@@ -905,7 +905,7 @@ HyCAM 特有的超参数设置如下:Gumbel-Softmax 温度系数 $\tau$ 设置
|
||||
\begin{figure}[htp]
|
||||
\centering
|
||||
\includegraphics[width=0.72\linewidth]{assets/3_loss.pdf}
|
||||
\caption[HyCAM 不同方法的训练过程对比]{不同方法的训练过程对比。HyCAM 相较基线方法表现出更快的收敛速度与更低的最终损失。}
|
||||
\caption[HyCAM 不同方法的训练过程对比]{不同方法的训练过程对比。\\ HyCAM 相较基线方法表现出更快的收敛速度与更低的最终损失。}
|
||||
\label{fig:ch3_loss}
|
||||
\end{figure}
|
||||
|
||||
|
||||
Reference in New Issue
Block a user