91 lines
3.6 KiB
TeX
91 lines
3.6 KiB
TeX
% 符号定义
|
||
\Signs{
|
||
\begin{longtable}{@{}p{0.26\textwidth}p{0.68\textwidth}@{}}
|
||
\renewcommand{\arraystretch}{1.25}
|
||
\endfirsthead
|
||
\multicolumn{2}{l}{\textbf{主要符号表(续)}} \\
|
||
\endhead
|
||
\multicolumn{2}{r}{\small 续下页} \\
|
||
\endfoot
|
||
\endlastfoot
|
||
\multicolumn{2}{l}{\textbf{一般符号}} \\
|
||
$\mathbb{R}$ & 实数域 \\
|
||
$\odot$ & Hadamard(逐元素)乘法 \\
|
||
$\|\cdot\|_2$ & 向量$L_2$范数 \\
|
||
$\sigma(\cdot)$ & Sigmoid激活函数 \\
|
||
$\bigoplus$ & 频段重组操作 \\[4pt]
|
||
|
||
\multicolumn{2}{l}{\textbf{数据与任务}} \\
|
||
$\mathbf{X}$ & 输入样本或指令序列 \\
|
||
$\mathbf{Y}$ & 目标输出 \\
|
||
$\mathcal{D}$ & 训练数据集 \\
|
||
$\mathcal{T}$ & 任务集合 \\
|
||
$\tau$ & 任务类型标识 \\
|
||
$T$ & 序列长度或时间步数 \\
|
||
$N$ & 任务数量(视上下文而定)\\
|
||
$B$ & 批次大小或参数预算(视上下文而定)\\[4pt]
|
||
|
||
\multicolumn{2}{l}{\textbf{模型架构}} \\
|
||
$\Theta_0$ & 预训练模型参数 \\
|
||
$\Theta_a$ & 适配参数 \\
|
||
$\Delta\Theta$ & 参数更新增量 \\
|
||
$\ell$ & Transformer层索引 \\
|
||
$d$ & 隐藏维度 \\
|
||
$H$ & 注意力头数 \\
|
||
$d_h$ & 每头维度($d_h = d/H$) \\
|
||
$\mathbf{H}^{(\ell)}$ & 第$\ell$层隐藏状态 \\
|
||
$\mathbf{Q}^{(\ell)}, \mathbf{K}^{(\ell)}, \mathbf{V}^{(\ell)}$ & Query、Key、Value矩阵 \\
|
||
$\mathbf{W}_Q, \mathbf{W}_K, \mathbf{W}_V$ & 注意力投影权重矩阵 \\
|
||
$\mathbf{W}_0$ & 预训练权重矩阵 \\
|
||
$\Delta\mathbf{W}$ & 权重更新矩阵 \\[4pt]
|
||
|
||
\multicolumn{2}{l}{\textbf{统一分析框架}} \\
|
||
$\mathcal{M}_\theta(\cdot)$ & 结构感知调制算子 \\
|
||
$\mathbf{Z}^{(\ell)}$ & 第$\ell$层中间表示 \\
|
||
$\tilde{\mathbf{Z}}^{(\ell)}$ & 调制后的表示 \\
|
||
$\mathcal{R}$ & 结构角色描述符 \\
|
||
$\mathcal{R}_{mod}$ & 模块级功能异质性描述符 \\
|
||
$\mathcal{R}_{dim}$ & 维度级位置结构异质性描述符 \\
|
||
$\mathcal{R}_{spec}$ & 频谱级多尺度异质性描述符 \\
|
||
$\mathcal{R}_{param}$ & 参数级容量分配异质性描述符 \\
|
||
$\mathbf{S}_\theta(\cdot)$ & 条件化调制信号生成函数 \\[4pt]
|
||
|
||
\multicolumn{2}{l}{\textbf{RoPE与位置编码}} \\
|
||
$\theta_i$ & 第$i$个维度对的旋转角度 \\
|
||
$\omega$ & RoPE基础频率常数(默认10000) \\[4pt]
|
||
|
||
\multicolumn{2}{l}{\textbf{RoSA方法}} \\
|
||
$r_{\text{low}}$ & 低频维度比例 \\
|
||
$\alpha$ & 缩放/调制强度因子 \\
|
||
$\mathcal{L}_S$ & 动态层选择的活跃层集合 \\
|
||
$k_{\text{ratio}}$ & 层选择比例 \\
|
||
$p_{\text{exploit}}$ & 利用-探索中的利用概率 \\
|
||
$u$ & 层选择的周期性间隔步数 \\[4pt]
|
||
|
||
\multicolumn{2}{l}{\textbf{DyPAM方法}} \\
|
||
$d_e$ & 每头调制特征维度 \\
|
||
$r$ & 低秩投影秩 \\
|
||
$\mathbf{E}_Q^{(\ell)}, \mathbf{E}_K^{(\ell)}$ & 维度嵌入矩阵 \\
|
||
$\boldsymbol{\beta}^{(\ell)}$ & 层级结构偏置 \\
|
||
$\boldsymbol{\beta}^{(\ell)}_h$ & 头级结构偏置 \\
|
||
$s^{(\ell)}_{t,h,i}$ & 归一化调制因子 \\[4pt]
|
||
|
||
\multicolumn{2}{l}{\textbf{CASCADE方法}} \\
|
||
$\mathbf{S}_{\text{dct}}$ & DCT域系数矩阵 \\
|
||
$\mathcal{I}_{\text{dct}}$ & 低频索引集合 \\
|
||
$K_{\text{dct}}$ & 低频DCT系数数量 \\
|
||
$\mathcal{B}$ & 小波细节子带集合$\{\text{LH}, \text{HL}, \text{HH}\}$ \\
|
||
$\gamma_b, \beta_b$ & 级联FiLM调制的缩放与偏移参数 \\
|
||
$w_e(\mathbf{x})$ & 输入依赖的专家路由权重 \\
|
||
$E$ & 专家数量 \\[4pt]
|
||
|
||
\multicolumn{2}{l}{\textbf{MESSA方法}} \\
|
||
$\Delta_{\text{sh}}$ & 跨任务共享稀疏更新 \\
|
||
$\Delta_{\text{sp}}^{(t)}$ & 任务$t$的特有稀疏更新 \\
|
||
$z^{\text{sh}}_g$ & 参数组$g$的共享软门控值 \\
|
||
$z^{\text{sp}}_{g,t}$ & 参数组$g$在任务$t$上的特有软门控值 \\
|
||
$\mathcal{G}$ & 参数组集合 \\
|
||
$s_g$ & 参数组$g$的参数代价 \\
|
||
\end{longtable}
|
||
}
|