LLMver_v1

2026-03-20 22:40:13 +08:00
parent cf02f82db0
commit cacdc79ae2
75 changed files with 2553 additions and 10203 deletions
--- a/assets/5_bias_comparison.pdf
+++ b/assets/5_bias_comparison.pdf
--- a/assets/5_bias_modulation.pdf
+++ b/assets/5_bias_modulation.pdf
--- a/assets/5_dypam_ablation.pdf
+++ b/assets/5_dypam_ablation.pdf
--- a/assets/5_dypam_arch.pdf
+++ b/assets/5_dypam_arch.pdf
--- a/assets/5_modulation_range.pdf
+++ b/assets/5_modulation_range.pdf
--- a/assets/5_rope_response.pdf
+++ b/assets/5_rope_response.pdf
--- a/assets/5_token_heterogeneity.pdf
+++ b/assets/5_token_heterogeneity.pdf
--- a/assets/6_agentcity_frontend.png
+++ b/assets/6_agentcity_frontend.png
--- a/assets/6_agentcity_leaderboard.png
+++ b/assets/6_agentcity_leaderboard.png
--- a/assets/6_agentcity_overview.pdf
+++ b/assets/6_agentcity_overview.pdf
--- a/assets/6_benchmark_dist.png
+++ b/assets/6_benchmark_dist.png
--- a/assets/6_cascade_ablation_a.pdf
+++ b/assets/6_cascade_ablation_a.pdf
--- a/assets/6_cascade_ablation_b.pdf
+++ b/assets/6_cascade_ablation_b.pdf
--- a/assets/6_cascade_arch.pdf
+++ b/assets/6_cascade_arch.pdf
--- a/assets/6_messa_analysis.pdf
+++ b/assets/6_messa_analysis.pdf
--- a/assets/6_messa_arch.pdf
+++ b/assets/6_messa_arch.pdf
--- a/assets/6_poiqa_illustration.png
+++ b/assets/6_poiqa_illustration.png
--- a/assets/6_poiqa_qa_synthesizing.png
+++ b/assets/6_poiqa_qa_synthesizing.png
--- a/assets/6_poiqa_rag_pipeline.png
+++ b/assets/6_poiqa_rag_pipeline.png
--- a/assets/6_spectral_analysis.pdf
+++ b/assets/6_spectral_analysis.pdf
--- a/assets/6_task_activation.png
+++ b/assets/6_task_activation.png
--- a/assets/unsorted/AgentCity/agentv2.pdf
+++ b/assets/unsorted/AgentCity/agentv2.pdf
--- a/assets/unsorted/AgentCity/assets/.gitkeep
+++ b/assets/unsorted/AgentCity/assets/.gitkeep
@@ -1 +0,0 @@
-
--- a/assets/unsorted/AgentCity/assets/Agent_Promo.png
+++ b/assets/unsorted/AgentCity/assets/Agent_Promo.png
--- a/assets/unsorted/AgentCity/assets/Agent_Promo_NG.png
+++ b/assets/unsorted/AgentCity/assets/Agent_Promo_NG.png
--- a/assets/unsorted/AgentCity/assets/ablation_main.pdf
+++ b/assets/unsorted/AgentCity/assets/ablation_main.pdf
--- a/assets/unsorted/AgentCity/assets/attndiff.png
+++ b/assets/unsorted/AgentCity/assets/attndiff.png
--- a/assets/unsorted/AgentCity/assets/model2.pdf
+++ b/assets/unsorted/AgentCity/assets/model2.pdf
--- a/assets/unsorted/AgentCity/assets/router_weights_by_layer.pdf
+++ b/assets/unsorted/AgentCity/assets/router_weights_by_layer.pdf
--- a/assets/unsorted/AgentCity/figures/AgentCity.png
+++ b/assets/unsorted/AgentCity/figures/AgentCity.png
--- a/assets/unsorted/AgentCity/figures/Frontend.png
+++ b/assets/unsorted/AgentCity/figures/Frontend.png
--- a/assets/unsorted/AgentCity/figures/LeaderBoard.png
+++ b/assets/unsorted/AgentCity/figures/LeaderBoard.png
--- a/assets/unsorted/AgentCity/figures/agent.png
+++ b/assets/unsorted/AgentCity/figures/agent.png
--- a/assets/unsorted/AgentCity/figures/attn_vis.tex
+++ b/assets/unsorted/AgentCity/figures/attn_vis.tex
@@ -1,25 +0,0 @@
-\begin{figure}[t]
-% \captionsetup[subfigure]{labelformat=simple, labelsep=period}
-% \renewcommand\thesubfigure{\alph{subfigure})} % 将子标题的标签格式改为 "a)"
-  \centering
-  \begin{subfigure}[b]{0.47\linewidth}   % PD:平衡一下图片大小，如果一样的图可以都用0.48
-    \hspace{-3px} % PD: 往左挪点防止重心偏右
-    \includegraphics[width=\linewidth]{assets/Layer10.pdf}
-    % \includegraphics[width=\linewidth]{assets/Layer10_norubost.pdf}
-    \caption{Across Head Dimensions}      % 子图标题留空即可自动生成 (a)
-    \label{fig:attnindim}
-  \end{subfigure}
-  \hfill % 在两张图之间插入一个弹性空白，使它们左右对齐
-  \begin{subfigure}[b]{0.48\linewidth}
-    \hspace{-3px} % PD: 往左挪点防止重心偏右
-    \includegraphics[width=\linewidth]{assets/AcrossLayer.pdf}
-    \caption{Across Layers}
-    \label{fig:attninlayer}
-  \end{subfigure}
-  \caption{Q-state activation strength visualizations in LLaMA-2-7B.
-We compute the average L2 norm per attention head to quantify activation strength.
-Stronger activations are concentrated in high-indexed (\ie low-RoPE frequency) dimensions and vary across layers, highlighting both dimension-wise and layer-wise heterogeneity.
-}
-  \label{fig:hotattn}
-\end{figure}
-% \py{font size of figure is too small}
--- a/assets/unsorted/AgentCity/figures/conference.png
+++ b/assets/unsorted/AgentCity/figures/conference.png
--- a/assets/unsorted/AgentCity/figures/model_arch.tex
+++ b/assets/unsorted/AgentCity/figures/model_arch.tex
@@ -1,7 +0,0 @@
-% \begin{figure*}[ht]
-%     \centering
-%     \includegraphics[width=0.7\linewidth]{assets/model2.pdf}
-%     \caption{MESSA framework with shared--specific sparse updates. Sparse structures are learned via budget-aware soft gating and overlap regularization, and hardened through a soft-to-hard training process under a unified parameter budget.}
-%     % \caption{The architecture of CAM and HyCAM framework. HyCAM applies a hybrid CAM mechanism to the output of the Attention module within each Transformer block, while the backbone LLM remains frozen. Specifically, HyCAM integrates a shared, full-parameter CAM module and multiple lightweight Specialized CAMs for common and task-specific knowledge.} % with a dynamic routing strategy. % adaptively coordinates the contributions of these specialized modules.
-%     \label{fig:framework}
-% \end{figure*}
--- a/assets/unsorted/AgentCity/figures/new_vis.tex
+++ b/assets/unsorted/AgentCity/figures/new_vis.tex
--- a/assets/unsorted/AgentCity/figures/task.png
+++ b/assets/unsorted/AgentCity/figures/task.png
--- a/assets/unsorted/AgentCity/figures/wordcloud_keywords.png
+++ b/assets/unsorted/AgentCity/figures/wordcloud_keywords.png
--- a/assets/unsorted/AgentCity/figures/year.png
+++ b/assets/unsorted/AgentCity/figures/year.png
--- a/assets/unsorted/AgentCity/pie_combined.png
+++ b/assets/unsorted/AgentCity/pie_combined.png
--- a/assets/unsorted/POI-QA/figs/QA_sample_synthesizing.png
+++ b/assets/unsorted/POI-QA/figs/QA_sample_synthesizing.png
--- a/assets/unsorted/POI-QA/figs/dify_knowledge_retrieval.png
+++ b/assets/unsorted/POI-QA/figs/dify_knowledge_retrieval.png
--- a/assets/unsorted/POI-QA/figs/dify_overview.png
+++ b/assets/unsorted/POI-QA/figs/dify_overview.png
--- a/assets/unsorted/POI-QA/figs/dify_split_retrieval_task.png
+++ b/assets/unsorted/POI-QA/figs/dify_split_retrieval_task.png
--- a/assets/unsorted/POI-QA/figs/illustration.png
+++ b/assets/unsorted/POI-QA/figs/illustration.png
--- a/assets/unsorted/POI-QA/figs/llama3.1structure.png
+++ b/assets/unsorted/POI-QA/figs/llama3.1structure.png
--- a/assets/unsorted/POI-QA/figs/llama3.1training.png
+++ b/assets/unsorted/POI-QA/figs/llama3.1training.png