LoRA+

1 篇文章

浏览此标签下的所有文章

深入理解大模型微调：从 LoRA 到 LoRA+ 的理论演进

深入理解大模型微调：从 LoRA 到 LoRA+ 的理论演进

周四 11月 20 2025

2260 字 · 9 分钟

DeepDive

本文深入探讨了大语言模型高效微调技术 LoRA 及其改进版 LoRA+，详细解析了低秩假设、参数初始化策略以及非对称学习率对模型性能与收敛速度的影响。

AIGC Research LoRA LoRA+ 模型微调 LLM 深度学习参数高效微调

深入理解大模型微调：从 LoRA 到 LoRA+ 的理论演进

周四 11月 20 2025

2260 字 · 9 分钟

DeepDive

本文深入探讨了大语言模型高效微调技术 LoRA 及其改进版 LoRA+，详细解析了低秩假设、参数初始化策略以及非对称学习率对模型性能与收敛速度的影响。

AIGC Research LoRA LoRA+ 模型微调 LLM 深度学习参数高效微调

深入理解大模型微调：从 LoRA 到 LoRA+ 的理论演进

His Smile

麗美