LLM

3 篇文章
所有标签

浏览此标签下的所有文章

算力杂谈:从微观算子到宏观架构
周一 1月 26 2026
1400 字 · 6 分钟
DeepDive

深度解析2026年算力格局,从RTX 5090、H200到Apple M4 Max的架构差异,以及底层FLOPs与内存墙的本质探讨。

算力杂谈 (Ep.1):众神殿的战争 —— 2026 算力格局深度横评
周一 1月 26 2026
1494 字 · 6 分钟
Hardware

这是一个算力过剩又极度匮乏的时代。我们在 RTX 5090 的 GDDR7 和 H200 的 HBM3e 之间,寻找 AI 基础设施的最优解。

深入理解大模型微调:从 LoRA 到 LoRA+ 的理论演进
周四 11月 20 2025
2260 字 · 9 分钟
DeepDive

本文深入探讨了大语言模型高效微调技术 LoRA 及其改进版 LoRA+,详细解析了低秩假设、参数初始化策略以及非对称学习率对模型性能与收敛速度的影响。

cover

His Smile

麗美