标签 - LLM - zzw4257's Blog

算力杂谈：从微观算子到宏观架构

周一 1月 26 2026

1400 字 · 6 分钟

DeepDive

深度解析2026年算力格局，从RTX 5090、H200到Apple M4 Max的架构差异，以及底层FLOPs与内存墙的本质探讨。

周一 1月 26 2026

1400 字 · 6 分钟

DeepDive

深度解析2026年算力格局，从RTX 5090、H200到Apple M4 Max的架构差异，以及底层FLOPs与内存墙的本质探讨。

周一 1月 26 2026

1494 字 · 6 分钟

Hardware

这是一个算力过剩又极度匮乏的时代。我们在 RTX 5090 的 GDDR7 和 H200 的 HBM3e 之间，寻找 AI 基础设施的最优解。

周一 1月 26 2026

1494 字 · 6 分钟

Hardware

这是一个算力过剩又极度匮乏的时代。我们在 RTX 5090 的 GDDR7 和 H200 的 HBM3e 之间，寻找 AI 基础设施的最优解。

周四 11月 20 2025

2260 字 · 9 分钟

DeepDive

本文深入探讨了大语言模型高效微调技术 LoRA 及其改进版 LoRA+，详细解析了低秩假设、参数初始化策略以及非对称学习率对模型性能与收敛速度的影响。

周四 11月 20 2025

2260 字 · 9 分钟

DeepDive

本文深入探讨了大语言模型高效微调技术 LoRA 及其改进版 LoRA+，详细解析了低秩假设、参数初始化策略以及非对称学习率对模型性能与收敛速度的影响。