首页 | LLM Learning

矩阵是 ML 的通用语言。本路径从特征分解出发，建立四件核心工具（分解、度量、微分、迭代），经 SVD、PCA、NMF 等经典分解方法和 PageRank、谱聚类等算子分析方法，最终汇聚到 LoRA、Efficient Attention、SSM/Mamba 等现代架构。三段式弧线"拆→传→汇"揭示同一数学工具如何贯穿看似不同的领域。

31 篇文章

图算法：从结构探索到组合优化

中级

图是"实体+关系"的通用建模语言。本路径从图的基本问题分类出发，建立三层能力（探索结构、度量性质、组合优化），经 BFS/DFS、最短路径、网络流等经典算法，最终汇聚到随机图模型、概率图推断和图神经网络等现代方法。四段式弧线"探→量→优→建模"揭示同一组图工具如何贯穿看似不同的工程领域。

学习路径

Transformer 核心机制

Transformer 跨模态应用

LLM 量化技术

vLLM + SGLang 推理引擎深度解析

LLM Model Routing：智能模型选择与混合推理

LLM 评估与 Benchmark 深度解析

Ollama + llama.cpp 深度解析

llama.cpp 源码精读

AI Compute Stack

图编译与优化

强化学习：从基础到 LLM 对齐与推理

Intel iGPU 推理深度解析：Xe2 架构、oneDNN 与 OpenVINO

矩阵数学：从基础理论到现代 AI 架构

图算法：从结构探索到组合优化

按标签浏览

全部文章

从 DPO 到 GRPO：直接偏好优化

从文本到向量：Tokenization 与词嵌入

代码 Benchmark

代码生成（上）：指令选择、Vectorization 与 Register Allocation

代码生成（下）：Triton Pipeline、编译器后端与数值正确性

当 RL 遇上 LLM：从语言生成到策略优化

调度与抢占：推理引擎的 Scheduler

调度与执行优化

动手：HF → GGUF / ONNX / OpenVINO 三条路径端到端

多模态对齐：CLIP 与跨模态嵌入空间

多模型协作：从选一个到用多个

分布式编译与图分割

服务层与调度

概率图模型：图上的不确定性推理

工具全景与 GGUF 二进制解析

核心性质速查：概念关系图与公式速查表

级联与自验证：先试便宜的，不行再升级

计算图捕获：TorchDynamo、AOTAutograd 与 Functionalization

计算图构建与架构分发

计算图与推理引擎

矩阵补全：从极少观测恢复低秩矩阵

矩阵范数、内积与条件数：度量的艺术

矩阵加速单元 — Tensor Core 与 XMX

矩阵结构的几何：二次型、正定性与协方差

矩阵数学全景图：ML 的通用语言

矩阵微积分：从 Jacobian 到损失曲面

句子嵌入：从 Token 级到语义检索

扩散模型基础：从噪声中生成

连通性：图能拆成几块？

连续时间线性系统与 Kalman 滤波：从离散步进到平滑流动

量化编译与混合精度优化

量化感知训练 (QAT)

量化基础

量化与模型转换工具链全景

路由分类器：让小模型决定谁来回答

马尔可夫链与转移矩阵：当矩阵编码概率

模型发布 Benchmark 标配解析

模型加载：从文件到设备

模型生态

欧拉与哈密顿：遍历的两种完备性

排行榜解读与模型选型

匹配：最优配对

奇异值分解：核心中的核心

前缀缓存与 RadixAttention

强化学习基础：从 Agent 到 Bellman 方程

全景图：ML 编译器的世界

社区发现：哪些节点抱团？

视频生成：时空注意力与 Sora 架构

树上算法：图的特殊骨架

数据矩阵分解概述：问题、工具与方法谱系

算子矩阵全景：当矩阵不再装数据

算子融合（上）：融合类型学与判定算法

算子融合（下）：Cost Model 与融合实战

随机化 SVD：当精确分解算不动的时候

随机图与网络模型：真实网络长什么样？

随机游走与图嵌入：DeepWalk/Node2Vec

拓扑排序与 DAG：有依赖时的合法顺序

特征分解与对角化：万物之基

图 Laplacian 与谱聚类：从图结构到最优分割

图建模案例集：这个问题其实是图问题

图扩散、热核与 GNN 消息传递：从热方程到图神经网络

图嵌入与图神经网络：把图变成向量

图上的通用迭代机器（上）：从数学问题到求解框架