学习笔记

研二在读 · 计算机科学 · 每天进步一点点

PRML 第三章 · 线性回归模型

2025-03-19 · 机器学习

这一章主要讲了线性回归的贝叶斯视角。最大似然和最大后验的区别终于有点明白了:

岭回归其实就是高斯先验下的 MAP,Lasso 对应拉普拉斯先验。

论文阅读 · Transformer 变体综述

2025-03-12 · NLP

周五组会要讲这篇综述。整理了一下主要改进方向:稀疏注意力、线性注意力、递归 Transformer、状态空间模型。

Mamba 和 RWKV 最近很火,下周单独开一篇笔记细讲。

凸优化第四讲复习

2025-03-05 · 数学

共轭函数的性质很漂亮,特别是 Fenchel 不等式。下周作业题要用到。