<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Newton-Schulz on Xu'Blog</title><link>https://xuquant.com/tags/newton-schulz/</link><description>Recent content in Newton-Schulz on Xu'Blog</description><image><title>Xu'Blog</title><url>https://xuquant.com/og-default.png</url><link>https://xuquant.com/og-default.png</link></image><generator>Hugo -- 0.152.2</generator><language>zh</language><lastBuildDate>Mon, 18 May 2026 09:00:00 +0800</lastBuildDate><atom:link href="https://xuquant.com/tags/newton-schulz/index.xml" rel="self" type="application/rss+xml"/><item><title>Polar Express：用 Chebyshev 逼近把 Muon 的矩阵正交化提速一倍</title><link>https://xuquant.com/posts/mathematics/matrix/polar-express/</link><pubDate>Mon, 18 May 2026 09:00:00 +0800</pubDate><guid>https://xuquant.com/posts/mathematics/matrix/polar-express/</guid><description>Newton-Schulz 迭代在 Muon 优化器里有个隐疾——前十几步几乎不动。ICLR 2026 Honorable Mention 论文 The Polar Express 用区间最优多项式 + Chebyshev 等振荡逼近修好了这个问题，并给出 GPT-2 上一致的 val loss 改善。本文从 Newton-Schulz 的痛点出发，对比 Jordan 启发式、You 六步法、Polar Express 三家解法，详解 Remez 算法在 odd quintic 上的应用、区间复合多项式的收敛性证明，以及 bfloat16 上的工程取舍。</description></item></channel></rss>