2026  50

六月  5

Flow Matching 训练的广度、深度与物理 horizon:cone 几何下的三轴分解

2026年6月26日 · 29 分钟 · LexHsu

MiniT2I:把文生图拉回 ImageNet 实验台

2026年6月23日 · 14 分钟 · LexHsu

从 million 到 billion:VLA 训练 recipe 在量级跃迁上的工程层重构

2026年6月13日 · 18 分钟 · LexHsu

X-Foresight:长时 chunk-wise AR 把世界模型嵌进 VLA 主干

2026年6月9日 · 20 分钟 · LexHsu

训练大模型的 Scaling Law:科学、工程与边界

2026年6月7日 · 43 分钟 · LexHsu

五月  22

Qwen-VLA 解读:T2A 解压先验、流匹配 PPO、跨形态零样本

2026年5月28日 · 16 分钟 · LexHsu

VLA 加几何 backbone 的负结果:GR00T × VGGT 三架构对照

2026年5月28日 · 14 分钟 · LexHsu

深入理解 KL 散度:四个视角

2026年5月28日 · 12 分钟 · LexHsu

HiF-VLA:把 codec 副产品当成 VLA 的时间记忆

2026年5月27日 · 10 分钟 · LexHsu

量产 VLA 的 8 个工程判断 + 4 个反例

2026年5月26日 · 8 分钟 · LexHsu

熵与信息论:从 -log p 到深度学习

2026年5月25日 · 18 分钟 · LexHsu

Affordance vs Symbolic Perception in AD:二分 framing 错在哪

2026年5月24日 · 11 分钟 · LexHsu

Dense Latent Predictive Supervision in AD VLA:为什么 pixel 不是最优

2026年5月24日 · 16 分钟 · LexHsu

自动驾驶 VLA 的 3D 视觉表征:从能力边界到工程注入

2026年5月22日 · 36 分钟 · LexHsu

ATLAS:视觉推理的动作词表

2026年5月21日 · 12 分钟 · LexHsu

X-World:小鹏可控自车视角多相机世界模型——量产驾驶世界模型的工程化

2026年5月20日 · 26 分钟 · LexHsu

自动驾驶世界模型 × Action:六范式在 NAVSIM 上的落地与跨域对偶

2026年5月19日 · 19 分钟 · LexHsu

Polar Express:用 Chebyshev 逼近把 Muon 的矩阵正交化提速一倍

2026年5月18日 · 16 分钟 · LexHsu

为什么大扩散模型不会背诵训练数据:两个时间尺度的隐式正则化

2026年5月18日 · 18 分钟 · LexHsu

4D Vision Encoder for Autonomous Driving:信息瓶颈视角下的统一审视

2026年5月17日 · 20 分钟 · LexHsu

从预测未来到驱动行动:机器人世界模型的架构与评测

2026年5月15日 · 14 分钟 · LexHsu

VLA 语义下的导航信息注入:从 Prompt 到 Diffusion Condition

2026年5月14日 · 31 分钟 · LexHsu

得分匹配、GAN 与生成模型的统一

2026年5月11日 · 15 分钟 · LexHsu

VLM 时序记忆机制:从视频压缩到长短时记忆融合

2026年5月9日 · 11 分钟 · LexHsu

最优传输与 Wasserstein 距离:从 Monge 到 Kantorovich

2026年5月6日 · 14 分钟 · LexHsu

代码即感知:当大模型「看得懂代码」才是攻克理科题的钥匙

2026年5月2日 · 11 分钟 · LexHsu

变分自编码器:从 ELBO 到重参数化

2026年5月2日 · 17 分钟 · LexHsu

四月  8

ReflectDrive-2:理想汽车的离散扩散端到端驾驶与 RL 联合优化

2026年4月25日 · 19 分钟 · LexHsu

Flow Matching 与一致性模型:生成范式的新统一

2026年4月25日 · 21 分钟 · LexHsu

扩散模型的 SDE/ODE 统一:随机微分方程到确定性采样

2026年4月22日 · 21 分钟 · LexHsu

凯明的方法论:从 ResNet 到 iMF —— 一个本质追问者的研究路径

2026年4月18日 · 21 分钟 · LexHsu

扩散模型的变分基础:从 ELBO 到去噪

2026年4月18日 · 16 分钟 · LexHsu

旋转约束下的压缩:从 RoPE 到 DeepSeek MLA

2026年4月11日 · 17 分钟 · LexHsu

DeepSeek 以视觉原语思考:让多模态大模型学会「用手指着推理」

2026年4月4日 · 19 分钟 · LexHsu

RoPE 的 β 进制类比与长度外推

2026年4月4日 · 19 分钟 · LexHsu

三月  9

X-Cache:小鹏自动驾驶世界模型的推理加速 Infra

2026年3月28日 · 10 分钟 · LexHsu

旋转位置编码的几何本质:从复数到旋转矩阵

2026年3月28日 · 18 分钟 · LexHsu

SceneVerse++: Lifting Unlabeled Internet Videos into 3D Scene Understanding Training Data

2026年3月21日 · 12 分钟 · LexHsu

VGGT: 几何重建作为世界模型的 reconstruct 维度

2026年3月21日 · 17 分钟 · LexHsu

Wan2.2 and the Boundary of Video World Models

2026年3月14日 · 27 分钟 · LexHsu

Muon 优化器:矩阵正交化驱动的梯度更新

2026年3月14日 · 25 分钟 · LexHsu

Qwen3.5 vs Qwen3: A Deep Architectural Comparison

2026年3月7日 · 12 分钟 · LexHsu

从 2D 到 4D:视觉表征的本体论问题

2026年3月7日 · 11 分钟 · LexHsu

谱范数、条件数与优化景观

2026年3月7日 · 11 分钟 · LexHsu

二月  4

奇异值分解与低秩近似:从矩阵压缩到 LoRA 微调

2026年2月28日 · 17 分钟 · LexHsu

Driving JEPA 综述:V-JEPA 系列方法在自动驾驶场景的应用

2026年2月21日 · 11 分钟 · LexHsu

Depth Anything 3: Geometric Grounding for World Models

2026年2月7日 · 24 分钟 · LexHsu

LeJEPA:当 JEPA 不再需要启发式

2026年2月7日 · 12 分钟 · LexHsu

一月  2

DINOv3:自监督视觉基模的规模化困局与 Gram Anchoring 破局

2026年1月24日 · 11 分钟 · LexHsu

V-JEPA 2.1: When Self-Supervised Vision Learns to See Every Pixel

2026年1月10日 · 20 分钟 · LexHsu

2025  11

十一月  2

CORAL:面向开放式发现的自主多Agent进化

2025年11月22日 · 16 分钟 · LexHsu

扩散模型与自动驾驶规划:从去噪的数学到轨迹的生成

2025年11月8日 · 26 分钟 · LexHsu

十月  2

ReconVLA:用 gaze-crop 重建给 VLA 视觉接地

2025年10月27日 · 11 分钟 · LexHsu

InSpatio-World: Real-Time 4D World Simulation via Spatiotemporal Autoregressive Modeling

2025年10月25日 · 7 分钟 · LexHsu

九月  2

Reinforcement Learning for End-to-End Autonomous Driving: From Offline DPO to Iterative Self-Improvement

2025年9月20日 · 12 分钟 · LexHsu

Multi-Head Latent Attention: DeepSeek V2/V3 工程视角

2025年9月13日 · 5 分钟 · LexHsu

八月  2

Alpamayo:面向自动驾驶的推理-动作对齐 VLA 系统

2025年8月30日 · 8 分钟 · LexHsu

Policy Optimization for End-to-End Autonomous Driving: From REINFORCE to GRPO

2025年8月9日 · 17 分钟 · LexHsu

七月  1

End-to-End Autonomous Driving: From Modular Decoders to VLA Architectures

2025年7月19日 · 16 分钟 · LexHsu

六月  2

Trajectory Tokenization for Autoregressive Planning: Clustering, Matching, and the AR+Diffusion Paradigm

2025年6月28日 · 11 分钟 · LexHsu

Why Generative Planning? The Non-Convexity Argument Against Regression in Autonomous Driving

2025年6月7日 · 8 分钟 · LexHsu
访客 2766 人次 · 访问 3605 次