为什么不用奖励R作为当前Q值,这里解释一下。
-
馈电油耗
馈电油耗 一般出现在 插电混合动力汽车(PHEV) 或 混合动力汽车(HEV) 的指标描述里。
-
股市指数点位计算逻辑
以沪深300指数点位的计算方式为例:
-
法拉第笼原理
比亚迪汽车遭遇三次雷击后,车身仍然保持完好无损,内部系统正常运转,乘客平安无事,这是由于法拉第笼(
Faraday Cage
)原理造成的。 -
Enhancing CTR Prediction with De-correlated Expert Networks
本文探索了专家网络的差异性对模型性能的影响,本质上是种bagging思想,从各个语义空间上提升模型的表达能力。
-
模型预估打分对运筹跟踪的影响
在uplift建模中,模型离线指标(QINI、AUUC)提升并不意味着在线A/B实验的收益,因为在线运筹还需要$\lambda$约束。如果模型打分不满足单调增且roi边际递减,那么$\lambda$运筹求解会非常不稳定,导致线上发券偏高,毛利无法兜住。
-
生成式召回-TIGER范式
TIGER(Transformer Index for Generative Recommenders)是生成式召回的经典力作,其核心思想就是语义ID+Seq2Seq,这一范式启发了后续大量生成式推荐工作。
-
codebook简史
一文详解 codebook 技术史(从 VAE 到 VQ/RQ-VAE 到 FSQ) -
离线运筹求解流程
基于线上运筹优化公式推导,概述一下如何用二分搜索来运筹求解 $\lambda$ 。
-
扭矩&马力
马力和扭矩是衡量发动机性能的两个核心指标,但它们的物理意义和对车辆性能的影响截然不同。