Levy's Blog

自编码器

AE, VAE, VQ-VAE, RQ-VAE 晚点写

2025-07-03

深度学习

拉格朗日对偶问题

参考资料：拉格朗日对偶拉格朗日函数的定义：拉格朗日对偶的定义：拉格朗日对偶函数一定是一个凹函数，因为仿射函数的下界一定是凹的。明确拉格朗日对偶的作用：原优化问题比较难求解的情况下(存在约束)，就可以将其转化为拉格朗日对偶问题，对偶问题一定是一个凸问题。但值得注意的是，对偶问题得到的求解是原问题的下界(弱对偶)。那什么情况下是强对偶，也就是对偶问题的最优解即为原问题的最优解

2024-10-25

数学

理解比特币白皮书

看了中本聪2008年写的比特币白皮书，有种相见恨晚的感觉，理解BTC后发现这个东西确实存在极大的合理性和价值，去中心化的思想非常美妙。详细文档可看李笑来的github。文中的具体细节不再赘述，主要记录一些我阅读过程中思考以及理解的要点。数字货币的概念文中将一枚数字硬币定义为a chain of digital signatures，即一串数字签名，并且示意图如下：上图可以这么理解，假如所有

2024-02-18

数字货币

#比特币

Tensorflow op调用机制解析

最近老是有需求去看tf一些op的源码实现，比如ftrl优化器源码实现，在看的过程中会发现涉及python和c++的调用逻辑，因为大部分op在tf底层其实使用c++实现的。因此，大致梳理了一下tf的op调用机制。以FTRL优化器为例，探索这个调用链路。（本文中的Tf为1.12版本）原始import如下 1from tensorflow.train import FtrlOptimizer 本

2024-01-09

ML框架

#Tensorflow

tensorflow的自动求导机制

参考资料:https://www.zhihu.com/question/54554389 自动求导分成两种模式，一种是 Forward Mode，另外一种是 Reverse Mode，目前基本机器学习库用的后一种。 Forward mode: 每一步都用到链式求导，每个节点都记录其对原始节点的导数。 Reverse mode: 每一步都只记录相邻节点之间的导数，然后最终计算loss到某个节点的导数

2023-12-20

ML框架

#Tensorflow

hexo升级及图床配置

一直用免费的新浪图床，很多图都挂了，做了修复之后取了回来。为了以防万一，开通了ipic的会员和阿里云的oss存储服务，后续全部采用这个方式存图片了，花点钱省点心。教程：https://toolinbox.net/iPic/AddAliOSS.html。另外，hexo和node也升级了版本，不然deploy一直有问题… 再此外，github现在http clone的话，upload需要用私人秘钥

2023-09-14

博客

强化学习基本知识点整理

最近研究黑盒优化问题的时候，发现有方法就是借鉴强化学习的思路: 通过reward的反馈，来优化一个不相干的网络(参数与目标无法直接梯度求导)，这个思路在很多地方被反复用到，就像梯度下降一样是个比较经典的想法。因此重新看了一遍强化学习的知识，这一遍看完终于基本梳理清楚了其中的公式推导原理及流程，特此记录。参考资料: 动手学习强化学习基本概念强化学习在本质上是一个马尔科夫决策过程(MDP)，由元组

2023-08-17

强化学习

update_ops和control_dependencies的理解

control_dependencies作用是保证在执行之后的op时，确认某些op已经执行完毕，相加于强加了依赖。常见的场景为: 当用了tf.assign之类的op，并不会实际执行，需用手动sess.run该op才行，为了方便起见，就可以引入control_dependdencies，例子如下: 123456789101112131415161718192021import tensorflow

2023-07-10

ML框架

#Tensorflow

关于stop_gradient和trainable的理解

两个方法的分别意义： stop_gradient参考资料而trainable则是在初始化变量时，手动设置为True or Flase，意图为是否加入到trainable_variable中(计算梯度时的变量集合)。两个方法都可以起到停止梯度更新的作用，但stop_gradient更加灵活一点，可以直接截断路径上的前面所有变量的梯度。

2023-07-10

ML框架

#Tensorflow

Uplift model理解

背景在一些文档中看到了uplift模型，此类模型在一些用户增长(营销发券)，甚至广告模型中都有用到，因此做了一些查阅，发现确实是个蛮有意思的方向，从另一个切入点来建模广告营销场景，整理成blog记录下。参考文献建模以cvr模型为例，传统的cvr模型预估的是假设给用户曝光广告后的转化率，而没有考虑假设不曝光广告的自然转化率，uplift建模的则是该差值，并且期望找到的用户群体为：未曝光则不转化

2022-10-25

搜推广