-
广告算法业务知识入门
20分钟吃掉广告算法业务知识 -
ipynb导出为markdown
1jupyter nbconvert --to markdown pd.ipynb -
wsl2中volume挂载位置的问题
本人电脑环境:win10 + wsl2(Ubuntu 18.04.6 LTS)
运行命令:
docker inspect testvol
-
docker volume使用
volume
是docker官方提供的一种高级的持久化数据的方法,它比mount
有如下优点: -
java8 Stream流常用示例
Java8推出了Stream Api,开发者能够以声明的方式来流式处理数据。Stream可以让臃肿的代码变得更加简洁、高效。
Stream将要处理的元素集合看作一种流, 流在管道中传输,并且可以在管道的节点上进行处理,比如筛选、排序、聚合等。元素流在管道中经过中间操作的处理,最后由最终操作得到前面处理的结果。
-
An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition
现有片段分类方法采用Biaffine Decoder得到一个评分矩阵 $n \times n \times T$ ,$n$ 表示序列长度,$T$ 表示实体类别数量。本文沿用了片段分类的方法,但作者发现评分矩阵的临近片段具有非常明显的空间关联,如下图所示:
-
解决wsl2参考的对象类型不支持尝试的操作
最近windows的代理软件出现了问题,导致winsock出现问题,连锁反应就是wsl也用不了了。
-
DeepWalk解读
As a part of this blog series and continuing with the tradition of extracting useful graph features by considering the topology of the network graph using machine learning, this blog deals with Deep Walk. This is a simple unsupervised online learning approach, very similar to language modelling used in NLP, where the goal is to generate word embeddings. In this case, generalizing the same concept, it simply tries to learn latent representations of nodes/vertices of a given graph. These graph embeddings which capture neighborhood similarity and community membership can then be used for learning downstream tasks on the graph.
-
MR编程注意事项
在公司集群上跑MapReduce的时候会遇到一些异常报错,主要还是我们编程时没注意极端情况,想当然的认为没有bug就能顺利运行。以下列举几种例子: