• 广告算法业务知识入门

    20分钟吃掉广告算法业务知识
  • ipynb导出为markdown

    1jupyter nbconvert --to markdown pd.ipynb
  • wsl2中volume挂载位置的问题

    本人电脑环境:win10 + wsl2(Ubuntu 18.04.6 LTS)

    运行命令:docker inspect testvol

  • docker volume使用

    volume 是docker官方提供的一种高级的持久化数据的方法,它比 mount 有如下优点:

  • java8 Stream流常用示例

    Java8推出了Stream Api,开发者能够以声明的方式来流式处理数据。Stream可以让臃肿的代码变得更加简洁、高效。

    Stream将要处理的元素集合看作一种流, 流在管道中传输,并且可以在管道的节点上进行处理,比如筛选、排序、聚合等。元素流在管道中经过中间操作的处理,最后由最终操作得到前面处理的结果。

  • An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition

    现有片段分类方法采用Biaffine Decoder得到一个评分矩阵 $n \times n \times T$ ,$n$ 表示序列长度,$T$ 表示实体类别数量。本文沿用了片段分类的方法,但作者发现评分矩阵的临近片段具有非常明显的空间关联,如下图所示:

  • C++智能指针详解

    了解Objective-C/Swift的程序员应该知道引用计数的概念。引用计数这种计数是为了防止内存泄露而产生的。 基本想法是对于动态分配的对象,进行引用计数,每当增加一次对同一个对象的引用,那么引用对象的引用计数就会增加一次, 每删除一次引用,引用计数就会减一,当一个对象的引用计数减为零时,就自动删除指向的堆内存。

  • 解决wsl2参考的对象类型不支持尝试的操作

    最近windows的代理软件出现了问题,导致winsock出现问题,连锁反应就是wsl也用不了了。

  • DeepWalk解读

    转载自:dsgiitr/graph_nets


    As a part of this blog series and continuing with the tradition of extracting useful graph features by considering the topology of the network graph using machine learning, this blog deals with Deep Walk. This is a simple unsupervised online learning approach, very similar to language modelling used in NLP, where the goal is to generate word embeddings. In this case, generalizing the same concept, it simply tries to learn latent representations of nodes/vertices of a given graph. These graph embeddings which capture neighborhood similarity and community membership can then be used for learning downstream tasks on the graph.

  • MR编程注意事项

    在公司集群上跑MapReduce的时候会遇到一些异常报错,主要还是我们编程时没注意极端情况,想当然的认为没有bug就能顺利运行。以下列举几种例子:

/20