volume 是docker官方提供的一种高级的持久化数据的方法,它比 mount 有如下优点:
-
docker volume使用
-
java8 Stream流常用示例
Java8推出了Stream Api,开发者能够以声明的方式来流式处理数据。Stream可以让臃肿的代码变得更加简洁、高效。
Stream将要处理的元素集合看作一种流, 流在管道中传输,并且可以在管道的节点上进行处理,比如筛选、排序、聚合等。元素流在管道中经过中间操作的处理,最后由最终操作得到前面处理的结果。
-
An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition
现有片段分类方法采用Biaffine Decoder得到一个评分矩阵 $n \times n \times T$ ,$n$ 表示序列长度,$T$ 表示实体类别数量。本文沿用了片段分类的方法,但作者发现评分矩阵的临近片段具有非常明显的空间关联,如下图所示:
-
解决wsl2参考的对象类型不支持尝试的操作
最近windows的代理软件出现了问题,导致winsock出现问题,连锁反应就是wsl也用不了了。
-
DeepWalk解读
As a part of this blog series and continuing with the tradition of extracting useful graph features by considering the topology of the network graph using machine learning, this blog deals with Deep Walk. This is a simple unsupervised online learning approach, very similar to language modelling used in NLP, where the goal is to generate word embeddings. In this case, generalizing the same concept, it simply tries to learn latent representations of nodes/vertices of a given graph. These graph embeddings which capture neighborhood similarity and community membership can then be used for learning downstream tasks on the graph.
-
MR编程注意事项
在公司集群上跑MapReduce的时候会遇到一些异常报错,主要还是我们编程时没注意极端情况,想当然的认为没有bug就能顺利运行。以下列举几种例子:
-
Linux中[]和[[]]区别
[] 比较运算符只有==和!=,两者都是用于字符串比较的,不可用于整数比较,整数比较只能使用-eq,-gt这种形式。无论是字符串比较还是整数比较都不支持><。如果实在想用,对于字符串比较可以使用转义形式,如果比较”ab”和”bc”:[ a... -
Linux sort命令
sort命令用于对字符串排序,在日常的脚本处理中非常有用,用法也很简单。 -
Pandas入门
日常工作中经常需要数据分析,以前都是python脚本读取文件然后统计,十分麻烦。尝试了下Pandas,真香!