Pelhans Blog

Practice makes perfect
本站总访问量

候选实体生成策略

候选实体生成 基于字符匹配 基于名称字典的方法 字符串匹配技术 最小编辑距离(Levenshtein distance) Wagner and Fisher distance Edit distance with affine gaps Dice 系数 ...

Elasticsearch 笔记

用 ES 做实体召回

ES 简介 ES 核心概念 简单查询原理 倒排索引 查询评分 布尔检索 实用评分函数 向量空间模型 更牛的评分机制 利用 python 控制 ES 建立索引 删除索引 插入...

实体链接(三)

文本匹配 大礼包

文本匹配任务概览 基于表示的模型 SiameseNet – Signature Verification using a “Siamese” Time Delay Neural Network DSSM – Learning Deep Structured Semantic Models for Web Sea...

实体链接(二)

LIMES 中的大规模数据链接方法

LIMES — A Time-Efficient Approach for Large-Scale Link Discovery on theWeb of Data 数学框架 核心流程 Exemplar computation Matching Based on Exemplars ...

命名实体识别(二)

NER 大礼包

概览 分类标准 编码层改进 End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF CAN-NER Convolutional Attention Network for Chinese Named Entity Recognition Chinese NER Usi...

命名实体识别(一)

[笔记] 综述 A Survey on Deep Learning for Named Entity Recognition

摘要 NER 技术概览 NER 数据资源和流行工具 资源 NER 工具 NER 的性能评估指标 NER 中的深度学习技术 DL 为什么那么有效 模型分层标准 输入的分布式表示 Word-level 表示 ...

集成学习

集成学习 Boosting AdaBoost 算法 AdaBoost 多分类 AdaBoost 回归 提升树 算法流程 梯度提升树 GBT xgboost Li...

决策树

决策树 特征选择 信息增益 信息增益比 生成算法 剪枝算法 CART 树 CART 生成算法 CART 回归树 CART 分类树 ...

K-means

K-means 算法 k-means 算法 k-means 优缺点 k-means 与 EM 的等价性 k-means++ k-modes KNN 与 k-means 的区别与联系 K-means 算法 k-means 算法 k-means 算法是一种无监督聚类方法.给定数据集, 假设我们要分为 k 个类别 ...

KNN

KNN 算法 k 值的选择 距离度量 决策规则 kd 树 kd 树构建算法 搜索 kd 树 KNN 算法 K 近邻法(K-Nearest Neighbor: KNN) 是一种基本的分类与回归方法. 它是一种监督学习算法, 不具有显示的学习过程, 可以直接进行预测. 当用...