Pelhans Blog

Practice makes perfect
本站总访问量 本站访客数人次

实体链接(二)

LIMES 中的大规模数据链接方法

LIMES — A Time-Efficient Approach for Large-Scale Link Discovery on theWeb of Data 数学框架 核心流程 Exemplar computation Matching Based on Exemplars ...

命名实体识别(二)

NER 论文研读

End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF Leveraging linguistic structures for named entity recognition with bidirectional recursive neural networks Neural Reranking for ...

命名实体识别(一)

[笔记] 综述 A Survey on Deep Learning for Named Entity Recognition

摘要 NER 技术概览 NER 数据资源和流行工具 资源 NER 工具 NER 的性能评估指标 NER 中的深度学习技术 DL 为什么那么有效 模型分层标准 输入的分布式表示 Word-level 表示 ...

集成学习

集成学习 Boosting AdaBoost 算法 AdaBoost 多分类 AdaBoost 回归 提升树 算法流程 梯度提升树 GBT xgboost Li...

决策树

决策树 特征选择 信息增益 信息增益比 生成算法 剪枝算法 CART 树 CART 生成算法 CART 回归树 CART 分类树 ...

K-means

K-means 算法 k-means 算法 k-means 优缺点 k-means 与 EM 的等价性 k-means++ k-modes KNN 与 k-means 的区别与联系 K-means 算法 k-means 算法 k-means 算法是一种无监督聚类方法.给定数据集, 假设我们要分为 k 个类别 ...

KNN

KNN 算法 k 值的选择 距离度量 决策规则 kd 树 kd 树构建算法 搜索 kd 树 KNN 算法 K 近邻法(K-Nearest Neighbor: KNN) 是一种基本的分类与回归方法. 它是一种监督学习算法, 不具有显示的学习过程, 可以直接进行预测. 当用...

主成分分析 PCA

主成分分析 最大方差形式 最小误差形式 低空间维数的选取 证明两种方法的等价性 LDA 与 PCA 的关系 概率PCA 因子分析 核PCA 主成分分析 主成分分析,或者称为PCA,是一种被广泛使用的技术,应用领域包括维度降低。有损数据压缩、特征抽取、数据...

NLP 手册

支持向量机 SVM

支持向量机 基本概念 线性可分支持向量机 对偶算法 对偶问题的求解 SMO 算法 选择变量的启发式方法 外层循环 内层循环 ...

NLP 手册

朴素贝叶斯分类器

朴素贝叶斯法 优化目标 求解 算法流程 贝叶斯估计 模型优缺点 朴素贝叶斯法 朴素贝叶斯法是基于贝叶斯定理与条件特征独立假设的分类方法. 它首先基于特征条件独立假设学习输入, 输出的联合概率分布. 而后基于此模型, 对给定输入 x, 利用贝叶斯定理求出后验概率最大的输出 y.因此可以看出它是一个生成式模型. 具...