Pelhans Blog

Practice makes perfect
本站总访问量 本站访客数人次

<语义网基础教程>笔记(四)

本体工程

本部分将介绍手工构建本体、本体复用和使用半自动化方法等技术。其实原计划后面还应有一个逻辑与推理:规则部分,但是我自己也没太理解,因此等以后再补。 手工构建本体 确定范围 考虑复用 枚举术语 定义分类 定义属性 定义刻面 定义实例 检测异常 复用已有本体 ...

<语义网基础教程>笔记(三)

万维网本体语言:OWL2

首先描述 OWL2 的动机以及它与 RDF 和 RDFS 的关系。接下来将介绍 OWL2 的各种语言元素及 OWL2 概要。 简介 本体语言的需求 推理支持 OWL2 和 RDF/RDFS 的兼容性 两种语义 OWL2 Full:基于 RDF 的语义 OWL2 DL:直接语义 ...

<语义网基础教程>笔记(二)

查询语义网:SPARQL

本章将介绍SPARQL 查询得以执行的基础设施,之后讨论SPARQL的基础知识并逐步介绍其更复杂的部分。 简介 SPARQL 基础设施 基础知识:匹配模式 过滤器 处理一个开放世界的构造子 组织结果集 其他形式的 SPARQL 查询 通过 SPARQL 更新来增加信息 总结 简介 SPARQL 能够让我们通...

语义网基础教程笔记(一)

资源描述框架:RDF

看书不记笔记的下场就是还得看一遍。。。 RDF 是一种勇于表达有关对象(资源) 的生命的语言;它是一个标准的数据模型以提供机器可处理的语义。RDF模式提供了一组用于将RDF词汇表组织成带类型的层次结构的建模原语。 简介 RDF:数据模型 资源 属性 声明 图 指向声明和图 RDF 语法...

从零开始构建知识图谱(十三)

百科知识图谱构建(七)基于 Silk 的批量知识融合

目前为止我们已经从百度百科获取了三元组 62,857,364个,互动百科 65,738,654个。使用 Silk 工具将他们在实体层次进行融合并给出 关系时发现,在使用全部数据进行融合时,会导致内存爆掉。因此这里介绍通过使用命令行进行批量融合。 项目链接 简介 准备工作 加载数据到 tdb 知识融合 简介 前面使用 Silk 工具进行知识融合。但实际操作...

从零开始构建知识图谱(十二)

百科知识图谱构建(六)基于Silk的知识融合

目前为止我们已经从百度百科获取了三元组 62,857,364个,互动百科 65,738,654个,词条每个都是400多万个。由于都是百科类,因此有大量的重复词条。现在我们使用 Silk 工具将他们在实体层次进行融合并给出 关系。 简介 Silk 的安装 运行 Silk Workbench Silk 的使用说明 Workbench 概览 ...

从零开始构建知识图谱(十一)

百科知识图谱构建(五)Jena的使用及简单SPARQL查询

Apache Jena 是一个免费开源的支持构建语义网络和数据链接应用的Java 框架,由惠普实验室开发,支持内存和永久存储。 简介 Jena 及 Fuseki 的安装 Jena 及 Fuseki 的使用 NTriples to TDB Fuseki 服务的开启 简单 SPARQL 查询 简介 Apache J...

从零开始构建知识图谱(十)

百科知识图谱构建(四)数据库到RDF

结构化数据到RDF由两种主要方式,一个是通过direct mapping,另一个通过R2RML语言这种,基于R2RML语言的方式更为灵活,定制性强。对于R2RML有一些好用的工具,此处我们使用d2rq工具,它基于R2RML-KIT。这里和前面电影的有些重复,但侧重点不同。 简介 D2RQ 的安装 D2RQ 的使用 生成 mapping 文件 ...

MongoDB 入门笔记

工作需要用到了 MongoDB,怕自己忘掉做一个速查笔记…内容总结子菜鸟教程 MongoDB 简介 MongoDB 的安装 MongoDB 的使用 开启 MongoDB 服务 进入 MongoDB Shell MongoDB 基础概念 数据库 文档 集合 ...

从零开始构建知识图谱(九)

百科知识图谱构建(三)神经网络关系抽取的数据集构建与实践

在爬取互动百科的过程中,学习神经网络关系抽取。采用清华大学开源的OpenNRE框架,数据集是按照NYT论文中的描述生成的远程监督数据集。包含关系事实18226,无关系(NA)实体对336 693,总计实体对354 919,用到了462个关系(包含NA)。 简介 远程监督数据集的获取 加载字典 从数据库导出数据并清洗 生成数据 ...