全文索引体系结构

神通数据库中的全文索引功能分成两部分,即索引管理和索引检索。

../../../../../_images/image17.png

图376 全文索引体系结构

神通数据库系统启动时根据参数配置决定是否加载全文索引引擎,并与全文索引引擎进行通信,整理系统中的现有的全文索引信息,保证系统和磁盘中全文信息的完备与一致性。在系统加载后,全文索引引擎处于待命状态,准备接受从神通数据库中发送的指令。全文索引的索引文件没有直接存储在神通数库库系统中,直接存放于文件系统--默认库文件路径下的fulltextindex目录。

当用户发送全文命令,神通数据库检查语法正确性等,最后将发送内部命令指挥全文索引引擎工作。全文索引引擎接收命令,根据操作索引的状态,等待或执行相关操作,完成用户指令对索引创建、删除、更新、优化、查询等操作后,返回执行结果给神通数据库系统。

索引管理模块负责对全文索引的管理工作,包括创建、删除、优化、更新等;索引检索模块负责索引查询功能,协调控制多用户并发访问等;文本提取模块负责从不同格式的文件中提取文本串,供分词器解析提取词组;分词器负责从字符串中分割字词,过滤停用词等,并传给存储引擎进行字词索引或者检索。

体系结构特点

全文索引支持

可执行创建、删除、更新、优化全文索引等操作;

索引检索支持

支持多类查询条件的检索,检索性能高;

格式化文件支持

提供多种数据文件支持,如.doc、.docx、.pdf、.rtf格式文件;

索引文件可管理

索引文件存储在神通数据库之外,易于特殊化管理;