全文索引体系结构¶
神通数据库中的全文索引功能分成两部分,即索引管理和索引检索。
图376 全文索引体系结构
神通数据库系统启动时根据参数配置决定是否加载全文索引引擎,并与全文索引引擎进行通信,整理系统中的现有的全文索引信息,保证系统和磁盘中全文信息的完备与一致性。在系统加载后,全文索引引擎处于待命状态,准备接受从神通数据库中发送的指令。全文索引的索引文件没有直接存储在神通数库库系统中,直接存放于文件系统--默认库文件路径下的fulltextindex目录。
当用户发送全文命令,神通数据库检查语法正确性等,最后将发送内部命令指挥全文索引引擎工作。全文索引引擎接收命令,根据操作索引的状态,等待或执行相关操作,完成用户指令对索引创建、删除、更新、优化、查询等操作后,返回执行结果给神通数据库系统。
索引管理模块负责对全文索引的管理工作,包括创建、删除、优化、更新等;索引检索模块负责索引查询功能,协调控制多用户并发访问等;文本提取模块负责从不同格式的文件中提取文本串,供分词器解析提取词组;分词器负责从字符串中分割字词,过滤停用词等,并传给存储引擎进行字词索引或者检索。
体系结构特点
全文索引支持
可执行创建、删除、更新、优化全文索引等操作;
索引检索支持
支持多类查询条件的检索,检索性能高;
格式化文件支持
提供多种数据文件支持,如.doc、.docx、.pdf、.rtf格式文件;
索引文件可管理
索引文件存储在神通数据库之外,易于特殊化管理;