您现在的位置：主页 > 技术中心 > 数据库技术 > Oracle

Oracle全文检索方面的研究(全3)(2)

来源：未知责任编辑：责任编辑发表时间:2014-01-06 18:19　点击:次

Sqlserver Mysql Oracle DB2数据库数据库综合

ctx_ddl.set_attribute(german_lexer,mixed_case,yes);

ctx_ddl.set_attribute(german_lexer,alternate_spelling,german);

ctx_ddl.create_preference(japanese_lexer,japanese_vgram_lexer);

ctx_ddl.create_preference(global_lexer, multi_lexer);

ctx_ddl.add_sub_lexer(global_lexer,default,english_lexer);

ctx_ddl.add_sub_lexer(global_lexer,german,german_lexer,ger);

ctx_ddl.add_sub_lexer(global_lexer,japanese,japanese_lexer,jpn);

end;

create index globalx on globaldoc(text) indextype is ctxsys.context

parameters (lexer global_lexer language column lang);

3.3.3 chinese_vgram_lexer 和chinese_lexer

basic_lexer 只能识别出被空格、标点和回车符分隔出来的部分，如果要对中文内容进行索引的话，就必须使用chinese_vgram_lexer 或是chinese_lexer

Chinese_lexer 相比chinese_vgram_lexer 有如下的优点：

产生的索引更小

更好的查询响应时间

产生更接近真实的索引切词，使得查询精度更高

支持停用词

因为chinese_lexer 采用不同的算法来标记tokens, 建立索引的时间要比chinese_vgram_lexer

长.

字符集：支持al32utf8，zhs16cgb231280，zhs16gbk，zhs32gb18030，zht32euc，zht16big5

zht32tris， zht16mswin950，zht16hkscs，utf8

--建立chinese lexer

Begin

ctx_ddl.create_preference(my_chinese_vgram_lexer, chinese_vgram_lexer);

ctx_ddl.create_preference(my_chinese_lexer, chinese_lexer);

End;

-- chinese_vgram_lexer

Create index ind_m_lex1 on my_lex(docs) indextype is ctxsys.context Parameters (lexer foo.my_chinese_vgram_lexer);

Select * from my_lex t where contains(docs, 中国) > 0;

-- chinese_lexer

drop index ind_m_lex1 force;

Create index ind_m_lex2 on my_lex(docs) indextype is ctxsys.context

Parameters (lexer ctxsys.my_chinese_lexer);

Select * from my_lex t where contains(docs, 中国) > 0;

3.3.4 User_lexer

Use USER_LEXER to plug in your own language-specific lexing solution. This enables you to

define lexers for languages that are not supported by Oracle Text. It also enables you to define a

new lexer for a language that is supported but whose lexer is inappropriate for your application.

3.3.5 Default_lexer

如果数据库在建立的时候指定的是中文则default_lexer 为chinese_vgram_lexer，如果是英文，则default_lexer 为basic_lexer

3.3.6 Query_procedure

This callback stored procedure is called by Oracle Text as needed to tokenize words in the query.

A space-delimited group of characters (excluding the query operators) in the query will be

identified by Oracle Text as a word.

3.3.7 参考脚本

--建立basic_lexer

begin

ctx_ddl.create_preference(mylex, BASIC_LEXER);

ctx_ddl.set_attribute (mylex, printjoins, _-); --保留_ -符号

ctx_ddl.set_attribute (mylex,mixed_case,yes); --区分大小写

end;

create index indx_m_lex on my_lex(docs) indextype is ctxsys.context parameters(lexer

今日头条

更多>>

教学笔记-Oracle常用数据字典

[详细]

oracle存储过程2

Bulk Collect性能分析(zz)

export/import的使用

Table函数使用简介

您可能感兴趣的文章

快速直达

新闻点评智问网络

新闻关注排行榜

热门推荐最新推荐

Table函数使用简介

[详细]

Oracle数据库Constraint约束的常用操作及异常处理

export/import的使用

Bulk Collect性能分析(zz)

ORACLE10gr2数据导入MySQL方案

OCP043第十五讲 Database Security

oracle 让sys用户可以使用isqlplus

在oracle数据库下使用iSQL*Plus DBA访问数据库

Oracle行列转换小结

oracle存储过程2

ORACLE10gr2数据导入MySQL方案

ORACLE10gr2数据导入MySQL方案本次使用MySQL GUI Tools工具 1，下载My[详细]

OCP043第十五讲 Database Security

Oracle数据库Constraint约束的常用操作及异常处理

在oracle数据库下使用iSQL*Plus DBA访问数据库

oracle 让sys用户可以使用isqlplus

Oracle行列转换小结

教学笔记-Oracle常用数据字典

oracle存储过程2

Bulk Collect性能分析(zz)

export/import的使用