圖1:Your Data,Any Where、Any Time、Any Device. But not on your finger.
1.2 主要檢索技術(shù)的區(qū)別
& F$ m0 C. B% @7 h
有了數(shù)據(jù)但是沒有被使用,那么這些數(shù)據(jù)不應(yīng)該被稱為信息。它們無(wú)非是不斷充斥設(shè)備和網(wǎng)絡(luò)的比特而已,但是如何把數(shù)據(jù)提供給必要的人員,檢索技術(shù)是其中非常有效的途徑之一。本文筆者主要基于微軟平臺(tái),針對(duì)SQL Server 2005提供的全文檢索技術(shù)進(jìn)行介紹。與關(guān)系數(shù)據(jù)查詢、多維數(shù)據(jù)庫(kù)查詢和基于XML的XQuery、XPath不同,全文檢索技術(shù)主要處理對(duì)象是基于超大數(shù)據(jù)量的文本數(shù)據(jù)和結(jié)構(gòu)化的二進(jìn)制數(shù)據(jù)上類似LIKE的模糊查詢。主要區(qū)別見下表。
關(guān)系數(shù)據(jù)庫(kù)查詢 | 多維數(shù)據(jù)查詢 | XML查詢 | 全文檢索 | |
檢索技術(shù) | SQL | MDX | XQuery、XPath | SQL (extension) |
主要處理對(duì)象 | 關(guān)系二維數(shù)據(jù) | 結(jié)構(gòu)化多維數(shù)據(jù) | 層次型數(shù)據(jù) | 大容量二維和層次型數(shù)據(jù)的模糊檢索 |
主要應(yīng)用領(lǐng)域 | 一般的OLTP類應(yīng)用 | 一般的OLAP類分析型應(yīng)用 | 面向Internet、Intranet的松散耦合SOA應(yīng)用 | 企業(yè)內(nèi)部知識(shí)管理類應(yīng)用 |
索引 | 大量使用非聚簇索引,一般保存在數(shù)據(jù)庫(kù)中。 | 通過(guò)層次型、保存中間結(jié)果的方式,通過(guò)不同的軸向快速定位信息剖面。 | 基于XPath的索引,索引一般保存在數(shù)據(jù)庫(kù)中。 | 基于關(guān)鍵字的索引,保存在文件系統(tǒng)中。每個(gè)表僅支持一個(gè)索引。 |
表1:全文檢索與關(guān)系數(shù)據(jù)庫(kù)查詢、多維數(shù)據(jù)查詢、XML查詢的對(duì)比