大量のデータを高速に全文検索

WiSE Standard


WiSEとは

WiSE(Wordwide internet&intranet Search Engine)とは、BSTが自社開発した全文検索エンジンです。全文検索に最適化したデータベース構造を持ち、大量のデータを高速に全文検索できます。文字単位(欧米言語は単語単位)で、漏れのない検索ができます。


WiSEパッケージ

WiSEは、用途に応じた2種類のパッケージを選択できます。小規模から大規模まで、Webサイト、ECサイト、企業内ポータル、データベースコンテンツなどの検索システムを構築できます。Webクローラは単独でも利用できます。

WiSE Standard(ワイズ スタンダード)

Webサイトやイントラネットサイト内のオフィス文書等の検索

WiSE EC(ワイズ イーシー)

ECサイトの商品検索、CMS・データベース等のコンテンツ検索
WiSE ECの製品ページへ

WiSE Webクローラ(ワイズ ウェブクローラ)

Web上のデータ・クローリング
WiSE Webクローラの製品ページへ


WiSEの特徴

文字単位の全文検索

WiSEはN-gramのインデックス構造を持ちます。日本語は文字単位にインデックス化するので、形態素解析用の辞書は不要です。また、ひらがな/カタカナ/半角カタカナ/全角アルファベット/半角アルファベットなどを同一視することで、表記の揺れを吸収して検索できます。

検索に使うキーワードの個数にも制限はありません。もちろん、検索を行う際に、キーワードのすべてを含む、キーワードの一部を含む、特定のキーワードを含まない、等の条件を指定することも可能です。

検索用のデータとしては、全文検索用のテキストデータを中心に、数値、文字列、日付などのデータも格納することができます。さらに、それぞれのデータを対象に検索やソートを行うことができます。検索キーワードに加えて、日付や文書サイズで絞り込み重要度順にソートして表示する、といったことも可能です。

検索支援機能

全文検索の基本機能だけでなく、支援機能も充実しています。検索支援機能には、カテゴリ絞り込み、キーワード絞り込み、おすすめリンクなどがあります。ユーザがキーワードを入力しなくても、リンクをクリックするだけで目的の情報へたどりつけるナビゲーションや、キーワード連動広告などを実現できます。

検索アシスト辞書

WiSEでは文字単位の検索を行うため、通常は辞書のメンテナンスは不要です。しかし、綴りの間違いや、関連性の高いキーワードへの置き換えなどを行うために、ユーザが登録可能なアシスト辞書を提供しています。この辞書のメンテナンスは、管理画面からGUIを通じて行うことができます。
アシスト辞書を利用して、さらに的確な検索結果を示すようにすることが可能です。

文書フィルタ

HTML、PDF、Microsoft Office など、各種フォーマットのファイルからテキストを抽出して検索できます。対応フォーマットはこちらを参照してください。

複数サーバ対応

1台のサーバで処理しきれないような大量の文書があるような場合でも、クラスタ機能を利用することにより、複数のサーバに分散する形で検索システムを構築することが可能です。
クラスタを構成しておくと、検索サーバの一部が障害によりダウンするような場合でも、自動的にサーバの割り当てを行い、検索を停止させないシステムを構築することができます。

検索システムの開発

WiSEを利用するためには、検索用データ、検索を行うアプリケーションを作成する必要があります。検索用データは、簡単なテキスト形式のファイルを入力データとするため、簡単に作成することができます。検索を行う場合には、 WiSEサーバに対してHTTPで検索要求を行い、テキスト形式またはXML形式で検索結果を受け取ることができます。標準的なフォーマットがインターフェースになっていますので、容易に検索システムを作成することができます。

<WiSEの機能ブロックダイアグラム>
WiSEの機能ブロックダイアグラム
<WiSEの構成:画像>
WiSEの構成

※1 WiSE ECでは標準搭載、WiSE Standardではオプション
※2 WiSE Standardでは標準搭載、WiSE ECではオプション
※3 WiSE Standard、WiSE EC共に追加が可能なオプション

クローラ

クローラは、検索対象を収集する機能です。
クローラ機能と次のコネクタ機能を単一の実行イメージで実現する場合もあります。

コネクタ

コネクタは、クローラとインデクサをつなぐ機能です。
クローラが収集した検索対象のリストを元に検索対象の実体にアクセスし、各種フィルタを用いてデータを抽出します。その後、抽出したデータから、ECP形式の中間ファイルを生成します。

ECP

ECP(Enhanced Connector Protocol)とは、WiSEのインデクサがデータを受け付けるための固有の形式です。

インデクサ

WiSEのインデクサは、ECP形式のデータを受け付けて、インデックスデータベースを更新します。

検索Web API

WiSEを利用するアプリケーションは、検索Web APIを通して検索を行います。検索Web APIは、HTTPプロトコルのGETとPOST両方のメソッドをサポートしています。

ユーザアプリケーション

検索Web APIや検索WebクライアントAPIを利用することにより、サイト固有の事情にあわせて検索画面を作ることができます。WiSEには、PerlとJavaのサンプル検索画面が付属しています。


動作環境

対応OS

Red Hat Enterprise Linux 5 x86-64
Red Hat Enterprise Linux 6 x86-64
Red Hat Enterprise Linux 7 x86-64
CentOS 5 x86_64
CentOS 6 x86_64
CentOS 7 x86_64

※PHP7にも対応しています。

対応ブラウザ

Internet Explorer 8/9/10/11
Microsoft Edge
Firefox 最新版
Chrome 最新版

※管理画面が動作するブラウザです。

対応ハードウェア

※詳しくはお問い合わせください。


ご提供価格

WiSEは、パッケージとしてライセンス費用100万円~でご提供しておりますが、検索対象とするページ数やオプションなどによってさまざまな組み合わせがありますので、お客様のご要望をお伺いしてお見積もりさせていただきます。お気軽にお問い合わせください。

大量のデータを高速に全文検索

サービスラインナップ
TOP