検索エンジンについての一般的な質問
WiSEシリーズ(WiSE,SS,MT,EC)についての質問
- ・「WiSE」とは何ですか?
- ・「WiSE SS」とは何ですか?
- ・「WiSE MT」とは何ですか?
- ・「WiSE MT」に関して、エントリにあらかじめタグを付けておき、タグ検索を利用したいが可能ですか?
- ・「WiSE MT」に関して、DBのクローリングのタイミングは調整できますか?(例えばMTで作成したコンテンツが公開したタイミングでWiSEの方でもindex化できたら・・・。)
- ・「WiSE EC」とは何ですか?
WiSEシリーズ全般に関する質問〜一般編〜
- ・WiSEはソフトウェアをサーバーにインストールするだけですぐに使えますか?
- ・検索対象はどんな文書(PDF、Word、Excel等)でもOKですか?
- ・画面の検索窓の位置は自由に決められますか?
- ・価格について教えてください。
- ・納期はどれくらいかかりますか?
- ・「クローラー搭載」とありますが、どういったメリットがあるのですか?
- ・なぜ、検索漏れがないのですか?
- ・英語サイトや、中国語サイト、その他外国語サイトにも対応していますか?
- ・新コンテンツアップ時に、辞書メンテナンス作業(企業独特のサービス名や人名などの辞書登録作業)はありますか?
- ・WiSEの活用分野を教えてください。
- ・現在サイトを運営中ですが、途中からでもWiSE導入は可能ですか?
- ・別のサーバーにある文書も検索対象にできますか?
WiSEシリーズ全般に関する質問〜技術編〜
- ・FTP経由からでもインストールできますか?
- ・検索結果の表示方法や、画面のデザインは自由に決められますか?
- ・検索の表示順位はどのような方法で決まってますか?
- ・ユーザーがWiSEを使って検索する際の使用方法等のガイドはありますか?
(ex. or検索で|を使う等) - ・検索結果画面で表示させるテキストを変更する事はできますか?
(ex. 該当ページのdescriptionを表示させる等) - ・Yahoo!やGoogleのロボット避けのmetaタグはWiSEのでも検索対象から外れますか?
- ・フレームを使用したページの際、フレームセットだけでなく、メイン部もクローリング対象になりますか?また、検索結果から飛ぶページはメイン部だけでなくフレームセットも入った形でページへ飛ぶことは可能ですか?
- ・中国語の文字コード:GB2312は検索対象となり得ますか?
- ・1台のWiSEを導入したサイトで、TOPの検索窓では全サイトを検索対象にしつつ、ディレクトリ単位、サブドメイン単位で検索対象を絞り込んで検索結果を表示させることは可能ですか?
- ・30言語のグローバルサイトでWiSEを検討しています。検索窓としては、一つの窓で検索ワードの言語によって検索結果ページの不変部分の言語対応を自動で行いたいのですが。
- ・特定のページを検索させないことは可能ですか?
- ・既存システムへの組み込みは可能ですか?
- ・カスタマイズは可能ですか?
- ・ハードウェアはどのようなものを選べばよいですか?
- ・対応しているOSについて教えてください。
- ・Free BSDは動作可能ですか?
全文検索エンジンとは、検索対象としたコンテンツ内の全てのテキストやファイルを検索して探し出すエンジンです。WiSEは、それらを高速に処理・探し出すことのできる高性能全文検索エンジンです。
インデクシングとは、検索エンジンの運営過程の中で、「情報作成」「登録」の役割を担う作業です。検索エンジンは、クローラーが収集してきた情報をあらかじめ中間処理し、検索アルゴリズムが扱いやすいデータに変換した上で、インデックス(データベース)に格納します。
単語を「N個の文字の組み合わせ」と捉えて、文字列をN文字ずつ区切っていく方法です。 形態素解析のように辞書で分かち書きしないので辞書に依存せず、検索漏れもおきません。
インターネット、イントラ内等の高機能検索エンジンです。特徴としては、
・完全一致と検索漏れのないN-gram方式を採用、
・高いセキュリティ機能
・グローバルな組織でも使える国際化対応と多言語対応
又、検索方式は形態素解析など他の方式を組み合わせたハイブリッド化も行っております。
詳細はこちら→「WiSE製品情報」
「WiSE SS」 (ワイズエスエス : WiSE Site Search)は、企業や組織のWebサイトに全文検索機能を付加する、いわゆる検索窓を付ける用途に特化したサイト内検索パッケージで、 全文検索ソフトウェア WiSE とオプションのWebクローラ、ツール、サポートを1パッケージ化し、低価格で導入しやすくした製品です。
詳細はこちら→「WiSE SS製品情報」
「WiSE MT」 (正式名称: WiSE ブログ検索 for Movable Type) は、シックス・アパート社のブログ構築ツールである Movable Type (MT) に高速で高度な全文検索機能を追加する製品です。
詳細はこちら→「WiSE MT製品情報」
カスタマイズにより実現可能です。
DBのクローリングは、Perlスクリプトを実行することによって行いますので、cronやタスクスケジューラで実行日時を調整することは可能です。リアルタイムでの更新は、MTが更新されたら、「WiSE MT」の更新スクリプトにエントリiDを渡して実行するしくみを作りこめば可能です。
「WiSE EC」(WiSE e-Commerce)は、 BSTが開発・販売する多言語対応の高速全文検索エンジン製品である「WiSE」 をコアに、EC・ポータルサイトの運営に効果的な様々な機能を追加したソフトウェア製品です。
詳細はこちら→「WiSE EC製品情報」
WiSEの標準機能であれば、インストール後インデクシングするだけですぐに検索できます。
WiSEの標準対象文書フォーマットは以下の通りです。
・テキストファイル
・HTMLファイル
・WindoWs版/Macintosh版Microsoft Word、Excel、PowerPoint
・PDF 1.2 / 1.3 / 1.4 / 1.5 (Adobe Acrobat 4.0 / 5.0 / 6.0)
・JiS / EUC / SJiS / Unicodeテキスト
・一太郎 V5-V13 / 2004
・OASYS V6 / V7 / V8 / 2002
・Lotus Word Pro 2001
・RTFファイル
オプションのフィルタで、
・Mail
・AutoCAD
も対応可能です。
※詳細はお問い合わせください。ビジネスサーチテクノロジ梶iTEL:03-3526-6141 e-mail:inquiry@bsearchtech.com)
お客様のご要望により決めることが可能です。
詳細はこちら→「WiSE製品価格情報」
製品標準パッケージであれば、発注後2-3日以内に出荷可能です。
Webクローラーを使うことによって、稼働中のWebサーバーに直接インストールせずに、サイト内検索を実現する事が可能です。また、Webクローラーを利用することで、検索対象を1台のWebサーバーに限定する事なく利用する事ができます。
例えば、
・複数Webサーバー横断検索(自社/他社管理問わず)
・複数サイト横断検索(別ドメイン含む)
実際にどのようにご利用頂いているかは、「導入事例ページ:横断検索」もご参照下さい。
N-gram方式を採用しているからです。例えば、「ビジネスサーチテクノロジ」という言葉を「ビ/ジ/ネ/ス/サ/ー/チ/」と1文字づつインデクシングしますので、「ビジネスサーチ」(弊社名略)という言葉で検索されたとしても「ビジネスサーチテクノロジ」という言葉での検索結果と同様の結果が表示可能です。
対応しています。英語はもちろん、中国、韓国、フランス、スペイン、ロシア、ポルトガル、ドイツ等様々な外国語サイトの検索が可能です。
面倒なメンテナンスは不要です。
インターネット(組織外):Webサイト内・ブログサイト内・ECサイト内検索、FAQシステム検索 イントラネット(組織内):企業内検索(エンタープライズサーチ)、文書管理、ナレッジマネージメント、その他情報共有への利用 アプリケーションとの連携:携帯電話での検索、組み込み などなど。様々な「探したい」にお答えします。
もちろん可能です。お気軽にご相談ください。ビジネスサーチテクノロジ梶iTEL:03-3526-6141 e-mail:inquiry@bsearchtech.com)
例:Web サイト上のページ: 標準搭載されているWebクローラーの機能を使用してページを取得できます。コンテンツ設定で基点 URLを指定するだけでOKです。複数サイトを横断して検索したいときにも便利です。
Linuxではroot権限、WindowsではAdministrator権限が必要です。FTP経由でのファイルコピーだけではインストールできません。
標準でPHPベースの検索画面を提供しているので、PHPのタグを編集することにより自由にカスタマイズできます。 ソート順や表示件数などは設定ファイルの値を設定するだけで簡単に変更できます。
色々な項目で表示順を変更することが可能です。
・URLごとの重み順
・検索後の出現頻度数
・ファイル更新日付順
・タイトル順
・ファイルサイズ順
・ホスト名順 etc..
(ex. or検索で|を使う等)
製品標準ではありません。サンプルのヘルプ(HTML)は提供可能です。
(ex. 該当ページのdescriptionを表示させる等)
Descriptionを表示させることはできません。先頭何文字を表示、というようなことは可能ですが、カスタマイズ対応になります。
robots.txtやMETAタグのnoindex、nofollowは通常の検索エンジンと同じように適用されます。(検索対象から外すことが可能)
フレームセットを構成する個々のHTMLごとにインデックスに登録されます。結果も個々のHTMLごとに表示されます。
対象になります。ただし、METAタグにきちんとcharsetが表記されている必要があります。また多言語対応は現時点ではLinux版に限定されます。(Windows版は将来バージョンでの対応)
可能です。実現方法は2つあって、ディレクトリ、サブドメイン単位でDB(サービス)を作成する方法と1つのDBに対して検索オプションでパスを指定して絞り込む方法があります。
WiSEは多言語対応していますが、基本的に扱える言語はLinuxのiconvライブラリでサポートする言語になります。検索画面に関しては、キーワードの言語によって自動的に変えるというしくみはありません。フォームのパラメータ(Lang)で画面を変更するというしくみは用意しています。
可能です。
いくつか方法がありますが、
・インデクシング時にそのページを収集しない
・インデクシング後にそのページをDBから削除する
・HTMLの場合、METAタグに
<meta name="robots" content="noindex">
を入れると検索対象になりません。
可能です。色々な方法がありますので、そのような場合はご相談ください。
ビジネスサーチテクノロジ梶iTEL:03-3526-6141 e-mail:inquiry@bsearchtech.com)
可能です。色々な方法がありますので、そのような場合はご相談ください。
ビジネスサーチテクノロジ梶iTEL:03-3526-6141 e-mail:inquiry@bsearchtech.com)
インテルx86系CPUを搭載したサーバになります。
検索対象容量やシステムの要件によって求められるスペックは違ってきます。
Red Hat EnterpriSE Linux 4 ES/AS
Red Hat EnterpriSE Linux 3 ES/AS
Miracle Linux 3.x
Miracle Linux 4.x
CentOS 4.x
WindoWs Server 2003
詳細はお気軽にお問い合わせください。ビジネスサーチテクノロジ梶iTEL:03-3526-6141 e-mail:inquiry@bsearchtech.com)
FreeBSDは動作環境としてサポートしていません。
