全文検索エンジン「LudiaTM」の公開を開始 〜PostgreSQLに全文検索機能を提供〜
ニュースリリース/NTTデータ
2006年10月11日
株式会社NTTデータ
(株)NTTデータは、オープンソースで構成されるデータベース管理システム(DBMS)である「PostgreSQL」に、高速かつ高精度な全文検索機能を提供する検索エンジン「LudiaTM」(ルディア)を開発しました。Ludiaは、オープンソースソフトウエアとして平成18年10月11日より公開が開始されます。
【背景】
データベース内の情報をフリーワードで検索する全文検索機能は、顧客管理システムにおける顧客要望分析業務や、ブログシステムにおける記事検索機能を提供するために必要な機能です。この機能は、商用データベース管理ソフトでは、以前から実現させていましたが、オープンソースでは日本語に対応した高速・高精度なものが存在しませんでした。そのため、オープンソースでデータベース内の情報に対する全文検索機能を実現する場合は、データベースからデータを取り出し、別のシステムを構築する必要があるなど、効率的な開発の阻害要因となっていました。
【Ludiaの概要】
今回提供を開始したLudiaは、PostgreSQLのテーブル内のテキストデータに対する全文検索インデックスを、PostgreSQLデータベース内に作成注1し、商用のデータベース管理ソフトに匹敵する高速かつ高精度な全文検索機能を、シンプルなインタフェースで提供します。 これにより、PostgreSQL利用システムの構築において、データを分散することなく、データベースの本来の目的であるデータの一元管理を維持しつつ、全文検索機能を実装することができます。
【イメージ図】
【Ludiaの公開について】
Ludiaは、10月11日よりオープンソースソフトウエアとして公開され、OSSのライセンスであるGNU Lesser General Public License (LGPL)の定める条件に従って利用することができます。Ludiaプロジェクトの詳細については、以下のサイトをご覧下さい。
また、ソースコードはOSSの開発サイトである「SourceForge.jp」で公開されています。
【Ludia ver.0.8の機能について】
現在は、以下の機能が実現されています。
Ludiaではこのような全文検索機能の利用にあたり、PostgreSQLのSQLと極めて親和性の高いインタフェースを提供しており、アプリケーション開発における開発者の負担の低減を図っています。
【今後の展開】
NTTデータでは、今年度内にPostgreSQL利用システムへのLudiaの導入を目指します。 また、OSSとして公開することでPostgreSQLの機能をより充実させ、PostgreSQLの魅力の向上に寄与していきます。それにより、積極的にオープンソースの適用を促進し、ITインフラの発展に貢献していきます。
NTTデータでは、平成16年3月に公開した、PostgreSQLを拡張し並列・分散機能を追加した「PostgresForest®」に始まり、平成17年11月に公開したセキュリティ機能強化版Linuxである「TOMOYO® Linux」、運用管理ソフトウェアである「Hinemos®」など、相次いでOSSを公開してきています。今後もOSSの開発・公開を通じて、OSSコミュニティへ貢献していくとともに、エンタープライズ市場におけるOSSの活用を積極的に推進していきます。
注1 全文検索インデックスの作成には、OSSの全文検索エンジンであるSennaを利用しています。
注 「LudiaTM」は株式会社NTTデータの商標です。
注 「PostgresForest®」「TOMOYO®」「Hinemos®」は、株式会社NTTデータの登録商標です。
その他、文中に記載されている商品・サービス名、および会社名は、それぞれ各社の商標または登録商標です。
【背景】
データベース内の情報をフリーワードで検索する全文検索機能は、顧客管理システムにおける顧客要望分析業務や、ブログシステムにおける記事検索機能を提供するために必要な機能です。この機能は、商用データベース管理ソフトでは、以前から実現させていましたが、オープンソースでは日本語に対応した高速・高精度なものが存在しませんでした。そのため、オープンソースでデータベース内の情報に対する全文検索機能を実現する場合は、データベースからデータを取り出し、別のシステムを構築する必要があるなど、効率的な開発の阻害要因となっていました。
【Ludiaの概要】
今回提供を開始したLudiaは、PostgreSQLのテーブル内のテキストデータに対する全文検索インデックスを、PostgreSQLデータベース内に作成注1し、商用のデータベース管理ソフトに匹敵する高速かつ高精度な全文検索機能を、シンプルなインタフェースで提供します。 これにより、PostgreSQL利用システムの構築において、データを分散することなく、データベースの本来の目的であるデータの一元管理を維持しつつ、全文検索機能を実装することができます。
【イメージ図】
【Ludiaの公開について】
Ludiaは、10月11日よりオープンソースソフトウエアとして公開され、OSSのライセンスであるGNU Lesser General Public License (LGPL)の定める条件に従って利用することができます。Ludiaプロジェクトの詳細については、以下のサイトをご覧下さい。
- Ludiaプロジェクトサイト: http://www.nttdata.co.jp/services/ludia/index.html
また、ソースコードはOSSの開発サイトである「SourceForge.jp」で公開されています。
- Ludiaソースコード公開サイト: http://sourceforge.jp/projects/ludia/
【Ludia ver.0.8の機能について】
現在は、以下の機能が実現されています。
- 二種類の主要な全文検索インデックス方式(N-gram、形態素解析)を共にサポート
- 複数の検索方法(ブーリアン検索、近傍位置検索、類似文書検索)に対応
- 検索した結果が、どの程度期待している結果であるかを示す、「スコア」の取得
Ludiaではこのような全文検索機能の利用にあたり、PostgreSQLのSQLと極めて親和性の高いインタフェースを提供しており、アプリケーション開発における開発者の負担の低減を図っています。
【今後の展開】
NTTデータでは、今年度内にPostgreSQL利用システムへのLudiaの導入を目指します。 また、OSSとして公開することでPostgreSQLの機能をより充実させ、PostgreSQLの魅力の向上に寄与していきます。それにより、積極的にオープンソースの適用を促進し、ITインフラの発展に貢献していきます。
NTTデータでは、平成16年3月に公開した、PostgreSQLを拡張し並列・分散機能を追加した「PostgresForest®」に始まり、平成17年11月に公開したセキュリティ機能強化版Linuxである「TOMOYO® Linux」、運用管理ソフトウェアである「Hinemos®」など、相次いでOSSを公開してきています。今後もOSSの開発・公開を通じて、OSSコミュニティへ貢献していくとともに、エンタープライズ市場におけるOSSの活用を積極的に推進していきます。
注1 全文検索インデックスの作成には、OSSの全文検索エンジンであるSennaを利用しています。
注 「LudiaTM」は株式会社NTTデータの商標です。
注 「PostgresForest®」「TOMOYO®」「Hinemos®」は、株式会社NTTデータの登録商標です。
その他、文中に記載されている商品・サービス名、および会社名は、それぞれ各社の商標または登録商標です。