課題
-
巨大なデータ群/多言語
- 言語
- text type.
-
非構造化データ
- 複数のソース間でデータをリンクできるのか?
-
情報検索に時間を費やしすぎている
- mega dataを活用しきれていない。
Rosette
- 企業内検索
- web search
- テキストマイニング
trande
-
検索およびテキスト分析に基づいたtask/domain/workflowに固有のアプリ
- ユーザーのニーズに基づいたサーチアプリケーション
- 求人検索・情報分析・e-Discovery
-
カスタマイズ検索
- open source
- 企業内検索エンジン
- 高度な言語処理が要求される
-
あらゆるmeta dataを使用した検索結果のフィルタリング
- 結果セット内の探索
-
メタデータの自動生成
- 非構造化データから作成するなど。
sample
- walmart
- careerbuilder.com
- tweepz
Rosette
-
RLI(言語判別)
- 言語と文字コードを判別
- 50以上の言語
- 150以上のencoding pair
-
RCLU(Unicode対応)
- normalization
-
RBL
- 形態素解析システム
- 日本語の分節処理
- 複合語分析・品詞タグを付け、基本名詞句抽出.
-
REX
- 固有表現抽出
- meta dataの品質強化
- 人名・地名・組織名などに対応
-
RNI
- 人名・地名称号
- ファジーな曖昧なname search.
-
RNT
- 人名・地名翻訳
- place,organization/nationality
Rosetteのソリューション
-
どのようにして使えるのか?
- open sourceへの統合
- 商用エンジンにも適用可能