類義語辞書管理
ここでは、類義語辞書の登録やデプロイなどを行う「類義語辞書」について説明します。
このページの項目
- 類義語辞書とKandaSearch
- 類義語辞書を利用するには
- 類義語辞書一覧
- 類義語辞書を追加する
- 辞書詳細-一覧
- 辞書詳細-類義語セットの追加
- 辞書詳細-類義語セットの編集
- 辞書詳細-類義語セットの削除
- 辞書の名前を変更する
- 辞書をデプロイする
- 辞書に単語をインポートする
- 辞書をエクスポートする
- 辞書を削除する
類義語辞書とKandaSearch
類義語辞書を利用することで、例えば、検索キーワードに「スマホ」を指定して検索したとき、「スマートフォン」が含まれる文書も検索結果に表示させ、再現率(検索漏れがどれだけ少ないか)を向上させることができます。
Apache Solr では SynonymGraphFilter や ManagedSynonymGraphFilter を使うことで類義語検索が可能です。この機能を使うためには、CSVファイル形式、またはJSONファイル形式での辞書定義とそのデプロイ作業が必要です。
KandaSearchの類義語辞書機能を使うことで、類義語辞書の管理とデプロイを容易に行うことができます。
類義語辞書を利用するには
KandaSearchでは、プロジェクトに追加した類義語辞書を、同一プロジェクト内のインスタンスのコレクションへデプロイできます。
そのデプロイや類義語辞書の管理を行うためには、以下の操作で類義語辞書画面を表示します。
- KandaSearchへログインします。
- プロジェクトの一覧画面より、対象のプロジェクト名をクリックします。(プロジェクトの一覧を表示させるには、画面左上のKandaSearchのロゴをクリックします)
- プロジェクトビューの左サイドメニューより「類義語辞書」をクリックします。
- 登録済み類義語辞書の一覧画面が表示されます。
類義語辞書一覧
プロジェクトビューの左サイドメニューより「類義語辞書」をクリックすると、追加済みの類義語辞書の一覧が表示されます。
本画面には以下の機能があります。
- 「辞書を追加する」ボタン
- 辞書を追加できます。(詳細は後述)
- 辞書の情報表示
- 当該行の辞書名、作成者が表示されます。
- 「辞書を見る」(本)アイコン
- 当該行の辞書詳細画面へ移動します。
- 「辞書の名前を変更する」(リネーム)アイコン
- 当該行の辞書名を変更できます。(詳細は後述)
- 「辞書をデプロイする」(クラウド)アイコン
- 当該行の辞書をデプロイできます。(詳細は後述)
- 「その他のアクション」(縦三点)アイコン - 「辞書に単語をインポートする」
- 当該行の辞書への単語のインポートができます。(詳細は後述)
- 「その他のアクション」(縦三点)アイコン - 「辞書をエクスポートする」
- 当該行の辞書をエクスポートできます。(詳細は後述)
- 「その他のアクション」(縦三点)アイコン - 「辞書を削除する」
- 当該行の辞書を削除できます。(詳細は後述)
類義語辞書を追加する
類義語辞書一覧画面の「辞書を追加する」をクリックすると辞書を追加できます。 類義語辞書を追加する方法は以下の通りです。
辞書の新規作成のみを行う場合
- 類義語一覧画面の右上の「辞書を追加する」をクリックします。
- 辞書の新規作成のみを行うときは、「新規作成」タブをクリックし(デフォルトで「新規作成」タブが選択状態です)、辞書名を入力(辞書名には日本語も指定できます)します。
- 「作成」をクリックします。
- 類義語一覧画面で、辞書が追加されていることを確認します。
ローカルPC上にある辞書ファイルをインポートして追加する場合
- 類義語一覧画面の右上の「辞書を追加する」をクリックします。
- ローカルPC上にある辞書ファイルをインポートして追加する場合は、「インポートによる作成」タブをクリックます。
- ローカルPC上の辞書ファイルを破線枠内にドラッグ&ドロップするか、破線内の「ファイルを選択」をクリックし、辞書ファイルを指定します。
- 辞書名を入力(辞書名には日本語も指定できます)します。
- 「作成」をクリックします。
- 類義語一覧画面で、辞書が追加されていることを確認します。
補足情報
- アップロードできるファイルサイズには上限(500KB)があります。
- ファイルの文字コードはUTF-8です。
辞書詳細-一覧
類義語辞書一覧画面の「辞書を見る」(本の形)アイコンをクリックすると当該辞書の詳細画面が表示されます。
本画面には以下の機能があります。
- 検索ボックスと検索ボタン
- 辞書内の単語を検索できます。完全一致での検索も可能です。
- 「類義語セットを追加する」ボタン
- 類義語セットを追加できます。(詳細は後述)
- 「設定」(歯車)アイコン - 「辞書の名前を変更する」
- 当該辞書の名前を変更できます。(詳細は後述)
- 「設定」(歯車)アイコン - 「辞書をデプロイする」
- 当該辞書をデプロイできます。(詳細は後述)
- 「設定」(歯車)アイコン - - 「辞書に単語をインポートする」
- 当該辞書への単語のインポートができます。(詳細は後述)
- 「設定」(歯車)アイコン - 「辞書をエクスポートする」
- 当該辞書をエクスポートできます。(詳細は後述)
- 「設定」(歯車)アイコン - 「辞書を削除する」
- 当該辞書を削除できます。(詳細は後述)
- 類義語セットの情報表示
- 当該行の類義語セットのコメントの有無(マウスをアイコンに合わせるとコメント表示)、内容、編集者、最終更新日時が表示されます。
- 「編集」(鉛筆)アイコン
- 当該行の類義語セットを編集できます。(詳細は後述)
- 「削除」(ごみ箱)アイコン
- 当該行の類義語セットを削除できます。(詳細は後述)
辞書詳細-類義語セットの追加
辞書の詳細画面から類義語セットを追加する方法は以下の通りです。
- 辞書の詳細画面右上の「類義語セットを追加する」をクリックします。
- 「類義語セットの作成」ダイアログボックスが表示されますので、コメント(省略可)を入力します。
- 「新しい単語」フィールドに単語を入力し、+アイコンをクリックします。これを必要な分だけ繰り返します。
- 「確認」をクリックします。
- 辞書の詳細画面で、類義語セットが追加されていることを確認します。
補足情報
- 「リセット」をクリックすると、入力したすべての情報が消去されます。
- 追加した単語は、その行の右端の削除(ごみ箱)アイコンをクリックすると削除できます。
- 追加した単語は、その行の左端の削除ハンドル(=の形)アイコンのドラッグ&ドロップで、上下の並び順を変更できます。
辞書詳細-類義語セットの編集
辞書の詳細画面から類義語セットを編集する方法は以下の通りです。
- 辞書の詳細画面に表示された類義語セット行の「編集」(鉛筆)アイコンをクリックします。
- 「類義語セットの編集」ダイアログボックスが表示されますので、編集します。
- 単語の編集はできませんので、削除後、新しい単語として追加します。
- 「確認」をクリックします。
補足情報
- 「元に戻す」をクリックすると、編集したすべての情報が元に戻ります。
- 単語行の右端の削除アイコンをクリックすると削除できます。
- 単語行の左端の削除ハンドル(=の形)アイコンをドラッグ&ドロップすると、上下の並び順を変更できます。
- 追加した単語の行に「未保存」と表示されている行は保存されていませんので、「確認」をクリックして保存してください。
辞書詳細-類義語セットの削除
辞書の詳細画面から類義語セットを削除する方法は以下の通りです。
- 辞書の詳細画面の一覧より、削除対象行の「削除」(ごみ箱)アイコンをクリックします。
- 「類義語セット削除の確認」ダイアログボックスが表示されますので「確認」をクリックします。
削除した類義語セットは復元できませんのでご注意ください。
辞書の名前を変更する
辞書の名前を変更する方法は以下の通りです。
- プロジェクトビューの左サイドメニューより「類義語辞書」をクリックし、類義語辞書の一覧を表示します。
- リネーム対象行の「辞書の名前を変更する」(リネーム)アイコンをクリックします。または、辞書詳細画面の「設定」(歯車)アイコン - 「辞書の名前を変更する」を選択します。
- 「辞書名の更新」ダイアログボックスが表示されますので、辞書名を編集後、「更新」をクリックします。
辞書をデプロイする
類義語辞書を利用するには、検索エンジンインスタンスに作成したコレクションへのデプロイとリロードが必要ですが、本機能を使うことでデプロイとリロードを容易に行うことができます。 なお、デプロイ先のコレクションのmanaged-schemaへ、類義語辞書を使った検索を行うための設定を済ませておきます。その後、それに合わせたパラメータを指定してデプロイします。
なお、辞書を変更した後は、本機能を使ってデプロイしてください。
類義語辞書をデプロイする方法は次の通りです。
- プロジェクトビューの左サイドメニューより「類義語辞書」をクリックし、類義語辞書の一覧を表示します。
- デプロイ対象行の「辞書をデプロイする」(クラウド)アイコンをクリックします。または、辞書詳細画面の「設定」(歯車)アイコン - 「辞書をデプロイする」を選択します。
- 「辞書のデプロイ」ダイアログボックスが表示されますので、各項目を指定後、「確認」をクリックします。
- 検索UIなどから、類義語辞書を使った検索ができるか確認します。
補足説明
- 「デプロイ完了した後、コレクションをリロードする」チェックボックスをオフにすることで、リロードを行わないようにできます。
項目の設定例
- インスタンス コレクションが追加されているインスタンス名
- コレクション コレクション名
- シノニムフィルター ManagedSynonymGraphFilter
- Managed リソース synonym-ja
- パラメーター
- tokenizerFactory solr.JapaneseTokenizerFactory
- tokenizerFactory.mode normal
- ignoreCase true
- format solr
クエリ時のmanaged-schemaの設定例
<fieldType name="text_ja" class="solr.TextField" autoGeneratePhraseQueries="true" positionIncrementGap="100">
<analyzer type="index">
...
</analyzer>
<analyzer type="query">
<tokenizer name="japanese" mode="normal" userDictionary="userdict_ja.txt"/>
...
<filter name="managedSynonymGraph" managed="synonym-ja"/>
...
</analyzer>
</fieldType>
辞書に単語をインポートする
ローカルPC上の辞書ファイルに登録された単語を、既存の辞書へインポートできます。
インポート方法は以下の通りです。
- プロジェクトビューの左サイドメニューより「類義語辞書」をクリックし、類義語辞書の一覧を表示します。
- インポート対象行の「その他のアクション」(縦三点)アイコン - 「辞書に単語をインポートする」を選択します。または、辞書詳細画面の「設定」(歯車)アイコン - 「辞書に単語をインポートする」を選択します。
- 「辞書にインポート」ダイアログボックスが表示されますので、ローカルPC上の辞書ファイルを破線枠内にドラッグ&ドロップするか、破線内の「ファイルを選択」をクリックし、辞書ファイルを指定します。
- 「確認」をクリックします。
- 辞書一覧画面で、対象行の「辞書を見る」(本)アイコンをクリックし、単語が登録されたかどうか確認します。
補足情報
- 「既存のデータをクリアする」機能のみサポート(チェックボックスをオフにすることはできません)しています。操作前に辞書に登録されていた単語は削除され、指定されたファイルの内容に上書きされます。
- アップロードできるファイルサイズには上限(500KB)があります。
- ファイルの文字コードはUTF-8です。
辞書をエクスポートする
追加済みの辞書をエクスポートできます。
エクスポート方法は以下の通りです。
- プロジェクトビューの左サイドメニューより「類義語辞書」をクリックし、類義語辞書の一覧を表示します。
- エクスポート対象行の「その他のアクション」(縦三点)アイコン - 「辞書をエクスポートする」を選択します。または、辞書詳細画面の「設定」(歯車)アイコン - 「辞書をエクスポートする」を選択します。
- 「辞書のエクスポート」ダイアログボックスが表示されますので、ファイル形式とコメントの同時出力の有無(CSVファイル形式指定時のみ)を指定します。
- 「ダウンロード」をクリックします。
- ローカルPCへダウンロードしたファイルの内容を確認します。
辞書を削除する
類義語辞書の削除方法は以下の通りです。
- プロジェクトビューの左サイドメニューより「類義語辞書」をクリックし、類義語辞書の一覧を表示します。
- 削除対象行の「その他のアクション」(縦三点)アイコン - 「辞書を削除する」を選択します。または、辞書詳細画面の「設定」(歯車)アイコン - 「辞書を削除する」を選択します。
- 「辞書削除の確認」ダイアログボックスが表示されますので、「確認」をクリックします。
- 類義語一覧画面で、辞書が削除されていることを確認します。
削除した類義語辞書は復元できませんのでご注意ください。