類語をみつける方法

類語をみつける方法

というか同じカテゴリの単語を複数見つける方法
同位語検索というらしい
画像なぞなぞ認証で偽答を作るのを自動化したい
たとえば「大阪」が正解のとき「神戸」とか「京都」とかの偽答を自動生成したい
「的場」から「菊地」を生成するとか 

「や」を使う方法
"大阪や" でググると「大阪や埼玉」「大阪や鳥取」などが出る
京大田中研の研究 by 大島氏
結構使えるがテキスト処理しなければならないのは面倒
「鎌倉や」だとうまくいかない。そういう名前の店があるから。
Google Setsを使う方法
(Google Setsは動いてないようだ (2013/06/13 22:04:59))
単語ひとつだけでもうまくいく場合が多い (大阪)
複数単語を与えても全然駄目な場合も (佐藤/増井)
Boo!Wa!を使う方法
サービス止まってる (2013/06/13 22:05:31)
SEALという方法の改良版らしい
複数単語指定必要で動作が遅いが、精度が高い
東大田中氏によるもの

まとめ
単語ひとつだけ使うならGoogle Setsを使うか「や」を使う
複数単語を使えるならBoo!Wa!は最強。ただし遅い。
自力でシソーラスを作ったりする必要はないことがわかった。うまくなぞなぞ認証システムに組み込みたい。

その他
そもそも同位語検索はどういう目的で使われるものなのだろう??
比較検索や補完的検索,文書の網羅性などの計算に利用されたりします

ありがとうございました!
taktak
shn
yto

Powered by Helpfeel