<div dir="ltr">村上と申します。<br><div class="gmail_extra"><br><div class="gmail_quote">2016年2月17日 16:22 Seto Ryuta <span dir="ltr">&lt;<a href="mailto:rseto****@gmail*****" target="_blank">rseto****@gmail*****</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><span style="font-size:12.8px">お世話になっております。瀬戸と申します。</span><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Groongaのベクターカラムを対象とした全文検索について質問があります。<br></span><div><span style="font-size:12.8px">以下の設定で語彙表ができ、全文検索ができることがわかりました。</span><br></div><div>しかし、Groongaのドキュメントには、「ShortText, Text, LongTextの3つの型についてはベクターとして保存したり出力したりすることはできますが、検索条件やドリルダウン条件に指定することができません。」 という記述があります。</div><div>( <a href="http://groonga.org/ja/docs/reference/types.html#limitations-about-types" target="_blank">http://groonga.org/ja/docs/reference/types.html#limitations-about-types</a> )</div><div><br></div><div>上記のような検索はしないほうが良いのでしょうか?</div><div>ご教示いただければ幸いです。</div><div>( Groongaは5.1.2を使っています。 )</div><span class=""><font color="#888888"><div><br></div></font></span></div></div></blockquote><div><br></div><div>問題ないと思います。<br>Groongaではベクターを指定してもちゃんとBigramにトークナイズ<br>してくれて、転置索引を使って高速に検索できます。<br><br>昔はインデックスを使わない検索ができなかったようですが、<br>今はインデックス無しでもfilterならシーケンシャルでも一致検索は<br>できるようです。queryは今もできなそうです。<br><a href="http://groonga.org/ja/blog/2015/07/29/release.html">http://groonga.org/ja/blog/2015/07/29/release.html</a><br><br>ドリルダウンもできると思います。<br>ただし、数値型のドリルダウンに比べて遅いと思います。<br>参照型ベクター(テーブル型)の形にしておけば、テキストでも<br>高速にドリルダウンできます。<br><br>参考<br><a href="http://qiita.com/groonga/items/3b41893f3fe5230f5b1f">http://qiita.com/groonga/items/3b41893f3fe5230f5b1f</a><br><br><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote"><span style="font-size:12.8px">column_create BigramTerms entry_vector COLUMN_INDEX|WITH_SECTION|WITH_POSITION Entry vector</span><br><span style="font-size:12.8px"></span></blockquote><span style="font-size:12.8px"></span></div><div><br>余談ですが、インデックス対象のカラムを複数にする必要がなければ、<br>WITH_SECTIONはなくても大丈夫です。<br><br></div></div></div></div>