<div dir="ltr">瀬戸です。<div><br></div><div>村上さん、ありがとうございます。</div><div>ベクターカラムのタグ検索(一致検索)とドリルダウンは、以下のような形で参照テーブルを使っていたのですが、</div><div>同じような設定で全文検索をしようとすると語彙表にデータが登録されなかったため、質問をさせていただきました。</div><div>(スキーマのどこかが間違っていると思うのですが。。。)</div><div>ベクターカラムの全文検索についてはShortTextを型として利用することに致します。ありがとうございました。<br></div><div><br></div><div>・タグ検索</div><div><div>table_create Entry TABLE_HASH_KEY ShortText</div><div>table_create Vector TABLE_HASH_KEY ShortText</div><div>column_create Entry vector COLUMN_VECTOR Vector</div><div>column_create Vector entry COLUMN_INDEX Entry vector</div><div><br></div><div>load --table Entry</div><div>[</div><div>{&quot;_key&quot;:1, &quot;vector&quot;:[&quot;Head First Groonga&quot;, &quot;Head First Mroonga&quot;]},</div><div>{&quot;_key&quot;:2, &quot;vector&quot;:[&quot;Head First Mroonga&quot;, &quot;Head First Rroonga&quot;]}</div><div>]</div></div><div><br></div><div><div>&gt; select --table Entry --filter &#39;vector@&quot;Head First Groonga&quot;&#39;</div><div>[[0,1455753028.75039,0.00267195701599121],[[[1],[[&quot;_id&quot;,&quot;UInt32&quot;],[&quot;_key&quot;,&quot;ShortText&quot;],[&quot;vector&quot;,&quot;Vector&quot;]],[1,&quot;1&quot;,[&quot;Head First Groonga&quot;,&quot;Head First Mroonga&quot;]]]]]</div></div><div><br></div><div>・全文検索で参照テーブルを使った場合<br></div><div><div>table_create Entry TABLE_HASH_KEY ShortText</div><div>table_create Vector TABLE_PAT_KEY ShortText</div><div>column_create Entry vector COLUMN_VECTOR Vector</div><div>table_create BigramTerms TABLE_PAT_KEY ShortText --default_tokenizer TokenBigramSplitSymbolAlpha --normalizer NormalizerAuto</div><div>column_create BigramTerms entry_vector COLUMN_INDEX|WITH_POSITION Entry vector</div><div><br></div><div>load --table Entry</div><div>[</div><div>{&quot;_key&quot;:1, &quot;vector&quot;:[&quot;Head First Groonga&quot;, &quot;Head First Mroonga&quot;]},</div><div>{&quot;_key&quot;:2, &quot;vector&quot;:[&quot;Head First Mroonga&quot;, &quot;Head First Rroonga&quot;]}</div><div>]</div></div><div><br></div><div><div>&gt; select --table BigramTerms</div><div>[[0,1455753397.86934,0.00184440612792969],[[[0],[[&quot;_id&quot;,&quot;UInt32&quot;],[&quot;_key&quot;,&quot;ShortText&quot;],[&quot;entry_vector&quot;,&quot;UInt32&quot;]]]]]</div><div>&gt; select --table Entry --match_columns BigramTerms.entry_vector --query &quot;Mroonga&quot;</div><div>[[0,1455753456.73035,0.013195276260376],[[[0],[[&quot;_id&quot;,&quot;UInt32&quot;],[&quot;_key&quot;,&quot;ShortText&quot;],[&quot;vector&quot;,&quot;Vector&quot;]]]]]</div></div><div><br></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">2016-02-17 20:54 GMT+09:00 Naoya Murakami <span dir="ltr">&lt;<a href="mailto:visio****@gmail*****" target="_blank">visio****@gmail*****</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">村上と申します。<br><div class="gmail_extra"><br><div class="gmail_quote">2016年2月17日 16:22 Seto Ryuta <span dir="ltr">&lt;<a href="mailto:rseto****@gmail*****" target="_blank">rseto****@gmail*****</a>&gt;</span>:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><span style="font-size:12.8px">お世話になっております。瀬戸と申します。</span><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Groongaのベクターカラムを対象とした全文検索について質問があります。<br></span><div><span style="font-size:12.8px">以下の設定で語彙表ができ、全文検索ができることがわかりました。</span><br></div><span class=""><div>しかし、Groongaのドキュメントには、「ShortText, Text, LongTextの3つの型についてはベクターとして保存したり出力したりすることはできますが、検索条件やドリルダウン条件に指定することができません。」 という記述があります。</div><div>( <a href="http://groonga.org/ja/docs/reference/types.html#limitations-about-types" target="_blank">http://groonga.org/ja/docs/reference/types.html#limitations-about-types</a> )</div><div><br></div><div>上記のような検索はしないほうが良いのでしょうか?</div><div>ご教示いただければ幸いです。</div><div>( Groongaは5.1.2を使っています。 )</div><span><font color="#888888"><div><br></div></font></span></span></div></div></blockquote><div><br></div><div>問題ないと思います。<br>Groongaではベクターを指定してもちゃんとBigramにトークナイズ<br>してくれて、転置索引を使って高速に検索できます。<br><br>昔はインデックスを使わない検索ができなかったようですが、<br>今はインデックス無しでもfilterならシーケンシャルでも一致検索は<br>できるようです。queryは今もできなそうです。<br><a href="http://groonga.org/ja/blog/2015/07/29/release.html" target="_blank">http://groonga.org/ja/blog/2015/07/29/release.html</a><br><br>ドリルダウンもできると思います。<br>ただし、数値型のドリルダウンに比べて遅いと思います。<br>参照型ベクター(テーブル型)の形にしておけば、テキストでも<br>高速にドリルダウンできます。<br><br>参考<br><a href="http://qiita.com/groonga/items/3b41893f3fe5230f5b1f" target="_blank">http://qiita.com/groonga/items/3b41893f3fe5230f5b1f</a><span class=""><br><br><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote"><span style="font-size:12.8px">column_create BigramTerms entry_vector COLUMN_INDEX|WITH_SECTION|WITH_POSITION Entry vector</span><br><span style="font-size:12.8px"></span></blockquote><span style="font-size:12.8px"></span></span></div><div><br>余談ですが、インデックス対象のカラムを複数にする必要がなければ、<br>WITH_SECTIONはなくても大丈夫です。<br><br></div></div></div></div>
<br>_______________________________________________<br>
groonga-dev mailing list<br>
<a href="mailto:groon****@lists*****">groon****@lists*****</a><br>
<a href="http://lists.osdn.me/mailman/listinfo/groonga-dev" rel="noreferrer" target="_blank">http://lists.osdn.me/mailman/listinfo/groonga-dev</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature"><div dir="ltr">-----------------------------------------------------------<br>瀬戸隆太<br>E-mail: <a href="mailto:rseto****@gmail*****" target="_blank">rseto****@gmail*****</a><br>-----------------------------------------------------------<br></div></div>
</div>