<div dir="ltr"><div>PGroongaを使おうかと検討中です。</div><div><br></div><div><br></div><div>次のことについて教えてください</div><div>やりたいことは次のようなものです。</div><div><br></div><div>  * URLの検索</div><div>   - 前方一致・部分一致: url like &#39;%/a/b/c&#39;</div><div>   - 完全一致: url = &#39;<a href="http://pgroonga.github.io">http://pgroonga.github.io</a>&#39;</div><div>  * 日本語: なし</div><div><br></div><div>質問事項</div><div><br></div><div>1, インデックスの保存場所</div><div>  (1) groongaのデータはどこに保存されますか?</div><div>  (2) パスは変更可能でしょうか?</div><div>   ・容量が大きくなりそうなのでPGDATA以外のパスに保存したいです。</div><div><br></div><div>2, ASCIIだけでもpgroonga使った方がいいですよね?</div><div>  ASCIIだけでも、pg_trigm, pg_bigmよりも速いでしょうか?</div><div><br></div><div>  <a href="http://slide.rabbit-shocker.org/authors/kou/postgresql-conference-2015/">http://slide.rabbit-shocker.org/authors/kou/postgresql-conference-2015/</a></div><div>  17ページを見る限り、Groongaを使った方が良さそうですよね。</div><div><br></div><div>3, パーティションテーブル(inheritされたデーブル)</div><div><br></div><div>  URLのデータは日別のパーティションテーブルに格納しています。</div><div>  インデックスをかける場合は、継承したテーブル個々に</div><div>  using groongaでインデックスを作成すれば良いでしょうか?</div><div><br></div><div>4, 完全一致</div><div><br></div><div> 完全一致の時もPGroongaのインデックスが使われますでしょうか?</div><div><br></div><div>5, URL用のトークナイザーとノーマライザー</div><div>  ノーマライザーなしの、 TokenBigramが良いでしょうか?</div><div><br></div><div>  Groongaの場合、NormalizeAutoにしたらASCIIは単語の境界でトークナイズされると</div><div>  学んだように記憶しています。</div><div><br></div><div>  URLは単純なバイグラム(あるいは大文字を小文字に変換)にするのが検索に向いている</div><div>  思います。</div><div><br></div><div>  と思ったのですが、NormalizerNoneという指定はないように思います。</div><div>  <a href="http://groonga.org/ja/docs/reference/normalizers.html">http://groonga.org/ja/docs/reference/normalizers.html</a></div><div><br></div><div> どのようにするのが良いでしょうか?</div><div><br></div><div>背中を押してください。</div><div>よろしくお願いします。</div><div><br></div><div><br></div></div>