butterfly search 2.8c をリリースしました。
リリース先: https://www.vector.co.jp/soft/winnt/util/se437071.html(vectorさんでの審査後に公開されます。執筆時点では2.8bが公開されています)
大きな修正は
・大きいサイズの圧縮ファイルも処理できるように修正。
・圧縮ファイルの処理がエラーになる不具合の修正。
・インデックス生成時の進捗メッセージを修正。
・放送コード.xlsの梱包を中止。
です。
環境によっては同時ファイルオープン可能数が10000程度の場合があり、高速化の為に大きなファイルはCLOSEしないという作りがエラーを招いています。
修正点が多いのでデグレートしていたら教えてください。
いつも便利に使わせていただいており,大変感謝しております.
返信削除2.8cになってから検索の際に「DwFileNameB Error」が出ることがあります.
まずは状況報告まで.
すみません.こちらの不手際でした.butterflysearchのインストールフォルダも誤って検索対象フォルダに入っておりました.お騒がせいたしました.
削除ご利用ありがとうございます。
削除時々クラッシュすることもありますので、不具合情報はうれしいです。
何かありましたら引き続きご連絡お願いします。
探三郎から移行してきました。探三郎は以前はうまく機能していたのですが,最近はxdoc2txtとの連携がうまく行っていないのでしょうか,全文検索ができなくなっていました。ネット情報では,xdoc2txtを別途インストールすると書いてあったのですが,もう一つやり方が分からず別のソフトウェアを探したところ,butterfly searchに出逢いました。
返信削除butterfly searchは同様の機能を有していますが,特殊文字(独語のウムラウトや仏語のアクサンなど)が使える,プレビュー画面が大きいなど,幾つかの点で探三郎より優れていますね。このようなソフトウェアがあることをとても嬉しく思います。
使い始めて若干不便に感じたのは,連続して検索する際,新規検索の度に「検索文字列」にある直前の検索対象文字列を消さないといけないことです。「×」がボックスん右端にあって,簡単に消せると便利ですね。ご検討いただければ幸いです。
ご利用ありがとうございます。
返信削除気に入って頂けたようで何よりです。
「×」はありませんが、Ctrl+Aで全文字列の選択ができますので試してみて下さい。
また、Ctrl+Fによる分布表示も面白いと思いますので試してみて下さい。
宜しくお願い致します。
xdoc2txtですが、探三郎とbutterfly searchとでは使用しているオプションに違いが
ありました。変換結果に差分が生じていると思われますので、お気付きの点が
ありましたら、ご連絡頂ければと思います。
manomi様より探三郎での検索が上手くできない事があるとの事なので試してみました。
返信削除まず、探三郎v158に同梱されていた「xdoc2txt.exe」は古くて動作しなかった為、
「xdoc2txt.exe」をRev 2.19.1 へ差し替えてから試しました。
■検索対象:
1行毎に1~1048576までの数値を書いたエクセルファイルとテキストファイル
■検索ツール
探三郎:v158
buttfly_search:2.8C
■結果:
・探三郎
エクセル:567898行まで検索可能
テキスト:123444行まで検索可能
・butterfly_search
エクセル:709842行まで検索可能
テキスト:1048576行まで検索可能
■わかったこと:
buttfly_searchはエクセルの変換時にxdoc2txt.exeを-iオプションを付与して呼び出していますが、ここでファイルの後半の情報が失われていました。
探三郎はxdoc2txt.exeで-iオプションを使用しておらず、情報損失はありませんでした。
が、その後のインデックス作成時に情報が失われているようでした。
■今後の対応
次のbuttfly_searchでは、xdoc2txt.exeから-iオプション(iFilter)を外したいと思います。
(副作用は未知ですが)