◆サイトデータについて◆
サイトデータは細かく設定することもできますが、必要なのは2箇所、サイト名とURLだけです。とりあえずはこれだけでダウンロードできます(チェックを忘れないで下さい)。ただし、どうしても無駄な部分が多かったり、変に改行が入ってたりするので読みにくいテキストになりがちです。実用に絶えるテキストに整形するためには切り出し設定を工夫する必要があります。
◆基本的な切り出し設定◆
もっとも重要な切り出し設定は、切り出し開始文字列と終了文字列です。ほとんどのサイトはこれをうまく設定してやれば十分です。もちろん、「うまく」設定するためにはhtmlの知識が必要とされるので、あまり簡単ではありません。付属のサイトデータやあちこちのサイトで公開/配付されている切り出し(クリップ)設定を見てみるなどして試行錯誤して下さい。
◆高度な切り出し設定◆
基本的な設定以外の設定は二つに分けることができます。リンク系と変換系です。リンク系はニュースサイトのようなリンク集的なページを切り出すときに便利です。変換系は主に、邪魔な文字列の削除、見出し、画像対策、といった用途に使います。つまり、これらの設定次第ででき上がったテキストの読みやすさが大きく変わってくるわけです。
◆「下方向から切り出す」について◆
開始文字列→Mac→終了文字列→Visor→開始文字列→ぴるごむ→終了文字列
このオプションの名前からその機能を正確に理解するのは難しいかもしれません。そこで説明します。
このオプションがチェックされていると、ダウンロードしてきたテキストの最後から最初に向かって開始文字列を検索します。その後、通常通り最後に向かって終了文字列を検索します。ですので、
◆簡単に設定するには◆
これについてはここを見て下さい。