« org.ccil.cowan.tagsoup の情報求む | Main | tagsoup カスタム版 »
先のエントリ「org.ccil.cowan.tagsoup の情報求む」でドキュメントを探していた org.ccil.cowan.tagsoup パッケージだが、ドキュメントはなかったのだがソースはあった。
なんと、そのソースを読むと非 7 bit の文字は問答無用で実体参照にしていた。org.ccil.cowan.tagsoup を使う限りどうしようもないというわけだ。
そうなると取るべき手段は次のどれかだろう。
どれにしようかなあ。
全くどうしようもないというわけでもなさそうだ。ソースを読むとテキスト部分を CDATA としてしまえば実体参照にはならなように見える。しかしエントリを書くのに全てのテキストを <![CDATA[ と ]]> で挟むのはいくら僕でも苦痛だ。Thingamablog 内で一時的に付けて外すというのも面倒だ。というよりもそれができるのなら終了タグの欠落を補うコードを自前で書いた方が遥かにましだ。