AurigaDoclet日本語対応

問題発生。JTidyというHTML→XML変換ライブラリが、マルチバイト文字を考慮してない模様です・・・。このライブラリはAurigaDocletの中では、javadocコメント内のHTML表記をパースして、不要なタグを除去するために使用されています。この処理自体を省いてしまっても実用上は大して問題ないと思うのですが、ダウングレードするような感じで嫌だなあ。

Tidy#parseDOM()という、HTMLからDOMツリーを構築するメソッドが引数にInputStream, OutputStreamをとるようになっているのが致命的にマズイような気がします。これだと、byte単位の処理しかできないですよね?(自信なし)