2月 112004
 

日本語自動認識QTextCodec(QAutoJpCodec)を用いたKateの日本語の自動認識の実装についていろいろと検討はしていたものの、QTextStreamを通じてQAutoJpCodecを用いた文字コード判別が実装できたとしても、Qt自体の改造を伴うわりには認識精度が十分に確保できるとは思えない。
というわけで、実装方針を変更することとした。以前のエントリーで書いた項目の1番「Kateの読み込み箇所の変更」だけで対処を行なう。
QTextStreamの変更での実装も不可能ではないと思うが、どちらにせよ読み込み後に認識コードの取得作業があるため、各アプリの修正が必要であり、QTextStreamの変更を行なった場合の副作用を考慮すると変更を行なうことによる悪影響が無視できるとは思えなかったためだ。
その代わり、認識コードのクラス化を行ない、文字コードの判定は可能な限り遅らせ精度を高める。認識コードのクラス化についてはkzk氏が既にKDE(CVS-HEAD)の方でkdelibs/khtml/misc/guess_ja.{h,cpp}で行なっているが、kate用にいくつかの機能を実装したいため、独自に行なうこととした。

Continue reading »