ここのところ、まとまった時間がとれないので、コーディングを行なうかどうかは別としてもKateのファイルの文字コード自動認識の実現に向けての検討を行なってみることにした。
コードベースはとりあえず、KDE_3_2_BRANCHで検討を行なうが、最終的にはHEADへのcommitになるだろう。
自動認識を行なう対象文字コードはUTF-8, EUC-JP, Shift_JIS, ISO-2022-JPの日本語関連のみとする。
Kate自体には現在のエンコードがデフォルトのままなのか、指定されたものなのかの区別をするためのコードは実装されていないため、それらやUIについての懸念材料はあるが、それはあと回しにする。
また、変更の方針としては以下の項目を考慮する。
- できるだけコードの変更箇所は小さくまとめる。
- ファイルからの読み込みは一度で済ませる方が良い。
- 他のアプリにも適用できないかも考慮。