古いファイルを扱う際の「文字コード」について

先日このブログで書きましたが、モバイル環境での利用ハードとして今後はchromebookというウェブブラウザ「chrome」上でほとんど全てのことをやるパソコンにLinuxを入れて使おうと思っています。そこで、改めて過去に作ったテキストファイルをchromebookで開こうとすると一部のネットサービスを使った際の表示や、Linux上でのファイルを表示しようとする時に一部のファイルが文字化けしてしまって、Windowsでは全く問題なく開けるものでもchromebook上では何が書いてあるのかわからないテキストファイルがあることに気付きました。

過去にUNIXの技術を取り入れる前のMacを使っていた時や、MacにWindowsパソコンを買い足してデータのやり取りに使っていた時にも同じような状況がありました。詳しい方はすでに何が問題かおわかりのことと思いますが、一般的に文字だけの情報が入っているに過ぎないテキストファイル(Wordのようにレイアウトなど雑多な情報がファイルには入っていないのでサイズが小さくて扱いやすいのです)でも他の環境の上で使うと文字化けにより見られなくなったり、入力した通りに表示されなかったりします。

WindowsとMac/Unixではそれぞれ「改行コード」が違いますので場合によっては文字揃えがおかしくなっている場合もありますし、古くから日本語を扱えるテキストエディタの中では現在主流の「UTF-8」という方式でない文字コードで作られているものも混在しているので、そうした古いファイルに限ってはchromebook上やLinuxのエディタでは表示されなかったりするのです。

これは長くテキストファイル中心に文章を書いていた私のようなパソコンの使い方をしている人にはよくあって、特にWindowsをずっと使い続けていた人が文字コードを「UTF-8」にしないまま(「シフトJIS」などの文字コード)でテキストファイルを他のOSを使っている人に送った時、相手に知識があってWindowsで作ったテキストファイルを自分の環境で正しく読めるように変換できる方ならいいのですが、送った先の環境ではうまくファイルを開くことができずにコミュニケーションがうまくいかないような事も起こってくるかも知れません。

私自身過去には「UTF-8」を扱えないテキストエディタを使っていたのですが、現在の私は文字コードで「UTF-8」を扱えるものに変更し、保存する際には改行コードを「LF」にしています。今後、複数のOSの間でファイルをやり取りしようと考えている方で、今まで書いた内容は今ひとつピンとこなかった方は、改めてネットで文字コードと改行コードについて調べるなど念のためファイルのやり取りをしても大丈夫か確認しておき、いざ他の環境で過去に書いたものを読もうとした場合に文字化けして読めなくならないようにご注意下さい。

どちらにしても、こんな話というのはなかなか人に教わることもなく、何となく手元にあるパソコンやソフトを使っているうちに慣れ切ってしまい、自分の環境を他の人も全て使っていると勘違いしているとなかなかその事に気付かず、トラブルが起こってから気付くようなところがあるので、その点も注意したいところです。

人によっては、知り合いから送られてきたテキストファイルを開いたら文字化けしていた場合、もしそれが文字コードの環境によって自分の環境で正しく表示されなかった事に過ぎないような場合でも、ウィルスを送られたと誤解するなどして、送った人からすると意味がわからない怒りの返信メールを送ってしまうような事もあるかも知れません。

パソコンやネット上の仕組みについても同じような事が言えますが、自分自身が知らないことに原因があったのかも知れないのに、確認することなく相手にその苛立ちを相手に直接向けてしまうと、もし自分の方に非があった場合、かなり気まずい状況になってしまいます。

こうした落とし穴にはまってしまうのは全くの初心者というよりも、中途半端に新しい知識をかじっただけで全てをわかったように思ってしまいがちになるところにその傾向があると思います。特にパソコンの機能というものは、入力したスペルが1つ違っただけでも正しく動かないのが当り前の世界なので、自分で間違えておいてパソコンに当たってしまうという事も起こりがちではありますが、やはりまだまだ基本的なパソコンの知識について知らないであろうことがあるということを意識しつつ、謙虚に事にあたっていくことが大切なのではないかと自戒を込めて思ったりするのです。


スポンサーリンク

コメントを残す