2011年09月26日

文字コードではまる

WORDのデータを整形して、csvにして欲しいと頼まれた。
とりあえず、テキストエディタにコピーして、正規表現で何とか整形する事ができた。全てUTFで作業していた。

さて、そのデータをExcelに貼り付けて、カラム数が合っているか等チェックして、CSV形式で保存した。
ここに、失敗があった。word→テキストエディタは意識してUTFを気にかけていたものの、Excel→CSVの確認を忘れていた。
officeは内部コードをUTFで処理するようになったというのが、変に意識に残っていたのかもしれない。

cp932では表現できない文字コードが含まれていたため、後の処理で引っかかってしまった。

ExcelもCSVで保存する時に、そういったメッセージは出ないしなぁ。

エディタで、特定の文字を置換して切り抜けましたゎ〜
posted by baniko at 23:37| Comment(1) | TrackBack(0) | Mac | このブログの読者になる | 更新情報をチェックする
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。