とりあえず、テキストエディタにコピーして、正規表現で何とか整形する事ができた。全てUTFで作業していた。
さて、そのデータをExcelに貼り付けて、カラム数が合っているか等チェックして、CSV形式で保存した。
ここに、失敗があった。word→テキストエディタは意識してUTFを気にかけていたものの、Excel→CSVの確認を忘れていた。
officeは内部コードをUTFで処理するようになったというのが、変に意識に残っていたのかもしれない。
cp932では表現できない文字コードが含まれていたため、後の処理で引っかかってしまった。
ExcelもCSVで保存する時に、そういったメッセージは出ないしなぁ。
エディタで、特定の文字を置換して切り抜けましたゎ〜