揮発性のメモ2

知識をメモ書きしておく

①〜 SHIFT_JISX0213 か CP932

iconvで、丸数字や波線をSJISからUTF8に変換できないので CP932 か SHIFT_JISX0213 を指定する

marusuuji: ①
namidash: 〜
tilde: ~
$ iconv -f sjis marusuuji.txt
marusuuji: iconv: 位置 11 で不正な入力シーケンスがありました
$ iconv -f cp932 marusuuji.txt
marusuuji: ①
namidash: 〜
tilde: ~
$ iconv -f SHIFT_JISX0213 marusuuji.txt
marusuuji: ①
namidash: 〜
tilde: ‾

CP932指定でもだいたいいけるけど、一部まだおかしな文字があるそうだけど、SHIFT_JISX0213 はチルダ ~ がちょっとおかしくなる(‾になる)ので、やっぱりCP932が無難そう


ていうか 〜 が 〜 にされるのはちょっと納得しがたいのでやっぱりCP932を選択するしかない
もしくは、まず SHIFT_JISX0213 で変換し、そのあとに納得しがたい変換をsedで直す、か。