入力
ファイルはブラウザ内で読み込みます。内容はサーバーに送信されません。
※「Shift_JIS」と言いつつ、Windows環境で実際に使われがちなCP932(Windows-31J)寄りの判定になることがあります。
取引先仕様が厳密な場合は、実データでの確認も併用がおすすめ。
こんな時に使う(現場あるある)
- 取引先から「CSVはShift_JISで」指定され、取り込みエラーが出る
- Excelで作ったCSVを送ったら、相手で「?」に置換されていた
- 備考欄や商品名に、絵文字・旧字体・機種依存記号が混ざっていた
まずはこのページで不可文字を特定 → 正規化 / 機種依存置換 / 旧字体統一 を併用すると安全です。
よくある質問
Shift_JISとCP932は同じですか?
実務ではほぼ同義で扱われますが、CP932はMicrosoft拡張を含みます。 取引先仕様により厳密なShift_JISが求められる場合があります。
なぜ文字化けが起きるのですか?
Shift_JISでは表現できない文字を含んだまま保存すると、 「?」に置換されたり別の文字に化けることがあります。
チェック後はどう対処すればよいですか?
正規化ツールで整形するか、 不可文字を削除・互換文字へ置換するのが一般的です。
なぜShift_JISで文字化けするの?
古い業務システムや取引先のCSV仕様では、UTF-8ではなく「Shift_JIS」での受け渡しが指定されることがあります。 ところがShift_JISには表現できない文字があり、そのまま保存すると「?」に置換されたり、別の文字に化けたりします。
Shift_JIS と Windows-31J(CP932)は何が違う?
実務で「Shift_JIS」と言っているものの多くは、Windowsで一般的な CP932(Windows-31J) を指します。 これはShift_JISをベースに一部文字を追加した拡張で、環境によって「出せる文字」が微妙に変わります。
- 取引先が“厳密なShift_JIS”を想定していると、Windowsで通った文字が相手側で落ちることがあります。
- 逆に、Windows前提のCP932拡張を含むと、他OSや古いミドルウェアで文字化けすることがあります。
よく事故る文字の例
- 絵文字(🙂など)
- 旧字体・異体字(﨑、髙 など)
- 機種依存っぽい記号(①、㈱、㎜、Ⅳ など)
- 波ダッシュ・ハイフン類の表記ゆれ(〜、―、- など)
このページのチェッカーで「不可」と出た文字は、CSV取り込み先でエラーや文字化けを起こす可能性があります。
対処法(現場で一番安全な順)
- 正規化(NFKC)して表記ゆれを減らす(→ 全角半角・記号 正規化)
- 機種依存文字を置換する(→ 機種依存文字 検出)
- 旧字体・異体字を統一する(→ 旧字体→新字体 変換)
- どうしても無理な文字は、「?」置換または削除(このページのボタン)
“このチェックがOKなら絶対安全?”
仕様や環境差(厳密なShift_JIS / CP932 / ミドルウェアの違い)で結果が変わることがあります。 重要なデータ連携では、相手先の取り込み環境でのテストも併用してください。
- Shift_JIS 文字化け
- CP932 Windows-31J 違い
- CSV 取り込み エラー 文字
- SJIS 変換できない 文字
- ? に置換 直す
- UTF-8禁止 CSV
- 基幹システム 文字コード