← legacy tools

Shift_JIS 不可文字チェッカー

Shift_JIS(※実装上はCP932寄り)で表現できない文字をハイライトします。

関連ツール

入力

ファイルはブラウザ内で読み込みます。内容はサーバーに送信されません。

※「Shift_JIS」と言いつつ、Windows環境で実際に使われがちなCP932(Windows-31J)寄りの判定になることがあります。
取引先仕様が厳密な場合は、実データでの確認も併用がおすすめ。

こんな時に使う(現場あるある)

まずはこのページで不可文字を特定 → 正規化 / 機種依存置換 / 旧字体統一 を併用すると安全です。

よくある質問

Shift_JISとCP932は同じですか?

実務ではほぼ同義で扱われますが、CP932はMicrosoft拡張を含みます。 取引先仕様により厳密なShift_JISが求められる場合があります。

なぜ文字化けが起きるのですか?

Shift_JISでは表現できない文字を含んだまま保存すると、 「?」に置換されたり別の文字に化けることがあります。

チェック後はどう対処すればよいですか?

正規化ツールで整形するか、 不可文字を削除・互換文字へ置換するのが一般的です。

なぜShift_JISで文字化けするの?

古い業務システムや取引先のCSV仕様では、UTF-8ではなく「Shift_JIS」での受け渡しが指定されることがあります。 ところがShift_JISには表現できない文字があり、そのまま保存すると「?」に置換されたり、別の文字に化けたりします。

Shift_JIS と Windows-31J(CP932)は何が違う?

実務で「Shift_JIS」と言っているものの多くは、Windowsで一般的な CP932(Windows-31J) を指します。 これはShift_JISをベースに一部文字を追加した拡張で、環境によって「出せる文字」が微妙に変わります。

  • 取引先が“厳密なShift_JIS”を想定していると、Windowsで通った文字が相手側で落ちることがあります。
  • 逆に、Windows前提のCP932拡張を含むと、他OSや古いミドルウェアで文字化けすることがあります。
よく事故る文字の例
  • 絵文字(🙂など)
  • 旧字体・異体字(﨑、髙 など)
  • 機種依存っぽい記号(①、㈱、㎜、Ⅳ など)
  • 波ダッシュ・ハイフン類の表記ゆれ(〜、―、- など)

このページのチェッカーで「不可」と出た文字は、CSV取り込み先でエラーや文字化けを起こす可能性があります。

対処法(現場で一番安全な順)
  1. 正規化(NFKC)して表記ゆれを減らす(→ 全角半角・記号 正規化
  2. 機種依存文字を置換する(→ 機種依存文字 検出
  3. 旧字体・異体字を統一する(→ 旧字体→新字体 変換
  4. どうしても無理な文字は、「?」置換または削除(このページのボタン)
“このチェックがOKなら絶対安全?”

仕様や環境差(厳密なShift_JIS / CP932 / ミドルウェアの違い)で結果が変わることがあります。 重要なデータ連携では、相手先の取り込み環境でのテストも併用してください。

CSVで困っている場合はこちら
CSV安全化 総合ガイドへ
関連キーワード(よく検索される)
  • Shift_JIS 文字化け
  • CP932 Windows-31J 違い
  • CSV 取り込み エラー 文字
  • SJIS 変換できない 文字
  • ? に置換 直す
  • UTF-8禁止 CSV
  • 基幹システム 文字コード

結果

不可文字一覧(ユニーク)

Legacy Tools
レガシー日本語ツールの一覧
©Step to you Corporation.
プライバシー・お問い合わせ