← legacy tools

Shift_JIS・CP932・UTF-8の違いと文字化けの原因

PC-98

「Shift_JISで送ってと言われた」「CP932って何?」「UTF-8じゃダメなの?」 実務で混乱しやすい文字コードの違いを、できるだけ現場目線で整理します。

まず結論(超ざっくり)

名称 特徴 よくある現場
UTF-8 世界標準。絵文字もOK。可変長(日本語は主に3バイト)。 Web、最近のシステム
Shift_JIS 古い日本語向け。表現できない文字がある。 古い基幹、取引先CSV指定
CP932(Windows-31J) Windows版Shift_JIS拡張。実務での「SJIS」はこれを指すことが多い。 Excel保存、Windows環境

なぜ文字化けが起きる?

文字コードが違う状態でデータを解釈すると、同じバイト列でも 別の文字として読まれてしまいます。

特にCSV連携では、保存時のエンコーディング設定が原因になることが多いです。

よく事故る文字の例

これらは Shift_JIS不可文字チェッカーCSV列ごと監査ツール で確認できます。

安全にCSVを渡すための実務フロー

  1. まず NFKC正規化 で表記ゆれを減らす
  2. 機種依存文字 を推奨表記へ
  3. 旧字体を統一
  4. SJIS不可チェック
  5. 必要なら 修正版CSVを生成
取引先仕様が「Shift_JIS」とだけ書かれている場合、CP932前提かどうかも確認できると安心です。

関連キーワード

Legacy Tools
レガシー日本語ツールの一覧
©Step to you Corporation.
プライバシー・お問い合わせ