まず何をすればいい?(おすすめ手順)
- 列ごと集計で地雷列を特定(→ CSV列ごとSJIS不可文字 集計)
- 必要なら NFKC正規化(→ 正規化ツール)
- 機種依存(①㈱㎜)を置換(→ 機種依存文字検出)
- 旧字体・異体字(﨑髙)を統一(→ 旧字体→新字体)
- 最終手段:SJIS不可を 「?」置換 or 削除(→ SJISチェッカー)
※ 取引先が「厳密なShift_JIS」を要求する場合、Windows(CP932)で通る文字でも相手側で落ちるケースがあります。重要案件は相手環境でのテストも併用が安心。
よくある症状→最短リンク
CSV取り込みで「不正な文字」「変換できない文字」エラーが出る
まずは 列ごと集計ツール で原因列を特定 → 修正版CSVを生成して再取り込みがおすすめです。
取引先が「Shift_JISで送って」と言う(UTF-8禁止)
Shift_JIS不可文字チェッカー で本文/列をチェック。 事前に NFKC正規化 をかけると事故が減ります。
①㈱㎜Ⅳなどの記号が相手で化ける
機種依存文字検出 で見つけて推奨表記に置換。 CSV修正版生成の中でも自動置換が使えます。
﨑/髙/德/澤など、人名・地名の文字が混在して名寄せできない
旧字体→新字体 変換 で統一してから、CSV修正版生成へ。
文字数制限やバイト制限に引っかかる
文字数・バイト数カウンター で UTF-8 / SJIS / EUC-JP のサイズを比較できます。
チェック観点(現場メモ)
- 不可視文字:ゼロ幅スペース / NBSP / 改行混在(→ 不可視文字ツール)
- 表記ゆれ:全角英数 / ハイフン類 / 波ダッシュ(→ 正規化)
- 機種依存:①㈱㎜Ⅳ(→ 機種依存検出)
- 旧字体/異体字:﨑髙澤德(→ 旧字体変換)
- SJIS制約:保存/取り込み先がShift_JIS指定(→ SJISチェッカー)
/tools/legacy/csv-safety/
今すぐやるなら
列ごと集計&修正版を作る 本文をSJISチェック更新ログ
- v0.1:列ごとSJIS不可文字 集計&修正版ダウンロード追加
- v0.2:機種依存文字 推奨置換を統合
- v0.3:旧字体→新字体 変換を統合
- v0.4:文字数・バイト数カウンター追加
※ 今後も実務で出た“事故パターン”を随時追加予定。
関連キーワード(よく検索される)
- CSV 文字化け 直し方
- Shift_JIS CSV 作り方
- CP932 とは
- 機種依存文字 CSV
- 旧字体 名寄せ
- SJIS 変換 エラー
- 基幹システム 文字コード