入力
こんな時に使う(現場あるある)
- 全角英数や記号ゆれで、検索や名寄せがうまく一致しない
- ハイフン(-/-/―)や波ダッシュ(〜)が混ざって、比較がずれる
- CSV取り込み前に、とりあえず事故率を下げたい
正規化は“まず最初にやる整形”として優秀です。 それでも落ちるなら SJIS不可チェック へ。
よくある質問
NFKC正規化とは何ですか?
Unicodeの互換正規化形式の一つで、全角英数や丸囲み数字などを 標準的な表記に変換します。データ整形や検索精度向上に役立ちます。
正規化すると意味が変わることはありますか?
一部の記号やローマ数字などは見た目が変わることがあります。 元データを保持したい場合はバックアップを推奨します。
なぜ事前に正規化すると安全なのですか?
表記ゆれや互換文字を統一することで、 CSV取り込みエラーやシステム検索の不一致を防げます。
CSVで困っている場合はこちら
CSV安全化 総合ガイドへ
関連キーワード(よく検索される)
- NFKC 正規化 とは
- 全角 半角 変換
- 表記ゆれ 統一
- 波ダッシュ 〜 統一
- ハイフン - ― 統一
- 丸囲み数字 ① 変換
- ローマ数字 Ⅳ 変換
出力
何が起きる?
- 全角英数や全角カッコ類を半角に(例:ABC123 → ABC123)
- 丸囲み数字や単位記号などを互換文字へ(例:① → 1、㈱ → (株) など)
- ハイフン類の統一(例:−—― → -)