備忘録
正規表現
正規表現の種類 (使える機能と表記,オプション)
ファイルの文字コードとツールの内部コード
漢字と正規表現
漢字1字にマッチする正規表現 その1 (Shift JIS)
漢字1字にマッチする正規表現 その2 (Unicode)
CJK互換漢字について
重複して登録されている漢字 (KS X 1001, Unicode)
外部リンク:
CJK互換漢字 - Wikipedia
「煕」の異体字について
(2007/11/1 公開)
2つの「〆」(非漢字の〆と漢字の乄)
文字コードと改行コード
UTF-16 テキストの処理
Shift JIS
Shift_JIS と CP932
外部リンク:
ShiftJIS::CP932::MapUTF - Microsoft CP-932とUnicodeとの変換
UNIX / dicom2
locale によるコマンドの動作の違い
locale と grep の正規表現の解釈
locale と sort, uniq
GNU grep 2.5 のバグ
dicom2:/corpus/ProjectGutenberg/ の改行コード問題
Mac で UNIX
中日新聞記事データ集
[linginfo06:00091] 2/2の授業内容
[linginfo06:00092] 1/26の授業の復習
重複IDの確認
[linginfo06:00094] 中日新聞記事データ集 同一ID記事比較
データの欠損
作成 2007/09/23
更新 2012/02/23