Subject: [linginfo06:00091] 2/2の授業内容 Date: 2007年1月26日 15:49:28:JST 皆さん 大名です。 2月2日の言語情報システム論の授業では,中日新聞記事データ集を例に, 以下のことを行います。 ■ 改行コードの処理   改行コードを揃える ■ 記事単位で処理する   レコードセパレータの変更 ■ 複数行にまたがるテキストを処理するときの注意   行をまたいだマッチング:m//, s/// 演算子の s, m オプション ■ 記事からID,日付などの情報を取り出す   マッチングによる部分文字列の参照 ■ データを記事単位でファイルに切り分け保存する   レコードセパレータの変更   部分文字列の参照と s/// 演算子の e オプションを利用したサプルーチンによる処理    ・サブルーチンによる文字種の変換 (全角→半角) ■ テキストの一部のみを対象として処理する   配列を利用した処理   部分文字列の参照と s/// 演算子の e オプションを利用したサプルーチンによる処理    ・サブルーチンによる文字種の変換 (片仮名→平仮名)    ・茶筌による解析 -- 名古屋大学大学院国際開発研究科 国際コミュニケーション専攻 大名 力 (Tsutomu OHNA)