正規化頻度法 文字列長 : 大 ====> 文字列の種類数 : 大 f(x) = f(y) であっても |x| < |y| ならば y の方が重要 文字列長に応じた出現頻度の補正が必要 正規化頻度(normalized frequency): Nf : 単調増加 ====> 長い文字列ほど高い評価値 Nf の大きい順に文字列を定型表現として獲得