
Применение машинного обучения для смыслового анализа текста
255
ции сообщений электронной почты от спама (см. «Words versus character n-grams for
anti-spam fi ltering» by Ioannis Kanaris, Konstantinos Kanaris, Ioannis Houvardas,
and Efstathios Stamatatos, International Journal on Artificial Intelligence Tools, World
Scientifi c Publishing Company, 16(06): 1047–1067, 2007).
В соответствии с концепцией n-граммного предста вления 1-граммное и 2-граммные
представления нашего первого предложения «the sun is shining» будут построены
следующим образом:
• 1-грамма: «the», «sun», «is», « shining»;
• 2-грамма: «the sun», ...