Бесплатная Доставка от 65,- €

Аннотация: Методы статистического анализа литературных текстов

В настоящей книге излагается новый подход к решению некоторых задач математической лингвистики, основанный на использовании кинетических уравнений, описывающих эволюцию выборочных функций распределения текста по буквам. Этот подход сочетает в себе методы традиционной математической статистики и статистической механики, модифицированные для применения их к нестационарным временным рядам, каковыми являются последовательности букв в тексте.
Центральной задачей, решаемой в данной работе, является идентификация автора и жанра "условно неизвестного" литературного текста в библиотеке известных текстов. Построен высокоточный метод идентификации, использующий функционал близости текстов как распределений пар букв в определенной норме.
Анализируются также статистические свойства распространенных европейских языков. Для них установлено полуэмпирическое распределение алфавитных символов по частоте встречаемости, которое оказалось зависящим от двух параметров - количества букв в алфавите данного языка и их соответствия звуковому ряду. Рассмотрены конкретные примеры статистического решения некоторых спорных вопросов об авторстве того или иного текста.
Книга будет полезна лингвистам и литературоведам, а также математикам, специализирующимся в области прикладной математической статистики.

Читать далее →

Бесплатная Доставка по Европе (EU)*

*Для заказов свыше 40,- евро  Подробнее

Методы статистического анализа литературных текстов

  • Модель: MYSH2490100
  • ISBN 978-5-397-02314-6
  • Наличие:
    Нет в наличии
  • 4.9 (14 оценок)
Loading
Loading

Описание

В настоящей книге излагается новый подход к решению некоторых задач математической лингвистики, основанный на использовании кинетических уравнений, описывающих эволюцию выборочных функций распределения текста по буквам. Этот подход сочетает в себе методы традиционной математической статистики и статистической механики, модифицированные для применения их к нестационарным временным рядам, каковыми являются последовательности букв в тексте.
Центральной задачей, решаемой в данной работе, является идентификация автора и жанра "условно неизвестного" литературного текста в библиотеке известных текстов. Построен высокоточный метод идентификации, использующий функционал близости текстов как распределений пар букв в определенной норме.
Анализируются также статистические свойства распространенных европейских языков. Для них установлено полуэмпирическое распределение алфавитных символов по частоте встречаемости, которое оказалось зависящим от двух параметров - количества букв в алфавите данного языка и их соответствия звуковому ряду. Рассмотрены конкретные примеры статистического решения некоторых спорных вопросов об авторстве того или иного текста.
Книга будет полезна лингвистам и литературоведам, а также математикам, специализирующимся в области прикладной математической статистики.

Характеристики

Мы доставляем наши товары по всей Европе, включая страны ЕС, в том числе по Латвии, Эстонии, Литве, Германии, Италии, Франции, Нидерландам (Голландии), Бельгии, Австрии, Польше, Финляндии, Ирландии, Чехии, Швеции, Дании, Португалии, Греции, Болгарии, Словакии, Кипру, Словении, Венгрии, Люксембургу, Мальте, Румынии, Хорватии, а также по Израилю, Соединённым Штатам Америки (США), Великобритании, Швейцарии, Канаде, Норвегии. Подробнее...