назад
29 ноября

Ученые предложили новый метод атрибуции литературных текстов

Ученые НГУ разработали метод атрибуции художественных текстов, основанный на «сжатии данных». Благодаря ему подтвердить или опровергнуть авторство можно с высокой статистической точностью.

Перед литературоведами нередко встает задача определить автора литературного текста. Многие слышали о «Шекспировском вопросе» и попытках выяснить, существовали ли великий драматург в действительности, или под этим псевдонимом трудилась группа авторов. Также у ученых до сих пор нет уверенности в авторстве знаменитого романа-эпопеи «Тихий Дон». Новый метод должен помочь решить эти загадки.

«Все экспериментальные науки представляют свои результаты, полученные в рамках математической статистики. Принципиальное отличие и новизна нашего метода – проведение экспериментов для исследования атрибуции литературных текстов в рамках проверки статистических гипотез, что дает возможность получать достоверные результаты при определении авторства того или иного текста. Из ограничений метода самое простое – объем анализируемого материала. Произведение должно быть достаточно большим, чтобы метод работал корректно и предоставлял результат с высокой точностью. Второе условие – наличие текстов, авторство которых точно известно, что необходимо для оценивания параметров анализа неидентифицированных текстов. В проведенных исследованиях эти условия выполнялись и вероятность ошибочных выводов (то есть ошибки при проверке гипотез) меньше 10 в степени -9», — рассказал доктор технических наук, профессор кафедры компьютерных систем факультета информационных технологий НГУ, сотрудник Федерального исследовательского центра информационных и вычислительных технологий СО РАН Борис Рябко.

Для экспериментов ученые НГУ взяли две литературных проблемы. Первая связана с утверждением ряда исследователей, что автором романов «Двенадцать стульев» и «Золотой теленок» является Михаил Булгаков, а не Ильф и Петров. Вторая проблема касается авторства различных частей романов «Три страны света» и «Мертвое озеро», которое приписывают Николаю Некрасову и Авдотье Панаевой.

В результате экспериментального исследования выяснилось, что авторство Михаила Булгакова в первом случае абсолютно исключено, а для романов «Три страны света» и «Мертвое озеро» были определены авторы различных частей.

В анализе данных произведений поучаствовала и студентка ФИТ НГУ Ангелина Щеголева. Она применяет разработку в другой области литературоведения — сравнении переводов англоязычных текстов с оригиналами.

«Корней Иванович Чуковский писал: «Перевод – это автопортрет переводчика». Научному руководителю и мне стало крайне интересно узнать, насколько стиль переводчика отражается в текстах, поэтому и появилась идея исследования. Хотя работа еще не закончена, уже можно заметить, что у различных переводчиков степень «сохранения стиля» оригинального произведения весьма различна, — прокомментировала Ангелина Щеголева.
  • #Лингвистика