Ученые НГУ разработали метод атрибуции художественных текстов, основанный на «сжатии данных». Благодаря ему подтвердить или опровергнуть авторство можно с высокой статистической точностью.
Перед литературоведами нередко встает задача определить автора литературного текста. Многие слышали о «Шекспировском вопросе» и попытках выяснить, существовали ли великий драматург в действительности, или под этим псевдонимом трудилась группа авторов. Также у ученых до сих пор нет уверенности в авторстве знаменитого романа-эпопеи «Тихий Дон». Новый метод должен помочь решить эти загадки.«Все экспериментальные науки представляют свои результаты, полученные в рамках математической статистики. Принципиальное отличие и новизна нашего метода – проведение экспериментов для исследования атрибуции литературных текстов в рамках проверки статистических гипотез, что дает возможность получать достоверные результаты при определении авторства того или иного текста. Из ограничений метода самое простое – объем анализируемого материала. Произведение должно быть достаточно большим, чтобы метод работал корректно и предоставлял результат с высокой точностью. Второе условие – наличие текстов, авторство которых точно известно, что необходимо для оценивания параметров анализа неидентифицированных текстов. В проведенных исследованиях эти условия выполнялись и вероятность ошибочных выводов (то есть ошибки при проверке гипотез) меньше 10 в степени -9», — рассказал доктор технических наук, профессор кафедры компьютерных систем факультета информационных технологий НГУ, сотрудник Федерального исследовательского центра информационных и вычислительных технологий СО РАН Борис Рябко.
Для экспериментов ученые НГУ взяли две литературных проблемы. Первая связана с утверждением ряда исследователей, что автором романов «Двенадцать стульев» и «Золотой теленок» является Михаил Булгаков, а не Ильф и Петров. Вторая проблема касается авторства различных частей романов «Три страны света» и «Мертвое озеро», которое приписывают Николаю Некрасову и Авдотье Панаевой.
В результате экспериментального исследования выяснилось, что авторство Михаила Булгакова в первом случае абсолютно исключено, а для романов «Три страны света» и «Мертвое озеро» были определены авторы различных частей.
В анализе данных произведений поучаствовала и студентка ФИТ НГУ Ангелина Щеголева. Она применяет разработку в другой области литературоведения — сравнении переводов англоязычных текстов с оригиналами.
«Корней Иванович Чуковский писал: «Перевод – это автопортрет переводчика». Научному руководителю и мне стало крайне интересно узнать, насколько стиль переводчика отражается в текстах, поэтому и появилась идея исследования. Хотя работа еще не закончена, уже можно заметить, что у различных переводчиков степень «сохранения стиля» оригинального произведения весьма различна, — прокомментировала Ангелина Щеголева.
Вам может быть интересно
10 августа
В Новосибирске состоится IX Международный форум технологического развития «Технопром-2022»
8 августа
Победитель «Лидеров России» предлагает создать команду ученых для интенсивного импортозамещения в химической промышленности
5 августа
Экскурсии «Наука рядом»: в июле школьники узнали, как создают вакцины, увидели строительство судов и сыграли роботами в лазертаг