«Лингвист — человек, за которым будущее»

В СПбГУ прошла первая Международная конференция «Литература, язык и компьютерные технологии LiLaC (Literature — Language — Computing: Russian Contribution)». С докладами на ней выступили представители различных вузов из России и из-за рубежа.

На открытии с приветственным словом выступил декан филологического факультета СПбГУ Михаил Корышев. Он отметил важность традиций в жизни Университета. «Я думаю, что сегодня мы с вами являемся свидетелями новой традиции: мы попробуем сделать так, чтобы то, чем обычно занимаются наши специалисты в области компьютерной лингвистики и речевых технологий, стало бы нашим общим достоянием», — сказал Михаил Витальевич. Он пояснил, что методы и результаты работы узких специалистов, собравшихся на конференции, могут быть полезны для исследователей из других сфер филологии.

Фотоотчет доступен в группе филологического факультета ВКонтакте.

Один из пленарных докладов — «Человек в цифровую эпоху: мозг и мир» — в рамках конференции представила директор Института когнитивных исследований СПбГУ профессор, член-корреспондент Российской академии образования Татьяна Черниговская. Она рассказала о стремительно ускоряющемся и изменяющемся мире, с которым человечество уже столкнулось. По мнению эксперта, эта новая реальность одновременно несет в себе угрозы и возможности.

«Если бы цифровых технологий не было, как бы мы выдержали ковид и локдаун? Если бы не было языковых баз данных — огромных хранилищ лексики, грамматики и так далее — что бы было? Нет лингвиста, который мог бы сам собрать такие данные, какие собраны, например, в Национальном корпусе русского языка», — отметила Татьяна Владимировна. Она добавила, что различные гаджеты и устройства действительно полезны для человека, однако без его участия они становятся бесполезными или даже опасными.

Технологии в цифровую эпоху могут поражать воображение и превосходить возможности людей. Так, например, существуют программы, способные обыграть в шахматы даже гроссмейстеров. «При игре в шахматы новейшие системы научились загонять противника в цугцванг, в ситуацию, когда человек уверен, что выигрывает и все в порядке, а система ведет его туда, откуда он уже не может выбраться. Это делается не алгоритмическим путем — это что-то вроде интуиции», — объяснила Татьяна Черниговская. Более того, компьютерные программы способны обыгрывать человека не только в шахматы, но и в такие игры, как го или покер.

Вместе с тем, по мнению ученого, искусственный интеллект все же не сможет освоить все, что подвластно человеческому разуму. «Для нас, лингвистов, понятно, что любой текст интерпретируется в зависимости от тысячи контекстов: кто писал, когда писал, кто читает, что они оба знают, какое у них мировоззрение. Поэтому надеяться на то, что системы машинной обработки текстов все сделают совершенно правильно, не стоит. Они очень мощные, в них закладывается способность играть с контекстами, но поэзия Бродского или Пастернака им будет не по зубам», — считает она. Более того, Татьяна Черниговская высоко оценила роль специалистов в области лингвистики в будущем. «Основная задача человеческого мозга — создавать смыслы. По сути, лингвист — человек, за которым будущее, потому что ему придется иметь дело с понятиями, которых еще не было на Земле», — заключила докладчик.

Подводя итог доклада о человеке в цифровую эпоху, профессор Татьяна Черниговская еще раз обратила внимание слушателей на проблемы и угрозы, с которыми столкнулось человечество в новой реальности: верификация информации, развитие искусственного интеллекта и опасность того, что он «обгоняет» человеческий, самые разные киберугрозы и так далее. «Нам нужно немного притормозить, перестать нестись и подумать. Постараться разобраться в том мире, в который мы попали, и не добавлять в него хаоса — хаоса в нем и так хватает», — подытожила она.

Другой пленарный доклад был посвящен машинному переводу в системе коммуникации и образовательном пространстве. Его представила профессор РГПУ имени А. И. Герцена, выпускница ЛГУ Лариса Беляева. Она затронула тему истории машинного перевода (в 2022 году исполнилось 75 лет с момента первых идей исследователя Уорена Вивера, основанных на теории информации, успехах взлома кодов во время Второй мировой войны и теориях об универсальных принципах, лежащих в основе естественного языка), рассказала о современных требованиях к технологическому процессу перевода, а также обозначила актуальные проблемы, связанные с машинным переводом.

Так, например, по мнению специалиста, в российских университетах при подготовке переводчиков недостаточно времени уделяется обучению редактированию текстов. Кроме того, многие преподаватели выступают против использования машинного перевода студентами, в частности иностранцами. Лариса Беляева же считает, что такие системы необходимо учитывать в образовательном процессе. «Преподавателям не нужно закрывать глаза и делать вид, что этого нет. Нужно учить пользоваться системами машинного перевода и искать эффективные способы их использования», — пояснила профессор.

Доцент РГГУ Александр Пиперски представил результаты исследования, посвященного лексическому разнообразию русских поэтов. «Я с большим удовольствием уже много лет занимаюсь изучением поэтического подкорпуса Национального корпуса русского языка. И надеюсь, что результаты этой работы могут действительно заинтересовать широкую публику, которая увлекается русской поэзией», — пояснил он.

Исследователем с помощью различных подходов и методик были проанализированы тексты 183 авторов, живших в XVIII–XXI веках. Спикер пришел к выводу, что лексическое разнообразие возрастает на протяжении истории русской поэзии, что, вероятно, связано с расширением тематики. Именно из-за тематик у авторов-женщин оно ниже, чем у мужчин, при этом женщины отличаются от мужчин по разнообразию используемых существительных и глаголов, но не прилагательных.

О конференции

Конференция «Литература, язык и компьютерные технологии LiLaC (Literature — Language — Computing: Russian Contribution)» в этом году проводится впервые. Цель мероприятия — предоставить возможность для научного диалога специалистам, использующим компьютерные технологии при изучении русского языка и русской литературы, а также в сопоставительных исследованиях на материале различных языков.

Материал также опубликован на сайте СПбГУ.

относится к: