/pages/Seminars.aspx science/seminars/

Научные семинары и конференции

Цикл семинаров ABBYY Open

ABBYY Open — открытый семинар компании ABBYY по компьютерной лингвистике. Приглашенными докладчиками семинара, который проводится несколько раз в год, являются самые авторитетные специалисты в области автоматического анализа естественного языка. Это дает возможность российским специалистам, и в особенности — студентам вузов, получить адекватное представление о методах и общем уровне современной мировой компьютерной лингвистики из уст наиболее ярких ее представителей.

Цикл семинаров ABBYY Open

Когда и где
Семинары проводятся в московском офисе ABBYY, либо в расположенном неподалеку театре "Художественная школа" по адресу ул. Олонецкая, д.15а.

Количество мест на каждый семинар ограничено, поэтому для посещения мероприятия необходимо предварительно зарегистрироваться.

Прошедший семинар

Владимир Беликов

31 января 2012 17:00
Актуальные проблемы компьютерной лингвистики: «Сегментно-статистический подход к Интернету как корпусу (на примере анализа блогосферы)»

ВНИМАНИЕ: Для участия в семинаре необходимо зарегистрироваться

Доклад посвящен разумным методам извлечения достоверной лингвистической информации из Интернета.

В очередной раз утверждается, что широко распространенный метод получения интернет-статистики методом «гугления» бессодержателен. Без детализации демонстрируется антинаучность основанного на подобных приемах направления «гуманетика» [М. Эпштейн 2006]. Вопреки голословным утверждениям автора, его же методами легко продемонстрировать, что документов с упоминанием Пушкина «больше», чем таковых с Shakespeare’ом (скриншоты от 24.01.2011; есть аналогичные от 9.01.2011 и 10.08.2011):

belikov1     belikov1

В докладе проводится сравнительный анализ НКРЯ и различных интернет-корпусов как источников сведений о разнородном русском лексическом узусе.

На материале русских толковых словарей и отдельных лингвистических исследований анализируются типичные ошибки и неточности, ставшие результатом игнорирования современных корпусных методов в лексикографии.

Рассматривается сегментная структура русскоязычной блогосферы, демонстрируются разнообразные результаты ее анализа сегментно-статистическим методом при исследовании синхронного состояния и динамики изменений в общерусской и региональной лексике, фразеологии, грамматике.

Детально излагается методика лингвистически ориентированного поиска в блогосфере и способы преодоления возникающих при этом трудностей. Намечаются сегментно-статистические подходы к извлечению экстралингвистической информации из блогосферы, выявлению динамики культурных процессов среди блоггеров.

Место проведения
Московский офис ABBYY, ауд. 3-02

Расписание

16.30-17.00 Регистрация участников. Приветственный кофе-брейк
17.00-19.00 Доклад Владимира Беликова и дискуссия

Приглашенный докладчик
Владимир Беликов с докладом «Сегментно-статистический подход к Интернету как корпусу (на примере анализа блогосферы)»

Материалы для скачивания
Видеозапись семинара