Темы Разделы Интересы Top 20
 |
| 1 |  Мы продолжаем серию семинаров по компьютерной лингвистике ABBYY Open. Очередное мероприятие пройдет 31 января в 17.00 в московском офисе ABBYY. Тема – «Сегментно-статистический подход к интернету как корпусу (на примере анализа блогосферы)». На семинаре выступит Владимир Беликов – доктор филологических наук, доцент Отделения теоретической и прикладной лингвистики филфака МГУ, ведущий научный сотрудник Института русского языка РАН.
Его доклад посвящен разумным методам извлечения достоверной лингвистической информации из интернета. В докладе проводится сравнительный анализ Национального корпуса русского языка и различных интернет-корпусов как источников сведений о русском лексическом узусе разного типа. На материале русских толковых словарей и отдельных лингвистических исследований анализируются типичные ошибки и неточности, ставшие результатом игнорирования современных корпусных методов в лексикографии.
Рассматривается сегментная структура русскоязычной блогосферы, демонстрируются разнообразные результаты ее анализа сегментно-статистическим методом при исследовании синхронного состояния и динамики изменений в общерусской и региональной лексике, фразеологии, грамматике. Детально излагается методика лингвистически ориентированного поиска в блогосфере и способы преодоления возникающих при этом трудностей.
Подробная информация и регистрация – на странице ABBYY Open. habrahabr.ru » | | 2 |  Всем привет! Сегодня у нас новость для лингвистов. 20 декабря в нашем московском офисе пройдет очередной семинар по компьютерной лингвистике ABBYY Open.
Семинар будет посвящен описанию структуры тезауруса русского языка РуТез, который представляет собой крупнейшую лингвистическую онтологию, используемую для автоматической обработки текстов. В докладе будет проведено сопоставление структуры тезауруса с другими подобными проектами: традиционными информационно-поисковыми тезаурусами, тезаурусами типа WordNet, формальными онтологиями. Будут рассмотрены приложения автоматической обработки текстов, в которых используется тезаурус РуТез.
Ведет семинар Наталья Лукашевич – кандидат физико-математических наук, ведущий научный сотрудник НИВЦ МГУ. Под ее руководством и при непосредственном участии разрабатываются такие лингвистические ресурсы, как Тезаурус русского языка РуТез, Онтология по естественным наукам и технологиям ОЕНТ, созданы онтологические ресурсы в конкретных предметных областях (компьютерная безопасность, авиационная сфера, банковское дело и др.). Данные ресурсы применяются в различных технологиях автоматической обработки текстов: автоматическое концептуальное индексирование, расширение поискового запроса, рубрицирование, автоматическое аннотирование отдельных документов и групп тематически близких документов, кластеризация документов.
Семинар начнется 20 декабря в 17.00. Подробная информация и регистрация – на странице ABBYY Open. habrahabr.ru » | | 3 |  В ближайший вторник, 24 мая, мы организуем в Москве семинар «Актуальные проблемы компьютерной лингвистики», посвящённый лингвистическому аннотированию текстов (корпусов). Мероприятие состоится в рамках серии открытых лекций и семинаров ABBYY Open.
Лингвистическое аннотирование является сегодня центральной темой, объединяющей интересы теоретических и компьютерных лингвистов. Разметка корпусов нужна как для задач машинного обучения систем Natural Language Processing (NLP), так и для получения собственно лингвистических результатов.
Приглашенные докладчики – известные специалисты в области компьютерной лингвистики Эдуард Хови (Eduard Hovy, University of Southern California/Information Sciences Institute) и Диана Маккарти (Diana McCarthy, Lexical Computing Ltd).
Подробную информацию о месте и времени проведения мероприятия, а также аннотации докладов вы можете прочитать здесь. Семинар бесплатный, для участия обязательно нужно зарегистрироваться и дождаться подтверждения регистрации.
Рабочий язык семинара – английский. habrahabr.ru » | | 4 |
Уважаемые читатели и писатели Хабра!
Хочу сказать спасибо всем участникам этого обсуждения за их искреннее желание сделать нашу страну лучше. Это видно во всех вопросах, заданных здесь, даже если они порой звучат жёстко и предубеждённо. Я посчитал важным ответить на вопросы, потому что ABBYY слишком давно не рассказывала о том, чем мы занимаемся, и как мы это делаем. А отсутствие информации порождает много нелепых догадок. Итак, время отвечать на вопросы.
В этих ответах я буду иногда отвлекаться к общим суждениям и общей информации, но не для того, чтобы что-то рекламировать, а чтобы лучше объяснить причины, лежащие в основе наших действий.
Начну с того, что компании ABBYY уже 21 год. Все это время мы делаем интересные продукты и технологии, известные во всём мире. Сейчас это продукты распознавания печатного и рукописного текста и словари. В будущем – это продукты, основанные на компьютерной лингвистике. Наши интересы не лежат в области потребления. Наши руководители и акционеры не ездят на роскошных автомобилях, не покупают яхт, вертолетов и дворцов, у нас нет дач на Рублевке. Нам интересно делать новые удивительные продукты, а не ходить по магазинам.
Читать дальше → habrahabr.ru » |
|
| |
|