Разметка и возможности поиска. Корпус имеет метаразметку, что позволяет получать информацию об употреблении языковых единиц по отдельным жанрам, периодам и т.п. Также есть морфологическая разметка. Возможен поиск как по словоформе, так и по лемме, а также по грамматической информации. Доступна информация о частотном распределении языковых единиц (о плотности распределения), а также информация о коллокациях.
История создания.
Предпосылками для создания корпуса послужили такие факторы, как отклонение современного чешского от принятых норм (создание корпуса помогло бы удержать чешскую лексикографию от неизбежных отклонений) и стабилизация политической ситуации (более широкое сотрудничество с международным научным сообществом помогло перекочеванию компьютерной лексикографии и корпусной лингвистики, как отдельных ветвей, в чешскую лингвистику). Тогда в 1994 году Институт Чешского Национального Корпуса был создан при Факультете философии Карлова Университета, а также были подписаны соглашения о сотрудничестве с некоторыми институциями Чехии
Идея CNK была впервые выдвинута в 1991 году и поддержана подписавшимися под ней представителями следующих институций: Факультета философии Университета имени Карла, Факультета математики и физики Университета имени Карла, Масарикова университета, Университета Палацкого, Института чешского языка Академии Наук Чешской Республики (англ.)
Комментариев нет:
Отправить комментарий