Обзор использования английского языка - Survey of English Usage

В Обзор использования английского языка был первым исследовательским центром в Европе, который проводил исследования с корпус. Исследование проводится на кафедре английского языка и литературы по адресу: г. Университетский колледж Лондона.

История

Обзор использования английского языка был основан в 1959 г. Рэндольф (теперь лорд) Причуда. Многие известные лингвисты проводили время, проводя исследования в Survey, в том числе Бас Аартс, Валери Адамс, Джон Альгео, Дуайт Болинджер, Ноэль Бертон-Робертс, Дэвид Кристал, Дерек Дэви, Ян Фирбас, Сидни Гринбаум, Лилиан Хегеман, Роберт Илсон, Рут Кемпсон, Джеффри Лич, Ян Русецки, Ян Свартвик и Джо Таглихт. Текущий директор - Бас Аартс.[1]

Оригинал Корпус обзора предшествовал современным вычислениям. Это было записано на катушке, переписано на бумагу, сохранено в картотеке и проиндексировано на бумажных карточках. Транскрипции снабжены подробными аннотациями. просодический и паралингвистический аннотация, разработанная Кристаллом и Куирком (1964).[2] Наборы бумажных карточек вручную аннотировали грамматические структуры и регистрировали, так что, например, все словосочетания можно было найти в картотеке именных фраз в Обзоре. Естественно, что для поиска по корпусу требовалось посещение Обзора.

Этот корпус теперь более известен как Лондон-Лунд Корпус (LLC), поскольку компьютеризация корпуса была ответственностью сотрудников из Лунда, Швеция. Тридцать четыре из устных текстов были опубликованы в виде книги как Svartvik and Quirk (1980),[3] и корпус послужил основой для знаменитой книги Комплексная грамматика английского языка (Галтель и другие. 1985).[4]

Текущее исследование

Построение корпуса

В 1988 году Сидни Гринбаум предложил новый проект, ЛЕД, то Международный корпус английского языка. ICE должен был стать международным проектом, осуществляемым в исследовательских центрах по всему миру, по составлению корпусов английских разновидностей, где английский был первым или вторым официальным языком. Тексты ICE будут содержать разговорный и письменный английский в сбалансированной выборке из миллиона слов на компонент, чтобы эти образцы можно было сравнивать самыми разными способами. Проект ICE продолжается по всему миру и по сей день.

ICE-GB, британский компонент ICE, был составлен в ходе обзора. ICE-GB был аннотирован на очень подробном уровне, включая построение полного грамматического анализа (синтаксического анализа) для каждого предложения в корпусе. Первый выпуск ICE-GB состоялся в 1998 году. ICE-GB распространялся с программным обеспечением для поиска и изучения проанализированный корпус называется ICECUP. Релиз 2 ICE-GB уже выпущен и доступен на компакт-диске.

Помимо контрастных разновидностей английского языка, многие исследователи интересуются развитием языка и его изменениями со временем. Недавний проект Survey предпринял анализ большой (400 000 слов) выборки речевой части LLC способом, прямо сопоставимым с ICE-GB, с образованием нового диахронического корпуса из 800 000 слов, названного Diachronic Corpus of Present- Дневной разговорный английский (DCPSE). DCPSE уже выпущен и доступен на компакт-диске в Survey.

Эти два корпуса составляют самую большую в мире коллекцию проанализированных и исправленных, орфографически расшифрованных данных разговорного английского языка с более чем одним миллионом слов разговорного английского языка в этой форме.

Изучение корпусов

Разобранные корпуса большие базы данных, содержащие подробные грамматические древовидные структуры. Одним из последствий формирования больших коллекций ценных лингвистических данных является острая потребность в методах и инструментах, которые помогут исследователям и другим пользователям максимально использовать их. Таким образом, параллельно с анализом данных на естественном языке команда Survey провела исследование и разработку программных инструментов, чтобы помочь лингвистам использовать эти корпуса. Исследовательская платформа ICECUP использует интуитивно понятное грамматическое представление запроса, называемое Fuzzy Tree Fragments (FTF), для поиска в проанализированных корпусах.

Лингвистические исследования с корпусами

А также распространение корпусов и инструментов среди корпусная лингвистика исследовательское сообщество, SEU проводит исследования по английскому языку. Недавние проекты включают исследования английской словосочетания существительное, подчиненности в устной и письменной речи и английской глагольной фразы. Обзор также оказывает поддержку аспирантам, которые проводят исследования корпусов английского языка.

Рекомендации

  1. ^ «Исследовательский персонал». Университетский колледж Лондона. Получено 14 ноября 2016.
  2. ^ Кристалл, Дэвид и Куирк, Рэндольф (1964). Системы просодических и паралингвистических признаков в английском языке. Гаага: Мутон.
  3. ^ Свартвик, Ян и Куирк, Рэндольф (1980) (ред.). Корпус разговорной речи на английском языке Лунд: CWK Gleerup.
  4. ^ Куирк, Рэндольф, Гринбаум, Сидни, Пиявка, Джеффри и Свартвик, Ян (1985). Комплексная грамматика английского языка Лондон: Лонгман.

внешняя ссылка