Навчальний посібник Вид-во жду ім. І. Франка Житомир 2013




Сторінка7/7
Дата конвертації25.12.2016
Розмір2.83 Kb.
ТипНавчальний посібник
1   2   3   4   5   6   7
Part-of-speech tagging (POS
tagging)
is a form of annotation that lies in adding part-of-speech tags to a text.
ча
ст
ино
мо
вн
а
ро
зм
іт
ка

Частиномовна розмітка
– це тип розмітки, що полягає у внесенні до корпусу морфологічних міток, які включають не тільки ознаки частини мови, але й ознаки граматичних категорій, властивих даній частині мови.
pe
da
g
o
g
ic
c
o
rpus

A pedagogic corpus is used for language teaching and consists of all of the language to which a learner has been exposed in the classroom; for example, the texts and exercises that the teacher has used.
пе
даг
ог
ічний
кор
пус

Педагогічний
корпус
використовується для навчання мові та включає навчальні тексти.
ra
w
co
rp
u
s
A raw corpus has not been processed in any way, it contains no annotation.
нео
бр
об
лений
(неа
но
то
ва
ни
й)

кор
пус

Необроблений
(неанотований) корпус не містить анотації.
136

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
sa
mp
le
co
rp
u
s
Sample corpus is a small section of a corpus that has been constructed or annotated for demonstration purposes, before the full corpus exists or has been annotated or a subset of the texts in the corpus that is released for free or at a very low price is referred to as a sample corpus.
ча
ст
ина
ко
рп
усу
д
ля

дем
онст
ра
ці
ї
мо
ж
ливо
ст
ей
всь
ог
о
ко
рп
усу

sema
n
ti
c
ta
g
g
er

Semantic tagger is a piece of software that attaches codes to words based upon their semantic function.
сем
ант
ич
ний
т
ег
ер

Семантичний тегер – це комп’ютерна програма, що приписує семантичні теги, які позначають семантичні категорії, до яких відноситься дане слово або словосполучення, а також більш вузькі підкатегорії, що специфікують значення.
sp
eci
a
li
zed
c
o
rp
u
s
A specialized corpus has been designed for a particular research project.
спеці
ал
ізо
ва
ний
кор
пус

Спеціалізований корпус – це жанрово чи галузево специфічний корпус, що має на меті відобразити певну підмову.
spo
ke
n
co
rpu
s
A spoken corpus consists entirely of transcribed speech
(e.g. spontaneous informal conversations, meetings, debates, classroom situations etc.).
ко
рп
ус
усно
го

мо
вл
енння

Корпус усного мовлення
– це спеціальна колекція ретельно відібраних текстових уривків (слів, фраз, речень), вимовлених численними мовцями за різних акустичних умов.
137

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
sta
ti
c
co
rp
u
s
A static corpus is intended to be of a particular size – once that target is reached, no more texts are included in it.
ст
ат
ичний
кор
пус

Статичний корпус не передбачає поповнення новими матеріалами.
to
ke
n

Token is any single, particular instance of an individual word in a text or corpus.
то
кен

Токен – це окрема значима одиниця.
to
k
en
is
at
ion

Tokenisation is the automatic process of converting all of a text into separate tokens.
то
кені
за
ці
я
Токенізація – це розбиття потоку символів природної мови на окремі значимі одиниці (токени, словоформи).
w
ri
tte
n
c
o
rp
u
s
A written corpus contains texts that have been produced or published in written format
(e.g. traditional books, novels, textbooks, newspapers, magazines or unpublished letters and diaries etc.).
ко
рп
ус
писем
но
го

мо
вл
ення

Корпус
писемного
мовлення містить лише текти писемного варіанту мови.
138

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
Предметний покажчик

автентичність автоматичне вирівнювання текстів анотація; розмітка архів; сховище варіативність відібраність дані корпусу дослідження, базовані на корпусі; корпуснобазовані дослідження дослідження, що управляються корпусом; корпуснокеровані дослідження емпричні дані збалансованість картотека ключове слово в контексті (KWIC) кодування колігація колокація комп’ютерна лінгвістика конкорданс конкордансер (корпусний менеджер) корпус загальномовний к. (національний к.)
139

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
збалансований к. діалектного мовлення к. діахронічний к. динамічний к. (моніторинговий к.) дослідницький к.
ілюстративний к.
інтерпретаційний к. моніторинговий к. (динамічний к.) необроблений (неанотований) к. національний к. (загальномовний к.) повнотекстовий к. паралельний к. педагогічний к. писемного мовлення к. розмічений к. синхронічний к. спеціалізований к. статичний к. усного мовленння к. учнівського мовлення к. фрагментарний к. корпусна лінгвістика лематизація лема машиночитаність метадані парсинг
140

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
репрезентативність розмітка анафорична р. лінгвістична р. морфологічна р. (частиномовна р.) семантична р. синтаксична розмітка, парсинг структурна р. просодична р. частиномовна р. (морфологічна р.) семантичний тегер стандартизація створення корпусу стеммінг токен токенізація формат даних частотний список
141

Навчальне видання


Вікторія Вікторівна Жуковська



ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ






Навчальний посібник


Комп’ютерна верстка: Гавриловський С. О.


Підписано до друку ___.10.2013 р. Формат 60х90/16. Ум. друк. арк. 8,14.
Обл. вид. арк. 4,81. Друк різографічний.
Гарнітура Times New Roman. Зам. 48. Наклад 100.
Видавництво Житомирського державного університету імені Івана
Франка
Свідоцтво про державну реєстрацію: серія ЖТ №10 від 07.12.04 р. м. Житомир, вул. Велика Бердичівська, 40 електронна пошта (E-mail): zu@zu.edu.ua

Document Outline

  • Вступ
  • Розділ 1. Корпусна лінгвістика як галузь прикладного мовознавства
    • 1.1. Сутність, предмет і завдання корпусної лінгвістики
    • 1.2. Корпусна лінгвістика в системі мовознавчих наук
    • 1.3. Типологія досліджень у царині корпусного мовознавства
    • 1.4. Критика корпусних розвідок
  • Розділ 2. Корпусні студії: історична перспектива та сучасний стан
    • 2.1. Історія становлення корпусної лінгвістики: від паперових конкордансів і картотек до перших електронних корпусів
    • 2.2. Корпусна лінгвістика з 60-х років ХХ ст. до пост 2000-х
    • 2.3. Корпусні дослідження в Україні
  • Розділ 3. Корпус текстів природної мови
    • 3.1. Конститутивні параметри корпусу текстів
    • 3.2. Типологія та огляд існуючих корпусів
  • Розділ 4. Поняття корпусної розмітки
  • Розділ 5. Технологія створення корпусів та комп’ютерні програми для роботи з корпусом
  • Розділ 6. Можливості використання корпусів у лінгвістичних дослідженнях
    • 6.1. Сфери застосування лінгвістичних корпусів
    • 6.2. Лексикографічні та граматичні дослідження на матеріалі корпусу
    • 6.3. Використання корпусів у навчанні іноземної мови
  • Список використаних джерел
  • Англо-український глоссарій основних термінів та понять корпусної лінгвістики
  • Предметний покажчик


Поділіться з Вашими друзьями:
1   2   3   4   5   6   7


База даних захищена авторським правом ©divovo.in.ua 2017
звернутися до адміністрації

войти | регистрация
    Головна сторінка


загрузить материал