Навчальний посібник Вид-во жду ім. І. Франка Житомир 2013




Сторінка1/7
Дата конвертації25.12.2016
Розмір2.83 Kb.
ТипНавчальний посібник
  1   2   3   4   5   6   7

Міністерство освіти і науки України
Житомирський державний університет імені Івана Франка





В.В. Жуковська




ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ








Навчальний посібник






Вид-во ЖДУ ім. І.Франка
Житомир 2013

УДК 81’33 (076)
ББК 81.1 я 7
АЗ Ж 86
Рекомендовано Вченою радою Житомирського державного
університету імені Івана Франка
Протокол № 3 від 25 жовтня 2013 р.

Автор:
Жуковська В. В. – кандидат філологічних наук, доцент, завідувач кафедри міжкультурної комунікації
Рецензенти:
Морозова О. І. – доктор філологічних наук, професор, професор кафедри англійської філології Харківського національного університету імені В.Н. Каразіна
Сингаївська А. В. – кандидат філологічних наук, професор, директор
Навчально-наукового інституту іноземної філології
Могельницька Л. Ф – кандидат філологічних наук, доцент, завідувач кафедри іноземних мов Житомирського державного технологічного університету

Жуковська В. В.
Вступ до корпусної лінгвістики: навчальний посібник /
В. В. Жуковська – Житомир: Вид-во ЖДУ ім. І. Франка, 2013.
– 142 с.
Навчальний посібник покликаний ознайомити студентів філологічних спеціальностей з базовими поняттями корпусної лінгвістики, охарактеризувати її мету та завдання, описати методи дослідження в цій галузі, представити основи корпусних технологій та показати теоретичне й практичне значення корпусів для проведення наукових досліджень в галузі лінгвістики та для навчання і вивчення
іноземної мови.
Адресований студентам вищих навчальних закладів.
Прислужиться всім, хто займається прикладними лінгвістичними дослідженнями та цікавиться питаннями реального функціонування мови.

Жуковська В. В., 2013.

Зміст

Вступ ................................................................................................. 5
Розділ 1. Корпусна лінгвістика як галузь прикладного
мовознавства ................................................................................... 8
1.1.
Сутність, предмет і завдання корпусної лінгвістики ......... 8 1.2.
Корпусна лінгвістика в системі мовознавчих наук .......... 13 1.3.
Типологія досліджень у царині корпусного мовознавства ............................................................................... 21 1.4.
Критика корпусних розвідок .............................................. 25
Розділ 2. Корпусні студії: історична перспектива та
сучасний стан ................................................................................ 29
2.1.
Історія становлення корпусної лінгвістики: від паперових конкордансів і картотек до перших електронних корпусів ................................................................. 29 2.2.
Корпусна лінгвістика з 60-х років ХХ ст. до пост
2000- х ........................................................................................... 35 2.3.
Корпусні дослідження в Україні ........................................ 48
Розділ 3. Корпус текстів природної мови ................................. 53
3.1.
Конститутивні параметри корпусу текстів ....................... 53 3.2.
Типологія та огляд існуючих корпусів .............................. 59
Розділ 4. Поняття корпусної розмітки ...................................... 76
4.1.
Типи корпусної розмітки .................................................... 76 4.2.
Вимоги до розмітки ............................................................. 82
Розділ 5. Технологія створення корпусів та комп’ютерні
програми для роботи з корпусом ............................................... 85
5.1.
Етапи створення корпусу .................................................... 85 5.2.
Формати даних і стандартизація даних корпусу .............. 91 5.3.
Комп’ютерні програми, що використовуються для аналізу даних корпусу ................................................................ 92 3

Розділ 6. Можливості використання корпусів у
лінгвістичних дослідженнях ..................................................... 105
6.1.
Сфери застосування лінгвістичних корпусів .................. 105 6.2.
Лексикографічні та граматичні дослідження на матеріалі корпусу ..................................................................... 106 6.3.
Використання корпусів у навчанні іноземної мови ....... 108
Список використаних джерел .................................................. 117
Англо-український глоссарій основних термінів та
понять корпусної лінгвістики .................................................. 129
Предметний покажчик .............................................................. 139
4

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
Вступ
У сучасних умовах постійного зростання інформаційних потоків проблема автоматичного опрацювання природномовної
інформації набуває всі більшого значення. Комп’ютерні
технології,
прийшовши в
лінгвістику,
запропонували свої
технічні
можливості
для опрацювання
, збереження
і
відбору мовного матеріалу. Це дало поштовх до зародження та розвитку нової галуззі мовознавчих досліджень: корпусної лінгвістики.
Базуючись на використанні величезних масивів емпіричного матеріалу та залученні комп’ютерних технологій для отримання об’єктивних висновків про функціонування мовних одиниць, лінгвістичні корпуси швидко перетворилися на неоціненний лінгвістичний ресурс. Отримані в результаті корпусного аналізу дані сприяють формулюванню якісно нових висновків про мову та окреслюють такі напрями лінгвістичних досліджень, які до появи корпусів не привертали уваги дослідників. Спираючись головним чином на реальний «живий» мовний матеріал, а не на мовну інтуїцію та інтроспекцію, корпусні дослідження дозволяють абстрагуватися від суб’єктивності дослідника і наблизитися до об’єктивного вивчення мови.
З часу свого становлення до сьогодні корпусна лінгвістика пройшла складний шлях від повного неприйняття у 60-ті роки
ХХ століття до магістрального напряму сучасного мовознавства.
Про популярність та інтенсивність розвитку корпусної лінгвістики у світі свідчить як чимале число наукових розвідок у провідних міжнародних наукових виданнях, посібників, підручників, так і самих корпусів різних типів. Вітчизняне корпусне мовознавство ще перебуває на етапі становлення.
Відчувається нестача ґрунтовних україномовних навчальних посібників, які б ознайомили майбутніх філологів з базовими
5

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
принципами та методами проведення корпусних досліджень.
Навчальний посібник «Вступ до корпусної лінгвістики» покликаний забезпечити лекційний курс з навчальної дисципліни «Корпусна лінгвістика», що викладається студентам магістратури спеціальності 8. 02030302 Мова і література
(англійська)*.
Метою посібника є ознайомити студентів філологічних спеціальностей з базовими поняттями корпусної лінгвістики, охарактеризувати її мету та завдання, описати методи дослідження в цій галузі, представити основи корпусних технологій та показати теоретичне й практичне значення корпусів для проведення наукових досліджень в галузі лінгвістики та для навчання і вивчення іноземної мови.
Виходячи з поставленої мети, посібник спрямовано на розв’язання таких завдань:
1)
ознайомити студентів із предметом, завданнями, методами й понятійним (термінологічним) апаратом корпусної лінгвістики;
2)
представити історію корпусних досліджень від перших паперових конкордансів до сучасності;
3)
надати інформацію про комп'ютерний інструментарій корпусної лінгвістики;
4)
проаналізувати основні типи існуючих корпусів;
5)
ознайомити студентів із практикою укладання корпусів;
6)
сформувати навички роботи із програмними засобами й
інформаційними ресурсами корпусної лінгвістики;
7)
продемонструвати можливості роботи з корпусними базами даних в лінгвістичних дослідженнях та з метою навчання і вивчення іноземної мови;
Слід зауважити, що запропонований посібник ніяким чином не претендує на повноту та вичерпність опису актуальних
6

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
проблем у царині корпусної лінгвістики. Проте автор сподівається, що викладений матеріал сприятиме формуванню у майбутніх філологів більш цілісного та поглибленого свідомлення професійної діяльності, наближенню її до сучасного рівня наукових лінгвістичних знань, розвитку компетенцій самостійного здійснення наукових досліджень та отримання нових знань за допомогою комп’ютерних технологій.
7

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
Розділ 1.
Корпусна лінгвістика як галузь прикладного мовознавства

1.1.
Сутність, предмет і завдання корпусної лінгвістики
Корпусна лінгвістика є одним із найбільш перспективних напрямків сучасного теоретичного і прикладного мовознавства.
Ця відносно нова лінгвістична галузь розпочала своє активне становлення у 60-х роках ХХ століття у зв’язку із інтенсивним розвитком комп’ютерних технологій. Сам термін «корпусна лінгвістика» міцно ввійшов до наукового вжитку лише в останні десятиліття ХХ століття з публікацією у 1983 році збірника наукових праць «Corpus Linguisitcs: Recent Developments in the
Use of Computer Corpora in English Language Research» за матеріалами конференції ICAME “Conference on the Use of
Computer Corpora in English Language Research”. Звичайно, застосування комп’ютерів та спеціального програмного забезпечення суттєво змінило спосіб дослідження мови та значно полегшило роботу по збору лінгвістичних даних. Без зусиль, лише за декілька секунд, стало можливим здійснювати пошук у багатомільйонних текстових масивах (лінгвістичних корпусах), будувати конкорданс для будь-якого слова, одержувати дані про частоту словоформ, лексем, граматичних категорій, синтаксичних конструкцій, відстежувати зміни у частоті і контексті мовної одиниці у різні хронологічні періоди, одержувати дані про лексичну (колокацію) та граматичну
(колігацію) сполучуваність і т. ін. Створення емпіричної бази дослідження таким способом забезпечує мінімум витрат зусиль і часу на зібрання даних, обсяг яких водночас суттєво збільшується.
8

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
Сьогодні дані корпусів масштабно використовуються в лексикографії, стилістиці, судовій лінгвістиці, лінгвістичній варіантології, перекладознавстві, соціолінгвістиці, методиці навчання і вивчення іноземної мови та в багатьох інших лінгвістичних дослідженнях [Baker, 2006: 2-3].
Отож, що ж становить собою корпусна лінгвістика?
Передусім, корпусна лінгвістика як галузь прикладного мовознавства займається визначенням загальних принципів побудови, обробки та експлуатації даних лінгвістичних корпусів
(корпусів текстів) із використанням сучасних комп’ютерних технологій, розробленням методики збору реальних мовних явищ – писемних та усних текстів, а також способів їх збереження та аналізу. Під корпусом текстів розуміється значний за обсягом, представлений в електронному вигляді, уніфікований, структурований, розмічений, філологічно компетентний масив мовних даних, створений для вирішення конкретних лінгвістичних завдань [Захаров, 2005: 3].
Корпусний аналіз вирізняється низкою характерних ознак:
1) емпіричний підхід до аналізу мовних даних (досліджуються реальні моделі мовної реалізації у природних текстах);
2) використання великих за обсягом, структурованих колекцій природних текстів (корпусів) як основи для аналізу; 3) широке залучення комп’ютерних технологій для дослідження лінгвального матеріалу; 4) застосування квалітативних і квантитативних аналітичних методик, з суттєвою перевагою останніх (вивчення частоти вживання лінгвістичних одиниць, статистичні дослідження сполучуваності і т.ін.). Отримані в результаті корпусного аналізу дані не тільки сприяють формулюванню якісно нових висновків про мову, але й окреслюють такі напрями досліджень, які до появи корпусів не привертали уваги дослідників. Спираючись головним чином на
9

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
реальний «живий» мовний матеріал, а не на мовну інтуїцію та
інтроспекцію, корпусні дослідження дозволяють абстрагуватися від суб’єктивності дослідника і наблизитися до об’єктивного вивчення мови. І, як стверджує Л. Ричкова, матеріал корпусу дозволяє не лише оптимізувати і об'єктивізувати лінгвістичні дослідження, але і по-новому окреслити багато традиційних лінгвістичних понять [Ричкова, 2003: 185]. Корпусні розвідки переорієнтовують традиційний підхід до вивчення мови, а результати аналізу даних корпусу сприяють переоцінці низки лінгвістичних теорій [MacEnery, Hardie, 2012: 1].
Власне кажучи, численні розвідки в галузі сучасного корпусного мовознавства відбуваються у двох магістральних напрямках. Перший напрям зосереджений на розробці проблем, що стосуються теорії та практики створення корпусів, іншими словами, концептуалізації корпусу: типологія корпусу, його призначення, обсяг, параметризація предметної галузі, репрезентативність, структурування та принципи відбору базових одиниць, зберігання і т. ін. А другий напрям спрямований на дослідження саме лінгвістичних корпусів, тобто вивчення мови за допомогою корпусних методів [Копотев,
Мустайоки, 2008: 12]. Проте слід зауважити, що чіткої межі між зазначеними напрямами не існує, адже практично всі укладачі корпусів в той же час здійснюють і лінгвістичні дослідження на
їх основі. Така двовекторність корпусної лінгвістики зумовлюється подвійною природою об’єкта її дослідження – текстового корпусу, який, з одного боку, виступає в якості вихідного мовленнєвого матеріалу для корпусної лінгвістики, а з іншого, є результатом діяльності цього мовознавчого напряму.
Предметом корпусної лінгвістики виступають теоретичні основи і практичні механізми створення та експлуатації мовних корпусів [Захаров, Богданова , 2011: 10].
10

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
Головне завдання корпусної лінгвістики вбачається у повному й системному відображенні змістовного спілкування мовою. Важливою особливістю цього інформаційно- семіотичного напряму лінгвістичних досліджень є підхід до розгляду прикладних проблем лінгвістики конкретно в комунікативних процесах. При цьому в центрі уваги виявляється не мова як система, і не проблема її формалізації, а процес змістовного спілкування мовою, і по можливості точний
її опис, який може бути використаний для розв’язання науково- технічних завдань інформатики [В.В. Риков
1
].
Першочерговою метою цієї мовознавчої галузі є об’єктивний лінгвістичний опис мовної системи, причому до цього опису корпусна лінгвістика підходить від вивчення конкретної людської комунікації. У якості другорядної цілі розглядається вироблення особливого способу відображення мовного матеріалу в корпусі текстів. Цей спосіб, у свою чергу, може використовуватися й
іншими лінгвістичними дисциплінами.
Теоретичним підґрунтям корпусної лінгвістики є структуралізм, який декларує примат реального тексту в лінгвістичному дослідженні. Для корпусних розвідок головним
є постулат, що мова як об’єкт дослідження може бути вивчена лише у формі писемних та усних текстів [Демьска 2010: 6]. У тексті, як формі існування мовлення, існує лише те, що передбачено системою мови, тому корпусна лінгвістика розглядає текст як засіб експлікації специфіки міжелементних мовних зв’язків. Дослідження тексту поглиблює розуміння суті природної мови. Для корпусного мовознавства притаманним є дещо відмінна від традиційного трактування рецепція тексту, згідно якої текст є тим, що дано лінгвістові для дослідження
1
http://corpora.iling.spb.ru/theory.html
11

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
мови, мовною дійсністю, реальністю, яка піддається науковому спостереженню, а не особливою мовною одиницею. Корпусний підхід до тексту перетворює процедуру інвентаризації тексту на науковий метод, оскільки базується на принципі, згідно з яким із тексту можна виділити ті риси (ознаки, параметри), на основі котрих реально збудувати певну модель об’єкта дослідження.
Корпус трактує текст під такими кутами зору: а) єдине, що дано дослідникові мови як вихідний пункт у своїй нерозчленованій і абсолютній цілісності – це текст; б) лінгвістична теорія починається з тексту як єдиного даного й намагається досягти несуперечливого й вичерпного опису цього тексту шляхом аналізу чи послідовного розподілу; в) через те, що тексти
природної мови надзвичайно великі числом і тривалістю, доцільно задовольнятися певною вибіркою з них або членуванням текстового континууму на твори окремих авторів, окремі праці, розділи, параграфи тощо, а відтак на складні й прості речення та слова. Тобто корпус, про який ми говоримо, тільки текстовий, текст у ньому може творити окремий корпус
(наприклад, корпус Біблії) або, частіше, окремий текст, або його фрагмент є структурним елементом зібрання текстів чи корпусу текстів. Оскільки до корпусу не можуть увійти всі тексти, створені у різні історичні періоди, то застосовують прийом цільового відбору текстів або фрагментів текстів. Корпусний текст відрізняється від так званого класичного тексту, крім
іншого, наявністю анотації: спеціальної розмітки структури тексту або текстів, композиційних та мовних одиниць тексту або текстів, і така розмітка неможлива без глибинного лінгвістичного аналізу текстових одиниць, що передбачає
ієрархічний поділ тексту або текстів аж до виділення навіть літерного символу [Демьска 2010: 6].
12

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
В основі корпусної лінгвістики лежить розуміння мови як повністю соціального явища, яке можна описати заснованими на досвіді даними, тобто в мовленнєвому акті. Як соціальний феномен мова проявляє себе саме в текстах, які можна записати, описати й проаналізувати. Внутрішні, «німі» тексти також є текстами, але їх не можна спостерігати і, отже, вони не є соціальним явищем. Більшість текстів зустрічаються у вигляді мовленнєвих актів, тобто як взаємодія між членами мовного суспільства [Teubert, 2007: 112].
Все вище сказане чітко окреслює дослідницьку програму корпусної лінгвістики, яка, будучи суто емпіричною дисципліною, при аналізі лінгвального матеріалу покладається на реальне функціонування мови з метою встановлення правил та вивчення особливостей продукування мови людиною, на відміну від тих досліджень, які опираються на вигадані приклади чи інтроспекцію. Застосування комп’ютерів дозволяє миттєво обробити величезний обсяг мовного матеріалу і відібрати всі можливі у конкретному корпусі приклади вживання необхідних для аналізу одиниць. У розпорядження лінгвіста надаються об’єктивні кількісні дані, забезпечуючи досягнення більш ґрунтовних та переконливих висновків.
Корпусна лінгвістика дозволяє вченим підтвердити або спростувати гіпотези про функціонування мови, а також окреслити нові напрями дослідження, які до застосування корпусних методів не попадали до фокусу уваги дослідників.
1.2.
Корпусна лінгвістика в системі мовознавчих наук
Незважаючи на значні досягнення та популярність, статус корпусної лінгвістики у сучасній мовознавчій парадигмі ще не є однозначно визначеним (див. наприклад: [Biber, Conrad, Reppen,
13

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
1998: 3; Kennedy, 1998: 2; McEnery, Wilson 2001: 2; Meyer 2002: xi]. Так, Т. МакЕненрі, Е. Вільсон, Р. Ксіао та інші лінгвісти характеризують її як особливу «методологію» (methodology) дослідження мовного матеріалу, на противагу таким традиційним галузям лінгвістики, як фонетика, синтаксис, семантика чи граматика. Зазначені мовознавчі галузі досліджують окремий аспект мовної системи, натомість корпусна лінгвістика не обмежується вивченням лише одного аспекту мовної реалізації. Більш того, корпусні методи можуть використовуватися для вивчення мовних одиниць будь-якого мовного рівня. Наприклад, синтаксичні явища можливо дослідити як із застосуванням корпусних методик, так і без них, так само існують корпусні і некорпусні семантичні дослідження
[McEnery, Wilson, 2001; McEnery, Xiao, Tono, 2006: 6].
Відзначається, що корпусна лінгвістика як система методів і принципів використання корпусів для вивчення мови та для вивчення/навчання мові має теоретичне підґрунтя, але саме по собі теоретичне підґрунтя ще не є науковою теорією. Звідси, корпусна лінгвістика визнається методологією вивчення мови з широкими можливостями застосування в багатьох лінгвістичних напрямах та теоріях [McEnery, Xiao, Tono, 2006: 7].
Проте більшість вітчизняних та зарубіжних лінгвістів не погоджується з цією точкою зору і розглядає корпусну лінгвістику як самостійну дисципліну прикладного мовознавства з власним предметом, об’єктом і метою дослідження, терміноапаратом, теоретичним і практичним підґрунтям, власними дослідними прийомами [Демська, 2005: 8,
12; Баранов, 2001: 112–117]. На переконання російських лінгвістів В.П. Захарова та С.Ю. Богданової, корпусна лінгвістика має принаймні дві ознаки, що дають їй підставу претендувати на статус самостійної дисципліни: 1) характер
14

ВСТУП ДО КОРПУСНОЇ ЛІНГВІСТИКИ
аналізованого словесного матеріалу;
2) специфіка
інструментарію [Захаров, Богданова, 2011: 9]. Сучасна корпусна лінгвістика вже «вийшла зі статусу методології» та стала окремою
«дисципліною»
[Тognini-Bonelli 2001: 1], сформувалася в самостійний науковий напрямок, досягнення якого знаменують новий етап розвитку наукової думки
[Колпакова, 2011: 1]. Російський вчений, член-кореспондент
РАН, завідувач відділу корпусної лінгвістики Інституту російської мови ім. В.В. Виноградова РАН, професор МДУ
ім. М.В. Ломоносова Володимир Олександрович Плунгян переконаний, що корпус – це не просто новий і потужний
інструмент: за використанням корпусу стоїть певна ідеологія, основні тенденції якої зародилися ще в класичній філології ХІХ століття, але значно інтенсифікувалися в останні десятиліття.
Головними пріоритетами цієї ідеології є:
1)
увага не до слова чи речення, а до тексту (дискурсу), тобто до реального інструменту комунікації в цілому, а не до його окремих фрагментів;
2)
увага до квантитативного компонента мови, тобто врахування в першу чергу більш частотних елементів порівняно з менш частотними, визнання квантитативних відношень суттєвим фактором у мовній еволюції і структурі мовних правил;
3)
увага до синхронічної варіативності мови, тобто визнання того факту, що не існує єдиної жорсткої системи засобів вираження змісту, а існують її різні реалізації, в тому числі залежні від психологічних, біологічних і соціальних факторів;
4)
увага до діахронічної варіативності мови, тобто визнання того факту, що мова постійно змінюється у часі і повністю відволіктися від цієї нестабільності не можливо, в кожен
15



Поділіться з Вашими друзьями:
  1   2   3   4   5   6   7


База даних захищена авторським правом ©divovo.in.ua 2017
звернутися до адміністрації

войти | регистрация
    Головна сторінка


загрузить материал