Тарануха В. Ю. Інтелектуальна обробка текстів




Сторінка6/6
Дата конвертації05.01.2017
Розмір0.71 Mb.
1   2   3   4   5   6
. Достовірність ПВС є надзвичайно важливою, адже

76 неправильні відповіді гірші, ніж відсутність відповідей. Дослідження ПВС мають бути зосереджені на шляхах оцінки правильності наданих відповідей та розробляти методи для виявлення випадків, коли наявні дані не містять відповіді. Необхідно виявляти суперечності в джерелах даних і на постійній основі опрацьовувати суперечливу інформацію. Для забезпечення достовірності система повинна включати в себе знання всього світу і механізми, які імітують доходження висновків особистістю у здоровому глузді.
Зручність. Часто знання в ПВС необхідно пристосовувати до конкретних потреб користувача. Необхідно розробляти спеціальні онтології і предметно-орієнтовані процедурні знання. Дуже важливим є швидке прототипування з предметно-орієнтованих знань та їх включення до відкритих онтологій вузькоспеціалізованих. Часто використовуються гетерогенні джерела даних - інформація може бути доступною в текстах, у базах даних, у відеокліпах або інших засобах масової інформації. ПВС повинна бути в змозі здобувати відповіді незалежно від формату джерела даних, і повинна надати відповідь у будь-якому форматі, який є бажаним для користувача. Навіть більше того, ПВС повинна дозволяти користувачеві описувати контекст запитання, і повинна давати всілякі пояснення та забезпечити його способами візуалізації і навігації.
Повнота. Бажано давати повні відповіді на питання користувача. Іноді в
інформаційних джерелах відповідь роззосереджена, або міститься у декількох документах. Потрібно зливати інформацію в єдину відповідь. Генерація повної відповіді повинна покладатися на імплікатури, оскільки люди висловлюються у економний спосіб, і також враховувати розрідженість даних. Крім того, загальні та предметно-орієнтовані знання повинні поєднуватися і досить складно вмотивовуватись. ПВС повинна включати в себе можливості, які дозволять все обміркувати і зуміти скористатися високопродуктивними базами знань. Іноді необхідно проводити аналогії з
іншими питаннями, і вони мають бути або в заданому користувачем

77 контексті, або в контексті профілю користувача. Автоматичне отримання профілю користувача являє собою метод, що дозволяє співробітництво з ПВС та отримання інформації зворотного зв'язку про ДС.
Актуальність. Відповідь на питання користувача повинні бути актуальними в певному контексті. Часто може виникати необхідність у
інтерактивній ПВС, де послідовність питань допомагає прояснити потрібну
інформацію. Складність питання і відповідну таксономію неможливо вивчити, не маючи точок дотику з користувачем і ПВС та без урахування наступного дослідження „по холодних слідах”. Оцінка ПВС повинна проводитись з огляду на задоволення потреб користувача: саме люди повинні приймати остаточне рішення про доцільність і достовірність інформації, отриманої від ДС та легкість її використання.
3.5. ВИСНОВКИ
Описано задачі та структуру питально-відповідальних систем.
Розглянуто взаємозв’язки з іншими задачами обробки природної мови.
Описано вимоги до перспективних ПВС.
Контрольні запитання
1.
Довідкові системи, питально-віповідальні системи.
2.
Фреймові моделі предметних областей, бази фактів.
3.
Використання фреймів для аналізу недосить специфічних питань.
4.
Використання онтологій для роботи з полісемією у запитаннях.
5.
Побудова оптимальної відповіді на основі запитання та бази відповідей
(застосування механізмів перекладу).

78
СПИСОК ЛІТЕРАТУРИ

1.
Анисимов А.В. Компьютерная лингвистика для всех: Мифы. Алгоритмы.
Язык Киев: Наук. думка, 1988.- 223 с.
2.
Белоногов Г.Г. Компьютерная лингвистика и перспективные информационные технологии М.: Русский мир. 2004, - 248 c. Ел. ресурс.
Режим доступу: http://www.twirpx.com/file/134393/
3.
Волошин В.Г. Комп’ютерна лінгвістика: Навчальний посібник. – Суми:
Університетська книга, 2004. –382 с.
4.
Марчук Ю.Н. Компьютерная лингвистика М.: Изд-во Восток-Запад, 2007 г.,
- 317 с Ел. ресурс. Режим доступу: http://www.twirpx.com/file/398578/
5.
Партико З.В. Прикладна і комп’ютерна лінгвістика, Львів, «Афіша», 2008,
- 221 с.
6.
Сайт «Автоматическая обработка текстов» Ел. ресурс. Режим доступу: http://aot.ru
7.
Сайт проекту Link Grammar Ел. ресурс. Режим доступу http://www.link.cs.cmu.edu/link/
8.
Сайт проекту
WordNet
Ел. ресурс.
Режим доступу: http://wordnet.princeton.edu/
9.
Clark A. The Handbook of Computational Linguistics and Natural Language
Processing /Clark A., Fox C., Lappin S.// Blackwell Publishing, 2010, - 775p.
Ел. ресурс. Режим доступу: stp.lingfil.uu.se/
santinim/sais/ClarkEtAl2010
_HandbookNLP.pdf
10.
Burger J Issues, Tasks and Program Structures to Roadmap Research in
Question & Answering (Q&A) /John Burger et al.// Ел. ресурс. Режим доступу^ http://www.inf.ed.ac.uk/teaching/courses/tts/papers/qa_roadmap.pdf
11.
Jurafsky D. Speech and Language Processing: An Introduction to Natural
Language Processing, Speech Recognition, and Computational Linguistics. 2nd edition, / Jurafsky D., Martin J.// 2009 Ел. ресурс. Режим доступу: http://www.cse.iitk.ac.in/users/mohit/Speech-and-Language-Processing.pdf
12.
Mitkov R. The Oxford handbook of computational linguistics /Oxford
University
Press,
2003
–786 p. Ел. ресурс. Режим доступу: http://www.google.com.ua/books?hl=uk&lr=&id=yl6AnaKtVAkC&oi=fnd&pg
=PP2&dq=5.%09The+Oxford+handbook+of+computational+linguistics
13.
Nirenburg S. Ontological semantics / Nirenburg S., Raskin V. //MIT Press,
2004, – 420 p. Ел. ресурс. Режим доступу: http://books.google.com.ua/ books/about/Ontological_semantics.html?id=OPek3LpMIigC&redir_esc=y
14.
Uwe Reinke State of the Art in Translation Memory Technology Ел. ресурс.
Режим доступу http://www.t-c3.org/index.php/t-c3/article/view/25

79
ЗМІСТ
Передмова
3 1
Автоматичне реферування
6 1.1
Постановка задачі
6 1.2
Допоміжні засоби
9 1.3
Індексація
10 1.3.1 Змістовна близькість
11 1.3.2 Лексичні ланцюжки
11 1.3.3 Спосіб об’єднання лексичних ланцюжків
12 1.3.4 Алгоритм побудови лексичних ланцюжків
14 1.3.5 Використання результатів індексації
16 1.4
Визначення можливих запозичень у текстах
16 1.4.1 Модель структури тексту
18 1.4.2 Запозичення в подробицях
19 1.5
Кластеризація
22 1.5.1 Міри якості кластерів та кластерного розбиття
22 1.5.2 Кластерний аналіз на зважених графах
24 1.6.
Виділення термінологічних одиниць
24 1.7
Реферування
25 1.7.1 Визначення важливості елементів тексту
26 1.7.2 Передобробка
28 1.7.3 Алгоритм планування
29 1.7.4. Семантико-синтаксичний алгоритм стиску
30 1.7.5 Семантичний алгоритм стиску
32 1.7.6 Алгоритм стиску вибором
34 1.7.7 Загальний алгоритм реферування
35 1.7.8 Покращення результатів реферування
36 1.7.9 Оцінювання якості рефератів
38 1.8
Висновки
39 2.
Машинний переклад
40 2.1
Автоматичний переклад
40 2.1.1 Мікрокосмос
45 2.1.2 Статистичний перекладач
48 2.1.3 Гібридний переклад
53 2.2.
Автоматизований переклад
54 2.2.1 Компоненти МПП
56 2.2.2 Виділення термінів
58 2.2.3 Методи співставлення термінів та блоків
60 2.2.4 Проблеми, що виникають при використанні МПП
61 2.2.5 Методи покращення співставлення термінів та блоків
62 2.3
Висновки
62 3.
Системи природномовного діалогу
65 3.1
Моделювання предметної області
69 3.2
Фрейми
71

80 3.3
Генерація відповіді
74 3.4
Перспективи розвитку ПВС
75 3.5
Висновки
77
Список літератури
78
Зміст
79



Поділіться з Вашими друзьями:
1   2   3   4   5   6


База даних захищена авторським правом ©divovo.in.ua 2017
звернутися до адміністрації

войти | регистрация
    Головна сторінка


загрузить материал