В семи томах том Информатика смысла Машинная лингвистика




НазваниеВ семи томах том Информатика смысла Машинная лингвистика
страница10/33
Дата29.11.2012
Размер4.61 Mb.
ТипДокументы
1   ...   6   7   8   9   10   11   12   13   ...   33

2.4.2. Классы понятий. Класс понятий в широком смысле слова определяется в СеГ и ЯПП. Некоторые рассматриваются в этом разделе. Класс понятия определяется также родством их характеристик. Например, класс понятий с назначением быть метапонятием - это совокупность или список понятий, поименованная некоторым термином и образующая внешнее понятие (метапонятие). Например, классами являются болезни, симптомы, методы, звери, люди и т.п. При таком перечислении указаны имена классов. Класс необходим для управления потоками данных при формировании запросов и ответов самой Интеллсист. Метапонятия вводятся для задания классификационных понятий. Итак, совокупность понятий может именоваться новым понятием, которое называется метапонятием. Значениями метапонятия являются тогда понятия, входящие в совокупность. Ниже будут рассмотрены и другие классы: синонимы, исключения, правила, прагмы, шаблоны и анкеты. Совокупность понятий образуют класс по их атрибутам. Атрибут сорт понятия, как общая характеристика понятий, относит каждое понятие к некоторой категории универсальной грамматики. Различают следующие сорта:

простое имя,

синоним,

тип,

константа,

литерал,

массив,

запись,

поле записи,

множество,

атрибут,

процедура,

функция,

операция,

формальный параметр,

метка,

исключение,

вводное слово,

прагма.

Сорт понятия определяет контекст применения термина этого понятия в текстах: какие операции являются допустимыми или какие композиции (сочетания) терминов будут правильными. Сорт понятия является естественной его характеристикой, по которой строятся правильные фразы и утверждения, имеющие вполне определимый смысл и назначение.


Класс понятий образуется по такому атрибуту как тип понятия, которое понимается как наименование множества значений (смыслов), которые может принимать данное понятие. Тип определяет класс понятий. Каждое понятие может принимать одно из множества значений. Различают следующие базовые и простые типы: логический, символьный, целый, вещественный, ссылочный. К составным типам относятся массивы, таблицы и записи, даты, время и др. Имеются типы расширения: короткий целый, вещественный плавающий, вещественный фиксированный, строковый. Понятия типа можно подразделить на такие:

дискретные (логический, символьный, целый, диапазон),

непрерывные (вещественный, плавающий вещественный, фиксированный вещественный),

индексируемые (массивы),

именуемые (записи из полей различных или одинаковых типов),

ссылочные (из ссылок на понятия данного типа),

множественные (конечное или бесконечное множество),

последовательностные (цепочки простых объектов),

подпрограммные (функции и процедуры),

и абстрактные (или неопределенный).


Значение понятия может быть задано вместе с термином, тогда он отражает факт (скорость равна нулю), в примере «скорость» - термин, «равна» - связка термина и значения, «нулю» - значение. Значение термина может подразумеваться, тогда термин отражает логическую связь с другими терминами, значение термина может отсутствовать, тогда термин является неопределенным своим значением, которое может определиться в процессе поиска разрешения запроса. Значения также могут определять класс понятий, которые имеют одинаковый (в некотором роде) смысл. Омографические термины (одинаковые по написанию, но с различными значениями) допустимы в том случае, когда они определяются в составе составных типов или в различных БЗ. Конкретные данные могут выступать в качестве начального (исходные факты), текущего (факты в процессе логического вывода решения) или конечного значения, получаемого при выводе (новых) фактов, в процессе вычислений или логического вывода результата запроса. Внешнее представление значений известно из практики работы со знаниями или из различных документов. Значениями могут быть числа, символы, строки, тексты, их композиции или действия - все они именуются лексемами. Значения используются при задании констант, начальных данных для величин, данных о границах диапазонов, кодов различного назначения и т.п. Внутреннее представление значений скрыто и может проявляться только при выводе его на экран или твердый визуализируемый носитель.


ЯПП в самом общем виде состоит из текстов на ЕЯ, включающих утверждения, используемые в соответствующей специальности. В текст на ЯПП могут входить формулы различной структуры, таблицы, конкретные различные данные (но не рисунки, которые необходимо представить текстами или ссылками на имена рисунков). Общая структура текстов ЯПП состоит из абзацев, которые состоят из утверждений, которые в свою очередь состоят из фраз. Структура текстов может относиться к описательному или командному языкам, а также к смеси описательных и командных языков.


Термин (их совокупность образует класс понятий текста) - основная единица ЯПП, он идентифицирует понятие или класс понятий. Терминами обозначаются понятия предметов, явлений или процессов. Каждый термин определяется строго своими характеристиками. Один и тот же термин не может определяться дважды, кроме случаев вложенных определений структурных величин. Различным терминам могут приписываться одинаковые характеристики. Предписание различных характеристик одному и тому же термину не допустимо (кроме случаев вложенных определений структурных величин). Все понятия, поименованные терминами, могут принимать значения в соответствии с характеристикой (семантическая валентность терминов). Написание термина обладает свойством непроницаемости - внутри термина недопустимо использовать другие термины или их части. Разновидности терминов образуются использованием различных их составов или изменением основ слов данного слова из термина. Термин может задаваться фразеологическим оборотом (фразеологизмом). Из этих определений следует, что понятие или класс понятий именуются терминами, они могут принимать значение из известного множества значений и возможно имеют текущее значение, ввод термина в Интеллсист автоматически снабжается датой (дата введения термина в язык не всегда известна), термин относится к определенному сорту или классу понятий.


Набор грамматических категорий СеГ составляет ее главные понятия. Поясним лишь некоторые категории, соответствующие классам понятий.


Синоним (термина) - это термин, именующий одно и то же понятие с одинаковыми значениями. Для человека синонимы характеризуют понятие с разных точек зрения, а для Интеллсист они характеризуются одинаково. Синонимы заменяют друг друга, они могут различаться в словах и/или знаках. Важно заметить, что среди синонимов одного понятия выделяется один, который является основным термином, объявленным своими характеристиками. Остальные термины являются синонимами и образуют (определяют) синонимический ряд. Выбор основного синонима остается за пользователем, его выбор определяет читаемость выдаваемого результата, поскольку результат печатается в основных терминах. Синонимы образуют словарное богатство ЯПП, делающее его образным и выразительным. Синонимия - явление профессиональное, в разных областях знаний она создается различными путями. Так как в качестве термина можно использовать фразеологические обороты, которые синонимически эквивалентны даже слову, то они могут использоваться для краткости и лаконичности, например, сокращения или аббревиатура. Синонимы - это характерная грамматическая категория, она максимально используется при формировании текстов ЯПП. Антонимы должны выражаться логически через зависимость от введенных ранее терминов (понятий).


ЕЯ использует многозначные слова и термины для обозначения понятий. Эта особенность ЕЯ не переносится в грамматику ЯПП, кроме одного случая. Контекст одного понятия может охватывать контекст для другого понятия. Если границы вложенности ясны, то по обе стороны границы можно вводить двузначный термин. Эта ситуация аналогична ситуации в блочном программировании и использовании при этом одинаковых идентификаторов для обозначения различных понятий. Естественно, что грамматическая категория синонима будет широко использоваться при описании ЯПП, а точнее при составлении лексикона.


ЕЯ использует понятие синоним, но в ЯПП понятие синонима расширено - можно вводить синонимы для любых терминов. К примеру, некоторое предложение может быть термином, и для него можно определить один или несколько синонимов, состоящих из одного слова или знака. Введение понятий термина и синонима исключает категории частей речи и предложения СиГ русского языка. Знания и запросы для Интеллсист передаются в соответствии с правилами СеГ при формировании БЗ, которая и является программой решения определенного класса прикладных задач.


И еще несколько классов понятий, определяемых в СеГ. Исключения – это класс понятий, с помощью которых динамически обнаруживаются и исправляются некоторые ошибки в знаниях и запросах либо стандартным образом, либо по запросу и заданию пользователя. Исключения задаются процедурами исправления ошибок.


Правила (их совокупность определяет класс понятий СеГ) задаются для формирования новых фактов по имеющимся фактам. Их применение становится необязательным, если не возникает определенная композиция имеющихся фактов. Легко привести математический пример - аналитическое дифференцирование или интегрирование выражений (формул). Правила - это два выражения, которые определяют вхождения первого выражения и заменяют его вторым, сохраняя смысл преобразуемого выражения.


Класс понятий с именем прагма определяется как служебные сообщения для Интеллсист о правилах ее поведения относительно данного запроса. Связь с Интеллсист необходима для управления ее работой в ситуациях, когда используются различные технические средства или способы формирования данных и знаний. Все прагмы определены и зафиксированы (см. Приложение 5).


Последние из упоминаемых здесь классов понятий СеГ – это понятия шаблона и анкеты как фиксированные формы построения запроса. При работе по шаблону задается меньше информации, но и круг решаемых задач также становится уже. Он состоит из фиксированного текста и заполняемых пользователем окон. Шаблон составляется знаниеведом и сохраняется в библиотеке для применений. При работе по анкете пользователь только отвечает на вопросы анкеты и получает решение задачи (например, диагностики). Анкета также составляется знаниеведом и сохраняется в библиотеке для применений.


2.4.3. Лексиконы. Повторимся, совокупность терминов (понятий) вместе с их реальными характеристиками определяет лексикон данной области знания. Таким образом, лексикон - это (в широком смысле его определения) словарь определений понятий для данного ЯПП. Определения используются для идентификации терминов, определения контекста использования термина и для построения логических выражений, представляющих знания. Идентификация термина является сложным процессом выделения термина из фразы, поиска его в лексиконе и извлечения необходимых в данном рассмотрении атрибутов определения понятия, идентифицируемого данным термином. Многие атрибуты определения понятия используются для формирования возможного контекста применения понятия. Лексикон определяет основу ЯПП, каков лексикон таков и ЯПП.


Лексикон состоит из двух главных частей: стандартная и переменная части. Стандартная часть предназначена для обслуживания всех ЯПП (или всего ЕЯ) и состоит из общеупотребительных понятий, используемых при формировании БЗ, переменная часть формируется в процессе анализа и ввода знаний и заданий. Например, термин «сложение» является общеупотребительным, он обозначает сложение, например чисел. Такое понятие попадает в стандартную часть лексикона. Термин «интеграл» используется в математике, он попадает в переменную часть лексикона ЯПП математики. Стандартная часть лексикона присоединяется к каждому лексикону по отраслям знаний, которые хранятся в библиотеке. Уместно заметить, что такие библиотеки должны стандартизоваться в масштабе страны так, чтобы стандарт обязывал пользователя придерживаться его для уменьшения числа ошибок при формировании заданий. В отличие от имеющихся стандартов на термины и определения предполагаемый стандарт должен содержать по возможности все синонимы и характеристики понятия, соответствующие набору атрибутов определения понятия в БЗ. Лексикон является точным терминологическим словарем для Интеллсист.


Полный перечень имен (они же и образуют термины стандартной части лексикона) представляет собой набор стандартизованных понятий (операций или операндов, например), обозначающих значащие константы и константные ограничители, в том числе и ключевые слова. Их список приведен в Приложениях без указания всех синонимов. Полный перечень операций представляет собой символьное изображение стандартизованных понятий, синонимами которых будут термины из слов или знаков, заимствованные из ЕЯ. В качестве терминов пунктуации могут использоваться также и комбинации приведенных в таблице ASCII символов. Кроме этого необходимо помнить, что символ пробела также является разделителем лексем.


К лексиконам относятся образующие их словари из знаков, слов, терминов и представлений данных. Лексикон формируется с помощью инструментальной системы, которая потенциально предназначена для решения следующих проблем:


1. Автоматизированное составление терминологического словаря по текстам, представляющим знания. Для этого используется программа корреляционного анализа текстов по смыслу.

2. Автоматизированное составление словаря по автономно задаваемым терминам вместе с их характеристиками. Словари составляются в процессе корреляционного анализа или при грамматическом разборе знаний и запросов.

3. Автоматизированное составление толкового терминологического словаря для некоторой предметной области. Эти операции реализуются с помощью меню инструментария Интеллсист.

4. Автоматизированная проверка текстов с лексической точки зрения для обнаружения грамматических ошибок в использовании терминов (терминография). С помощью лексикона осуществляется анализ текстов на правильность использования терминов.

5. Использование лексикона в трансляторе ЕЯ --> ФЯ для идентификации одно- или многословных (и многознаковых) терминов. При грамматическом разборе текстов проверяется правильность использования терминов и их взаимосвязи.

6. Создание библиотек лексиконов для реализации операций сопоставления, формирования или модификации лексиконов при использовании имеющихся или построении новых лексиконов.

7. Подготовка материала для издания толковых терминологических словарей. Любой лексикон служит основой для разработки толковых словарей, инструментарий Интеллсист автоматически формирует их по лексикону, так как в нем содержаться содержательные определения терминов для человека.


Среди всех девяти библиотек инструментария Интеллсист имеется библиотека лексиконов. Ее обслуживание связано со структурой лексиконов. Верно и обратное: структуру лексиконов необходимо выбирать так, чтобы работа с библиотекой лексиконов была эффективной. Исследование вопросов создания библиотек лексиконов выявило ряд особенностей их использования. Например, работа специалиста на стыке двух наук и формирование смешанного лексикона (сложение лексиконов) представляет собой длительную автоматизированную работу знаниеведа. Время его работы (а не системы) увеличивается из-за необходимости пересмотра характеристик терминов без изменения представлений знания.


Развитие лексиконов можно рассматривать с двух позиций. Можно рассматривать внутреннее развитие: пополнение новыми терминами, исправление имеющегося словаря (сопровождение), уточнение некоторых характеристик или определений понятий, устранение устаревших терминов (редактирование словарей и их характеристик), сохранение или создание копий. Можно рассматривать и внешнее развитие: составление библиотек лексиконов и таблиц терминов ЯПП, разработка стандарта лексикона по специальности или профессии, использование лексиконов в новых Интеллсист, работающих со знаниями, представленными на ЯПП.


Наравне с развитием лексикона большое значение имеет унификация лексикона. Дело в следующем. Укажем на класс задач криминалистики - ведение допроса и автоматическое формирование вопросов к подследственному. Следователь обычно сталкивается с самыми различными вещами и ситуациями. Сколько известно марок автомобилей, сколько театров и кино, сколько городов и поселков, а сколько реальных ситуаций, с которыми любому следователю приходится сталкиваться на допросах? Если все вещи и явления именовать терминами, то сразу обнаружится нехватка память под лексикон. Для подобных задач следует использовать аппарат таблиц с названиями автомобиль, театр, кинотеатр, город или поселение, ситуации, в которые вносятся все известные термины. Таблицы больших объемов допустимы, а получение справок из таблиц является простой процедурой. Здесь термины переходят в разряд данных с простым доступом. Все необходимые характеристики вещей и явлений должны поместиться в этой же таблице как их атрибуты. Проблема больших лексиконов будет разрешена. Этот прием перехода от терминов к данным, представленными терминами, используется в реальной жизни (например, использование справочников) и во многих реальных задачах. Всегда бывает ясна ситуация перехода от лексикона к справочным таблицам.

1   ...   6   7   8   9   10   11   12   13   ...   33

Похожие:

В семи томах том Информатика смысла Машинная лингвистика iconСобрание сочинений в семи томах 3 «Собрание сочинений в семи томах»: Время; 2008
Собрание сочинений М. М. Зощенко — самое полное издание прозы одного из крупнейших писателей-новаторов XX века. В него входят практически...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Излагаемые методы частично модифицированы по сравнению с их оригинальным изложением для их ориентирования и усиления при использовании...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Словарь поможет пользователям Интеллсист и разработчикам машинных систем разнообразного назначения в написании отчетов, руководств...
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Основы информатики (Введение в информатику)
Вм на основе своих общих и профессиональных знаний без привлечения программистов для решения задач, для разрешения вопросов или проблем...
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Представление знаний (Структуры данных)
Приводимые примеры служат фрагментами прототипов записей знаний и запросов, предназначенных для создателей заданий и запросов к базе...
В семи томах том Информатика смысла Машинная лингвистика iconРавительство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том V уфа гилем 2010
Российская академия наук Уфимский научный центр ■ Институт истории, языка и литературы
В семи томах том Информатика смысла Машинная лингвистика iconЬство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том VI москва восточная литература 2011
Российская академия наук Уфимский научный центр Институт истории, языка и литературы
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Интеллектуальные системы (Системы решения проблем)
Интеллсист, их структуры и технологии работы с инструментарием составляют центральную часть тома. Оценка возможностей Интеллсист...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика и вычислительная техника” и специальностей 220100 “Вычислительные машины, комплексы, системы и сети” и 021800 “Теоретическая и прикладная лингвистика” Ульяновск 2003
Методические указания к выполнению лабораторных работ по программированию для студентов направления 552800 “Информатика и вычислительная...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница