В семи томах том Информатика смысла Машинная лингвистика




НазваниеВ семи томах том Информатика смысла Машинная лингвистика
страница4/33
Дата29.11.2012
Размер4.61 Mb.
ТипДокументы
1   2   3   4   5   6   7   8   9   ...   33

Каждый человек работает в одной или

нескольких областях деятельности,

используя соответствующие области

знания и способы их представления.

1.3. Сравнение языков автокод, высокого уровня и ФРАК


Принципиальная возможность формирования языков ФРАК определяется наличием однозначного соответствия между компонентами архитектуры ВМ и основными понятиями языков высокого уровня, которые проектировались под прямым воздействием архитектур с учетом запросов практики применения ВМ. Заметим, что языки семейства ФРАК целесообразно писать не только для программирования ВМ, но и для программирования виртуальных или математических машин, для любых процессов, которые моделируются на ВМ. Можно указать такие примеры ММ как МГР [Красилов78а], ММ диалога [Красилов81б, 89а] и пакеты прикладных программ [Ершов82, Тамм77].


Важной информатической мыслью, возникающей в связи с конструированием языка ФРАК, является следующая: каждая программа (независимо от средств ее изображения) адекватна формуле со скобочной структурой. Каждая лексема (представляющая данные или величины) программы является операндом соответствующей формулы, а каждый ограничитель (запятая, точка с запятой или зарезервированное слово) программы является операции соответствующей формулы. Такое толкование любой программы унифицирует алгоритмы трансляции, обеспечивает проблему аналитических выкладок с текстами программы и указывает на принцип построения синтаксиса языка ФРАК [Красилов73б, 85а].


Процедура конструирования языка ФРАК состоит в формировании его синтаксиса, семантики и прагматики при последовательном изучении архитектуры ВМ, языков высокого уровня, выполнении принципов, требований и пользовательских запросов по области применения ВМ. Преимущества языка ФРАК (как указывалось) для системного программирования вытекают, например, из-за возможности доступа ко всем элементам архитектуры ВМ с помощью средств ЯВУ. Конечно, предлагаемые возможности языка ФРАК обладают одним существенным недостатком - язык является машинно-ориентированным.


Ниже используется табличный метод сопоставления языков, который способствует определению места языка ФРАК среди языков программирования. Сопоставление, представленное в табл.2.3, отражает только главные понятия языков и решает задачу выявления преимуществ одного сорта языков перед другими (автокод ныне именуется языком ассемблера).


Таблица 2.3. Сравнение автокода, языков высокого уровня и ФРАК


п/п

Автокод

ЯВУ

Язык ФРАК

1

Символьные имена

Символьные имена

Символьные имена

2

Управление памятью

Автоматическое распределение памяти

Автоматизированное распределение памяти

3

Аббревиатура операций

Универсальные средства выбора обозначений

Универсальные средства выбора обозначений

4

Машинная семантика

Семантика не зависит от конкретной ВМ

Семантика отражает свойства данной ВМ

5

Полное отражение системы команд

Неадекватность средств языка и ВМ

Соответствие система команд языковым примитивам

6

Форматная запись программы

Бесформатная запись программы

Свободный формат записи программы

7

Любая степень оптимизации рабочей программы

Уступка оптимизации рабочей программы изобразительным средствам

Оптимизация зависит от пользователя

8

Ограничители избыточны

Ограничители порождают команды

Ограничитель - команда ВМ

9

Описание предшествует использованию

Описание и использование независимы

Описание предшествует использованию

10

Трансляция за 1 - 2 прохода

Многопроходная трансляция

Трансляция за 1 - 2 прохода

11

Отсутствие рекурсий операторов

Декомпозиция формул и операторов

Декомпозиция формул и операторов

12

Прямая связь с операционной системой

Ограниченная связь с операционной системой

Прямая связь с операционной системой

13

Отсутствует динамическая память

Имеется динамическая память

Частично имеется динамическая память

14

Локальность контроля

Контроль формализован

Контроль формализован

15

Машинный уровень реализации автоматизации

Необходимы средства автоматизации

Необходимы средства автоматизации


Из приведенного сравнения видны многие существенные преимущества языков ФРАК перед автокодом и некоторые преимущества перед языками высокого уровня, отсутствуют недостатки по сравнению с автокодом и имеются некоторые недостатки по сравнению с ЯВУ. Оценивая сопоставления необходимо иметь в виду, что языки ФРАК ориентированы на системное программирование, а ЯВУ предназначен для программирования в прикладных областях применения ВМ. Язык ФРАК - эффективный инструмент программирования операционных, транслирующих и управляющих систем.


Языки ФРАК нашли практическое применение. Кроме уже упомянутых языков PL 360 для ЭВМ фирмы IBM, PL-БЭСМ-6 для указанной в названии ЭВМ, известны язык Эль-76 для ЭВМ Эльбрус, язык Ассоль для ЕС ЭВМ, языки ФРАК-Гелий и ФРАК-Пламя для встроенных технических систем. Последние два языка ориентированы на системное программирование управляющих встроенных ВМ и использованы при разработках технических систем управления. Известны и другие языки ФРАК. Ниже будет рассмотрен язык ФРАК для МГР текстов (программ).


Эффективность применения языков ФРАК стала возможной благодаря следующим факторам:

  • он является высокоуровневым языком типа ПЛ/1 или Алгол;

  • он «заставляет» программировать оптимально в соответствии с возможностями ВМ и квалификацией программиста;

  • он обеспечивает высокую степень автоматизации программирования в соответствии с формализованной технологией и методологией информатики, применением корреляционной зависимости команд.


Из сказанного следует, что язык ФРАК является алгоритмической моделью архитектуры ВМ с позиции пользователя. Такой взгляд позволяет сделать вывод о возможности проектирования ВМ по алгоритмическому описанию архитектуры, что заведомо обеспечит современный уровень программирования на будущей ВМ. (Если мир компьютеров не будет ориентироваться на единую архитектуру.) Сформулированный подход к проектированию ВМ позволяет оптимально решать проблемы соотношения аппаратных и программных средств, обеспечивающих полноту охвата классов решаемых с помощью ВМ задач.


1.4. Основа общения - язык, о способах задания языков


Самое общее определение языка дается так: множество знаков и множество правил образования слов и текстов из слов с помощью знаков. Совокупность правил вместе с алфавитом букв, цифр и знаков препинания составляет грамматику, именуемая грамматикой, например, русского языка. Грамматика определяет метапонятия - грамматические категории, которые выделяют подмножества слов или текстов и образуют словарь метапонятий, который является частью языка. Любой язык задается своими алфавитом и грамматикой.


ФЯ также определяются алфавитом и грамматикой. Обычно используют порождающие грамматики, для которых метаязыком является формализм Бэкус-Наура, возникший по работам, представленным в публикации [Хомский61] для описания языков программирования. Здесь используется чуть видоизмененный формализм под названием язык Марков. Будем рассматривать распознающие грамматики для описания любых языков [Красилов74в, 75а, 78а, 79а, 83б, 86а]. Основы распознающей грамматики рассмотрены в главе 5.


Общение в системе человек-ВМ использует все языковые средства: ЕЯ и его подмножества, ФЯ и их модификации, разнообразные командные языки и языки меню для программирования работ системы, языки сценариев и др. Любой из перечисленных языков описывается с помощью грамматики. Возникновение грамматик выдвинуло проблему ее представления. По современному пониманию грамматика состоит из алфавита символов, алфавита грамматических понятий (категорий), правил построения частей текста (синтаксис) и правил понимания текстов (семантика). В исключительных случаях, в научных целях или в формальных грамматиках, язык может определяться конечным набором слов. В таких случаях грамматика не формируется и проблемы представления грамматики не существует. Современные языки имеют определенную степень сложности, ограниченный алфавит, словари большого объема и требуют задания или определения грамматики. Словари и грамматика определяют способ задания языка. Все ЕЯ определяются грамматиками.


Самый простой способ задания языка общения в некоторой системе состоит в декларировании применения ЕЯ. Следует указать пороки такого задания (см. п.1.5). Они частично здесь изучаются. Из ЕЯ выделяется очерченное подмножество, с помощью которого можно передать для Интеллсист осмысливаемые системой тексты.


Особое место занимает язык меню, передающий для Интеллсист глобальную последовательность действий пользователя при сообщении им задания на поиск новых фактов или новых правил построения фактов. Средства построения и реализации языка меню включают использование дерева подработ Интеллсист, пиктограммы выбора работ, аналоги или стандарты последовательностей работ или формальная запись выполняемых последовательностей работ. Так поступают в разработках всех современных программных систем.


Любой язык может задаваться одним из способов:

  • описательно так, как это реализуется в учебниках,

  • на образцах так, как это делается в статьях,

  • может представляться формально так, как это делается в информатике,

  • грамматикой так, как это делается в лингвистике,

  • может определяться метаязыком так, как это делается при описании некоторых языков программирования,

  • может определяться в форме распознающей грамматики - графом языка так, как рассматривается в главе 5.

Имеется широкий спектр разнообразных средств определения языков различного назначения.


1.5. Языки профессиональной прозы


Средством общения людей является ЕЯ. Имеется большое число отличительных черт, выделяющих ЕЯ по сравнению с ФЯ, широко распространенных в общении людей различных профессий с ВМ. Это наиболее важная черта ЕЯ для применений Интеллсист. (Они же и определяют сложность ЕЯ.) Имеется в виду сложность ЕЯ, которая определяет невозможность реализации средств ЕЯ [Бакланов78, Белый10, Виноград76, Калугина79, ПоповЭ82] в «глобальных» Интеллсист. Вначале определим сложности в использовании ЕЯ.


Основные атрибуты сложности ЕЯ препятствуют его изучению и использованию для построения машинных систем работы с текстами ЕЯ. Отметим лишь некоторые. Значительные размеры контекста для определения смысла понятия, многозначность слов или понятий, большое число грамматических категорий СиГ и огромный размер словаря терминов (да и слов также) - это основные атрибуты сложности ЕЯ для Интеллсист. Первая сложность состоит в том, что понятие в ЕЯ имеет обширный контекст его определения. Это означает, что каждое понятие имеет определение, но оно локализуется весьма сложно (возможно и не в данном тексте). Например, контекстом данного понятия может быть память человека (порождение нового слова или термина), контекстом может быть содержимое книг библиотеки и др. Вторая сложность состоит в том, что ЕЯ использует синонимы таким образом, что некоторые два синонима могут иметь различные значения в некоторых контекстах с другими терминами. Их смысл определяется также по обширному контексту. Еще одна (третья) сложность использования ЕЯ: число грамматических категорий СиГ оценивается несколькими сотнями, что порождает сложности понимания ЕЯ для Интеллсист. Кроме этого, подавляющая часть грамматических категорий СиГ не способствует определению смысла текста. Работа с ЕЯ в условиях ограниченной памяти или быстродействия алгоритмов (для передачи знаний или для перевода текстов) представляет большую проблему. И, наконец, последняя (четвертая) сложность: наличие огромного словарного запаса ЕЯ. Для решения проблем пользователя конкретной специальности огромный запас слов или терминов просто не нужен. Этих четырех черт ЕЯ достаточно для понимания сложности работ с ЕЯ.


Охват всего ЕЯ пока немыслим. Попробуем взять часть ЕЯ, которой пользуются специалисты (все люди) в данной области знания. Такую часть ЕЯ будем именовать ЯПП. Во-первых, каждому специалисту достаточен такой язык, поскольку он решает свои проблемы по своей специальности. Во-вторых, такое ограничение приемлемо в любой Интеллсист. Наконец, в третьих, использование ЯПП постепенно приближает нас к ЕЯ и составляет существенный шаг в открытии доступа к ВМ для любого пользователя. Основные принципы, характеризующие ЯПП по сравнению с ЕЯ, можно сформулировать так:


Определение понятий ЕЯ помещается в памяти человека или находится в контексте большого объема (включая книги библиотеки), а определение понятия ЯПП помещается в памяти ВМ (в лексиконе) или помещается в тексте малого объема (в описании данного знания, передаваемого ВМ). Контекст можно определить формально так. Контекст - это часть текста, в котором помещено определение понятия и его использование. Контекст ЕЯ охватывает данный текст и еще ряд текстов, не доступных в данный момент для изучения контекста. Контекст каждого понятия ЯПП должен помещаться в памяти машины таким образом, чтобы программы осуществляли идентификацию каждого понятия, заданным в текстах терминами. Для создания таких контекстов формируется лексикон. Практически это означает, что вместе со знаниями (с БЗ) ВМ передается лексикон, содержащий определения каждого понятия.


Избыточного текста в ЕЯ не существует. Кажущийся избыточным текст передает эмоции человека, его состояние и умение, что обеспечивает передачу некоторого смысла. В ЯПП могут использоваться избыточные слова и тексты для передачи эмоциональной информации. Избыточные слова и тексты не создают контекста и могут не рассматриваться при анализе текстов ЯПП. Конечно, это утверждение верно в том случае, если лексикон не содержит в своем составе избыточных слов. По-видимому, если система учитывает избыточные слова, то это есть программная система (или Интеллсист), которая воспринимает и изучает, например эмоции человека.


В информатике при формировании нового языка поступают в соответствии со следующими основными шагами:

Первый шаг - наложение ограничений на ЕЯ по указанным четырем чертам.

Второй шаг - расширение ограниченного ЕЯ формализованными языками и ФЯ.

Третий шаг - ориентирование языка на данную профессию для передачи знаний этой профессии, а не любых знаний (вообще).

Эти три шага позволяют построить новые классы языков ЯПП. Такие языки не рассматривают некоторые грамматические категории, которые выражают эмоции как средства передачи интимных знаний (хотя для некоторых профессий такие средства могут использоваться для передачи ВМ знаний). Слово «проза» ограничивает нас от применения, например стихотворных форм для передачи знаний в задании для ВМ (хотя и они могут использоваться некоторыми профессиями для передачи знаний). Рассмотрим указанные три шага формирования ЯПП, а также некоторые принципы, характеризующие ЯПП.


Относительно первого шага. Языки, используемые специалистами данной профессии, уже имеют ограничения, как по составу словаря, так и по грамматической форме построения текстов. Действительно, воспользуемся тем обстоятельством, что люди одной и той же профессии для точного понимания смысла профессиональной деятельности используют ЯПП. Использование слов других профессий в данной профессии приводит к формированию языка новой профессии, рождаемого на стыке двух профессий. Определение каждого понятия введено в память ВМ либо непосредственно через словарь (лексикон), либо оно дано в ограниченном контексте. Синонимы используются широко с таким ограничением: каждый синоним имеет одно фиксированное значение, определяемое ведущим понятием. Число используемых грамматических категорий ограничено десятками, они чаще всего не совпадают с грамматическими категориями ЕЯ.


Относительно второго шага. Подключение ФЯ и/или формализованного языка является естественным шагом в каждой профессии. Формализация знаний в любой форме присуща каждой профессии, она отражается и в используемом языке. Формализация языка профессии - один из методов процесса абстракции.


Наконец, относительно третьего шага. Язык профессии отражается в лексиконе (словаре терминов), в грамматическом строе фраз ЯПП и при определении единственного значения каждого синонима. Все сказанное определяет смысл ЯПП. Этим проблемам будет отведено место далее.


Мы выбираем вариант формулировки языка по СеГ русского языка (или любого другого ЕЯ). СеГ является основой для построения ЯПП, который является средством для внешнего представления знаний специалистов данной профессии при вводе их в память ВМ для обработки «старого» и выработки нового знания. Для описания свойств ЯПП будем использовать концепции понятия, термина и слова. Каждое понятие имеет свое определение, оно изображается некоторым термином, состоящим из слов, лексем и знаков (в самом общем смысле понимания этого понятия). Слово- это последовательность букв и цифр, некоторое число или выделенный символ (в ФЯ такие конструкции именуются лексемами). Любое знание можно представить на ЯПП (может быть за исключением графического знания). В соответствии с определением понятия для изображения знания необходимо формировать утверждения, представляющие факты, правила получения новых фактов и т.п. Концепций понятия, термина и слова для построения утверждений и описания фактов вполне достаточно.


Главные преимущества естественным образом вытекают из сказанного о ЯПП. Применение ЯПП не связано с использованием руководств по Интеллсист. Зачем изучать руководящий материал, если ВМ понимает родной язык специалиста. ЯПП обеспечивает автоматический контроль над правильностью использования слов и знаков, что не характерно для ЕЯ. Интеллсист обеспечивает автоматизм выявления недостающего знания и поиска ошибок.


Грамматика ЕЯ характеризуется сотнями категорий (простой подсчет показывает, что имеется более 250 грамматических категорий в русском языке). Грамматика ЯПП характеризуется десятками категорий (это часть определения ЯПП, лексикона и всех вспомогательных данных). Следовательно, по сравнению с ЕЯ при анализе текстов ЯПП можно игнорировать значительное число форм, поддерживающих «ненужные» для ЯПП категории. Среди грамматических категорий ЯПП могут быть категории, почти совпадающие с грамматическими категориями ЕЯ, например синонимы.


Эмоциональная окраска фраз в ЕЯ, передающая знания, может быть уточнена с помощью вопросно-ответной системы. Не все знания, передаваемые эмоционально, могут помещаться в данном тексте. Вопросы, формируемые ВМ (а точнее Интеллсист), требуют от пользователя простого ответа типа «да» и «нет». Интеллсист может проявить настойчивость и сформулировать несколько вопросов. Ответы на вопросы Интеллсист или инструментария Интеллсист произведут уточнение исходного текста, учтут знания, передаваемые эмоциями.


Избыточные слова ЕЯ, если они не передают знания, игнорируются при вводе фраз в память ВМ, они отсутствуют в лексиконе и, следовательно, не входят в ЯПП. Избыточные слова в ЯПП не изменяют знания и игнорируются. Избыточные слова передают знания, но они (знания) не относятся к данному предмету исследования. Именно поэтому игнорирование таких терминов допустимо, несмотря на то, что в другом ЯПП они будут играть существенную роль.


Определение понятия должно находиться в памяти ВМ (или в доступном для Интеллсист месте), а совокупность определений (вместе с терминами) должна составлять лексикон предметной и проблемной областей знаний в данной профессии. Это требование предполагает разделы лексикона: стандартная, профессиональная, меняющаяся и пополняемая части. Каждое понятие определяется в лексиконе. Определение понятия должно находиться в БЗ, что несколько уменьшает контекст данного понятия. Термин, обозначающий понятие, может характеризоваться базами слов без учета грамматических категорий изменяемости этих слов. База слова понимается в обобщенном смысле: зафиксированная часть слова или все слово, обозначающие понятия и не учитывающие категории их изменчивости. База и конец слова - новые грамматические категории, относящиеся к грамматике ЯПП.


Кратко определим ЯПП так: ЯПП - это часть ЕЯ, используемая в данной профессии и использующая фиксированный (но расширяемый) лексикон, содержащий определения терминов, и формализованные языки или ФЯ как часть определения языка. Более точное определение дано выше в форме объяснения и сопоставления с ЕЯ. К преимуществам ЯПП следует отнести такие факторы, которые сформулированы более четко и полнее (чем ранее) в перечислении, данном ниже.

1.Поскольку лексикон ЯПП задается заведомо, легко реализовать синтаксический контроль над правильностью синтаксического представления знаний в этом лексиконе. Так реализуется автоматическая отладка текстов. Лексикон задается при первичном формировании знаний в памяти ВМ.

2. ЯПП поддержан ФЯ (языком Лейбниц), что также обеспечивает автоматизацию синтаксической и семантической отладки текстов знаний. Поддержка подкрепляется тем обстоятельством, что для текстов знаний подключается транслятор ЯПП на ФЯ, который контролирует тексты автоматическими средствами.

3. Для специалиста, работающего в данных предметной и проблемной областях, ЯПП является естественным профессиональным языком с возможными включениями формализованных или ФЯ его специальности. Это обеспечивает упрощение специалисту в общении его с ВМ по элементам знания при наполнении базы знаниями.

4. При выполнении условий предыдущих пунктов создается ситуация общения специалиста с ВМ без участия знаниеведа. Это обстоятельство обеспечивает отторжение разработок знаниеведа для пользователя Интеллсист. Роль отторжения велика. Интересна, например, проблема секретности знаний или их индивидуализация.

5. Освоение любой Интеллсист должно обходиться без емких руководств. Для использования Интеллсист должно быть достаточно самой системы, которая общается с пользователем на его ЯПП. Обучение должно предусматривать исключение из практики применения Интеллсист пособий и руководств, особенно в тот момент, когда идет производственная работа (как с играми на ВМ).

6.Система составления и использования лексикона предусматривает возможность пополнения его новыми терминами в процессе эксплуатации самой Интеллсист для решения данного задания. Развитие ЯПП является естественной основой для любой науки.

7.Настройка Интеллсист проходит стадии: набор текстов знания, прогон текстов для выборки и формирования лексикона, прогон знаний при вводе его в БЗ, контрольный ввод знаний в базу. ЯПП обеспечивает параллельную работу с лексиконом и знаниями, что продуктивно может использоваться для формирования самого знания.


Перечисленные выше преимущества по существу не оправдывают процедуру выделения ЯПП из ЕЯ лингвистом или знаниеведом. Они лишь показывают на удовлетворение запросов пользователя, который желает вести общение с ВМ в его профессиональном лексиконе, и заинтересован в быстром решении своих задач.

1   2   3   4   5   6   7   8   9   ...   33

Похожие:

В семи томах том Информатика смысла Машинная лингвистика iconСобрание сочинений в семи томах 3 «Собрание сочинений в семи томах»: Время; 2008
Собрание сочинений М. М. Зощенко — самое полное издание прозы одного из крупнейших писателей-новаторов XX века. В него входят практически...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Излагаемые методы частично модифицированы по сравнению с их оригинальным изложением для их ориентирования и усиления при использовании...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Словарь поможет пользователям Интеллсист и разработчикам машинных систем разнообразного назначения в написании отчетов, руководств...
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Основы информатики (Введение в информатику)
Вм на основе своих общих и профессиональных знаний без привлечения программистов для решения задач, для разрешения вопросов или проблем...
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Представление знаний (Структуры данных)
Приводимые примеры служат фрагментами прототипов записей знаний и запросов, предназначенных для создателей заданий и запросов к базе...
В семи томах том Информатика смысла Машинная лингвистика iconРавительство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том V уфа гилем 2010
Российская академия наук Уфимский научный центр ■ Институт истории, языка и литературы
В семи томах том Информатика смысла Машинная лингвистика iconЬство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том VI москва восточная литература 2011
Российская академия наук Уфимский научный центр Институт истории, языка и литературы
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Интеллектуальные системы (Системы решения проблем)
Интеллсист, их структуры и технологии работы с инструментарием составляют центральную часть тома. Оценка возможностей Интеллсист...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика и вычислительная техника” и специальностей 220100 “Вычислительные машины, комплексы, системы и сети” и 021800 “Теоретическая и прикладная лингвистика” Ульяновск 2003
Методические указания к выполнению лабораторных работ по программированию для студентов направления 552800 “Информатика и вычислительная...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница