В семи томах том Информатика смысла Машинная лингвистика




НазваниеВ семи томах том Информатика смысла Машинная лингвистика
страница2/33
Дата29.11.2012
Размер4.61 Mb.
ТипДокументы
1   2   3   4   5   6   7   8   9   ...   33
Глава 7. Транслятор текстов ЯПП на ФЯ
7.1. Общее понятие о режимах работы Интеллсист

7.2. Реализация режимов и параметров работ

7.3. Схемы транслятора ЯПП на язык Лейбниц

7.4. Состав БЗ для сохранения и трансляция текстов

7.5. Генератор вопросов

7.6. Алгоритмы и их запись

7.7. Диспетчер мыслишек

Литература

Приложение 1. Таблица символов для лексического анализа

Приложение 2. Список типов данных в языке Лейбниц
Приложение 3 Синонимы для операций языка Лейбниц

Приложение 4 Предопределенные атрибуты

Приложение 5 Список прагм

Приложение 6 Граф языка Лейбниц

Приложение 7 Сводка правил порождающей грамматики языка Лейбниц

Приложение 8 Характеристики, зависящие от реализации

Приложение 9. Фундаментальные знания

Приложение 10. Список базовых операций

Приложение 11. Список стандартных операций

Приложение 12. Паспорта структурных данных

Приложение 13. Список стандартных исключений

Приложение 14. Список обозначений расширений для имен файлов

Приложение 15. Список ошибок, обнаруживаемых в Интеллсист


Сокращения для терминов


АП - алгоритм порождения

АР - алгоритм распознавания

БД - база данных

БЗ - база знаний

ВМ - вычислительная машина

ГЯ - граф языка

ЕЯ - естественный язык

ИИС - инструментарий интеллектуальной системы

ИМГР - интерпретатор машины грамматического разбора

Интеллсист - интеллектуальная система

КС - контекстно-свободный

МАВ - машина алгебраического вывода

МГР - машина грамматического разбора

МГР1 - машина грамматического разбора первого типа

МГР2 - машина грамматического разбора второго типа

МГР3 - машина грамматического разбора третьего типа

МГР4 - машина грамматического разбора четвертого типа

ММ - математическая машина

МТ - машина Тьюринга

ППП - пакет прикладных программ

ПЭВМ - персональная электронная вычислительная машина

СВТ - средства вычислительной техники

СеГ - семантическая грамматика

СиГ - синтаксическая грамматика

СП - синтезированная программа

СУБД - система управления базой данных

СУБЗ - система управления базой знаний

т. - том публикации Информатика

ФРАК - формульный автокод

ФЯ - формальный язык

ЭВМ - электронная вычислительная машина

ЭС - экспертная система

ЯВУ - языки высокого уровня

ЯЛ - язык Лейбниц

ЯПП - язык профессиональной прозы


Язык философии - язык понятий


Введение


Программисты прекрасно ориентируются в программировании, поскольку оно определяет их предметную и проблемную области знания. Однако такие знания весьма полезны для решения важных программистских проблем: создание предметов общего системного программирования, разработка операционных систем, программных комплексов обслуживания и автоматизации процессов использования вычислительной техники. Прямой пользователь ВМ решает свою проблему применения ВМ, ее характеристики выходят за пределы характеристик предметной и проблемной областей программиста. Различие в знании программиста и прямого пользователя не способствует эффективному применению ВМ для решения проблем прямого пользователя при использовании им усилий программиста. Итак, хорошее знание только процедурного вида знаний и плохое знание предметной и проблемной областей прямого пользователя не обеспечит качественного использования ВМ и получение своевременного результата, соответствующего проблеме.


Решение проблем или конкретных заданий, по которым строится алгоритм их решения, связано с получением и вводом знаний от прямого пользователя в ВМ. Здесь имеется порог, который преодолеть почти невозможно. Прямой пользователь является специалистом в своей конкретной области знания. Программист чаще всего не имеет таких же знаний в этой области. Конечно, за время общения с прямым пользователем программист многому научился и готов решать проблемы пользователя. При построении алгоритмов программист будет (он почти вынужден) терять часть знаний из-за неточностей в понимании пользователя. Непонимание может быть неуловимым. Понятие приближенных знаний еще не раскрыто, а проблемы уточнения знаний не разрешены. Поэтому программист осуществляет алгоритмизацию знаний пользователя заведомо с потерей точности в процедурном представлении знаний.


Говорят часто о том, что некоторые знания плохо формализуемы. Что это такое? Плохо формализуемые знания можно интерпретировать так. Действительно, некоторым знаниям сложно сопоставить точный процедурный эквивалент, им сопоставляется подходящая процедура, отображающая часть знаний. Прекрасно понимается точность представления чисел, неточность представлений чисел находится под контролем самого алгоритма или программиста. Точность представления знаний, если она выражается численно, также будет находиться под контролем. Не все знания представляются числами, поэтому часть знаний находится не под контролем программиста, они плохо формализованы. Такие рассуждения показывают о возможной утрате знаний пользователя в случае, когда программист использует только процедурное представление знаний. Знания плохо формализуются из-за использования финитных средств их представления. Это вполне оправдано для процедурного подхода в информатике.


Программирование связано с ФЯ, который необходимо изучать и наилучшим образом использовать. Некоторые трудности можно ожидать по этой причине при решении проблем прямого использования ВМ. Будет ли соответствовать ФЯ области знаний, которой интересуется прямой пользователь? Хватит ли языковых средств и методов для представления данных и знаний? Обеспечит ли язык эффективность и надежность программы и процесса ее построения? Имеются и другие вопросы по проблеме соотношения ФЯ - знания. Такие вопросы являются малоизученными, они требуют специального рассмотрения. Это не менее важная причина беспокойств - процесс внедрения ФЯ при использовании ВМ. Почти каждый ФЯ опирается на 30 стандартных зарезервированных слов, которые должны обеспечивать (а фактически не обеспечивают) точность перевода лексикона проблемной области прямого пользователя на этот ФЯ. Конечно же, имеются большие сомнения относительно выполнения требований точного перевода. Здесь издержки обязательны. В связи с такой ситуацией актуальными становятся методы использования естественных национальных языков. Слово «национальных» важно в силу того, что перевод с одного ЕЯ на другой также как и перевод на ФЯ обладает теми же недостатками в применениях относительно представления знания. Знания должны представляться для ввода в ВМ теми средствами, на которых эти знания зарождались. Перевод знания в памяти ВМ должен обеспечивать максимальную точность передачи исходных знаний.


Казалось бы, что спасительным вариантом для устранения любых беспокойств является совместная работа программиста и прямого пользователя. Для организации эффективной совместной работы необходимо обеспечить программиста знаниями в его области, а прямого пользователя в области программирования, построить технологию использования ВМ таким образом, чтобы их деятельность была направлена на решение проблем прямого пользователя. Надо быть каждому хорошим специалистом в своем деле! Реализация этого лозунга и является тормозом при использовании программиста в качестве посредника на пути передачи ВМ точных знаний в рамках процедурного программирования.


Из всех рассуждений вытекает, что прямой пользователь должен быть реальным прямым пользователем без программиста между ним и ВМ. Это означает, что средства передачи знаний ВМ должны ограничиваться ЕЯ или его частью, удовлетворяющей пользователя в его области знания.


На первых ВМ работали исследователи сложных технических систем, которые применяли вычислительную технику для моделирования динамики поведения этих систем, а задания были написаны на математическом языке и проблемы алгоритмизации почти не возникали. Расчет траекторий, распространение тепла в телах, характеристики проникновения частичек в сложных средах и др. применения ВМ использовали математические зависимости. Моделирование технических систем требовало знания математики и приближенных вычислений, что хорошо согласовалось с возможностями процессора ВМ. Может быть и наоборот, процессор ВМ строился так, чтобы максимально удовлетворить запросы моделирования. В качестве языка использовалось цифровое (а затем буквенное) кодирование команд.


Впоследствии началось тиражирование СВТ, что привело к существенному увеличению числа прямых пользователей, исключая программистов. Прежде всего, на вычислительный центр пошел коммерсант, специалист, непрерывно обрабатывающий огромное количество бумажных документов. Как и в предыдущем случае между ВМ и прямым пользователем стоял (и стоит) программист, который с успехом справлялся со своими обязанностями перевода пожеланий пользователя, которые излагались на ЕЯ, в процедурные знания. Кроме этого, сам программист становился прямым пользователем, поскольку ВМ использовалась для составления программ для таких пользователей. Постепенно осуществлялась мечта Лейбница об использовании ВМ для обработки символов таким же образом, как и чисел. С увеличением числа прямых пользователей с одной стороны повысилась роль ЕЯ, а с другой стороны программистам стало работать намного сложнее из-за расширения используемых областей ЕЯ.


ИИС в самых общих чертах представляет собой программный комплекс, с помощью которого собираются словари и характеристики каждого термина (знако или словосочетания), на основе словаря формируется лексикон и грамматика языка профессионала, формируется БЗ из отдельных сообщений пользователя, «обучение Интеллсист», и подготавливается работа процессора логического и алгебраического выводов из вводимого запроса искомого ответа. ИИС напоминает учителя или преподавателя, обучающего своему мастерству учеников (в нашем случае - ВМ). Интеллсист напоминает специалиста, который после обучения становится квалифицированным консультантом и решателем проблем по данной специальности с помощью части ЕЯ, которая обозначена как ЯПП. Так должна выглядеть процедура работы с ВМ. При этом надо учитывать требовательность по быстродействию и физическим размерам памяти ВМ.


Итак, в памяти ВМ, в которой находится Интеллсист, имеется лексикон конкретной предметной и проблемной области, БЗ и процессор логического вывода нового знания из имеющегося знания. Каждый прямой пользователь желает решить свою проблему на основе БЗ. Он формулирует свой запрос, ставит вопрос или составляет задание, для решения его проблемы. Запрос, вопрос или задание на выполнение работ передается ВМ для выполнения. Интеллсист в результате логического вывода по БЗ выводит и печатает ответ или формулирует свои вопросы прямому пользователю для уточнения запроса, вопроса или задания. Прямой пользователь в таком случае будет замыкать цикл запрос-ответ путем принятия решений относительно полученного от ВМ ответа. Если ответ не удовлетворителен, то Интеллсист может запросить дополнительные знания для уточнения ответа. Если ответ удовлетворителен, то прямой пользователь может переходить к разрешению других запросов, вопросов или заданий (подробно процедуры работы ИИС и Интеллсист даны в томе 7).


Запросы, вопросы или задания могут иметь значительные размеры. Имеется в виду запрос, состоящий из сотни тысяч символов. Работа с таким запросом потребует специальной технологии общения с ВМ. Работа в таком случае должна опираться на такие методы информатики как модульное (структурное, сверху вниз или снизу-вверх и др.) проектирование и разработка. Эти методы требуют специальных знаний в информатике, применяемых в данной области или отрасли знаний. Методам программирования и информатики описаны в томе 6.


Из предварительного рассуждения видно, что использование ВМ начинается с построения средств общения в системе человек-ВМ. Худшим вариантом общения является передача для ВМ знания в форме кода или машинного языка. Конечно же, улучшенным вариантом является использование ФЯ. Наилучшим вариантом общения является передача для ВМ знания на ЕЯ. Эти варианты будут рассмотрены ниже как противоположные с точек зрения эффективности работы ВМ и пользователя. Рассуждение об Интеллсист приведены только для ориентира, который нужно иметь в виду, если прогнозировать развитие информатики.


Все мы невежды, но только в разных областях.

У. Роджерс


Глава 1. Общение в системе человек-ВМ


Компьютер (для универсальности конструкции компьютера употребляется аббревиатура ВМ - вычислительная машина) становится привычным орудием исследования. Им пользуются научные работники, финансисты, работники торговли или управления, студенты и дети, а в недалеком будущем и домашние хозяйки. Многие люди, стремящиеся решать на ВМ свои задачи, считают, что ВМ - это рабочее место программиста. Во многом они правы, поскольку без составления программы новую задачу на ВМ не решить. Чаще всего для новой задачи еще не существует программы или имеющаяся программа не совсем подходит к решению новой задачи. Действительно, составление программы является уделом программистов, если не существует программы составляющей программы по информации, которой располагает желающий решить новую задачу, а пользователь ВМ является специалистом в своей области знания и не должен знать программирование.


Для того чтобы успешно решать свои новые задачи на ВМ каждый специалист должен иметь средства общаться с ВМ на его профессиональном языке независимо от того, в какой области знания он работает. Только программист может общаться с ВМ на языке программирования. Попробует разобраться в вопросе использования ВМ каждым специалистом, научным работником, финансистом, работником торговли или управления, студентом и детьми. Рассмотрим такие средства общения с ВМ, которые близки пользователям ВМ.


Работа с ВМ - это диалог с предложениями от человека по выполнению заданий и с ответами ВМ на предложения. Диалог естественным образом подразумевает язык, с помощью которого формируются сообщения от человека для ВМ и от ВМ для человека. Нельзя при этом забывать об общении человек-человек и ВМ-ВМ. Общение человек-человек подразумевает использование ЕЯ, а общение ВМ-ВМ - последовательности кодов. Указанные средства важны для информатики, поскольку они влияют на средства общения человек-ВМ и способствуют углубленному пониманию смысла передаваемых сообщений. Изучение диалога человек-ВМ представляется сложным и быстро прогрессирующим делом. История такого диалога насчитывает уже достаточное число лет [Бакланов78, Белнап81, Белый10, Бидер76, Богодист74, Брябрин81, Ван Дейк78, Виноград76, Денинг84, Косарев89, Коутс90, Красилов78б, Ловицкий80, Машина86, ПоповЭ82, Рубашкин89, Сильдмяэ83, Фреге77, Ыйм78].


1.1. Основные средства общения


Самая общая классификация средств общения включает предметы, рисунки и символы. Такая последовательность в перечислении является исторической. На ранней стадии своего развития человек (по-видимому) общался с другим человеком предметно, затем появились рисунки для передачи мыслей между людьми и, наконец, родились знаки (условные обозначения рисунков) для повышения эффективности общения. Знаковые системы до сих пор развиваются и пока не видна альтернатива таким средствам общения. Использование знаков привело к необходимости построения системы из правил сочетания знаков в последовательности, появилась грамматика.


В информатике реализуется обратная последовательность. Вначале развития СВТ использовались символы для передачи информации в системах, в которые входит человек и ВМ. С развитием СВТ стали использовать средства визуализации информации и средства передачи информации рисунками. Дальнейшее развитие СВТ приведет к возможности использования реальных предметов для передачи информации. Более тонкая классификация имеет смысл внутри основных средств общения. По мере необходимости будем рассматривать тонкую классификацию.


Общение в системах человек-человек строится на основе широкого использования всех органов чувств человека: зрения, слуха, осязания, обоняния, вкуса и др. Знаки, как единицы сообщений, имеют самые разнообразные формы и структуры. Информатика стремится использовать те же основы общения в системах человек-ВМ. Полная реализация программы общения человек-человек в системах человек-ВМ не представляется пока возможным. Эта ситуация объясняется достаточно еще слабыми результатами развития СВТ и сложностями формализации процессов общения человек-человек. Сегодня еще имеется недостаточное представление о проблеме передачи интонации, длинного контекста и условностей общения. Пути развития средств общения в системах человек-ВМ можно проследить на имеющихся средствах. Конечно, Здесь не будет никакого касательства технических средств конструирования устройств общения. Здесь рассматриваются только информатические вопросы и проблемы общения.


Символическое и предметное общение в системе человек-ВМ имелось и остается - это использование клавиш (предметов) для воздействия на программы или ход вычислительного процесса. Общение с помощью рисунков еще предстоит осваивать, поскольку графика используется еще не достаточно широко. Несмотря на имеющиеся успехи необходим огромный труд по освоению методов, средств и операций ввода, преобразования и вывода графики, картинок и рисунков. Информатика рисунков (графическая информатика) находится в зачаточном состоянии. Известны средства их ввода, печати и некоторые простейшие операции для преобразования.


Эффективное использование зрения, связанного с информатикой рисунков, находится в стадии развития. Телевизионное изображение вводится в память ВМ и частично обрабатывается. Решаются некоторые задачи на основе зрительных образов. Известны программы создания не только мультфильмов, но и фильмов с реальными объектами. Методы и средства решения таких задач основаны на использовании программистских приемов. Не так долго осталось ждать широкого применения ввода, преобразования и вывода зрительных образов с помощью зрительных сенсоров.


Хуже обстоит дело с использованием слуха человека. Имеются технические средства восприятия и воспроизведение звуковых сигналов, их распознавание (осмысливания) и синтез звука по текстам. Можно сказать, что начальное общение человека с ВМ на основе звуков освоено. Предстоит важная работа по синтезу текстов, являющихся результатами решения задач, преобразованию текстов в звук с учетом интонаций, образов и ситуаций передачи результатов работы ВМ звуком.


Осязание также используется в СВТ, например, при передаче информации с помощью экрана дисплея. Но это все пока только начальная стадия внедрения осязательных возможностей человека, реализующая предметное общение. Важно, чтобы в память ВМ вводилась осязательная информация в таком количестве, чтобы Интеллсист могла не только решать оперативные задачи, но и по необходимости ставить задачи автоматически.


Совсем плохо дело обстоит с обонятельным и вкусовым общением человека с ВМ, поскольку моделирование таких способностей человека не достигло уровня, на котором можно реализовать такие средства в системе человек-ВМ. Нужны ли такие средства общения? Бесспорно, нужны. Если человек эффективно их использует, то эффективность использования органов чувств человека можно повысить в связи с применением СВТ и в особенности системы человек-ВМ.


Следует обратить внимание на то обстоятельство, что внутренняя обработка информации реализуется с помощью начальных программ. Это значит, что главная трудность в использовании всех возможностей человека лежит в области создания СВТ и программ обработки соответствующего вида информации. Использование программ ввода того или иного вида информации не заставит себя ждать.


Итак, будем ориентироваться на символьные средства общения. Смысл предмета, явления или процесса можно передать только средствами языка. В связи с этим исследование языков и методов их применения является важной составляющей частью информатики. Именно поэтому проблемы языкового общения в системе человек-ВМ рассматриваются в виде самостоятельного тома (см. т.4).


Конечно, основным рассматриваемым средством общения будем считать язык. Самая общая классификация языков известна и она определяется следующей фразой: языки подразделяются на рассудительные и командные языки. Язык рассуждений представляются текстами описания предметов, явлений и процессов, фактами на эти объекты. Языки команд также представляются текстами описания предписываемых действий и требуют специального рассмотрения. Языки команд ВМ освоены широко в программировании, проблема командного общения человека нуждается в поисках новых путей реализации, исключая простые средства типа команда человека – одна процедура или подпрограмма. А начнем именно с рассудительного языка, а затем рассматриваются некоторые командные языки. История информатики начиналась с использования командных языков. В первую очередь к языкам команд относятся языки программирования. Специальным языком команд является язык МГР, который описывается в главе 5.


Основные функции языка связаны с задачами, которые решаются в процессе коммуникации и познания. Язык выполняет следующие основные функции:

  1. Описательная функция - сообщения о реальном или мыслимом положении вещей. Сюда можно отнести разделы, в которых описываются величины, употребляемые в командах.

  2. Язык предназначен для изложения смысла, передачи осмысливаемых сообщений.

  3. Язык определяет предметы, явления и процессы.

  4. С помощью языка осуществляется накопление фактов.

  5. К нормативным функциям языка относится формирование норм (правил) для понимания сообщений (приемником).

  6. С помощью языка реализуется изменение мира слов путем передачи команд и оценок состояния (приемника).

  7. Языком осуществляется выражение разнообразных чувств, отношений к реальному миру.

Все эти функции можно усмотреть при неформальном и формальном описании ЯПП.

1   2   3   4   5   6   7   8   9   ...   33

Похожие:

В семи томах том Информатика смысла Машинная лингвистика iconСобрание сочинений в семи томах 3 «Собрание сочинений в семи томах»: Время; 2008
Собрание сочинений М. М. Зощенко — самое полное издание прозы одного из крупнейших писателей-новаторов XX века. В него входят практически...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Излагаемые методы частично модифицированы по сравнению с их оригинальным изложением для их ориентирования и усиления при использовании...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Определяются логические лексемы, фундаментальные операции, правила преобразования логических уравнений, а также металогика для обоснования...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика в семи томах
Словарь поможет пользователям Интеллсист и разработчикам машинных систем разнообразного назначения в написании отчетов, руководств...
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Основы информатики (Введение в информатику)
Вм на основе своих общих и профессиональных знаний без привлечения программистов для решения задач, для разрешения вопросов или проблем...
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Представление знаний (Структуры данных)
Приводимые примеры служат фрагментами прототипов записей знаний и запросов, предназначенных для создателей заданий и запросов к базе...
В семи томах том Информатика смысла Машинная лингвистика iconРавительство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том V уфа гилем 2010
Российская академия наук Уфимский научный центр ■ Институт истории, языка и литературы
В семи томах том Информатика смысла Машинная лингвистика iconЬство республики башкортостан академия наук республики башкортостан история башкирского народа в семи томах том VI москва восточная литература 2011
Российская академия наук Уфимский научный центр Институт истории, языка и литературы
В семи томах том Информатика смысла Машинная лингвистика iconВ семи томах том Интеллектуальные системы (Системы решения проблем)
Интеллсист, их структуры и технологии работы с инструментарием составляют центральную часть тома. Оценка возможностей Интеллсист...
В семи томах том Информатика смысла Машинная лингвистика iconИнформатика и вычислительная техника” и специальностей 220100 “Вычислительные машины, комплексы, системы и сети” и 021800 “Теоретическая и прикладная лингвистика” Ульяновск 2003
Методические указания к выполнению лабораторных работ по программированию для студентов направления 552800 “Информатика и вычислительная...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница