Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика»




НазваниеКнига предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика»
страница4/12
Дата02.03.2013
Размер1.54 Mb.
ТипКнига
1   2   3   4   5   6   7   8   9   ...   12

1.3. Файлы и файловая структура

Единицы представления данных

Существует множество систем представления данных. С одной из них, принятой в информатике и вычислительной технике, двоичным кодом, мы познакомились выше. Наименьшей единицей такого представления является бит (двоичный разряд).

Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. Практика показывает, что с битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называются байтами.



Понятие о байте как группе взаимосвязанных битов появилось вместе с первыми образцами электронной вычислительной техники. Долгое время оно было машинно-зависимым, то есть для разных вычислительных машин длина байта была разной. Только в конце 60-х годов понятие байта стало универсальным машиннонезависимым.

Выше мы видели, что во многих случаях целесообразно использовать не восьми­разрядное кодирование, а 16-разрядное, 24-разрядное, 32-разрядное и более. Группа из 16 взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называ­ется словом. Соответственно, группы из четырех взаимосвязанных байтов (32 разряда) называются удвоенным словом, а группы из восьми байтов (64 разряда) — учетверенным словом. Пока, на сегодняшний день, такой системы обозначения достаточно.

Единицы измерения данных

Существует много различных систем и единиц измерения данных. Каждая науч­ная дисциплина и каждая область человеческой деятельности может использовать . свои, наиболее удобные или традиционно устоявшиеся единицы. В информатике для измерения данных используют тот факт, что разные типы данных имеют уни­версальное двоичное представление и потому вводят свои единицы данных, осно­ванные на нем.

Наименьшей единицей измерения является байт. Поскольку одним байтом, как правило, кодируется один символ текстовой информации, то для текстовых доку­ментов размер в байтах соответствует лексическому объему в символах (пока исклю­чение представляет рассмотренная выше универсальная кодировка UNICODE).

Более крупная единица измерения — килобайт (Кбайт). Условно можно считать, что 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислитель­ной техники, работающей с двоичными числами, более удобно представление чисел в виде степени двойки и потому на самом деле 1 Кбайт равен 210 байт (1024 байт). Однако всюду, где это не принципиально, с инженерной погрешностью (до 3 %) «забывают» о «лишних» байтах.

В килобайтах измеряют сравнительно небольшие объемы данных. Условно можно считать, что одна страница неформатированного машинописного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавлением префиксов мега-, гига,- тера-; в более крупных единицах пока нет практической надобности.

1 Мбайт = 1024 Кбайт = 1020 байт

1 Гбайт = 1024 Мбайт = 1030 байт

1 Тбайт = 1024 Гбайт = 1040 байт

Особо обратим внимание на то, что при переходе к более крупным единицам «инже­нерная» погрешность, связанная с округлением, накапливается и становится недо­пустимой, поэтому на старших единицах измерения округление производится реже.

Единицы хранения данных

При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру, а при этом, как мы уже знаем, образуется «паразитная нагрузка» в виде адресных данных. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.

Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т. п.), поскольку неполное заполнение одной единицы хранения приводит к неэффективности хранения.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл — это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относя­щиеся к одному типу. В этом случае тип данных определяет тип файла.

Проще всего представить себе файл в виде безразмерного канцелярского досье, в которое можно по желанию добавлять содержимое или извлекать его оттуда. Поскольку в определении файла нет ограничений на размер, можно представить себе файл, имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информа­цией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адреса­цией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информа­ции из файла.

Понятие о файловой структуре

Требование уникальности имени файла очевидно — без этого невозможно гаран­тировать однозначность доступа к данным. В средствах вычислительной техники требование уникальности имени обеспечивается автоматически — создать файл с именем, тождественным уже имеющемуся, не может ни пользователь, ни авто­матика.

Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги {папки}. Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ «\» (обратная косая черта).

Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами.

Пример записи полного имени файла:

<имя носителя>\<имя каталога-1>\...\<имя каталога-М>\<собственное имя файла>

Вот пример записи двух файлов, имеющих одинаковое собственное имя и размещен­ных на одном носителе, но отличающихся путем доступа, то есть полным именем. Для наглядности имена каталогов (папок) напечатаны прописными буквами.

С:\АВТОМАТИЧЕСКИЕ АППАРАТЫ\ВЕНЕРА\АТМОСФЕРА\Результаты исследований С:\РАДИОЛОКАЦИЯ\ВЕНЕРА\РЕЛЬЕФ\Результаты исследований

О том, как на практике реализуются файловые структуры, мы узнаем несколько позже, когда познакомимся со средствами вычислительной техники и с понятием файловой системы.


1.4. Информатика

Предмет и задачи информатики

Информатика — это техническая наука, систематизирующая приемы создания, хранения, воспроизведения, обработки и передачи данных средствами вычислитель­ной техники, а также принципы функционирования этих средств и методы управ­ления ими.

Из этого определения видно, что информатика очень близка к технологии, поэтому ее предмет нередко называют информационной технологией.

Предмет информатики составляют следующие понятия:

• аппаратное обеспечение средств вычислительной техники;

• программное обеспечение средств вычислительной техники;

• средства взаимодействия аппаратного и программного обеспечения;

• средства взаимодействия человека с аппаратными и программными средствами.

Как видно из этого списка, в информатике особое внимание уделяется вопросам взаимодействия. Для этого даже есть специальное понятие — интерфейс. Методы и средства взаимодействия человека с аппаратными и программными средствами называют пользовательским интерфейсом. Соответственно, существуют аппаратные интерфейсы, программные интерфейсы и аппаратно-программные интерфейсы.

Основной задачей информатики является систематизация приемов и методов работы с аппаратными и программными средствами вычислительной техники. Цель система­тизации состоит в выделении, внедрении и развитии передовых, наиболее эффектив­ных технологий, в автоматизации этапов работы с данными, а также в методическом обеспечении новых технологических исследований.

Информатика — практическая наука. Ее достижения должны проходить подтверж­дение практикой и приниматься в тех случаях, когда они соответствуют критерию повышения эффективности. В составе основной задачи информатики сегодня можно выделить следующие направления для практических приложений:

• архитектура вычислительных систем (приемы и методы построения систем, предназначенных для автоматической обработки данных);

• интерфейсы вычислительных систем (приемы и методы управления аппаратным и программным обеспечением);

• программирование (приемы, методы и средства разработки компьютерных программ);

• преобразование данных (приемы и методы преобразования структур данных);

• защита информации (обобщение приемов, разработка методов и средств защиты данных);

• автоматизация (функционирование программно-аппаратных средств без участия человека);

• стандартизация (обеспечение совместимости между аппаратными и программ­ными средствами, а также между форматами представления данных, относя­щихся к различным типам вычислительных систем).

На всех этапах технического обеспечения информационных процессов для инфор­матики ключевым понятием является эффективность. Для аппаратных средств под эффективностью понимают отношение производительности оборудования к его стоимости (с учетом стоимости эксплуатации и обслуживания). Для программного обеспечения под эффективностью понимают производительность лиц, работающих с ними (пользователей). В программировании под эффективностью понимают объем программного кода, создаваемого программистами в единицу времени.

В информатике все жестко ориентировано на эффективность. Вопрос, как сделать ту или иную операцию, для информатики является важным, но не основным. Основным же является вопрос, как сделать данную операцию эффективно.

Истоки и предпосылки информатики

Слово информатика происходит от французского слова Informatique, образован­ного в результате объединения терминов Information {информация) и Automatique {автоматика), что выражает ее суть как науки об автоматической обработке инфор­мации. Кроме Франции термин информатика используется в ряде стран Восточной Европы. В то же время, в большинстве стран Западной Европы и США используется Другой термин — Computer Science {наука о средствах вычислительной техники).

В качестве источников информатики обычно называют две науки — документалистику и кибернетику. Документалистика сформировалась в конце XIX века в связи с бур­ным развитием производственных отношений. Ее расцвет пришелся на 20-30-е годы XX века, а основным предметом стало изучение рациональных средств и методов повышения эффективности документооборота.

Основы близкой к информатике технической науки кибернетики были заложены трудами по математической логике американского математика Норберта Винера, опубликованными в 1948 году, а само название происходит от греческого слова (kybemeticosискусный в управлении).

Впервые термин кибернетика ввел французский физик Андре Мари Ампер в первой половине XIX веке. Он занимался разработкой единой системы классификации всех наук и обозначил этим термином гипотетическую науку об управлении, которой в то время не существовало, но которая, по его мнению, должна была существовать.

Сегодня предметом кибернетики являются принципы построения и функционирова­ния систем автоматического управления, а основными задачами — методы моделиро­вания процесса принятия решений техническими средствами, связь между психоло­гией человека и математической логикой, связь между информационным процессом отдельного индивидуума и информационными процессами в обществе, разработка принципов и методов искусственного интеллекта. На практике кибернетика во многих случаях опирается на те же программные и аппаратные средства вычисли­тельной техники, что и информатика, а информатика, в свою очередь, заимствует у кибернетики математическую и логическую базу для развития этих средств.

Подведение итогов

Все процессы в природе сопровождаются сигналами. Зарегистрированные сигналы образуют данные. Данные преобразуются, транспортируются и потребляются с помощью методов. При взаимодействии данных и адекватных им методов образу­ется информация. Информация — это динамический объект, образующийся в ходе информационного процесса. Он отражает диалектическую связь между объектив­ными данными и субъективными методами. Свойства информации зависят как от свойств данных, так и от свойств методов.

Данные различаются типами, что связано с различиями в физической природе сигналов, при регистрации которых образовались данные. В качестве средства хра­нения и транспортировки данных используются носители данных. Для удобства операций с данными их структурируют. Наиболее широко используются следую­щие структуры: линейная, табличная и иерархическая — они различаются методом адресации к данным. При сохранении данных образуются данные нового типа — адресные данные.

Вопросами систематизации приемов и методов создания, хранения, воспроизведения, обработки и передачи данных средствами вычислительной техники занимается техническая наука — информатика. С целью унификации приемов и методов работы с данными в вычислительной технике применяется универсальная система кодирова­ния данных, называемая двоичным кодом. Элементарной единицей представления данных в двоичном коде является двоичный разряд (бит). Другой, более крупной единицей представления данных является байт.

Основной единицей хранения данных является файл. Файл представляет собой последовательность байтов, имеющую собственное имя. Совокупность файлов обра­зует файловую структуру, которая, как правило, относится к иерархическому типу. Полный адрес файла в файловой структуре является уникальным и включает в себя собственное имя файла и путь доступа к нему.

Вопросы для самоконтроля

1. Как вы можете объяснить бытовой термин «переизбыток информации»? Что име­ется в виду: излишняя полнота данных; излишняя сложность методов; неадек­ватность поступающих данных и методов, имеющихся в наличии?

2. Как вы понимаете термин «средство массовой информации»? Что это? Средство массовой поставки данных? Средство, обеспечивающее массовое распростране­ние методов? Средство, обеспечивающее процесс информирования путем поставки данных гражданам, обладающим адекватными методами их потребления?

3. Как вы полагаете, являются ли данные товаром? Могут ли методы быть товаром?

4. На примере коммерческих структур, обеспечивающих коммуникационные услуги, покажите, как взаимодействуют между собой маркетинг данных и маркетинг методов? Можете ли вы привести примеры лизинга данных и методов?

5. Как вы понимаете диалектическое единство данных и методов? Можете ли вы привести примеры аналогичного единства двух понятий из других научных дисциплин: естественных, социальных, технических?

6. Как вы понимаете динамический характер информации? Что происходит с ней по окончании информационного процесса?

7. Можем ли мы утверждать, что данные, полученные в результате информаци­онного процесса, адекватны исходным? Почему? От каких свойств исходных данных и методов зависит адекватность результирующих данных?

8. Что такое вектор данных? Является ли список номеров телефонов населенного пункта вектором данных? Является ли вектором данных текстовый документ, закодированный двоичным кодом, если он не содержит элементов оформления?

9. Является ли цифровой код цветного фотоснимка вектором данных? Если нет, то чего ему не хватает?

10. Как вы понимаете следующие термины: аппаратно-программный интерфейс, программный интерфейс, аппаратный интерфейс? Как бы вы назвали специ­альность людей, разрабатывающих аппаратные интерфейсы? Как называется специальность людей, разрабатывающих Программные интерфейсы?

11. На основе личных наблюдений сделайте вывод о том, какими средствами может пользоваться преподаватель для обеспечения интерфейса с аудиторией. Можете ли вы рассмотреть отдельно методические и технические средства, имеющиеся в его распоряжении? Может ли преподаватель рассматривать вашу тетрадь и авто­ручку как свое средство обеспечения интерфейса? Если да, то в какой мере?



1   2   3   4   5   6   7   8   9   ...   12

Похожие:

Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconУчебник для вузов Под редакцией С. В. Симоновича
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика», для преподавательского...
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconКнига также может быть полезна практикующим инженерам, осваивающим современные компьютерные технологии, преподавателям вузов и средних специальных учебных заведений
Учебник предназначен для студентов и бакалавров, магистров и аспирантов технических вузов, изучающих информационные технологии в...
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconНовый комплексный учебник по сапр
Учебник предназначен для студентов и бакалавров, магистров и аспирантов технических вузов, изучающих информационные технологии в...
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconПрограмма дисциплины «Информационные технологии в рекламе» для направления 031600. 61 «Реклама и связи с общественностью»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов для специальности 032401....
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconАннотация дисциплины «Мировые информационные ресурсы и сети» Общая трудоемкость изучения дисциплины составляет
Дисциплина «Мировые информационные ресурсы и сети» предназначена для студентов третьего курса, обучающихся по направлению 220400...
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconАннотация дисциплины «Мировые информационные ресурсы и сети» Общая трудоемкость изучения дисциплины составляет
Дисциплина «Мировые информационные ресурсы и сети» предназначена для студентов третьего курса, обучающихся по направлению 220400...
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconПрограмма дисциплины «Информационные технологии в рекламе»  для специальности 032401. 65 «Реклама»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов для специальности 032401....
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconИ. В. Челышева методика и технология
Книга предназначена для студентов вузов, аспирантов, преподавателей высшей школы, учителей, исследователей в области педагогики и...
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconПрограмма дисциплины Распределенные информационные системы для направления 080500. 62 «Бизнес-информатика»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080500....
Книга предназначена для студентов технических вузов, изучающих информационные технологии в рамках дисциплины «Информатика» iconПрограмма дисциплины «Проектирование информационных систем» для специальности 230201. 65 «Информационные системы и технологии»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов специальности 230201. 65 «Информационные...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница