- Способы доступа к файлам в рамках межпрограммных и пользовательских интерфейсов.
Первые 2 компонента являются базовыми, они составляют так называемую физическую основу файловой системы. Последний компонент наиболее важен для пользователя, он составляет логическую организацию файловой системы.
Та или иная физическая организация файловой системы устанавливается процедурой форматирования носителя данных. Процедура форматирования уничтожает все данные на носителе (если они там были) и превращает носитель в «чистый лист», на который можно записывать файлы.
По способу физической организации существует несколько различных файловых систем. Рассмотрим наиболее распространенные из них.
Файловая система FAT (File Allocations Table) – это одна из наиболее старых файловых систем для ПК, разработанная Биллом Гейтсом и Марком МакДональдом в 1977г. Система FAT может реализовываться на логических дисках HDD, на FDD и на других аналогичных носителях. При использовании системы FAT все пространство данного диска делится на равные последовательно расположенные области – кластеры. Как было указано ранее, существует минимальный объем данных, называемый сектором (блоком), который может быть записан на жесткий диск или прочитан с жесткого диска. Объем кластера должен составлять целое число секторов. Каждый файл может состоять из одного или из нескольких кластеров в зависимости от своего размера. Минимальный размер файла на диске – один кластер. Весь диск делится на 5 разделов — загрузочный сектор (1-й сектор 1-й дорожки), область FAT-таблицы, область копии FAT-таблицы, область каталога, область файлов. Первые 4 раздела занимают небольшой объем и содержат системную информацию.
В загрузочном секторе находится загрузочная запись, указывающая системе BIOS местонахождение на данном носителе загружаемой операционной системы. Если загрузочная запись отсутствует или в ней есть ошибка, BIOS считает, что на данном носителе загружаемая операционная система отсутствует.
В FAT-таблице хранится информация обо всех кластерах логического диска. Каждому кластеру в FAT соответствует отдельная запись, которая показывает, свободен ли он, занят ли данными файла, или помечен как сбойный (испорченный). Если кластер занят под файл, то в соответствующей записи в таблице размещения файлов указывается адрес следующего кластера этого файла. В записи, соответствующей последнему кластеру данного файла, вместо адреса следующего кластера ставится специальная метка. Отметим, что в FAT-таблице не содержатся имена файлов. Копия FAT-таблицы идентична самой FAT-таблице. Она используется для восстановления файлов в случае сбоев.
Каталог (корневая папка) содержит все имена файлов и подкаталогов (вложенных папок) со ссылкой на запись в FAT-таблице, указывающей на первый кластер данного файла. Кроме того, в каталоге указываются дополнительные характеристики (атрибуты) файла: дата и время создания, размер, дополнительные атрибуты (архивный, скрытый, системный, “только для чтения”).
Поскольку FAT изначально проектировалась для однопользовательской операционной системы DOS, то она не предусматривает хранения такой информации, как сведения о владельце или полномочия доступа к файлу/каталогу. Кроме того, т. к. DOS – 16-разрядная операционная система, то, соответственно, FAT – также 16-разрядная файловая система. Это означает, что максимальное количество кластеров на диске составляет 216 (примерно 64000 тыс.). Это совсем немного. Еще один недостаток FAT-системы – сильное уменьшение скорости поиска файлов, при увеличении объема носителей. Наконец, FAT не может поддерживать диски объемом более 2 ГБ.
В настоящее время FAT используется в основном для магнитных дискет (FDD).
Файловая система VFAT (Virtual FAT), реализованная в Windows 95/98 — это система FAT, дополненная поддержкой длинных имен файлов в кодировке UNICODE (каждый символ имени кодируется 2 байтами). VFAT использует ту же самую схему распределения дискового пространства, что и файловая система FAT. В VFAT имя может быть длиной до 255 символов, в имя можно включать несколько пробелов и точек, текст после последней точки рассматривается как расширение, регистр символов в именах не различается, но сохраняется. Длинные имена по частям хранятся в специальных записях каталога. Для каждого файла и подкаталога в VFAT хранится два имени: длинное и короткое. Короткое имя генерируется файловой системой автоматически в формате 8.3 (имя из 8 символов, точка, расширение из 3-х символов).
Файловая система FAT32 — это 32-разрядная файловая система, которая пришла на смену VFAT, сохранив основные черты и принципы организации последней. FAT32 поддерживает жесткие диски объемом до 2 терабайт. Впервые файловая система FAT32 была включена в состав ОС Windows 95 OSR 2. В FAT32 были расширены атрибуты файлов, позволяющие теперь хранить время и дату создания, модификации и последнего доступа к файлу или каталогу. В FAT32 адрес каждого кластера стал 32 разрядным, что позволило иметь на диске до 232 = 4 млрд. кластеров. В FAT32 объем кластера должен быть не менее 4 кБ, а объем диска – не менее 512 МБ. Корневой каталог в FAT32 больше не располагается в определенном месте, вместо этого хранится указатель на начальный кластер корневого каталога. В результате снимается ранее существовавшее ограничение на число записей в корневом каталоге. Кроме того, для учета свободных кластеров, в зарезервированной области на разделе FAT32 имеется сектор, содержащий число свободных кластеров и номер самого последнего использованного кластера. Это позволяет системе при выделении следующего кластера не перечитывать заново всю таблицу размещения файла. FAT32 поддерживается в Windows 98, Windows ME, Windows 2000 и Windows XP.
Файловая система NTFS (New Technology File System) — наиболее предпочтительная файловая система при работе с ОС Windows 2000 и Windows XP.
Каждый файл на томе NTFS представлен записью в специальном файле – главной файловой таблице — метафайле MFT (Master File Table). В отличие от файловой таблицы и каталога FAT метафайл является иерархической базой данных, позволяющей очень быстро осуществлять поиск нужного файла
NTFS является 64-разрядной файловой системой, что дает возможность иметь 264 кластеров, каждый размером до 64 Кбайт. Как и в FAT размер кластера может меняться, но необязательно возрастает пропорционально размеру диска. NTFS позволяет хранить файлы размером до 16 эксабайт (264 байт).
Файловая система NTFS является журналируемой – все изменения в файловой системе записываются в специальный журнал транзакций (log file), что позволяет восстанавливать файловую систему после сбоев системы.
В NTFS значительно расширены возможности по управлению доступом к отдельным файлам и каталогам, введено большое число атрибутов, реализована отказоустойчивость, средства динамического сжатия файлов. NTFS позволяет использовать имена файлов длиной до 255 символов, при этом она использует тот же алгоритм для генерации короткого имени, что и VFAT. .Начиная с NTFS 5.0 введена возможность динамического шифрования файлов и каталогов, повышающая надежность хранения информации.
Файловые системы UFS (Unix File System) – это семейство файловых систем для операционных систем UNIX. Существует много различных версий ОС UNIX, разработанных разными фирмами, соответственно существуют и различные виды UFS, в том числе 32-разрядные и 64-разрядные USF. Так же как и в других файловых системах, в UFS файл записывается в один или несколько (а может быть и в несколько сотен тысяч) кластеров. Особенностью USF является иерархическая кластерная структура файла, включающая кластеры, содержащие адреса других кластеров данного файла. Еще одной особенностью UFS является очень мощная и разветвленная система защиты файлов от несанкционированного доступа – для этого файловая система содержит большое количество атрибутов. Классическая UFS поддерживает 14-буквенные имена файлов, современные UFS позволяют создавать длинные имена (до 255 символов).
Перечислим еще несколько современных файловых систем, близких по принципам построения к NTFS и USF.
Файловая система HPFS (High Performance File System) была разработана вместе с операционной системой OS/2. По структуре и возможностям близка к NTFS. В настоящее время используется редко.
Файловые системы Linux ext, Linux ext2, Linux ext3 (extended file system) специально разработаны под операционную систему Linux. Они обладают высокой надежностью и производительностью. Начиная с ext3 файловая система становится журналируемой.
Файловая система XFS — высокопроизводительная 64-разрядная журналируемая файловая система, созданная компанией Silicon Graphics и поддерживаемая операционными системами Linux (начиная с версии 2.4.25) и. FreeBSD. Позволяет эффективно работать с данными на RAID-массивах и других носителях очень большого объема.
Для персональных компьютеров Mac под Mac OS X используются файловые системы HFS (Hierarchical File System), HFS Plus. Недавно для этих компьютеров была разработана высокопроизводительная 64- битная сетевая файловая система Xsan.
Одной из неприятностей, возникающих при работе с файловой системой, является фрагментация файлов – в процессе удаления файлов (очистки кластеров) и записи новых файлов (заполнения кластеров) неизбежно оказывается, что многие файлы состоят из кластеров, находящихся в разных частях диска. В результате сильно понижается скорость работы с диском (для чтения или записи фрагментированного файла магнитной головке необходимо последовательно перемещаться на все дорожки, содержащие кластеры этого файла). Для избежания этого необходимо периодически проводить процедуру дефрагментации диска – запускать специальную утилиту, которая собирает данные из всех кластеров каждого файла и записывает их в компактную область диска (насколько это возможно). Для эффективной работы процедуры дефрагментации необходимо, чтобы диск не был полностью занят, желательно, чтобы не менее 20 – 30% диска было свободно. Особенно это важно для файловой системы NTFS. Процедуру дефрагментации лучше проводить, не дожидаясь сильной фрагментации диска, т.к. время на эту процедуру резко возрастает с увеличением фрагментации. Для сильно фрагментированного диска процедура дефрагментации может потребовать несколько часов. Для проведения дефрагментации в состав ОС Windows входит утилита, которая так и называется Дефрагментация диска.
Некоторые из современных файловых систем не требуют запуска процедуры дефрагментации, а поддерживают возможность постоянной дефрагментации операционной системой в автоматическом режиме (дефрагментация «на лету»). Такая возможность предусмотрена, например, в файловой системе XFS.
3.3.2. Логическая файловая система.
Логическая файловая система – это файловая структура с точки зрения прикладных программ и пользователя. Пользователю не очень важно как именно физически расположен файл на диске, из каких кластеров он состоит и как к этим кластерам получить доступ – ему нужно просто получить данные, находящиеся в файле или записать туда новые данные. На жестком диске современного ПК может храниться много тысяч файлов и, если бы не было четкой логики их размещения, разобраться в этом наборе данных было бы невозможно. Такая логика и обеспечивается логической файловой структурой.
С этой точки зрения файловая система представляет собой иерархическую структуру, состоящую из файлов и контейнеров – папок (каталогов, директорий). Каждая папка может включать в себя файлы и другие папки, которые в этом случае называются вложенными. Каждая папка, кроме одной, самой верхней папки, называемой корневой папкой (корневым каталогом), оказывается вложенной в какую-либо другую папку. Логическая иерархия папок повторяет логическую иерархию каталогов, заложенную на уровне физической файловой системы.
Логическая файловая структура приводит к понятию полного имени файла (пути к файлу) – символьному имени, уникальному для каждого файла. Полные имена любых двух файлов диска не могут совпадать (в отличие от просто имен).
Полное имя файла формируется следующим образом. Корневой каталог обозначается идентификатором диска с двоеточием после него, например c:, d:, e: и т.д. Далее указывается вся цепочка имен вложенных папок, приводящая к данному файлу, в конце указывается имя файла. Для отделения имени файла от имени папки и имен папок в цепочке друг от друга используется разделитель. В Windows это обратный слеш \, в UNIX – просто слеш / (впрочем, сейчас многие оболочки допускают оба этих разделителя). Таким образом, запись c:\Windows\System32\cmd.exe означает, что файл с именем cmd.exe находится в папке System32, которая вложена в папку Windows, которая, в свою очередь, вложена в корневую папку диска c: (находится в корневом каталоге диска c:). При этом запись c:\Windows\System32\cmd.exe можно рассматривать как одно уникальное имя – полное имя файла cmd.exe.
Кроме структуры вложенных папок и формирования полного имени, логическая файловая структура включает в себя обработку атрибутов и расширений файлов. Например, для файла могут быть указаны атрибуты «системный», «скрытый», «только для чтения». Расширение файла обозначает его тип: txt – простой текстовой документ, doc – документ MS Word, mp3 – мультимедийный файл и т.д. В функцию логической файловой системы входит установка, обработка и интерпретация всех этих значений в соответствии с командами пользователя или запросами программ.
Глава 3.4. Интерфейс пользователя. Графическая оболочка Windows 95/98/ME/NT/2000/XP.
Одна из важнейших задач, возникающих при работе с компьютером – обеспечение удобного и эффективного взаимодействия компьютера и пользователя. Эту задачу решает пользовательский интерфейс, включающий, во-первых, набор соглашений о представлении входной и выходной информации, а во-вторых, набор программ, обеспечивающих эти соглашения.
В настоящее время фактическим стандартом стал многооконный графический пользовательский интерфейс (GUI – Graphic User Interface), управляемый мышью. В рамках этого интерфейса каждый информационный объект представляется на экране в виде некоторого графического образа. Графический образ меняется в зависимости от состояния объекта. Существует 2 основных типа стандартных графических образов объектов – значок и окно. Значок обычно используется для неактивных объектов, а окно – для активных, работающих в данный момент и ведущих диалог с пользователем. Структура окна такова, чтобы наиболее эффективно обеспечить диалог объекта с пользователем.
Программы, обеспечивающие пользовательский интерфейс, называются программами-оболочками. В состав большинства современных операционных систем входят встроенные оболочки. Однако не обязательно пользоваться именно встроенной оболочкой операционной системы – можно и любой другой программой-оболочкой, если для данной операционной системы такая программа существует.
Рассмотрим кратко реализацию GUI в оболочке ОС Windows.
Основное управляющее устройство при работе с GUI – это мышь. При работе с мышью в рамках GUI действуют следующие соглашения. Если поместить курсор мыши попал в область, занятую графическим образом какого-либо объекта, то становятся доступными свойства этого объекта и методы, связанные с этим объектом. Для каждого объекта выделяется основной метод (запуск), который для большинства объектов реализуется двойным щелчком левой кнопки мыши. Для тех объектов, у которых основной метод является единственным (например, для пунктов меню) достаточно одиночного нажатия левой кнопкой. Дополнительные свойства и методы реализуются при помощи контекстного меню, которое запускается нажатием правой кнопки мыши. Для перемещения графического образа объекта по экрану используется перемещение мыши с нажатой левой или правой клавишей. При этом графический образ как бы «прилипает» к курсору мыши. Если в процессе перемещения графический образ оказался в области, занятой графическим образом другого объекта, то реализуется «вставка» первого объекта во второй (если такая операция определена). Для изменения размеров графического образа объекта (если такое возможно) также используется перемещение мыши с нажатой левой клавишей, но при этом курсор мыши должен быть установлен в строго определенное место – на маркер изменения размеров или на границу. Доступные действия при нахождении курсора мыши в данном месте можно определить по изменению вида курсора (простая белая стрелка, двойная тонкая черная стрелка, перекрестие черных стрелок и т.д.).
Базовый объект GUI – Рабочий стол, он занимает весь экран и представляет собой поле, на котором расположены графические образы наиболее важных объектов (значки и ярлыки) и Панель задач с кнопкой Пуск.
Панель задач предназначена для отображения (в виде значков) всех активных в данный момент прикладных информационных объектов, т.е. на ней отображаются все открытые документы, запущенные приложения и т.д. Обычно, на панели задач находится ярлыки панелей настройки системных часов и переключения раскладки клавиатуры (RU – русская, EN – английская). Следует отметить, что большинство системных программ и процессов не отображается на Панели задач – для того, чтобы их увидеть, необходимо запустить Диспетчер задач комбинацией клавиш Ctrl+Alt+Delete и перейти во вкладку Процессы. На Панели задач можно также организовать панель быстрого запуска, расположив на ней наиболее часто использующиеся объекты. Обычно Панель задач расположена в нижней части экрана, но можно передвинуть мышью и в другое место.
Кнопка Пуск (Start), расположена на Панели задач, при ее нажатии вызывается главное меню Windows, через которое возможен доступ к любым программам, документам и другим ресурсам компьютера.
Окно – это один из основных элементов графического интерфейса. При запуске любой программы, открытии любого документа и вообще при активизации любого прикладного объекта, использующего GUI, появляется соответствующее окно. Обычно окно приложения состоит из заголовка (верхняя панель, содержащая название окна; за эту панель можно окно переместить в другое место), кнопок сворачивания, развёртывания и закрытия окна (справа от заголовка), значка системного меню (слева от заголовка), границ окна (двигая которые можно изменять его размер), главного меню (под заголовком), панели инструментов (под главным меню), строки состояния (нижняя строчка окна). Остальное – рабочая область окна. В рабочей области отображается в текстовом и графическом виде вся необходимая пользователю информация. Если пользователю необходимо ввести текстовые данные в программу, это также делается через рабочую область окна. Рабочая область может также содержать дополнительные меню и панели, она может быть разбита на автономные области – фреймы и включать в себя вложенные окна. Окно, с которым пользователь работает в данный момент, является активным, и выделено другим цветом заголовка и кнопки на панели задач.
Меню – тоже часть графического интерфейса. Меню состоит из списка команд, представленного в виде набора пунктов меню. Нужный пункт меню выбирается мышью. Меню может включать команды, которые сами являются списками команд, выбор соответствующего пункта приводит к появлению нового (вложенного) меню.
Контекстные меню вызываются нажатием правой кнопки мыши на какой-нибудь объект (например, рабочий стол или файл). С их помощью можно изменять свойства объектов и запускать связанные с ними программы и команды.
Диалоговые панели — специальные окна, позволяющие пользователю вводить информацию. Могут состоять из нескольких страниц – вкладок. Могут содержать кнопки, раскрывающиеся списки, ползунки, флажки, переключатели, текстовые поля и счётчики.
Папки представляют элементы логической файловой системы. В исходном виде папка представляется в виде значка. Если папку открыть (двойным щелчком мыши), то она представится в виде окна, в рабочей области которого будут отображены, находящиеся в этой папке файлы и вложенные папки. Любую из вложенных папок можно открыть аналогично.
Ярлык объекта – это указатель на данный объект. Ярлык можно создать в любой папке (или на Рабочем столе) для того, чтобы получить доступ к объекту из этой папки. Двойной щелчок по ярлыку позволяет запустить объект. Ярлык – это графический образ специального маленького файла, содержащего адрес (полное имя) объекта
Более подробно работа с графическим интерфейсом Windows рассмотрена в разделе 4.
Глава 3.5. Кодирование текста, цвета и звука.
При формировании информационных объектов весьма важным является ответ на вопрос как те или иные свойства объекта представляются в виде данных. Например, объект представляет текст, состоящий из символов (букв, цифр, знаков препинания). Как этот текст представить в виде набора данных, т.е. набора чисел? Аналогичные вопросы можно задать и по поводу изображения, и по поводу и звука.
Рассмотрим сначала пример с текстом. Текст состоит из символов, но сами символы уже ни из чего не состоят – они являются элементарными объектами. Причем символов конечное количество. Например, в русском языке 33 заглавных и 33 строчных буквы, вместе со знаками препинания – чуть больше 70 символов. Самый простой способ превратить символы в числа (данные) – просто перенумеровать их, т.е. поставить в соответствие каждому числу его порядковый номер и далее работать с этими номерами. Более общий способ – поставить в соответствие каждому символу какое-либо число (код) с одним обязательным условием – разным символам должны соответствовать разные коды. Это и есть кодировка символов.
Вообще, представление однородной группы элементарных объектов или элементарных свойств объекта в виде чисел (кодов), так что каждый объект (или свойство) представляется одним кодом и разным объектам (или свойствам) соответствуют разные коды, называется кодированием этой группы объектов.
3.4.1. Кодирование текста.
Для кодирования символов применяются две основных кодировки (системы кодирования):
- ASCII (однобайтовая кодировка)
- UNICODE (двухбайтовая кодировка).
Исторически сложилось, что сначала текст начали кодировать, присваивая символам номера от 0 до 255 (256 значений). При этом код любого символа укладывается в один байт, поэтому такая кодировка была названа однобайтовой. Таблица соответствия символов и кодов, называется кодировочной таблицей. Для однобайтовой кодировки символов кодировочную таблицу считают состоящей из двух частей – нижней (символы с кодами от 0 до 127) и верхней (символы с кодами от 128 до 255). Нижняя часть кодировочной таблицы соответствует стандарту ASCII (American Standard Code for Information Interchange).
Нижняя часть кодировочной ASCII – таблицы. | |||||||
16 | 32пробел | 48 0 | 64 @ | 80 P | 96 ` | 112 p | |
1 O | 17 | 33 ! | 49 1 | 65 A | 81 Q | 97 a | 113 q |
2 O | 18 ¦ | 34 « | 50 2 | 66 B | 82 R | 98 b | 114 r |
3 ¦ | 19 ! | 35 # | 51 3 | 67 C | 83 S | 99 c | 115 s |
4 ¦ | 20 ¶ | 36 $ | 52 4 | 68 D | 84 T | 100 d | 116 t |
5 ¦ | 21 § | 37 % | 53 5 | 69 E | 85 U | 101 e | 117 u |
6 ¦ | 22 — | 38 | 54 6 | 70 F | 86 V | 102 f | 118 v |
7 • | 23 ¦ | 39 ‘ | 55 7 | 71 G | 87 W | 103 g | 119 w |
8 • | 24 ^ | 40 ( | 56 8 | 72 H | 88 X | 104 h | 120 x |
9 0 | 25 v | 41 ) | 57 9 | 73 I | 89 Y | 105 i | 121 y |
10 0 | 26 | 42 * | 58 : | 74 J | 90 Z | 106 j | 122 z |
11 | 27 | 43 + | 59 ; | 75 K | 91 [ | 107 k | 123 { |
12 + | 28 L | 44 , | 60 | 76 L | 92 \ | 108 l | 124 | |
13 d | 29 — | 45 — | 61 = | 77 M | 93 ] | 109 m | 125 } |
14 d | 30 ^ | 46 . | 62 | 78 N | 94 ^ | 110 n | 126 ~ |
15 0 | 31 Ў | 47 / | 63 ? | 79 O | 95 _ | 111 o |
В приведенной таблице в каждой ячейке слева расположен код символа, а справа — сам символ. Первые 32 кода (от 0 до 31) не используются при кодировании символов – они являются управляющими. Эти символы используются для форматирования текста и для других служебных надобностей. Например, в редакторе Microsoft Word символ с кодом 20 обозначает конец абзаца. В таблице приведены принятые графические обозначения для управляющих символов. Для собственно кодировки символов используются коды с 32 по 126 (коду 127 не соответствует никакой символ). Отметим, например, что символ ‘1’ имеет код 49, т.е. если мы при наборе текста введем символ ‘1’, то в текстовой файл запишется код 49 или в двоичной записи код 110001 ( 49 =(110001)2 ).
Для того чтобы ввести символ по его коду достаточно в режиме ввода текста при нажатой клавише Alt ввести код символа на правой части клавиатуры. При этом должен быть включен режим Num (переключается клавишей Num/Lock).
Нижняя часть ASCII таблицы является общепринятым мировым стандартом, который поддерживают фактически все компьютеры в мире. Это означает, что если написать текст, используя только символы этой приведенной таблице на любом компьютере, этот текст правильно отобразится на любом другом компьютере. Так как в нижней части ASCII таблицы есть только латинские буквы, то этот текст должен быть на латинице. Таким образом, текст на английском языке будет правильно прочитан везде.
А как быть с текстом на других языках? В рамках однобайтной кодировки для этого предусмотрена верхняя часть кодировочной таблицы (коды с 128 по 255), т. е. тоже 128 кодов. Для кодировки символов любого языка (кроме японского и китайского) — это вполне достаточное количество кодов. Но языков много, а для того чтобы закодировать все символы всех языков 128 кодов недостаточно. Поэтому, при однобайтовой кодировке для каждого языка существует своя верхняя часть кодировочной таблицы, а для некоторых языков используется даже насколько таких таблиц. Такие таблицы называются кодовыми страницами, им присваиваются номера и названия. Например, для русского языка широко используется 3 кодировочных таблицы — ГОСТ- альтернативная (866), КОИ-8 и Windows (1251). Если при записи текста использовалась одна кодировка, а при отображении другая, то текст отобразится неправильно (на экране появится «китайская грамота»).
Ответим теперь на следующий вопрос. Если в текстовой файл записываются только коды символов, то откуда берутся сами символы (т.е. графические образы) при отображении текста на экране? Ответ следующий. Эти графические образы хранятся операционной системой в специальных файлах шрифтов. Каждый такой файл содержит таблицу соответствия кодов символов и графических образов этих кодов. Естественно, содержимое такого файла должно соответствовать той или иной кодировочной таблице, но даже файлы соответствующие одной таблице могут различаться между собой – по величине символов, по их начертанию, насыщенности и т.д. Поэтому различных шрифтов, установленных в операционной системе, может оказаться очень много.
Неудобство использования ASCII кодировки очевидно – для каждого национального алфавита требуется своя расширенная таблица. Поэтому была предложена универсальная двухбайтовая система кодирования символов Unicode.
Стандарт Unicode был разработан с целью создания единой кодировки символов. Каждый символ в этом стандарте кодируется 16 битами, что позволяет ему охватить до 65,536 кодов – этого вполне достаточно для присваивания уникального кода каждому символу каждого языка, включая японский, китайский, а также древние письменные языков. В настоящее время Unicode содержит более 29000 неиспользованных кодов для расширения, позволяющие включить новые знаки. В будущем это может позволить включить в стандарт исторические знаки типа иероглифов и возможные расширения существующих алфавитов и/или наборов символов. Кроме того, Unicode резервирует более чем 6000 кодов, которые разработчики программного обеспечения и аппаратных средств могут использовать для собственных знаков и символов. Отметим, что первые 127 значений кодов Uncode соответствуют кодам ASCII, что обеспечивает полную совместимость этих кодировок. Подробное описание стандарта Unicode можно найти по адресу http://www.unicode.org/ .
Статьи к прочтению:
- Таким образом, информатика – это наука об общих принципах обработки информации при помощи компьютерных средств. 7 страница
- Таким образом, информатика – это наука об общих принципах обработки информации при помощи компьютерных средств. 8 страница
Жизнь по законам математики | Вопрос науки
Похожие статьи:
-
Единственный недостаток двухбайтовой кодировки по сравнению с однобайтовой – объем данных для записи текста возрастает в 2 раза, — но это для современных…
-
В описанном алгоритме вычисление хеш-функции является необязательным элементом – можно было бы зашифровывать весь текст закрытым ключом и прикладывать…