Тема 2.1 данные и информация

      Комментарии к записи Тема 2.1 данные и информация отключены

Занятие №3

Тема 2. Информация и информационные технологии.

Тема 2.1 Данные и информация

1. Виды данных и информации.

2. Системы счисления и области их использования.

Информация — это сведения о фактах, концепциях, объектах, событиях и идеях, которые в данном контексте имеют вполне определенное значение. Информация — это не просто сведения, а сведения нужные, имеющие значение для лица, обладающего ими.

Можно при определении понятия информации оттолкнуться от схематичного представления процесса ее передачи. Тогда под информацией будут пониматься любые сведения, являющиеся объектом хранения, передачи и преобразования. Информационное сообщение связано с источником сообщения (передатчиком), приемником (получателем) и каналом связи.

В одном терминологическом ряду с понятием информации стоят понятия «данные» и «знания».

Данные — это информация, представленная в виде, пригодном для обработки автоматическими средствами при возможном участии человека.

Знания — это информация, на основании которой путем логических рассуждений могут быть получены определенные выводы.

Важными характеристиками информации являются ее структура и форма. Структура информации определяет взаимосвязи между составляющими ее элементами. Среди основных форм можно выделить символьно-текстовую, графическую и звуковую формы. Основные требования, предъявляемые к экономической информации — точность, достоверность, оперативность, полнота.

Данные

Остановимся на понятии «данные». Все, что нас окружает, и с чем мы сталкиваемся, относится либо к физическим телам, либо к физическим полям. Все объекты находятся в состоянии непрерывного движения и изменения, которое сопровождается обменом энергией и ее переходом из одной формы в другую. Все виды энергообмена сопровождаются появлением сигналов. При взаимодействии сигналов с физическими телами в последних возникают определенные изменения свойств — это явление называется регистрацией сигналов. Такие изменения можно наблюдать, измерять или фиксировать теми или иными способами — при этом возникают и регистрируются новые сигналы, т. е. образуются данные».

Это определение принимает первичность и объективность существования данных, в том числе — независимость от субъекта их использующего. Но если существование данных не зависит от того, будут ли они когда-либо использованы или нет, эффективность функционирования многих процессов (имеющих контур управления) зависит от данных. Например, данные, используемые для изменения поведения процесса на основе построения прогноза (т. е. факты, характеризующие предшествующие состояния), позволят оптимизировать получение конечного результата, и будут уже выступать в роли управляющей информации. Роль и характер используемых данных в целом отражены на обобщенной схеме управляемого функционального процесса, представленной на рис.

Система преобразования ресурса, функциональность которой обусловлена проблемным контекстом (данными, представляющими целевую задачу), фактически преобразует и информацию. Потенциально полезные данные, выделенные из общегомножества в соответствии с контекстом задачи (исходная информация) в результате использования порождает выходную информацию — актуализированные данные, подтверждающие или отрицающие действенность выбранных исходных данных для решения задачи.

Рис. Обобщенная схема функционального процесса, управляемого данными

Системы счисления

Компьютер является цифровым устройством, значит любая информация представляется в виде чисел.

Для записи чисел люди используют различные системы счисления. Система счисления показывает, по каким правилам записываются числа и как выполняются арифметические действия над ними.

Мы используем в обычной жизни десятичную систему записи чисел, когда число записывается с помощью 10 цифр (0,1…9). Для счета времени в часах используется двенадцатиричная система счисления, в минутах и секундах — шестидесятиричная система счисления. И это никого из нас не удивляет.

В компьютере для записи чисел используется двоичная система счисления, т.е. любое число записывается в виде сочетания двух цифр — 0 и 1. Почему? Просто двоичные числа проще всего реализовать технически: 0 — нет сигнала, 1 — есть сигнал (напряжение или ток).

И десятичная и двоичная системы счисления относятся к позиционным, т.е. значение цифры зависит от ее расположения в записи числа. Место цифры в записи числа называется разрядом, а количество цифр в числе — разрядностью числа. Разряды нумеруются справа налево, и каждому разряду соответствует степень основания системы счисления.

Минимальной единицей информации в компьютере является 1 бит — информация, определяемая одним из двух возможных значений — 0 или 1.

На практике используется более крупная единица информации — байт. Байт — это информация, содержащаяся в 8-разрядном двоичном коде: 1 байт = 8 бит.

В одном байте можно хранить целые числа (десятичные) от 0 до 255.

Для хранения действительных чисел используются ячейки из 4 или 8 байт. При этом число представляется в экспоненциальной форме: 275,986 = 0,275986 Е + 3.

При хранении действительного числа в ячейке из 4 байт 7 бит занимает порядок числа, а 25 бит — мантисса.

Компьютер всегда округляет действительные числа, представляя их приближенно. Для уменьшения погрешности вычислений используют представление чисел с двойной точностью, когда число храниться в ячейках памяти из 8 байт.

Любая информация, кроме числовой, в компьютере кодируется, т.е. представляется в виде чисел. Каким образом осуществляется кодировка информации? Рассмотрим представление текстовой информации.

В одном байте можно хранить 256 различных чисел (от 0 до 255). Для того чтобы закодировать прописные и строчные буквы латинского алфавита, необходимо 52 числа, а для русского алфавита необходимо еще 66 чисел. Кроме того, необходимо закодировать различные знаки препинания и специальные символы. Таблица такой кодировки носит название таблицы ASCII. Ее первая половина используется для хранения латинского алфавита и специальных символов, а вторая половина содержит символы псевдографики и буквы национальных алфавитов.

Для хранения больших объемов информации используются производные единицы измерения ее количества:

1 Кбайт = 1024 байт = 210 байт;

1 Мбайт = 1024 Кбайт = 210 Кбайт;

1 Гбайт = 1024 Мбайт = 210 Мбайт.

Если на одной странице текста содержится около 3000 знаков, то это 3 Кбайт информации, а в 1 Мбайт можно сохранить около 300 страниц текста.

Представление графической информации опирается на представление экрана монитора в виде массива цветовых точек размером MxN. Каждая точка имеет свой цвет, представляемый в виде комбинации оттенков трех основных цветов: красного, синего и зеленого. Для того чтобы цветопередача была приближена к реальной, необходимо не менее 256 оттенков каждого цвета. При представлении экрана монитора в виде массива 800×600 точек экран покрывает 480000 точек. Используя 8-битное кодирование каждого цвета, получим: 8x3x480000= 1 х 107 бит — 1,12 Мбайт.

В двоичном виде также можно закодировать и звуковую информацию.

Контрольные вопросы:

1.Дайте определения следующим терминам: «Информация», «Знания».

2. Назовите виды данных.

3.Какие системы счисления вы знаете?

Статьи к прочтению:

Железная тема. Технологии анализа больших данных для обработки информации социальных сетей — лекарст


Похожие статьи: