Компьютерная организация данных и их обработка

Основные определения и понятия

Понятия «информация» и «данные» являются базовыми, первичными понятиями в информатике, поэтому на протяжении многих лет существовала и существует в настоящее время проблема при их трактовке. Многие авторы в отечественной учебной литературе при формулировке понятий «информация» и «данные» пытаются выразить их через сходства или различия самих понятий или вообще при определении одного из них не упоминают о другом. Чтобы не быть голословным, приведем несколько примеров.

«Данными называют факты, сведения, представленные в формализованном виде (закодированные), занесенные нате или иные носители и допускающие обработку с помощью специальных технических средств» [1].

Это определение можно отнести и к понятию «информация», т. е. являются ли понятия «данные» и «информация» синонимами или имеют различия, определить невозможно.

«Данные – это материальные объекты произвольной формы, выступающие в качестве средства представления информации. Преобразование и обработка данных позволяют извлечь информацию, т. е. данные служат исходным «сырьем» для получения информации. Фиксация информации в виде данных осуществляется с помощью конкретных средств общения на конкретном физическом носителе» [4].

Согласно данному определению данные, будучи средством представления информации, ею как таковой не являются, кроме того, из этого определения можно также сделать вывод, что фиксированные данные есть информация. Налицо явное противоречие.

«Сигналы, зарегистрированные на материальном носителе, называются данными. Данные несут информацию о событии, но не являются самой информацией, так как одни и те же данные могут восприниматься (отображаться или интерпретироваться) в сознании разных людей совершенно по-разному. Чтобы получить информацию, имея данные, необходимо к ним применить методы, которые преобразуют данные в понятия, воспринимаемые человеческим сознанием. Таким образом, можно считать, что информация – это продукт взаимодействия данных и адекватных методов» [5].

Данное определение также содержит противоречие: данные и несут информацию о событии (т. е. содержат в себе информацию), и не являются ею.

«Данные – формализованное представление сообщения о любых фактах, действиях, предположениях, которые могут быть описаны понятным для вычислительного устройства способом, т. е. данные представляются сигналами. Человек работает с данными, чтобы получить информацию. Поэтому неправильно отождествлять данные и информацию. Информация – это интерпретация данных. Компьютер собирает и обрабатывает данные, чтобы пользователь получил информацию» [6].

В понятие «информация» входит не только интерпретация данных, так как информация кроме рассмотрения ее на смысловом уровне может рассматриваться на вероятностном и прагматическом уровне.

«Данные – это особая форма представления информации. Под данными понимается информация, представленная обычно в цифровой форме или в каком-либо другом формализованном виде. Данные – это такой вид информации, который легко закодировать и передавать в форме дискретных электрических сигналов. Слова «данные» и «информация» кажутся синонимами. Тем не менее, в контекстах, относящихся к обработке данных в информационных системах, они имеют различные значения. Здесь под данными понимается то, что поступает на вход системы обработки. Информация – это то, что получается на выходе системы обработки данных, это переработанные данные» [3].

Это определение наиболее близко к разрешению этого противоречия. Однако и здесь оно присутствует, так как согласно приведенному выше определению, если информация – это то, что получается на выходе системы обработки, а данные – это то, что поступает на вход этой системы, то при подаче этой информации на вход другой системы обработки она автоматически переходит в данные.

По мнению автора данного учебного пособия, противоречие лежит в плоскости разных подходов к трактовке понятия информации и может быть устранено путем принятия определенных соглашений (правил).

Соглашение 1

При синтаксическом (вероятностном) подходе к определению этих понятий «информация» и «данные» – синонимы.

Соглашение 2

При семантическом (смысловом) подходе следует разделять входную информацию, поступающую на вход системы обработки информации в данный момент времени, и выходную информацию, и данные являются синонимом входной информации. Таким образом, подданными следует понимать входную информацию, поступающую на вход системы обработки информации в данный момент времени и определенным образом структурированную (т. е. представленную в форме, пригодной для ее передачи и обработки) в зависимости от целей, преследуемых системой передачи и обработки информации.

Соглашение 3

При прагматическом подходе данные и информацию не следует отождествлять и информация может рассматриваться как интерпретация данных.

x