Что такое данные в информатике определение: 1. Данные и информация. Информатика. – Данные (в информатике) — это… Что такое Данные (в информатике)?

Содержание

Данные (в информатике) — это… Что такое Данные (в информатике)?

В вычислительной технике данные обычно различают от программ. Программа является набором инструкций, которые детализируют вычисление или задачу, которая производится компьютером. Данные — это всё отличное от программного кода.

С точки зрения программиста данные — это часть программы, совокупность значений определенных ячеек памяти, преобразование которых осуществляет код. С точки зрения компилятора, процессора, операционной системы, это совокупность ячеек памяти, обладающих определёнными свойствами (возможность чтения и записи (необязательно), невозможность исполнения).

Контроль за доступом к данным в современных компьютерах осуществляется аппаратно.

В соответствии с принципом фон Неймана, одна и та же область памяти может выступать как в качестве данных, так и в качестве исполнимого кода.

Типы данных

Традиционно выделяют два типа данных — двоичные (бинарные) и текстовые.

Двоичные данные обрабатываются только специализированным программным обеспечением, знающим их структуру, все остальные программы передают данные без изменений.

Текстовые данные воспринимаются передающими системами как текст, записанный на каком-либо языке. Для них может осуществляться перекодировка (из кодировки отправляющей системы в кодировку принимающей), заменяться символы переноса строки, изменяться максимальная длина строки, изменяться количество пробелов в тексте.

Передача текстовых данных как бинарных приводит к необходимости изменять кодировку в прикладном программном обеспечении (это умеет большинство прикладного ПО, отображающего текст, получаемый из разных источников), передача бинарных данных как текстовых может привести к их необратимому повреждению.

Данные в ООП

Могут обрабатываться функциями объекта, которому принадлежат сами, либо функциями других объектов, имеющими для этого возможность.

Данные в языках разметки

Имеют различное отображение в зависимости от выбранного способа представления

Данные в XML

Множество данных может иметь надмножество, называемое метаданными

Wikimedia Foundation. 2010.

Информация и данные — урок. Информатика, 10 класс.

Познавая окружающий мир, человек постоянно имеет дело с информацией. Она помогает человеку правильно оценить происходящие события, принять обдуманное решение, найти наиболее удачный вариант своих действий. Интуитивно мы понимаем, что информация — это то, чем каждый из нас пополняет собственный багаж знаний.

 

Информация также является сильнейшим средством воздействия на личность и общество в целом. Кто владеет наибольшим объёмом информации по какому-либо вопросу, тот всегда находится в более выигрышном положении по сравнению с остальными.

 

Информация является общенаучной категорией. Существует множество определений этого термина, но в обыденной жизни информацию отождествляют с такими понятиями, как сообщение, сведения, знания.

 

Информация позволяет человеку снизить уровень неопределённости знания о сути какого-либо объекта: предмета, явления или процесса. В результате обмена сведениями об определённом объекте у каждого из участников обмена формируется более полное представление о рассматриваемом предмете, повышается их уровень осведомлённости и, соответственно, понижается уровень неопределённости знаний, касающихся этого объекта. Поэтому информацию также определяют как меру устранения неопределённости знаний об объекте.

Информация — это сведения об объектах и явлениях окружающего мира, уменьшающие степень неопределённости знаний об этих объектах или явлениях.

Информация не существует сама по себе. Всегда имеется источник, который производит информацию, и приемник, который её воспринимает.

 

В роли источника или приемника может быть любой объект материального мира: человек, устройство, животное, растение. То есть информация всегда предназначена конкретному объекту.

Источник информации — это объект, порождающий информацию и представляющий её в виде сообщения.

Приемник информации — это объект, принимающий сообщение и способный правильно его интерпретировать.

Человек получает информацию из разных источников: когда читает или слушает радио, смотрит телепередачу или разглядывает картину в музее, дотрагивается до предмета или пробует на вкус какую-нибудь еду. При этом одну и ту же информацию каждый человек может воспринимать по-разному.

 

Информация несёт человеку знания об окружающем мире, многообразие которого и порождает её различные виды. Так, например, существует информация для узкого круга людей, специализирующихся в определенной научной области: химии, биологии, математике, физике, информатике, литературе. Такую информацию называют

научной. В каждой научной области используется специализированный язык, для понимания которого требуются определённые знания и специальное обучение.

 

Для человека также важную роль играют средства массовой информации: радио, телевидение, газеты и журналы. Они распространяют общественно-политическую, научно-популярную, культурологическую информацию. С их помощью люди узнают о событиях в мире, науке и искусстве.

С понятием «информация» тесно связано понятие «данные».

Данные — это «сырьё» для получения информации.

Одни и те же данные могут нести разным людям разную информацию. Так, книга математического содержания может дать много полезной информации математику, а для специалиста в другой области знаний, например, для биолога или филолога, она окажется непонятной, и поэтому всё представленное в ней будет восприниматься только как совокупность данных (в виде теорем, формул, доказательств), которые никакой информации этим специалистам не несут.

 

Одна и та же телевизионная передача кому-то даст новую информацию к размышлению, потому что заинтересует его, а другой воспримет всё, что в ней рассказано, только как набор мало значащих для него сведений (данных).

 

Данные могут фиксироваться и храниться на каком-либо материальном носителе: бумаге, компакт-диске, магнитном диске.

Следовательно, данные могут обрабатываться с помощью различных технических устройств.

Они могут быть преобразованы в другую форму представления, сгруппированы, отсортированы и т.д.

Так, например, сведения об учениках школы могут храниться в компьютере на жёстком диске в виде базы данных.

Возможны любые варианты обработки этих данных, например, их можно сгруппировать по классам или отсортировать в алфавитном порядке.

Данные — это совокупность сведений, зафиксированных на определённом носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Носитель информации — это любой материальный объект, используемый для записи и хранения на нём информации.

Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует её и по результатам анализа принимает то или иное решение.

 

Если в базе данных, описанной выше, сделать любую операцию обработки по желанию человека, то результат обработки будет нести в себе определённую информацию.

Например, директор школы может получить информацию из такой базы данных о том, кто из учеников живет на улице Счастливой, сколько девочек по имени Надежда учится в школе или кто из учеников в течение четверти ни разу не получил ни одной тройки.

 

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

 

Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации, которые не изучаются в школе.

 

Более понятным и, следовательно, более распространённым методом является подход, связанный с измерением объема данных в сообщении. Это особенно важно при разработке технических систем.

Так, например, при проектировании и эксплуатации систем связи важно наличие устройств, передающих наибольший объём данных за наименьшее время. Как известно, в памяти компьютера информация представляется в форме данных. В этом случае объём информации измеряется количеством двоичных разрядов (

битов), содержащихся в этом сообщении.

 

На протяжении тысячелетий своего существования человечество накопило огромные запасы информации, которые продолжают увеличиваться. В наши дни объём информации удваивается каждые два года. От умения человека правильно понимать и обрабатывать информацию во многом зависят его способности к познанию окружающего мира.

Данные — это… Что такое Данные?

Да́нные (калька от англ. data[источник не указан 101 день]) — представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе.

Изначально — данные величины, то есть величины, заданные заранее, вместе с условием задачи. Противоположность —

переменные величины.

В информатике данные — это результат фиксации, отображения информации на каком-либо материальном носителе, то есть зарегистрированное на носителе представление сведений независимо от того, дошли ли эти сведения до какого-нибудь приёмника и интересуют ли они его.[1]

Данные — это и текст книги или письма, и картина художника, и ДНК.

Данные, являющиеся результатом фиксации некоторой информации, сами могут выступать как источник информации. Информация, извлекаемая из данных, может подвергаться обработке, и результаты обработки фиксируются в виде новых данных.

Данные могут рассматриваться как записанные наблюдения, которые не используются, а пока хранятся.

Информация, отображаемая данными, может быть непонятна приемнику (шифрованный текст, текст на неизвестном языке и пр.).

Синонимы: сведения, информация

С точки зрения программиста, данные — это часть программы, совокупность значений определённых ячеек памяти, преобразование которых осуществляет код. С точки зрения компилятора, процессора, операционной системы, это совокупность ячеек памяти, обладающих определёнными свойствами (возможность чтения и записи (необяз.), невозможность исполнения).

Контроль за доступом к данным в современных компьютерах осуществляется аппаратно.

В соответствии с принципом фон Неймана, одна и та же область памяти может выступать как в качестве данных, так и в качестве исполнимого кода.

Типы данных

Традиционно выделяют два типа данных — двоичные (бинарные) и текстовые.

Двоичные данные обрабатываются только специализированным программным обеспечением, знающим их структуру, все остальные программы передают данные без изменений.

Текстовые данные воспринимаются передающими системами как текст, записанный на каком-либо языке. Для них может осуществляться перекодировка (из кодировки отправляющей системы в кодировку принимающей), заменяться символы переноса строки, изменяться максимальная длина строки, изменяться количество пробелов в тексте.

Передача текстовых данных как бинарных приводит к необходимости изменять кодировку в прикладном программном обеспечении (это умеет большинство прикладного ПО, отображающего текст, получаемый из разных источников), передача бинарных данных как текстовых может привести к их необратимому повреждению.

Данные в объектно-ориентированном программировании

Могут обрабатываться функциями объекта, которому принадлежат сами, либо функциями других объектов, имеющими для этого возможность.

Данные в языках разметки

Имеют различное отображение в зависимости от выбранного способа представления.

Данные в XML

В теории множеств

В отличие от операций над элементами множества, представляют собой множество (название и элементы множества)

В лингвистике

В отличие от операций (действие, процесс) по работе с данными (сказуемое с возможными его обстоятельствами и дополнениями), выражаются подлежащим (с возможными его определениями).

Метаданные

Множество данных может иметь надмножество, называемое метаданными. Другими словами, метаданные — это данные о данных.

Операции с данными

Для повышения качества данные преобразуются из одного вида в другой с помощью методов обработки. Обработка данных включает операции:

  1. ввод (сбор) данных — накопление данных с целью обеспечения достаточной полноты для принятия решений;
  2. формализация данных — приведение данных, поступающих из разных источников, к одинаковой форме, для повышения их доступности;
  3. фильтрация данных — это отсеивание «лишних» данных, в которых нет необходимости для повышения достоверности и адекватности;
  4. сортировка данных — это упорядочивание данных по заданному признаку с целью удобства их использования;
  5. архивация — это организация хранения данных в удобной и легкодоступной форме;
  6. защита данных — включает меры, направленные на предотвращение утраты, воспроизведения и модификации данных;
  7. транспортировка данных — приём и передача данных между участниками информационного процесса;
  8. преобразование данных — это перевод данных из одной формы в другую или из одной структуры в другую.

Примечания

  1. Максимович Г. Ю. Информационные системы : Учебное пособие / Ю. Г. Максимович, А. Г. Романенко, О. Ф. Самойлюк; Под общей ред. К. И. Курбакова. — М.: Изд-во Рос. экон. акад., 1999. — 198 с.

См. также

❶ Что такое данные и информация 🚩 информационные данные 🚩 Школы


Данные — это совокупность сведений, которые зафиксированы на каком-либо носителе — бумаге, диске, пленке. Эти сведения должны быть в форме, пригодной для хранения, передачи и обработки. Дальнейшее преобразование данных позволяет получить информацию. Таким образом, информацией можно назвать результат анализа и преобразования данных. В базе хранятся различные данные, а система управления базой может выдавать по определенному запросу требуемую информацию. К примеру, можно узнать из школьной базы данных, кто из учеников живет на определенной улице или кто в течение года не получил плохой отметки и др. Данные превращаются в информацию тогда, когда ими заинтересуются. Можно утверждать, что информация — это используемые данные.

Слово «информация» произошло от латинского informatio, что значит «сведения, изложение, разъяснение». Также информацией называют сведения об объектах, явлениях окружающей среды, их свойствах, которые уменьшают степень неопределенности, неполноты знаний. В результате обмена сведениями формируется более полное представление о предмете, повышается уровень осведомленности.

Информация не существует изолированно, сама по себе. Всегда есть источник, который ее производит и приемник, ее воспринимающий. В роли источника или приемника выступает любой объект — человек, компьютер, животное, растение. Информация всегда предназначается конкретному объекту.

Человек получает информацию из самых разных источников — при чтении, прослушивании радио, просмотре телепередач, когда он дотрагивается до предмета, пробует на вкус еду. Одну и ту же информацию разные люди могут воспринимать по-разному.

В зависимости от сферы использования существует научная, техническая, экономическая и другие виды информации. Это сильнейшее средство воздействия на личность и на общество в целом. Согласно известному выражению, кто владеет наибольшей информацией по какому-либо вопросу, тот владеет миром, то есть, находится в выигрышном положении в сравнении с другими. В повседневной жизни от информации зависит развитие общества, здоровье и жизнь людей.

На протяжении тысячелетий человечество накопило огромные запасы знаний, которые все продолжают увеличиваться. Объем информации в наши дни удваивается каждые два года. В любой ситуации, даже самой обыденной, эффективна лишь актуальная, полная, достоверная и понятная информация. Только актуальные, то есть, вовремя полученные сведения могут принести пользу людям. Прогноз погоды или предупреждение об урагане важно узнать накануне, а не в этот же день.

Понятие информации. Информатика

Слово «информация» происходит от латинского слова informatio, что означает разъяснение, высказывания, осведомленность. Само слово информация лишь сравнительно недавно стало превращаться в точный термин. До этого информацию воспринимали как то, что присутствует в языке, письме или передается при общении. Сейчас смысл, который вкладывается в это понятие, очень изменился и расширился. Возникла особая математическая дисциплина — теория информации.

Хотя в теории информации и вводится несколько ее конкретных определений, все они не охватывают всего объема этого понятия. Рассмотрим некоторые определения.

Информация — это отражение реального (материального, предметного) мира, которое выражается в виде сигналов, знаков.

Информация — любая совокупность сигналов, сведений (данных), которые какая-либо система воспринимает из окружающей среды (входная информация), выдает в окружающую среду ( исходящая информация ) или сохраняется внутри определенной системы (внутренняя информация).

Информация существует в виде документов, рисунков, текстов, звуковых и световых сигналов, энергетических и нервных импульсов и т.п.

Под информацией понимают сведения об объектах окружающего мира, которые воспринимаются человеком, животным, растительным миром или специальными устройствами и повышают их уровень информированности.

Информация передается с помощью сообщений. Сообщение бывают устными, письменными, в виде рисунков, жестов, специальных знаков или организованными каким-то другим образом. Примерами сообщений являются: показания измерительного устройства, дорожные знаки, текст телеграммы, устный рассказ и тому подобное.

С помощью сообщений происходит обмен информацией между людьми, между людьми и машинами, между машинами; обмен сигналами в растительном и животном мире, от клетки к клетке, от организма в организм и тому подобное. Рекомендуем также прочитать статью «Информационные сообщения и процессы«.

Виды информации

Информацию можно разделить на виды по нескольким признакам:

По способу восприятия

Для человека информация делится на виды в зависимости от типа рецепторов, воспринимающих ее:

  • Визуальная — воспринимается органами зрения.
  • Аудиальная — воспринимается органами слуха.
  • Тактильная — воспринимается тактильными рецепторами.
  • Обонятельная — воспринимается обонятельными рецепторами.
  • Вкусовая — воспринимается вкусовыми рецепторами.

По форме представления

По форме представления информация делится на следующие виды:

  • Текстовая — что передается в виде символов, предназначенных обозначать лексемы языка.
  • Числовая — в виде цифр и знаков, обозначающих математические действия.
  • Графическая — в виде изображений, событий, предметов, графиков.
  • Звуковая — устная или в виде записи передача лексем языка аудиальным путем.

По назначению

  • Массовая — содержит тривиальные сведения и оперирует набором понятий, понятным большей части социума.
  • Специальная — содержит специфический набор понятий, при использовании происходит передача сведений, которые могут быть не понятны основной массе социума, но необходимы и понятны в рамках узкой социальной группы, где используется данная информация.
  • Личная — набор сведений о какой-либо личности, которые определяют социальное положение и типы социальных взаимодействий внутри популяции.

Свойства информации

Полезность. Полезность информации оценивается по тем задачам, которые можно решить с ее использованием. Сведения, важные и полезные для одного человека, оказываются бесполезными для другого, если он не может их использовать.

Актуальность. Информация актуальна (своевременна), если она важна в данный момент времени. Если вы собираетесь ехать поездом, то для вас важна информация о том, когда этот поезд отправляется. Однако эта информация теряет свою актуальность после того, как поезд тронулся.

Вероятность (правдивость). Информация считается достоверной, если она не противоречит реальной действительности, правильно ее объясняет и подтверждается. Если вы узнали о наводнении из информационной телепрограммы, то эта информация, по всей вероятности, является достоверной. В то же время слухи о пришествии инопланетян, которое ожидается на следующей неделе, недостоверны.

Объективность. Информация может быть объективной или субъективной (зависеть или не зависеть от чьего суждения). Например, сообщение «вода в море холодная» является субъективным, одновременно сообщение «температура воды +17 градусов Цельсия» дает объективную информацию.

Полнота. Информация полная, если ее достаточно для правильных выводов и принятия правильных решений. Если человеку на основе какой-либо информации приходится что-то решать, то он сначала оценивает, достаточно этой информации для принятия правильного решения.

Понятность. Информация понятна, если при ее восприятии нет необходимости в дополнительных сообщениях (не возникает вопросов). Если человеку говорят что-то, к восприятию чего он еще не подготовлен, например обращаются английском раньше, чем человек выучил этот язык, то он из услышанной информации вынесет совсем другую информацию, чем это было бы тогда, когда человек выучил английский язык.

Носители информации

Среда, в которой зафиксировано сообщение, называют носителем сообщения. В «докомпьютерную» эру информацию хранили на бумаге, фотографиях, кинопленке, магнитной ленте и др. С появлением первых компьютеров нашли широкое применение перфокарты и перфоленты, магнитные диски, компакт-диски.

Перфокарта — это лист тонкого картона стандартных размеров. В определенных позициях перфокарты пробивают дырочки. Наличие дырочки в определенной позиции считают единицу, а ее отсутствие — ноль.

Перфолента — это лента плотной бумаги стандартной ширины, на которую заносится информация пробивкой дырочек в соответствующих позициях на 5-ти или 8-ми параллельных дорожках.

Конечно, за дырочками, нанесенными на перфокарты или перфоленты, стоит вполне определенная информация.

Магнитные ленты и магнитные диски для хранения информации начали использовать с развитием вычислительной техники. Для записи 1 (единицы) намагничивалась небольшая область. Размагниченная (или намагниченная противоположно) область означала 0 (ноль).

Гибкие магнитные диски, или ГМД (FDD), позволяли легко переносить информацию с одного компьютера на другой, а также сохранять информацию, которая не используется на компьютере постоянно. Выпускались дискеты, как правило, с диском диаметром 3,5 дюйма и имели емкость всего 1,44 Мбайта.

Жесткие магнитные диски, или винчестеры (HDD), и сегодня являются основным типом носителей для долговременного хранения информации. Накопитель включает собственно магнитный диск, систему позиционирования и комплект магнитных головок — все это размещено в герметично закрытом корпусе.

Магнитные карточки содержат закодированную информацию, эта технология используется в кредитных, телефонных и регистрационных карточках, а также пропусках и «ключах» для кодовых замков.

Компакт-диски (оптические диски или CD) — это диск из специальной пластмассы с зеркальным покрытием с той стороны, с которой записывается и считывается информация. Информация на диск записывается так: диск вращается, и на его поверхности лазером в определенных местах наносятся «повреждение» поверхности таким образом, чтобы от них не отражался луч лазера при считывании. Таким образом записывается 1, «неповрежденные» места означают логический 0.

Существуют CD-R, DVD-R — оптические диски, на которые можно осуществлять однократную запись, а также CD-RW, DVD-RW — оптические диски, на которые можно осуществлять многократную запись.

Формы и способы представления информации

Символьная форма представления информации является наиболее простой, в ней каждый символ имеет какое-то значение. Например: красный свет светофора, показатели поворота на транспортных средствах, различные жесты, сокращения и обозначения в формулах.

Текстовая форма представления информации является более сложной. Эта форма предусматривает, что содержание сообщения передается не через отдельные символы (цифры, буквы, знаки), а их сочетанием, порядком размещения. Последовательно расположены символы образуют слова, которые в свою очередь могут образовывать предложения. Текстовая информация используется в книгах, брошюрах, газетах, журналах и т.

Графическая форма представления информации, как правило, имеет наибольший объем. К этой форме относятся фотографии, картины, чертежи, графики и тому подобное. Графическая форма более информативна. Видимо, поэтому, когда берем в руки новую книгу, то первым делом ищем в ней рисунки, чтобы создать о ней наиболее полное впечатление.

Информацию можно подавать одним из способов: буквами и знаками, жестами, нотами музыки, рисунками, картинами, скульптурами, звукозаписью, видеозаписью, кинофильмами и тому подобное.

Информация может быть в виде непрерывных (аналоговых) и дискретных (цифровых) сигналов.

Информация в аналоговом виде меняет свое значение постепенно (показатели термометра, часов со стрелками, спидометра и т.д.).

Информация в дискретном виде меняет свое значение с определенным шагом (показатели электронных часов, весы с гирями, подсчет количества предметов и т.п.).

Информатика

Термин информатика происходит от двух слов: информация и автоматика. Значит информатика это «наука о преобразовании информации».

Этот термин впервые введен в обиход во Франции в середине 60-х годов XX в., когда началось широкое использование вычислительной техники. Тогда в англоязычных странах вошел в употребление термин «Computer Science» для обозначения науки о преобразовании информации, которая базируется на вычислительной технике. Теперь эти термины являются синонимами.

Основа информатики — информационные технологии — совокупность средств и методов, с помощью которых осуществляется информационные процессы во всех сферах жизни и деятельности человека.

Информационная системавзаимосвязанная совокупность средств, методов и персонала, используемая для хранения, обработки и выдачи информации с целью достижения конкретной задачи.

Современное понимание информационной системы (ИС) предусматривает использование компьютера в качестве основного технического средства обработка информации. Как правило, это компьютеры, оснащенные специализированными программными средствами.

В работе ИС, в ее технологическом процессе можно выделить следующие этапы :

  1. Зарождение данных — формирование первичных сообщений фиксируют результаты определенных операций, свойства объектов и субъектов управления, параметры процессов, содержание нормативных и юридических актов и т.п.
  2. Накопление и систематизация данных — организация такого их размещения, которое обеспечивало бы быстрый поиск и отбор нужных сведений, защита их от искажений, потери, деформирование целостности и др.
  3. Обработка данных — процессы, в результате которых на основании ранее накопленных данных формируются новые виды данных: обобщающие, аналитические, рекомендательные, прогнозные. Производные данные также могут проходить дальнейшую обработку, давая сведения обобщенности и др.
  4. Отображение данных — представление их в форме, пригодной для восприятия человеком. Прежде всего — это вывод на печать, то есть изготовление документов, удобных для восприятия человеком. Широко используют построение графических иллюстративных материалов (графиков, диаграмм) и формирование звуковых сигналов.

Сообщения, которые формируются на первом этапе, могут быть обычным бумажным документом, сообщением «в электронном виде» или тем и другим одновременно. В современных информационных системах сообщение по большей части имеют «электронный вид». Основные составляющие информационных процессов:

  • сбор данных: накопление данных с целью достаточной полноты для принятия решений;
  • сохранения;
  • передача;
  • обработка.

Одним из важнейших условий применения электронно — вычислительных машин (ЭВМ) для решения тех или иных задач является построение соответствующего алгоритма (программы), содержащий информацию о правилах получения результирующей (итоговой) информации из заданной (входной) информации.

Программирование — дисциплина, исследующая методы формулировки и решения задач с помощью ЭВМ, и является основной составной частью информатики.

Итак, информация, ЭВМ, алгоритм — три фундаментальных понятия информатики.

Информатика — комплексная научная и инженерная дисциплина, изучающая все аспекты проектирования, создания, оценки, функционирования компьютерных систем обработки информации, ее применение и влияние на различные области социальной практики.

Родоначальниками информатики является науки: документалистика и кибернетика. Кибернетика — переводится, как «искусный в управлении».

В информатике выделяют три основных части:

  • алгоритмы обработки информации ( algorithm )
  • вычислительную технику ( hardware )
  • компьютерные программы ( software ).

Предмет информатики составляют понятия:

  • аппаратное обеспечение средств вычислительной техники
  • программное обеспечение средств вычислительной техники;
  • средства взаимодействия аппаратного и программного обеспечения;
  • средства взаимодействия человека и аппаратного и программного обеспечения.

Методы и средства взаимодействия человека с аппаратными и программными средствами называется интерфейсом.

Двоичное кодирование информации

В разговорной речи часто встречаются такие выражения, как передача информации, сжатие информации, обработка информации. В таких случаях всегда идет об определенном сообщении, которое закодировано и передано тем или иным способом.

В вычислительной технике наиболее часто применяется двоичная форма представления информации, основанной на представленные данных последовательностью двух знаков: 0 и 1

Эти знаки называются двоичными цифрами, по — английски — binary digit , или, сокращенно bit (бит).

Также используется восьмеричная форма представления информации (основана на представленные последовательности цифр 0, 1, …, 7) и шестнадцатеричная форма представления информации (основана на представленные последовательностью 0, 1, …, 9, A, B, C, …, F).

Информационным объемом сообщение называется количество битов в этом сообщении. Подсчет информационного объема сообщение является чисто техническим заданием, так как при таком подсчете содержание сообщения не играет никакой роли.

В современной вычислительной технике биты принято объединять в восьмерки, которые называются байтами : 1 байт = 8 бит. Наряду с битами и байтами используют и большие единицы измерения информации.

  • bit binary digit {0,1};
  • байт = 8 бит;
  • Кбайт = 2 10 байт = 1024 байт;
  • Мбайт = 2 10 Кбайт = 1024 Кбайт = 2 20 байт;
  • Гбайт = 2 10 Мбайт = 1024 Мбайт = 2 30 байт;
  • Тбайт = 2 10 Гбайт = 1024 Гбайт = 2 40 байт.
  • Пбайт = 2 10 Тбайт = 1024 Тбайт = 2 50 байт.
десятичное число двоичное число байт
1 1 0000 0001
2 10 0000 0010
255 1111 1111 1111 1111

С помощью двух бит кодируются четыре различных значения: 00, 01, 10, 11. Тремя битами можно закодировать 8 состояний:

  • 000 001 010 011 100 101 110 111

Вообще с помощью n бит можно закодировать 2n состояний.

Скорость передачи информации измеряется количеством битов, передаваемых за одну секунду. Скорость передачи бит за одну секунду называется 1 Бодом. Производные единицы скорости передачи называются Кбод, Мбод и Гбод:

  • 1 Кбод (один килобод) = 2 10 бод = 1024 бит / с;
  • 1 Мбод (один мегабод) = 2 20 бод = 1024 Кбод;
  • 1 Гбод (один гигабод) = 2 30 бод = 1024 Мбод.

Пример. Пусть модем передает информацию со скоростью 2400 бод. Для передачи одного символа текста нужно передать около 10 битов. Таким образом, модем способен за 1 секунду передать около 2400/10 = 240 символов.

На ЭВМ можно обрабатывать не только числа, но и тексты. При этом нужно закодировать около 200 различных символов. В двоичном коде для этого нужно не менее 8 разрядов ( 28 = 256 ). Этого достаточно для кодирования всех символов английского и русского алфавитов (строчные и прописные), знаков препинания, символов арифметических действий некоторых общепринятых спецсимволов.

В настоящее время существует несколько систем кодирования.

Наиболее распространенными являются следующие системы кодирования: ASCII, Windows-1251, KOИ8, ISO.

ASCII (American Standard Code for Information Interchange — стандартный код информационного обмена)

В системе ASCII закреплены 2 таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, расширенная от 128 до 255.

В первых 32 кодах (0-31) размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и, соответственно коды не выводятся ни на экран, ни на устройстве печати.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита.

Символы национального алфавита размещены в кодах от 128 до 255.

Кодирования Windows-1251 стала стандартом в российском секторе Wold Wide Web .

KOИ8 (код обмена информацией) является стандартным кодированием в сообщениях электронной почты и телеконференций.

ISO ( International Standard Organization ) — международный стандарт. Это кодирования используется редко.

Появление информатики обусловлено возникновением и распространением новой технологии сбора, обработки и передачи информации, связанной с фиксацией данных на машинных носителях. Основной инструмент информатики — компьютер.

Компьютер, получивший свое название от первоначального назначения — выполнения вычислений, имеет второе очень важное применение. Он стал незаменимым помощником человека в его интеллектуальной деятельности и основным техническим средством информационных технологий. А быстрое развитие в последние годы технических и программных возможностей персональных компьютеров, распространение новых видов информационных технологий создают реальные возможности их использования, открывая перед пользователем качественно новые пути дальнейшего развития и адаптации к потребностям общества.

Дезинформация

Дезинформация — заведомо неверная, ложная информация, предоставляемая оппоненту или противнику для более эффективного ведения военных действий, получения каких либо конкурентных преимуществ, для проверки на утечку информации и выявления источника утечки, определения потенциально ненадежных клиентов или партнеров. Также дезинформацией называется сам процесс манипулирования информацией, как то: введение кого-либо в заблуждение путём предоставления неполной информации или полной, но уже не актуальной информации, искажения контекста, искажения какой либо части информации.

Дезинформация, как мы видим, — это результат деятельности человека, желание создать ложное впечатление и, соответственно подтолкнуть к требуемым действиям и/или бездействию.

Данные (в информатике) Википедия

Данные — поддающееся многократной интерпретации представление информации в формализованном виде, пригодном для передачи, связи, или обработки (ISO/IEC 2382-1:1993)[1].

Для долговременного хранения данных обычно используются базы данных. Данные в памяти могут быть организованы в различные виды структур данных, таких как массивы, связанные списки или объекты. Структуры данных могут хранить данные различных типов, включая числа, строки и другие структуры данных. Ввод и вывод данных в компьютеры производится через периферийные устройства.

В вычислительной технике данные обычно отличают от программ. Программа представляет собой набор данных, содержащих последовательность инструкций, исполняемых компьютером и детализирующих вычисление или задачу. Согласно принципу фон Неймана, имеющему место в большинстве современных компьютеров, одна и та же область памяти может содержать как программу (в частности, машинный ), так и иные данные, то есть и то и другое выражается в виде одинаковых информационных форм, как правило, в виде двоичного а.

В языках высокого уровня данные воплощаются в виде переменных. Данные с точки зрения процесса (выполняемой программы) — содержимое части адресного пространства.

Организация данных[ | ]

Традиционно применяют два способа организации данных: текстовые данные (в файловой системе: текстовый файл, в программировании: строковый тип данных) — последовательность символов алфавита, представленная в виде ировки.

Двоичные данные — последовательность байтов. «Двоичная» организация не является способом организации данных как таковым, а лишь термином, объединяющим форматы (формы организации), отличные от текста. Могут включать в себя разнообразные элементы, такие как машинный (или иной исполняемый) , числовые данные, условные ы, битовые карты, местоположение других данных (смещения, а также указатели в оперативной памяти), фрагменты текста (см. выше), сжатые и случайные данные.

Типы и иерархия данных в программировании[ | ]

Традиционный подход к данным в программировании основан на понятии типа данных. В

Тип данных — Википедия

Python 3. The standard type hierarchy.png

Тип данных (тип) — множество значений и операций над этими значениями (IEEE Std 1320.2-1998)[1].

Другие определения:

  • Тип данных — класс данных, характеризуемый членами класса и операциями, которые могут быть к ним применены (ISO/IEC/IEEE 24765-2010)[2].
  • Тип данных — категоризация абстрактного множества возможных значений, характеристик и набор операций для некоторого атрибута (IEEE Std 1320.2-1998)[3].
  • Тип данных — категоризация аргументов операций над значениями, как правило, охватывающая как поведение, так и представление (ISO/IEC 19500-2:2003)[4].
  • Тип данных — допустимое множество значений[5].

Тип определяет возможные значения и их смысл, операции, а также способы хранения значений типа. Изучается теорией типов. Неотъемлемой частью большинства языков программирования являются системы типов, использующие типы для обеспечения той или иной степени типобезопасности.

Тип данных характеризует одновременно:

  • множество допустимых значений, которые могут принимать данные, принадлежащие к этому типу;
  • набор операций, которые можно осуществлять над данными, принадлежащими к этому типу.

Первое свойство можно рассматривать как теоретико-множественное определение понятия типа; второе — как процедурное (или поведенческое) определение.

Кроме этого, в программировании используется низкоуровневое определение типа — как заданных размерных и структурных характеристик ячейки памяти, в которую можно поместить некое значение, соответствующее этим характеристикам. Такое определение является частным случаем теоретико-множественного. На практике, с ним связан ряд важных свойств (обусловленных особенностями организации памяти компьютера), требующих отдельного рассмотренияПерейти к разделу «#Представление на ЭВМ».

Теоретико-множественное определение, особенно в низкоуровневом варианте, чаще всего используется в императивном программировании. Процедурное определение в большей степени связывается с параметрическим полиморфизмом. Объектно-ориентированное программирование использует процедурное определение при описании взаимодействия компонентов программы, и теоретико-множественное — при описании реализации этих компонентов на ЭВМ, соответственно, рассматривая «класс-как-поведение» и «класс-как-объект в памяти»[источник не указан 1810 дней].

Операция назначения типа информационным сущностям называется типизацией. Назначение и проверка согласования типов может осуществляться заранее (статическая типизация), непосредственно при использовании (динамическая типизация) или совмещать оба метода. Типы могут назначаться «раз и навсегда» (сильная типизация) или позволять себя изменять (слабая типизация).

Типы позволяют избежать парадокса Рассела, в частности, Чёрч ввёл типы в лямбда-исчисление именно с этой целью[6].

В естественном языке за типизацию отвечают вопросительные местоимения.

Единообразная обработка данных разных типов называется полиморфизмом[7][8].

Понятие типобезопасности опирается преимущественно на процедурное определение типа. Например, попытка деления числа на строку будет отвергнута большинством языков, так как для этих типов не определено соответствующее поведение. Слабо типизированные языки тяготеют к низкоуровневому определению. Например, «число» и «запись» имеют различное поведение, но значение адреса «записи» в памяти ЭВМ может иметь то же низкоуровневое представление, что и «число». Слабо типизированные языки предоставляют возможность нарушить систему типов, назначив этому значению поведение «числа» посредством операции приведения типа. Подобные трюки могут использоваться для повышения эффективности программ, но несут в себе риск крахов, и поэтому в безопасных языках не допускаются, либо жёстко обособляются.

К неполным по Тьюрингу языкам описания данных (таким как SGML) процедурное определение обычно неприменимо[источник не указан 1810 дней].

Существуют различные классификации типов и правил их назначения.

По аналогии с математикой, типы данных делят на скалярные (примитивные) и нескалярные (агрегатные). Значение нескалярного типа (нескалярное значение) имеет множество видимых пользователю компонентов, а значение скалярного типа (скалярное значение) не имеет такового.[9] Примерами нескалярного типа являются массивы, списки и т. д.; примеры скалярного типа — «целое», «логическое» и т. д.

Структурные (агрегатные) типы не следует отождествлять со структурами данных: одни структуры данных непосредственно воплощаются определёнными структурными типами, но другие строятся посредством их композиции, чаще всего рекурсивной. В последнем случае говорят о рекурсивных типах данных[en]. Примером структур данных, которые почти всегда строятся посредством композиции объектов рекурсивного типа, являются бинарные деревья.

По другой классификации типы делятся на самостоятельные и зависимые. Важными разновидностями последних являются ссылочные типы, частным случаем которых, в свою очередь, являются указатели. Ссылки (в том числе и указатели) представляют собой несоставной зависимый тип, значения которого являются адресом в памяти ЭВМ другого значения. Например, в системе типов Си тип «указатель на целое без знака» записывается как «unsigned *», в языке ML тип «ссылка на целое без знака» записывается как «word ref».

Также типы делятся на мономорфные и полиморфные (см. переменная типа).

Некоторые распространённые типы данных[править | править код]

Логический тип[править | править код]

Логические, или булевы значения (по фамилии их изобретателя — Буля), могут иметь лишь одно из двух состояний — «истина» или «ложь». В разных языках обозначаются bool, BOOL, или boolean. «Истина» может обозначаться как true, TRUE или #T. «Ложь», соответственно, false, FALSE или #F. В языках C и C++ любое ненулевое число трактуется как «истина», а ноль — как «ложь». В Python некоторым единичным типам[en] также назначается то или иное «логическое значение». В принципе, для реализации типа достаточно одного бита, однако из-за особенностей микропроцессоров, на практике размер булевых величин обычно равен размеру машинного слова.

Целочисленные типы[править | править код]

Целочисленные типы содержат в себе значения, интерпретируемые как числа (знаковые и беззнаковые).

Числа с плавающей запятой[править | править код]

Используются для представления вещественных (не обязательно целых) чисел. В этом случае число записывается в виде x=a*10^b. Где 0<=a<1, а b — некоторое целое число из определённого диапазона. a называют мантиссой, b — порядком. У мантиссы хранятся несколько цифр после запятой, а b — хранится полностью.

Строковые типы[править | править код]

Последовательность символов, которая рассматривается как единое целое в контексте переменной. В разных языках программирования накладываются разные ограничения на строковые переменные. Строки могут содержать управляющие последовательности.

Указатели[править | править код]

Указатель — переменная, диапазон значений которой состоит из адресов ячеек памяти или специального значения для обозначения того, что в данный момент в переменной ничего не записано.

Идентификационные типы[править | править код]

Идентификационные типы интерпретируются не как число, а как уникальный идентификатор объекта. Например, FourCC.

Абстрактные типы данных[править | править код]

Типы данных, которые рассматриваются независимо от контекста и реализации в конкретном языке программирования. Абстракция в математическом смысле означает, что алгебра данных рассматривается с точностью до изоморфизма. Абстрактные типы находят широкое применение в методологии программирования, основанной на пошаговой разработке программ. На этапе построения спецификации проектируемой программы алгебра данных моделирует объекты предметной области, в терминах решаемой задачи. В процессе пошагового уточнения данные конкретизируются путём перехода к промежуточным представлениям до тех пор, пока не будет найдена их реализация с помощью базовой алгебры данных используемого языка программирования. Существует несколько способов определения абстрактных типов: алгебраический, модельный и аксиоматический. При модельном подходе элементы данных определяются явным образом. При алгебраическом используются методы алгебраических отношений, а при аксиоматическом подходе используется логическая формализация.

  • примитивные типы, в том числе:
  • ссылочные типы
  • опциональные типы[en]
  • Композитные типы, в том числе:
  • алгебраические типы
  • подтипы[en]
  • унаследованные типы
  • объектные типы, то есть объекты, значением которых являются типы — например, переменные типов
  • частичные типы[en]
  • рекурсивные типы[en]
  • функциональные типы, например бинарные функции
  • универсально квантифицированные типы, такие как параметрические типы
  • экзистенциально квантифицированные, такие как модули
  • зависимые типы — типы, зависящие от термов (значений)
  • уточняющие типы[en] — типы, идентифицирующие подмножества других типов
  • Предопределённые типы (являющиеся фактически структурными, но предоставляемые на правах примитивных) для удобства промышленных разработок, такие как «дата», «время», «валюта» и др.

Тип может быть параметризован другим типом, в соответствии с принципами абстракции и параметричности[en]. Например, для реализации функции сортировки последовательностей нет необходимости знать все свойства составляющих её элементов — необходимо лишь, чтобы они допускали операцию сравнения — и тогда составной тип «последовательность» может быть определён как параметрически полиморфный. Это означает, что его компоненты определяются с использованием не конкретных типов (таких как «целое» или «массив целых»), а параметров-типов. Такие параметры называются переменными типа (англ. type variable) — они используются в определении полиморфного типа так же, как параметры-значения в определении функции. Подстановка конкретных типов в качестве фактических параметров для полиморфного типа порождает мономорфный тип. Таким образом, параметрически полиморфный тип представляет собой конструктор типов, то есть оператор над типами в арифметике типов.

Определение функции сортировки как параметрически полиморфной означает, что она сортирует абстрактную последовательность, то есть последовательность из элементов некоторого (неизвестного) типа. Для функции в этом случае требуется знать о своём параметре лишь два свойства — то, что он представляет собой последовательность, и что для её элементов определена операция сравнения. Рассмотрение параметров процедурным, а не декларативным, образом (то есть их использование на основе поведения, а не значения) позволяет использовать одну функцию сортировки для любых последовательностей — для последовательностей целых чисел, для последовательностей строк, для последовательностей последовательностей булевых значений, и так далее — и существенно повышает коэффициент повторного использования кода. Ту же гибкость обеспечивает и динамическая типизация, однако, в отличие от параметрического полиморфизма, первая приводит к накладным расходам. Параметрический полиморфизм наиболее развит в языках, типизированных по Хиндли — Милнеру, то есть потомках языка ML. В объектно-ориентированном программировании параметрический полиморфизм принято называть обобщённым программированием.

Несмотря на очевидные преимущества параметрического полиморфизма, порой возникает необходимость обеспечивать различное поведение для разных подтипов[en] одного общего типа, либо аналогичное поведение для несовместимых типов — то есть в тех или иных формах ad-hoc-полиморфизма. Однако, ему не существует математического обоснования, так что требование типобезопасности долгое время затрудняло его использование. Ad-hoc-полиморфизм реализовывался внутри параметрически полиморфной системы типов посредством различных трюков. Для этой цели использовались либо вариантные типы[en], либо параметрические модули (функторы либо так называемые «значения, индексированные типами» (англ. type-indexed values), которые, в свою очередь, также имеют ряд реализаций[10]. Классы типов, появившиеся в языке Haskell, предоставили более изящное решение этой проблемы.

Если рассматриваемой информационной сущностью является тип, то назначение ей типа приведёт к понятию «тип типа» («метатип»). В теории типов это понятие носит название «род типов» (англ. kind of a type или type kind). Например, род «*» включает все типы, а род «* -> *» включает все унарные конструкторы типов. Рода явным образом применяются при полнотиповом программировании — например, в виде конструкторов типов в языках семейства ML.

Расширение безопасной полиморфной системы типов классами и родами типов сделало Haskell первым типизированным в полной мере языком. Полученная система типов оказала влияние на другие языки (например, Scala, Agda).

Ограниченная форма метатипов присутствует также в ряде объектно-ориентированных языков в форме метаклассов. В потомках языка Smalltalk (например, Python) всякая сущность в программе является объектом, имеющим тип, который сам также является объектом — таким образом, метатипы являются естественной частью языка. В языке C++ отдельно от основной системы типов языка реализована подсистема RTTI, также предоставляющая информацию о типе в виде специальной структуры.

Динамическое выяснение метатипов называется отражением (а также рефлексивностью или интроспекцией).

Наиболее заметным отличием реального программирования от формальной теории информации является рассмотрение вопросов эффективности не только в терминах О-нотации, но и с позиций экономической целесообразности воплощения тех или иных требований в физически изготовляемой ЭВМ. И в первую очередь это сказывается на допустимой точности вычислений: понятие «число» в ЭВМ на практике не тождественно понятию числа в арифметике. Число в ЭВМ представляется ячейкой памяти, размер которой определяется архитектурой ЭВМ, и диапазон значений числа ограничивается размером этой ячейки. Например, процессоры архитектуры Intel x86 предоставляют ячейки, размер которых в байтах задаётся степенью двойки: 1, 2, 4, 8, 16 и т. д. Процессоры архитектуры Сетунь предоставляли ячейки, размер которых в трайтах задавался кратным тройке: 1, 3, 6, 9 и т. д.

Попытка записи в ячейку значения, превышающего максимально допустимый для неё предел (который известен) приводит к ошибке переполнения. При необходимости расчётов на более крупных числах используется специальная методика, называемая длинной арифметикой, которая в силу значительной ресурсоёмкости не может осуществляться в реальном времени. Для наиболее распространённых в настоящее время архитектур ЭВМ «родным» является размер ячеек в 32 и 64 бит (то есть 4 и 8 байт).

Кроме того, целые и вещественные числа имеют разное представление в этих ячейках: неотрицательные целые представляются непосредственно, отрицательные целые — в дополнительном коде, а вещественные кодируются особым образом. Из-за этих различий сложение чисел «1» и «0.1», которое в теории даёт значение «1.1», на ЭВМ непосредственно невозможно. Для его осуществления необходимо сперва выполнить преобразование типа, породив на основании значения целого типа «1» новое значение вещественного типа «1.0», и лишь затем сложить «1.0» и «0.1». В силу специфики реализации вещественных чисел на ЭВМ, такое преобразование осуществляется не абсолютно точно, а с некоторой долей приближения. По той же причине сильно типизированные языки (например, Standard ML) рассматривают вещественный тип как equality types (или identity types) (Equality type[en]).

Для низкоуровневого представления составных типов важное значение имеет понятие о выравнивании данных. Языки высокого уровня обычно изолируют (абстрагируют) программиста от этого свойства, однако, с ним приходится считаться при связывании независимо скомпилированных модулей между собой. Однако, некоторые языки (Си — , С++) предоставляют возможность контролировать низкоуровневое представление типов, в том числе и выравнивание. Такие языки временами называют языками среднего уровня.

  1. ↑ IEEE Std 1320.2-1998 (R2004) IEEE Standard for Conceptual Modeling Language Syntax and Semantics for IDEF1X97:
    a set of values and operations on those values
  2. ↑ ISO/IEC/IEEE 24765-2010 Systems and software engineering — Vocabulary:
    a class of data, characterized by the members of the class and the operations that can be applied to them
  3. ↑ IEEE Std 1320.2-1998 (R2004) IEEE Standard for Conceptual Modeling Language Syntax and Semantics for IDEF1X97:
    a categorization of an abstract set of possible values, characteristics, and set of operations for an attribute
  4. ↑ ISO/IEC 19500-2:2003, Information technology — Open Distributed Processing — Part 2: General Inter-ORB Protocol (GIOP)/Internet Inter-ORB Protocol (IIOP):
    a categorization of values operation arguments, typically covering both behavior and representation
  5. ↑ С. J. Date. On The Logical Differences Between Types, Values, and Variables // Date on database: Writings 2000—2006, Apress, 2006, ISBN 978-1-59059-746-0
  6. Харрисон Дж. Введение в Функциональное Программирование = http://www.cl.cam.ac.uk/Teaching/Lectures/funprog-jrh-1996/. — 1997. Архивировано 11 января 2015 года.
  7. ↑ Strachey, 1967, 3.6.4. Polymorphism, p. 36—37.
  8. ↑ Cardelli, 1991, 2. Typeful languages, p. 5.
  9. ↑ Дейт К. Дж., 2005.
  10. ↑ Type-Indexed Values
  • Дейт К. Дж. Введение в системы баз данных = Introduction to Database Systems. — 8-е изд. — М.: Вильямс, 2005. — 1328 с. — ISBN 5-8459-0788-8 (рус.) 0-321-19784-4 (англ.).
  • C. Strachey. Fundamental Concepts in Programming Languages. — 1967. Архивировано 12 августа 2017 года.
  • Luca Cardelli, Peter Wegner. On Understanding Types, Data Abstraction, and Polymorphism. — ACM Computing Surveys, 1985. — С. 471—523. — ISSN 0360-0300.
  • Лука Карделли[en]. Typeful programming (англ.) // IFIP State-of-the-Art Reports. — Springer-Verlag, 1991. — Iss. Formal Description of Programming Concepts. — P. 431–507.
  • Pierce, Benjamin C. Types and Programming Languages. — MIT Press, 2002. — ISBN 0-262-16209-1.
  • Luca Cardelli. CRC Handbook of Computer Science and Engineering. — 2nd. — CRC Press, 2004. — ISBN 158488360X.
  • Zhe Yang. Encoding Types in ML-like Languages. — Department of Computer Science, New York University, (c) ACM, 1998.

Leave a comment