Обработка и хранение информации

Хранение данныхНикогда не задавались вопросом, зачем вам компьютер? В широком смысле этого слова. Ведь сейчас компьютерами можно назвать не только ящик с монитором, который стоит на столе (или ноутбук), но и планшет, и даже телефон. Да уж, телефоны сейчас имеют такую начинку, о которой 15 лет назад компьютерщики только мечтать могли. Итак, давайте разберемся в высоких целях компьютеризации.

На мой взгляд, цели всего две:

  1. Производить вычисления. Это решение задач, моделирование процессов, игры всевозможные и прочее и прочее.
  2. Хранение, обработка и анализ информации.

Вот на втором пункте я и хочу остановиться поподробнее. Все наше общение с офисными программами (Word, и Access) представляет собой именно работу с некоторой информацией, которую мы храним и обрабатываем на своих компьютерах.

Ну, когда речь идет о документах Word, тут, казалось бы, более-менее все понятно. Набрали документ, распечатали, сохранили для истории и ладушки. И все же, есть пара рекомендаций, которые могут оказаться полезными.

  • Хранить лучше в упорядоченной структуре папок (например, упорядоченной по времени или тематически, так легче искать нужное).
  • Располагайте ваши данные на отдельном логическом диске (например, на диске D:), но не на системном (обычно, это диск С:).
  • Не храните кучу документов (например, рапортов или выписок из протоколов) в одном файле. Если будет какой-либо сбой, и именно этот файл повредится, то вы потеряете все данные.

А вот редактор электронных таблиц и реляционная СУБД выполняют полный спектр задач над данными –  их хранение, обработку и анализ. Да-да, Excel, это не только построение таблиц и выполнение над ними вычислений. В таблицах Excel можно организовать грамотное и анализ информации, конечно, если этих данных не очень много (не тысячи строк). При больших объемах данных лучше использовать СУБД (Access, например). Поэтому тоже можно отнести к реляционным базам данных. Кстати, давайте разберемся с термином – реляционные базы данных. Основой реляционной модели данных является реляционная алгебра. Она позволяет выполнять операции над таблицами (или ещё говорят, над отношениями) и базируется на математической логике. Гм, страшновато звучит, но, поверьте, там не очень сложно. 🙂 Я, пожалуй, позже посвящу этому отдельную статью, уж больно это важная вещь, когда коснусь операций в базе данных. Так вот, реляционная алгебра замкнута на понятии двумерной таблицы (двумерная, это строки и столбцы), так как все действия, которые выполняются ею над таблицами (ее операторами), дают в результате тоже двумерную таблицу! Что очень удобно.

В настоящее время данная модель хранилища данных приобрела наибольшую популярность и практически все современные СУБД ориентированы именно на такое представление данных.

Реляционную модель можно представить как особый метод рассмотрения данных, содержащий и данные (в виде таблиц), и способы их организации (в виде связей). Поэтому реляционная модель предполагает три концептуальных элемента: структура базы, ее целостность и обработка хранимых данных.

Таблица выступает как непосредственное «хранилище» данных. При этом столбцы таблицы имеют уникальные (в пределах таблицы) имена. Для таблицы предусматривается уникальный идентификатор — один или несколько столбцов, значения которых для отдельной строки в одно и то же время не бывают одинаковыми – идентификатор называют первичным ключом. Задача у первичного ключа сделать каждую строку в таблице уникальной, чтобы исключить избыточность информации. Действительно, зачем хранить несколько одинаковых строк? Одной вполне хватит.

В реляционных БД пользователь указывает, какие данные для него необходимы, а не то, как их оттуда извлечь (как при фильтрации в Excel). По этой причине процесс перемещения и навигации по БД в реляционных системах является автоматическим, а эту задачу выполняет так называемый оптимизатор. Его работа заключается, например, в том, чтобы наиболее эффективным способом произвести выборку данных из БД по конкретному запросу. Таким образом, оптимизатор, по крайней мере, должен суметь определить, из каких таблиц выбираются данные, насколько много информации в этих таблицах, каков физический порядок записей в таблицах и как они сгруппированы и. т. д.

Кроме того, реляционная СУБД выполняет и функции каталога. В каталоге хранятся описания всех объектов, из которых состоит БД — таблиц, индексов и т. п. Очевидно, что это жизненно необходимо для правильной работы всей системы — так, например, оптимизатор использует в своей работе информацию, хранящуюся в каталоге. Интересен тот факт, что каталог сам является набором таблиц, поэтому СУБД может манипулировать ими традиционными средствами, не прибегая к каким-то особым приемам и методам.

Так что, если вам нужно хранить определенный объем информации, и периодически обращаться к нему, то для этого удобно создать одну или несколько таблиц. Если это одна таблица, то подойдет и Excel, а если несколько, то лучше – Access. Кстати, в тоже можно организовать выполнение запросов пользователя на выборку данных как в рамках одного документа, так и нескольких, а также обращение к базе данных или SQL Server, но об этом в следующих статьях.

Для получения анонсов статей удобно воспользоваться рассылкой, подписаться на которую можно ЗДЕСЬ.