Реферат создание архива данных извлечение данных из архива

Обновлено: 05.07.2024

Архивация - это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле. Архивация данных - это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.

Архивация проводится в следующих случаях:

  • когда необходимо создать резервные копии наиболее ценных файлов;
  • когда необходимо освободить место на диске;
  • когда необходимо передать файлы по E-mail.

Архивный файл представляет собой набор из нескольких файлов (одного файла), помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.

В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:

  • имя файла;
  • размер файла на диске и в архиве;
  • сведения о местонахождения файла на диске;
  • дата и время последней модификации файла;
  • код циклического контроля для файла, используемый для проверки целостности архива;
  • степень сжатия.

Любой из архивов имеет свою шкалу степени сжатия. Чаще всего можно встретить следующую градацию методов сжатия:

  1. Без сжатия (соответствует обычному копированию файлов в архив без сжатия).
  2. Скоростной.
  3. Быстрый (характеризуется самым быстрым, но наименее плотным сжатием).
  4. Обычный.
  5. Хороший.
  6. Максимальный (максимально возможное сжатие является одновременно и самым медленным методом сжатия).

Лучше всего архивируются графические файлы в формате .bmp, документы MS Office и Web-страницы.

Что такое архиваторы?

Архиваторы – это программы (комплекс программ) выполняющие сжатие и восстановление сжатых файлов в первоначальном виде. Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов – разархивированием. Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия (WinZip 9.0, WinAce 2.5, PowerArchiver 2003 v.8.70, 7Zip 3.13, WinRAR 3.30, WinRAR 3.70 RU).

Другие названия архиваторов: утилиты - упаковщики, программы - упаковщики, служебные программы, позволяющие помещать копии файлов в сжатом виде в архивный файл.

В ОС MS DOS существуют архиваторы, но они работают только в режиме командной строки. Это программы PKZIP и PKUNZIP, программа архиватора ARJ. Современные архиваторы обеспечивают графический пользовательский интерфейс и сохранили командную строку. В настоящее время лучшим архиватором для Windows является архиватор WinRAR.


WinRAR – это 32 разрядная версия архиватора RAR для Windows. Это - мощное средство создания архивов и управления ими. Есть несколько версий RAR, для разных операционных систем: Windows, Linux, UNIX, DOS, OS/2 и т.д.

Существует две версии RAR для Windows:

  • версия с графическим пользовательским интерфейсом - WinRAR.EXE;
  • Консольная версия RAR.EXE пульт линии команды (способ текста) версия - Rar.exe.
  1. Позволяет распаковывать архивы CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2, JAR, ISO, и обеспечивает архивирование данных в форматы ZIP и RAR.
  2. Обеспечивает полную поддержку архивов ZIP и RAR.
  3. Имеет специальные алгоритмы, оптимизированные для текста и графики. Для мультимедиа сжатие можно использовать только с форматами RAR.
  4. Поддерживает технологию перетаскивания (drag & drop).
  5. Имеет интерфейс командной строки.
  6. Может осуществлять непрерывное архивирование, что обеспечивает более высокую степень сжатия по сравнению с обычными методами сжатия, особенно при упаковке большого количества небольших файлов однотипного содержания.
  7. Обеспечивает поддержку многотомных архивов, то есть осуществляет разбивку архива на несколько томов (например, для записи большого архива на диски). Расширение томов: RAR, R01, R02 и т.д. При самораспаковывающемся архиве первый том имеет расширение EXE.
  8. Создает самораспаковывающиеся архивы (SFX) обычные и многотомные архивы, обеспечивает защиту их паролями.
  9. Обеспечивает восстановление физически поврежденных архивов.
  10. Имеет средства восстановления, позволяющие восстанавливать отсутствующие части многотомного архива.
  11. Поддерживает UNICODE в именах файлов.
  12. Для новичков предназначен режим Мастер (Wizard), с помощью которого можно легко осуществить все операции над архивами.

WinRAR имеет и другие дополнительные функции. WinRAR способен создать архив в двух различных форматах: RAR иZIP.

Рассмотрим преимущества каждого формата.

Архив в формате ZIP

Архив в формате RAR

формат RAR в большинстве случаев обеспечивает значительно лучшее сжатие, чем ZIP. Кроме того, формат RAR обеспечивает поддержку многотомных архивов, имеет средства восстановления поврежденных файлов, архивирует файлы практически неограниченных размеров. Необходимо отметить, что при работе в файловой системе FAT32 архивы могу достигать только 4 гигабайт. Работа с большими размерами архива поддерживается только в файловой системе NTFS.

Программа архивации Microsoft Backup (резервная копия)

Запуск программы осуществляется: Пуск – программы – стандартные – служебные – архивация данных. Откроется мастер архивации и восстановления в обычном режиме. Из этого режима можно перейти в расширенный режим для работы с мастером архивации, мастером восстановления и мастером аварийного восстановления ОС.

Программа архивации позволяет защитить данные от случайной утери в случае, если в системе возникает сбой оборудования или носителя информации. С помощью Backup можно создать резервную копию данных на жестком диске, а затем создать архив на другом носителе данных. Носителем архива может быть логический диск или отдельное устройство (съемный диск).

Программа архивации создает снимок состояния тома, представляющий собой точную копию содержимого диска на определенный момент времени, в том числе открытых файлов, используемых системой. Во время выполнения программы архивации пользователь может продолжать работать с ОС без риска потери данных.

* Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.

Министерство образования РФ.

Новгородский государственный университет имени Ярослава Мудрого.

Кафедра математики и информатики.

Лабораторная работа №6

Винник Людмила Ивановна

Целью работы является изучение основных видов программ-архиваторов, алгоритмов архивации данных, приобретение практических навыков их использования.

2. ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ

2.1 Применение архиваторов

Раньше в вычислительных машинах для хранения больших объемов информации в течение длительного времени использовались накопители на магнитных лентах, которые обладали колоссальной емкостью, а сжатие информации на диске было нерациональным решением, так как работа с ней в таком виде отнимала драгоценное машинное время. Необходимость в архиваторах возникла, когда появились персональные компьютеры, и для хранения в них информации использовались дискеты и жесткие диски первоначально небольшой емкости. Повышение скорости работы процессоров персональных компьютеров в середине 80-х годов позволило создать утилиты, сжимающие информацию в два раза.

С развитием компьютера стали увеличиваться и объемы информации хранимой в нем, что в свою очередь привело к развитию технологий по хранению этой информации в сжатом виде, то есть в архивах. Для этого было придумано множество программ осуществляющих архивацию информации.

Архиваторы в основном использовались для резервного копирования и переноса информации. При хранении копий файлов в сжатом виде они занимают меньше места, к тому же удобнее оперировать с одним или несколькими файлами, чем с большим количеством файлов и директорий. Не потеряли архиваторы актуальности и теперь, однако требования, предъявляемые пользователям к этой категории программных продуктов, существенно изменились. Если раньше едва ли не самым важным было требование по максимальному сжатию информации, хотя бы в силу дороговизны на тот момент носителей информации - в первую очередь распространялись архиваторы, удовлетворяющие именно этому требованию, то теперь ситуация значительно изменилась и на первое место встают простота и удобство в использовании.

Еще одним немаловажным требованием, предъявляемым к архиваторам при переносе информации, была его распространенность, т. е. чтобы при передаче информации не приходилось в придачу передавать и сам архиватор

2.2 Понятие процесса архивации файлов

Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.

Сжатие информации — это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.

Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации.

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.

Архивный файл — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения компьютерными вирусами.

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей — 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Архивация (упаковка) — помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде. Разархивация (распаковка) — процесс восстановления файлов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память;

Архиваторы - это программы, позволяющие создавать и обрабатывать архивные копии файлов. При этом архивные копии имеют меньший размер, чем оригиналы. С помощью специальных алгоритмов сжатия из файлов удаляется вся избыточная информация, а при применении обратных алгоритмов распаковки архивная копия восстанавливается в первоначальном виде.

Программы-архиваторы позволяют создавать и такие архивы, для извлечения из которых содержащихся в них файлов не требуются какие-либо программы, так как сами архивные файлы могут содержать программу распаковки. Такие архивные файлы называются самораспаковывающимися.

Самораспаковывающийся архивный файл — это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.

Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа в MS DOS обычно создаются в форме .ЕХЕ-файла.

Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными. Том — это составная часть многотомного архива. Создавая архив из нескольких частей, можно записать его части на несколько дискет.

Сжатие информации - проблема, имеющая достаточно давнюю историю, гораздо более давнюю, нежели история развития вычислительной техники, которая (история) обычно шла параллельно с историей развития проблемы кодирования и шифровки информации.

Все алгоритмы сжатия оперируют входным потоком информации, минимальной единицей которой является бит, а максимальной - несколько бит, байт или несколько байт.

Целью процесса сжатия, как правило, есть получение более компактного выходного потока информационных единиц из некоторого изначально некомпактного входного потока при помощи некоторого их преобразования.

Основными техническими характеристиками процессов сжатия и результатов их работы являются:

* степень сжатия (compress rating) или отношение (ratio) объемов исходного и результирующего потоков;

* скорость сжатия - время, затрачиваемое на сжатие некоторого объема информации входного потока, до получения из него эквивалентного выходного потока;

* качество сжатия - величина, показывающая на сколько сильно упакован выходной поток, при помощи применения к нему повторного сжатия по этому же или иному алгоритму.

2.3. Алгоритмы архивации данных

Все способы сжатия можно разделить на две категории: обратимое (сжатие без потерь) и необратимое сжатие.

Под необратимым сжатием подразумевают такое преобразование входного потока данных, при котором выходной поток, основанный на определенном формате информации, представляет, с некоторой точки зрения, достаточно похожий по внешним характеристикам, на входной поток объект, однако отличается от него объемом.

Такие подходы и алгоритмы используются для сжатия, например данных растровых графических файлов с низкой степенью повторяемости байтов в потоке. При таком подходе используется свойство структуры формата графического файла и возможность представить графическую картинку приблизительно схожую по качеству отображения (для восприятия человеческим глазом) несколькими (а точнее n) способами. Поэтому, кроме степени или величины сжатия, в таких алгоритмах возникает понятие качества, т.к. исходное изображение в процессе сжатия изменяется, то под качеством можно понимать степень соответствия исходного и результирующего изображения, оцениваемая субъективно, исходя из формата информации. Для графических файлов такое соответствие определяется визуально, хотя имеются и соответствующие интеллектуальные алгоритмы и программы. Необратимое сжатие невозможно применять в областях, в которых необходимо иметь точное соответствие информационной структуры входного и выходного потоков. Данный подход реализован в популярных форматах представления видео и фото информации, известных как JPEG и JFIF алгоритмы и JPG и JIF форматы файлов.

Обратимое сжатие всегда приводит к снижению объема выходного потока информации без изменения его информативности, т.е. - без потери информационной структуры.

Более того, из выходного потока, при помощи восстанавливающего или декомпрессирующего алгоритма, можно получить входной, а процесс восстановления называется декомпрессией или распаковкой и только после процесса распаковки данные пригодны для обработки в соответствии с их внутренним форматом.

Перейдем теперь непосредственно к алгоритмическим особенностям обратимых алгоритмов и рассмотрим важнейшие теоретические подходы к сжатию данных, связанные с реализацией кодирующих систем и способы сжатия информации.

2.3. 1 Алгоритмы сжатия без потерь

2.3.1.1. Сжатие способом кодирования серий (RLE)

Наиболее известный простой подход и алгоритм сжатия информации обратимым путем - это кодирование серий последовательностей (Run Length Encoding - RLE).

Суть методов данного подхода состоит в замене цепочек или серий повторяющихся байтов или их последовательностей на один кодирующий байт и счетчик числа их повторений.

44 44 44 11 11 11 11 11 01 33 FF 22 22 - исходная последовательность

03 44 05 11 01 01 01 33 01 FF 02 22 - сжатая последовательность

Первый байт указывает сколько раз нужно повторить следующий байт

Если первый байт равен 00, то затем идет счетчик, показывающий сколько за ним следует неповторяющихся данных.

Данные методы, как правило, достаточно эффективны для сжатия растровых графических изображений (BMP, PCX, TIF, GIF), т.к. последние содержат достаточно много длинных серий повторяющихся последовательностей байтов.

Недостатком метода RLE является достаточно низкая степень сжатия.

2.3.1.2 Алгоритм Хаффмана

Сжимая файл по алгоритму Хаффмана первое что мы должны сделать - это необходимо прочитать файл полностью и подсчитать сколько раз встречается каждый символ из расширенного набора ASCII.

Если мы будем учитывать все 256 символов, то для нас не будет разницы в сжатии текстового и EXE файла.

После подсчета частоты вхождения каждого символа, необходимо просмотреть таблицу кодов ASCII и сформировать бинарное дерево.

Мы имеем файл длинной в 100 байт и имеющий 6 различных символов в себе . Мы подсчитали вхождение каждого из символов в файл и получили следующее :

Теперь мы берем эти числа и будем называть их частотой вхождения для каждого символа.

Мы возьмем из последней таблицы 2 символа с наименьшей частотой. В нашем случае это D (5) и какой либо символ из F или A (10), можно взять любой из них например A.

Сформируем из "узлов" D и A новый "узел", частота вхождения для которого будет равна сумме частот D и A :

Номер в рамке - сумма частот символов D и A. Теперь мы снова ищем два символа с самыми низкими частотами вхождения. Исключая из просмотра D и A и рассматривая вместо них новый "узел" с суммарной частотой вхождения. Самая низкая частота теперь у F и нового "узла". Снова сделаем операцию слияния узлов :

Рассматриваем таблицу снова для следующих двух символов ( B и E ).

Мы продолжаем в этот режим пока все "дерево" не сформировано, т.е. пока все не сведется к одному узлу.

Теперь когда наше дерево создано, мы можем кодировать файл . Мы должны всегда начинать из корня ( Root ). Кодируя первый символ (лист дерева С) Мы прослеживаем вверх по дереву все повороты ветвей и если мы делаем левый поворот, то запоминаем 0-й бит, и аналогично 1-й бит для правого поворота. Так для C, мы будем идти влево к 55 ( и запомним 0 ), затем снова влево (0) к самому символу . Код Хаффмана для нашего символа C - 00. Для следующего символа ( А ) у нас получается - лево,право,лево,лево , что выливается в последовательность 0100. Выполнив выше сказанное для всех символов получим

A = 0100 ( 4 бита )

D = 0101 ( 4 бита )

При кодировании заменяем символы на данные последовательности.

2.3.1.3 Арифметическое кодирование

Совершенно иное решение предлагает т.н. арифметическое кодирование. Арифметическое кодирование является методом, позволяющим упаковывать символы входного алфавита без потерь при условии, что известно распределение частот этих символов и является наиболее оптимальным, т.к. достигается теоретическая граница степени сжатия.

Предполагаемая требуемая последовательность символов, при сжатии методом арифметического кодирования рассматривается как некоторая двоичная дробь из интервала [0, 1). Результат сжатия представляется как последовательность двоичных цифр из записи этой дроби.

Идея метода состоит в следующем: исходный текст рассматривается как запись этой дроби, где каждый входной символ является "цифрой" с весом, пропорциональным вероятности его появления. Этим объясняется интервал, соответствующий минимальной и максимальной вероятностям появления символа в потоке.

Пусть алфавит состоит из двух символов: a и b с вероятностями соответственно 0,75 и 0,25.

Рассмотрим наш интервал вероятностей [0, 1). Разобьем его на части, длина которых пропорциональна вероятностям символов. В нашем случае это [0; 0,75) и [0,75; 1). Суть алгоритма в следующем: каждому слову во входном алфавите соответствует некоторый подинтервал из интервала [0, 1) а пустому слову соответствует весь интервал [0, 1). После получения каждого следующего символа интервал уменьшается с выбором той его части, которая соответствует новому символу. Кодом цепочки является интервал, выделенный после обработки всех ее символов, точнее, двоичная запись любой точки из этого интервала, а длина полученного интервала пропорциональна вероятности появления кодируемой цепочки.

Применим данный алгоритм для цепочки "aaba":

Границы интервала вычисляются так берется расстояние внутри интервала (0,5625-0,421875=0,140625), делится на частоты [0; 0,10546875) и [0,10546875; 1) и находятся новые границы [0,421875; 0,52734375) и [0,52734375; 0,5625).

В качестве кода можно взять любое число из интервала, полученного на шаге 4, например, 0,43.

Алгоритм декодирования работает аналогично кодирующему. На входе 0,43 и идет разбиение интервала.

Продолжая этот процесс, мы однозначно декодируем все четыре символа. Для того, чтобы декодирующий алгоритм мог определить конец цепочки, мы можем либо передавать ее длину отдельно, либо добавить к алфавиту дополнительный уникальный символ - "конец цепочки".

2.3.1.4 Алгоритм Лемпеля – Зива - Велча (Lempel-Ziv-Welch - LZW)

Данный алгоритм отличают высокая скорость работы как при упаковке, так и при распаковке, достаточно скромные требования к памяти и простая аппаратная реализация.

Недостаток - низкая степень сжатия по сравнению со схемой двухступенчатого кодирования.

Алгоритм просматривает входной поток, разбивая его на подстроки и добавляя новые гнезда в конец словаря. Прочитаем несколько символов в строку s и найдем в словаре строку t - самый длинный префикс s.

Пусть он найден в гнезде с номером n. Выведем число n в выходной поток, переместим указатель входного потока на length(t) символов вперед и добавим в словарь новое гнездо, содержащее строку t+c, где с - очередной символ на входе (сразу после t). Алгоритм преобразует поток символов на входе в поток индексов ячеек словаря на выходе.

При практической реализации этого алгоритма следует учесть, что любое гнездо словаря, кроме самых первых, содержащих одно-символьные цепочки, хранит копию некоторого другого гнезда, к которой в конец приписан один символ. Вследствие этого можно обойтись простой списочной структурой с одной связью.

В настоящее время большинство из нас часто пользуется Интернетом и часто сталкивается с информацией заархивированной различными программами – архиваторами. Данная курсовая работа посвящена изучению архивации данных на примере программы WinRAR.

Цель данной курсовой работы заключается в раскрытии понятия архивации данных, изучения алгоритма сжатия информации, программ архиваторов и процесса упаковки и распаковки файлов с помощью программы - архиватора WinRAR. Также целю курсовой работы, является закрепление знаний и умений работы с программами Microsoft Word, Microsoft Excel, Microsoft Access.

Архиваторы - это программы, позволяющие уменьшить размер файла для экономии места на диске. Работа их заключается в следующем: найти повторяющиеся фрагменты в файлах и записать вместо них информацию о количестве повторяющихся кусков. Их можно разделить на два класса: программы упаковщики (архиваторы) и программы резервного копирования.

В ходе написания данной курсовой работы я использую знания, приобретенные на занятиях информатики, по использованию программ пакета Microsoft Office XP: Microsoft Word, Microsoft Excel, Microsoft Access.

С помощью программы Microsoft Word я могу создавать, редактировать, форматировать, сохранять и распечатывать документы. Текстовый процессор Microsoft Word имеет широкий спектр возможностей по созданию документов (вставка списков и таблиц, средства проверки орфографии, сохранение, исправление и др.)

Microsoft Excel - это программа для управления электронной таблицей. Электронная таблица позволяет обрабатывать большие массивы числовых данных, например результаты экспериментов, статистические данные и т.д.

Microsoft Access - система управления базами данных, входящая в Microsoft Office, позволяющая создавать базы данных, а также обеспечивать обработку (сортировку) и поиск данных.

Вариант курсовой работы 14.

1.Архивация данных (на примере программы WinRaR)

Постановка задачи. Написать реферат по заданной теме на 12 - 15 печатных листах. В реферате предусмотреть использование маркированного и нумерованного списков, вставку специального символа, вставку сноски, рисунка, оформление одного из абзацев в виде двух колонок.

Общие сведения об архивации файлов

Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для архивации, путем сжатия хранимой в них информации.

Сжатие информации - это процесс преобразования информации, хранящийся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.

Сжатие информации в файлах происходит за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов виде коэффициента повторения и соответствующих символов. Применяют различные алгоритмы подобного сжатия информации.

Сжиматься могут как один, так и несколько файлов, которые в жатом виде помещаются в так называемый архивный файл или архив.

Архивный файл- это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

Степень сжатия файлов характеризуется коэффициентом К с, определяемым как отношение объема сжатого файла V c к объему исходного файла V о , выраженное в процентах:

Архивация (упаковка) - помещение (загрузка) исходных файлов в архивный файл в сжатом или не сжатом виде.

Разархивация (распаковка) - процесс восстановления файлов из архива точно в таком виде, какой он имел до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.

Методы архивирования

Существует два основных метода архивации:

Алгоритм Хаффмана. Алгоритм основан на том факте, что некоторые символы из стандартного 256-символьного набора в произвольном тексте могут встречаться чаще среднего периода повтора, а другие, соответственно, – реже. Следовательно, если для записи распространенных символов использовать короткие последовательности бит, длиной меньше 1 байта, а для записи редких символов – более длинные, то суммарный объем файла уменьшится. Например буквы а,о,е,и – встречаются очень часто в русском тексте, объем каждой буквы равен 1 байт (8 бит), их можно заменить на цифры 0,1,2,3, которые можно разместить в 2-х битах. Т.е. коэффициент сжатия будет равен 25%.

Цели архивации

Архивация используется как средство для уменьшения размера файла – в архиве файла, как правило, занимает меньше места, чем в обычном состоянии, и применяется в основном для следующих целей:

Высвобождения места на жестком диске компьютера.

Сокращения объема файлов, пересылаемых по электронной почте.

Размещение данных на едином носители.

Размещение 1 объемного файла на нескольких носителях, когда он не помещается на 1 носитель.

Распаковка сжатых файлов.

Программы – архиваторы

Программы, осуществляющие упаковку и распаковку файлов, называются программами архиваторами.

Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными. Том – это составная часть многотомного архива. Создавая архив из нескольких частей, можно записать его части на несколько дискет.

В настоящее время применяется несколько десятков программ – архиваторов, которые отличаются перечнем функций и параметрами работы. Из числа наиболее популярных программ можно выделить:

WinZip , версия 8.0 пожалуй самый известный архиватор. Это наиболее популярный архиватор, используемый в Интернете. Часто является бесплатным или входит еще в какую – нибудь программу в качестве бесплатного бонуса. Начиная с версии ME (Millenium Edition), WinZip входит даже в систему Windows. Кроме того, существует немало модификаций архиватора WinZip, таких как zip – magic, 7 – zip, g – zip и т.п., различных по эффективности сжатия.

WinRar – автор программы – Евгений Рошал. Однопользовательская система обойдется вам в 29$. Загрузить испытательскую (пробную) версию можно с сайта www . RaRlab . com . Главный конкурент WinZip на просторах Интернета. Обладая лучшими характеристиками он постепенно теснит другие форматы, но с авторитетом WinZip пока сладить не может. Удобный (русифицированный) интерфейс и достаточно высокая скорость работы в сочетании с низкими системными требованиями обещают WinRar хорошее будущее.

WinAce 2.0 - свежая версия старого архиватора, пополнившаяся очень интересными функциями и новым алгоритмом сжатия. Этот архиватор использует самый большой размер словаря для архивирования (4 Мб), что во многом объясняет его высокие результаты.

Различных архиваторов существует немало. Эффективность того или иного архиватора зависит от нескольких факторов:

Содержимого сжимаемого файла (текстовый, графический, звуковой).

От того, какая программа выбрана в качестве архиватора.

От настроек программы – архиватора.

Типы архивных файлов

В файловой системе компьютера архивные файлы имеют строго заданный тип (расширение). Так, наиболее часто встречающиеся архивы имеют тип: ZIP, RAR, ARJ.

Кроме них на компьютерах используются архивы: CAB, LZH, TAR, GZ, UUE, BZ2, ISO и т.д.

Упаковка файлов

Рассмотрим работу с архиватором WinRaR. Упаковать файл можно тремя различными способами.

При помощи мастера упаковки WinRaR.

При помощи контекстного меню Windows, если вы встроили WinRaR в оболочку.

Непосредственно в самой программе WinRaR, без помощи мастера, щелкнув мышью по кнопке Добавить или воспользовавшись контекстным меню самой программы WinRaR.

Рассмотрим все три способа.

Упаковка файлов с помощью мастера

Щелкните мышью по кнопке Мастер на экране появится первый диалог Мастера (рис. 1.1).

Рис.1.1 Первый диалог Мастер: Выбор действий

Чтобы выполнить упаковку, щелкните мышью на переключатель Создать новый архив , затем – на кнопке Далее .

В возникшем диалоге Выберете файлы, которые нужно добавить щелкните мышью на кнопке открывающегося списка Папка и выберете диск, где расположены файлы, которые вы хотите упаковать, - щелкните на букве диска мышью (Рис. 1.2).

Рис. 1.2. Диалог Выберете файлы, которые нужно добавить

Выберете в рабочем поле диалога папку или файл, который будете упаковывать, - выделите их. Щелкните мышью по кнопке ОК .

Рис.1.3. Диалог Выбор названия для будущего архива

На экране появится диалог Мастер: Выбор архива , как показано на рис. 1.3. В поле ввода Имя архива введите название будущего архива.

Щелкните мышью по кнопке Далее . На экране появится диалог Мастер: Параметры архивации , как показано на Рис. 1.4. В этом окне можно сделать определенные настройки архивации, установить флажки в соответствующих полях.

Рис. 1.4. Диалог Мастер: Параметры архивации

Щелкните мышью по кнопке Готово , запустив тем самым процесс упаковки.

Рис. 1.5. Диалог Создание архива

После слов Создание архива в название диалога отображается название будущего файла (Рис. 1.5). Архивный файл расположится в том же месте, где находилась исходная папка.

Похожие страницы:

Архивация данных (2)

. смысл хранить редко употребляемые программы и данные в виде архивного файла, а . возможностью программы PKZIP является архивация файлов из подкаталогов указанного . наиболее часто используемых режимов программ архивации является, естественно, просмотр .

Архивация данных. Назначение программ архивации. Создание архивных файлов

Архивация данных. Назначение программ архивации. Создание архивных файлов Задание 1. . коэффициент сжатия. Найдите папку Урок 2. Архивация и скопируйте ее в свою рабочую . эту папку. В папке Урок 2. Архивация найдите файл История вычис­лительной техники .

Данные их носители и виды Операции с данными

. использования; повышает доступность информации; 6. Архивация данных – организация хранения данных в удобной и легкодоступной форме; служит .

Данные понятие, виды

. использования; повышает доступность информации; • архивация данных — организация хранения данных в удобной и легкодоступной форме; служит .

Автоматизация архивирования и копирования баз данных SQL, файлов и каталогов в Инспекции ФНС Рос

. системы архивации данных 26 2.1 Концептуальная модель системы архивации данных 26 2.2 Структурная модель системы архивации данных . 27 2.3 Функциональная модель системы архивации данных .

Нажмите, чтобы узнать подробности

Материал предназначен для студентов 1го года обучения.

Лекция содержит теоретический материал и контрольные вопросы.

Архив – это файл, содержащий в себе один или несколько файлов в сжатом (упакованном) виде.

Признаки архива:

Архив занимает меньше места, чем исходный объект.

Исключение составляют очень маленькие файлы, например, ярлыки.

А также сжатые файлы, например *.mp3.

Архив нельзя использовать по назначению.

Перед использованием его надо разархивировать.

Архивы создаются с целью уменьшения объема первоначального файла (экономится место на диске) и возрастания скорости копирования.

Архивация - это упаковка (сжатие, компрессия) файла или группы файлов с целью уменьшить место, занимаемое ими на диске. Архивацию используют при хранении запасных (страховых) копий на дискетах или жестких дисках, а также при создании дистрибутивных копий программных продуктов, чтобы уменьшить количество дискет при продаже или передаче продукта (или чтобы уместить дистрибутив на одном компакт-диске).

Для создания архивных (резервных) копий используют служебные программы архивации файлов - это программы-архиваторы.

Программы-архиваторы

Для рационального хранения информации на компьютерных носителях можно воспользоваться возможностями программ-архиваторов, которые позволяют представить информацию в упакованном виде.

Архивы создают в следующих случаях:

необходимо создать резервные копии наиболее важных файлов;

требуется освободить место на диске;

следует передать файлы по электронной почте;

планируется перенести большое количество файлов на другой носитель;

нужно защитить информацию от несанкционированного доступа — запаролить ее.

Упаковывать файлы и размещать их в специальных архивах позволяют программы-архиваторы. Архивный файл (архив) хранит в упакованном виде другие файлы (один или несколько), которые при необходимости могут быть извлечены из архива в первоначальной форме.

Все программы-архиваторы могут выполнять следующие функции:

помещение исходных файлов в архив;

извлечение файлов из архива;

удаление файлов из архива;

просмотр оглавления архива;

Размер архивного файла, как правило, меньше размера всех входящих в него файлов. Для преобразования информации программы-архиваторы используют разные алгоритмы, поэтому размеры архивов, содержащих одни и те же файлы, но созданных с помощью различных архиваторов, могут отличаться.

Информация в архивном файле хранится в закодированном виде, поэтому для просмотра содержимого архивного файла необходимо воспользоваться программой-архиватором. Для того чтобы иметь возможность работы с файлом, его нужно извлечь из архива. Делают это, используя ту же программу, с помощью которой создавался архив, или с помощью другой программы, распознающей данный тип архива.

Степень сжатия файла (отношение размера исходного файла к размеру упакованного файла);

Скорость работы (время процесса архивации);

В России наиболее распространены архиваторы LHA (расширение *.LZH), ARJ (расширение *.ARJ), PKZIP/PKUNZIP (расширение *.ZIP), WinRAR (расширение *.RAR).

Для Windows широко используется WinRAR. Архиватор предусматривает полную поддержку архивов формата *.ZIP и *.RAR, а также распаковку архивов *.ARJ, *.LZH и некоторых других.

Остановимся на изучении архиватора WinRar, так как он может работать не только со своими архивами, но и с архивами, созданными архиватором WinZip и целым рядом других архивов


Окно архиватора имеет знакомые вам элементы: меню, панель инструментов с всплывающими подсказками. Как видно на рис. 1, окно архиватора WinRAR, имеет средства навигации по дискам и папкам компьютера: поле списка для выбора дисков и папок, кнопку для перехода на верхний уровень в иерархии папок.

WinRAR имеет два основных режима: операции с файлами или операции с архивом. Если в поле списка отображается имя архивного файла, то WinRAR переключается в режим операций с архивом и при этом изменяется набор кнопок на стандартной панели инструментов.

Создание архивов и извлечение файлов из архива

Сегодня существует большое количество программ-архиваторов. По расширению архивного файла можно определить, каким архиватором был создан данный архив:


Наиболее известные - WinRar, 7-Zip, WinZip и др. (пример 1).

Пример 1. Логотипы некоторых программ-архиваторов

WinRar 7-Zip WinZip WinAce

При просмотре списка файлов в Проводнике архивные файлы помечаются значком (*.rar), (*.7z), (*.zip). Вид значка определяется программой, которая работает с архивами.

При установке программ-архиваторов действия по созданию архивов и извлечению файлов из архива добавляются в контекстное меню любого объекта файловой системы.

Для создания архивного файла необходимо выполнить следующие действия:

Щелкнуть правой клавишей мыши.

Выбрать архиватор (пример .2).

Выбрать одну из команд:

Пример 2. Контекстное меню с выбором архиватора:

Пример 3. Команды меню архиватора по добавлению файлов в архив:

Для извлечения файлов из архива нужно выполнить следующие действия:

Выбрать архивный файл.

Щелкнуть правой клавишей мыши.

Выбрать одну из команд:

Пример 4. Команды меню архиватора по извлечению файлов из архива:

Самораспаковывающийся архив – это исполняемая программа, которая включает в себя одновременно как архив, так и программу для его распаковки. Это особенно выгодно, когда неизвестно, есть ли соответствующая программа архивации на компьютере, на котором предстоит распаковка.

Другими словами, Самораспаковывающиеся или самораскрывающиеся архивы – это архивный файл, который будет иметь расширение *.exe и запускаться как обычная программа.

Пусть на диске имеется папка с именем КНИГА объемом 150 Кб, в которой хранятся несколько текстовых файлов (Глава 1.doc, Глава 2.doc, Глава 3.doc, Глава 4.doc). Выполнив упаковку папки, мы получили один архивный файл КНИГА.RAR объемом 30 Кб.

Чтобы вычислить степень сжатия в процентном соотношении, надо использовать формулу пропорции: если было 150Кб, а стало 30Кб - 30*100%/150=20%.

Таким образом, степень сжатия информации равна 20%, следовательно, папка Книга уменьшилась в объеме на 80%.


Архивировать можно и программные, и служебные, и текстовые, и любые другие файлы. Но следует учитывать, что разные файлы сжимаются с различной степенью. Лучше всех компрессируются текстовые файлы, а хуже всех графические файлы.

Если вам нужно передать много файлов по электронной почте, то для экономии времени и трафика их следует заархивировать. А так же при создании резервных копий на CD или DVD исходные данные необходимо сжать, чтобы на диске их уместилось как можно больше.

Читайте также: