КампутарыБяспеку

Кадаванне - гэта ... Знакавыя сістэмы: кадаваньне інфармацыі

Кадаванне інфармацыі - неверагодна шырокая вобласць ведаў. Зразумела, яна напрамую звязана з развіццём лічбавай тэхнікі. У многіх сучасных навучальных установах самая папулярная тэма - кадаванне інфармацыі. Сёння мы вывучым асноўныя трактоўкі гэтай з'явы ў дачыненні да розных аспектах працы кампутараў. Пастараемся адказаць на пытанне: "Кадаванне - гэта працэс, метад, інструмент або ўсе гэтыя з'явы адначасова?"

Нулі і адзінкі

Практычна любыя тыпы дадзеных, якія адлюстроўваюцца на экране кампутара, так ці інакш ўяўляюць сабой двайковы код, які складаецца з нулёў і адзінак. Гэта самы найпросты, "нізкаўзроўневы" спосаб шыфравання інфармацыі, які дазваляе ПК апрацоўваць дадзеныя. Двайковы код універсальны: яго разумеюць усе без выключэння кампутары (уласна, для гэтага ён і быў створаны - каб стандартызаваць карыстанне інфармацыяй у лічбавай форме).

Базавая адзінка, якую выкарыстоўвае двайковае кадаваньне, - гэта біт (ад словазлучэння "binary digit" - "падвойная лічба"). Ён роўны альбо 0, альбо 1. Як правіла, біты паасобку не выкарыстоўваюцца, а аб'ядноўваюцца ў 8-значныя паслядоўнасці - байты. У кожным з іх, такім чынам, можа ўтрымлівацца да 256 камбінацый з нулёў і адзінак (2 у 8-й ступені). Для запісу значных аб'ёмаў інфармацыі выкарыстоўваюцца, як правіла, не адзінкавыя байты, а больш маштабныя велічыні - з прыстаўкамі "кіло", "мега", "гіга", "тэра" і т. Д., Кожная з якіх у 1000 разоў большая за папярэднюю .

кадаванне тэксту

Самы распаўсюджаны выгляд лічбавых дадзеных - гэта тэкст. Якім чынам ажыццяўляецца яго кадаваньне? Гэта досыць лёгка зразумелы працэс. Літара, знакі прыпынку, лічба ці сімвал можа кадавацца праз аднаго або некалькіх байтаў, то ёсць кампутар бачыць іх як унікальную паслядоўнасць нулёў і адзінак, а затым, у адпаведнасці з закладзеным алгарытмам распазнання, адлюстроўвае на экране. Ёсць два асноўных сусветных стандарту "шыфравання" камп'ютэрнага тэксту - ASCII і UNICODE.

У сістэме ASCII кожны знак кадуецца толькі адным байце. Гэта значыць з дапамогай гэтага стандарту можна "зашыфраваць" да 256 знакаў - што больш чым дастаткова для адлюстравання сімвалаў большасці алфавітаў свету. Вядома, усе існуючыя на сёння нацыянальныя літарныя сістэмы не змесцяцца ў гэты рэсурс. Таму для кожнага алфавіту створана ўласная "падсістэма" шыфравання. Адбываецца кадаванне інфармацыі з дапамогай знакавых сістэм, адаптаваных да нацыянальных узорах пісьменнасці. Аднак кожная з гэтых сістэм, у сваю чаргу, з'яўляецца складовай часткай глабальнага стандарту ASCII, прынятага на міжнародным узроўні.

У рамках сістэмы ASCII гэты самы рэсурс з 256 знакаў дзеліцца на дзве часткі. Першыя 128 - гэта знакі, адведзеныя пад англійская алфавіт (літары ад a да z), а таксама лічбы, асноўныя знакі прыпынку і некаторыя іншыя сімвалы. Другія 128 байт зарэзерваваны, у сваю чаргу, пад нацыянальныя літарныя сістэмы. Гэта і ёсць "падсістэма" для неанглийских алфавітаў - рускага, хіндзі, арабскага, японскага, кітайскага і многіх іншых.

Кожная з іх прадстаўлена ў выглядзе асобнай табліцы кадоўкі. Гэта значыць можа атрымацца (і, як правіла, гэта адбываецца) так, што адна і тая ж паслядоўнасць бітаў будзе адказваць за розныя літары і сімвалы ў двух асобных "нацыянальных" табліцах. Больш за тое, у сувязі з асаблівасцямі развіцця IT-сферы ў розных краінах нават яны адрозніваюцца. Напрыклад, для рускай мовы найбольш распаўсюджаны дзве сістэмы кадавання: Windows-1251 і KOI-8. Першая з'явілася пазней (роўна як і сама сугучная ёй аперацыйная сістэма), але цяпер многімі IT-спецыялістамі выкарыстоўваецца ў першачарговым парадку. Таму кампутар, каб на ім можна было гарантавана чытаць беларускі тэкст, павінен умець карэктна распазнаваць абедзве табліцы. Але, як правіла, ніякіх праблем з гэтым няма (калі на ПК варта сучасная аперацыйная сістэма).

Метады кадавання тэкстаў ўвесь час удасканальваюцца. Акрамя "однобайтной" сістэмы ASCII, здольнай апераваць толькі 256 значэннямі для сімвалаў, ёсць таксама і "двухбайтная" сістэма UNICODE. Нескладана падлічыць, што яна дазваляе ажыццяўляць тэкставае кадаваньне ў колькасці, роўным 2 у 16-й ступені, гэта значыць 65 тыс. 536. У ёй, у сваю чаргу, ёсць рэсурсы для адначасовага кадавання практычных ўсіх існуючых нацыянальных алфавітаў свету. Выкарыстанне UNICODE не менш распаўсюджана, чым задзейнічанне "класічнага" стандарту ASCII.

кадаванне графікі

Вышэй мы вызначылі, якім чынам "шыфруюцца" тэксты і як пры гэтым выкарыстоўваюцца байты. Як ідзе справу з лічбавымі фатаграфіямі і малюнкамі? Таксама даволі проста. Аналагічна таму, як гэта адбываецца з тэкстам, галоўную ролю ў кадаванні камп'ютэрнай графікі гуляюць ўсё тыя ж байты.

Працэс пабудовы лічбавых малюнкаў у цэлым падобны з механізмамі, на аснове якіх працуе тэлевізар. На экране ТБ, калі прыгледзецца, малюнак складаецца з мноства асобных кропак, якія ў сукупнасці фарміруюць распазнаваць на некаторай адлегласці вокам фігуры. Тэлевізійная матрыца (або ЭПТ-праектар) атрымлівае з перадатчыка гарызантальныя і вертыкальныя каардынаты кожнай з кропак і паступова выбудоўвае малюнак. Кампутарны прынцып кадоўкі графікі працуе сапраўды гэтак жа. "Шыфраванне" малюнкаў байтамі заснавана на заданні кожнай з экранных кропак адпаведных каардынат (а таксама колеру кожнай з іх). Гэта калі казаць простай мовай. Зразумела, графічнае кадаваньне - гэта працэс нашмат больш складаны, чым тое ж тэкставае.

Метад заданні кропках адпаведных каардынат і каляровых параметраў называецца "растравым". Аналагічна называюцца многія файлавыя фарматы камп'ютэрнай графікі. Каардынаты кожнай з кропак малюнка, а таксама іх колер запісваюцца ў адзін або некалькі байтаў. Ад чаго залежыць іх колькасць? Галоўным чынам ад таго, колькі адценняў колеру трэба будзе "зашыфроўваць". Адзін байт, як вядома, - гэта 256 значэнняў. Калі для выбудоўвання карцінкі нам хопіць такой колькасці адценняў - абыдземся гэтым рэсурсам. У прыватнасці, у нашым распараджэнні можа апынуцца 256 адценняў шэрага колеру. І гэтага будзе дастаткова, каб кадзіраваць практычна любыя чорна-белыя выявы. У сваю чаргу, для каляровых малюнкаў дадзенага рэсурсу будзе відавочна недастаткова: чалавечае вока, як вядома, здольны адрозніваць да некалькіх дзесяткаў мільёнаў кветак. Таму неабходны "запас" не ў 256 значэнняў, а ў сотні тысяч разоў больш. З-за чаго для кадавання кропак задзейнічаецца не адзін байт, а некалькі: па існуючых на сёння стандартам іх можа быць 16 (можна "зашыфраваць" 65 тыс. 536 кветак) або 24 (16 млн 777 тыс. 216 адценняў).

У адрозненне ад тэкставых стандартаў, разнастайнасць якіх супастаўна з колькасцю сусветных моў, з графікай справы ідуць некалькі прасцей. Самыя распаўсюджаныя фарматы файлаў (такія як JPEG, PNG, BMP, GIF і т. Д.) Распазнаюцца на большасці кампутараў у цэлым аднолькава добра.

Няма нічога складанага з тым, каб зразумець, па якіх прынцыпах ажыццяўляецца кадаванне графічнай інфармацыі. 9 клас любой сярэдняй расійскай школы, як правіла, уключае ў сябе курс кампутарнай навукі, дзе падобныя тэхналогіі раскрываюцца даволі падрабязна вельмі простым і зразумелым мовай. Ёсць таксама і спецыялізаваныя праграмы навучання для дарослых - іх арганізуюць ВНУ, ліцэі, альбо таксама школы.

Таму сучаснаму расійскаму чалавеку ёсць дзе запазычыць веды аб кодах, якія маюць практычную значнасць у частцы кампутарнай графікі. А калі хочацца азнаёміцца з базавымі ведамі самастойна, можна абзавесціся даступнымі навучальнымі матэрыяламі. Да такіх можна аднесці, напрыклад, кіраўніка "Кадаванне графічнай інфармацыі (9 клас, падручнік" Інфарматыка і ІКТ "пад аўтарствам Угрыновіча Н. Д.).

Кадаванне гукавых дадзеных

Кампутар рэгулярна выкарыстоўваецца для праслухоўвання музыкі і іншых аўдыёфайлаў. Гэтак жа як і ў выпадку з тэкстам і графікай, любы гук на ПК - гэта ўсё тыя ж байты. Яны, у сваю чаргу, "дэшыфруе" аудиокартой і іншымі мікрасхемамі і пераўтворацца ў чутны гук. Прынцып тут прыкладна той жа, што і ў выпадку з пласцінкамі грамафона. У іх, як вядома, кожны гук адпавядае мікраскапічнай баразёнку на пластыцы, якая распазнаецца счытвальнікам, а затым агучваецца. У кампутары ўсё падобна. Толькі ролю баразёнак гуляюць байты, у прыродзе якіх, гэтак жа як і ў выпадку з тэкстам і малюнкамі, ляжыць двайковае кадаваньне.

Калі ў выпадку з кампутарнымі малюнкамі адзінкавым элементам выступае кропка, то пры запісе гуку гэта так званы "адлік". У ім, як правіла, прапісваецца два байта, генерыруючых да 65 тыс. 536 гукавых микроколебаний. Аднак, у адрозненне ад таго, як гэта адбываецца пры пабудове малюнкаў, для паляпшэння якасці гуку здзяйсняецца не даданне дадатковых байтаў (іх, відавочна, і так больш чым дастаткова), а павелічэнне колькасці "адлікаў". Хоць у некаторых аўдыёсістэма байтаў выкарыстоўваецца і меншае, і большы лік. Калі ажыццяўляецца кадаваньне гуку, то стандартнай адзінкай вымярэння "шчыльнасці патоку" байтаў выступае адна секунда. Гэта значыць микроколебания, зашыфраваныя пры дапамозе 8 тыс. Адлікаў у секунду, будуць, відавочна, больш нізкай якасці, чым паслядоўнасць гукаў, закадаваныя з дапамогай 44 тыс. "Адлікаў".

Міжнародная стандартызацыя аўдыёфайлаў, гэтак жа як і ў выпадку з графікай, добра развітая. Ёсць некалькі тыпавых фарматаў гукавога медыя - MP3, WAV, WMA, якімі карыстаюцца ва ўсім свеце.

кадаваньне відэа

Свайго роду "гібрыдная схема", пры якой шыфраванне гуку аб'ядноўваецца з кадаваннем малюнкаў, выкарыстоўваецца ў кампутарных відэароліках. Звычайна фільмы і кліпы складаюцца з двух тыпаў дадзеных - гэта як такі гук і спадарожны яму відэашэраг. Як "шыфруецца" першы кампанент, мы распавялі вышэй. З другім ледзь складаней. Прынцыпы тут іншыя, чым ўключае ў сябе разгледжаная вышэй графічнае кадаваньне. Але дзякуючы ўніверсальнасці "канцэпцыі" байтаў, сутнасць механізмаў цалкам зразумелая і лагічная.

Успомнім, як уладкованая кінастужка. Яна ўяўляе сабой не што іншае як паслядоўнасць асобных кадраў (іх, як правіла, 24). Зусім аналагічным чынам ўладкованыя кампутарныя відэаролікі. Кожны кадр - гэта карцінка. Пра тое, як яна будуецца пры дапамозе байтаў, мы вызначылі вышэй. У сваю чаргу, у відэашэрагу прысутнічае пэўная вобласць кода, якая дазваляе звязваць асобныя кадры паміж сабой. Свайго роду лічбавай заменнік кінастужкі. Асобнай адзінкай вымярэння відэаструменю (аналагічнай кропках для малюнкаў і адліку для гуку, як і ў "плёнкавыя" фармаце кіно і ролікаў), прынята лічыць кадр. Апошніх у адной секундзе, у адпаведнасці з прынятымі стандартамі, можа быць 25 або 50.

Гэтак жа як і ў выпадку з аўдыё, ёсць распаўсюджаныя міжнародныя стандарты відэафайлаў - MP4, 3GP, AVI. Вытворцы кіно і ролікаў імкнуцца выпускаць ўзоры медыя, сумяшчальныя з як мага большай колькасцю кампутараў. Названыя фарматы файлаў - у ліку самых папулярных, яны адкрываюцца практычна на любым сучасным ПК.

сціск дадзеных

Захоўванне кампутарных дадзеных ажыццяўляецца на розных носьбітах - дыскі, флэшкі і т. Д. Як мы ўжо сказалі вышэй, байты, як правіла, "абрастаюць" прыстаўкамі "мега", "гіга", "тэра" і т. Д. У некаторых выпадках велічыня закадаваныя файлаў такая, што размясціць іх пры наяўных рэсурсах на дыску немагчыма. Тады выкарыстоўваюцца рознага роду метады сціску дадзеных. Яны, па сутнасці, таксама ўяўляюць сабой кадаваньне. Гэта - яшчэ адна магчымая трактоўка тэрміна.

Існуе два асноўных механізму сціску дадзеных. Па першым з іх паслядоўнасць бітаў запісваецца ў "ўпакаваным" выглядзе. Гэта значыць кампутар не можа прачытаць змесціва файлаў (прайграць яго як тэкст, малюнак або відэа), калі не ажыццявіць працэдуру "распакавання". Праграма, якая выконвае сціск дадзеных такім спосабам, называецца архіватар. Прынцып яе працы досыць просты. Архіваванне дадзеных як адзін з самых папулярных метадаў, пры дапамозе якіх можна ажыццявіць кадаванне інфармацыі, інфарматыка школьнага ўзроўню вывучае ў абавязковым парадку.

Як мы памятаем, працэс "шыфравання" файлаў у байтах стандартызаваныя. Возьмем стандарт ASCII. Каб, скажам, зашыфраваць слова "прывітанне", нам спатрэбіцца 6 байт, зыходзячы з колькасці літар. Менавіта столькі прасторы файл з гэтым тэкстам зойме на дыску. Што будзе, калі мы напішам слова "прывітанне" 100 раз запар? Нічога асаблівага - для гэтага нам спатрэбіцца 600 байт, адпаведна, столькі ж месца на дыску. Аднак мы можам выкарыстоўваць архіватар, што створыць файл, у якім з дапамогай значна меншага колькасці байт будзе "зашыфравана" каманда, якая выглядае прыкладна так: "прывітанне памножыць на 100". Падлічыўшы колькасць літар у гэтым паведамленні, прыходзім да высновы, што для запісу такога файла нам спатрэбіцца ўсяго толькі 19 байт. І столькі ж месца на дыску. Пры "распакаванні" жа архіўнага файла адбываецца "дэшыфраванне", і тэкст набывае зыходны выгляд са "100 прывітаннямі". Такім чынам, выкарыстоўваючы спецыяльную праграму, якая задзейнічае асаблівы механізм кадавання, мы можам зэканоміць на дыску істотны аб'ём прасторы.

Вышэйапісаны працэс досыць універсальны: якія б ні выкарыстоўваліся знакавыя сістэмы, кадаванне інфармацыі з мэтай сціску заўсёды магчыма пры дапамозе архівавання дадзеных.

Што ўяўляе сабой другі механізм? У нейкі меры ён падобны з тым, што ўжываецца ў архіватара. Але прынцыповае яго адрозненне ў тым, што сціснуты файл цалкам можа адлюстроўвацца кампутарам без працэдуры "распакавання". Як працуе гэты механізм?

Як мы памятаем, у зыходным выглядзе слова "прывітанне" займае 6 байт. Аднак мы можам пайсці на хітрасць і запісаць яго так: "првт". Выходзіць 4 байта. Усё, што застаецца зрабіць - гэта "навучыць" кампутар дадаваць у працэсе адлюстравання файла тыя літары, якія мы прыбралі. Трэба сказаць, што на практыцы "навучальны" працэс арганізоўваць і не трэба. Базавыя механізмы распазнання адсутнічаюць сімвалаў закладзены ў большасці сучасных праграм для ПК. Гэта значыць асноўная частка файлаў, з якімі мы маем справу кожны дзень, так ці інакш ужо "зашыфравана" па гэтым алгарытме.

Безумоўна, ёсць і "гібрыдныя" сістэмы кадавання інфармацыі, якія дазваляюць ажыццяўляць сціск дадзеных пры адначасовым задзейнічанні абодвух вышэйапісаных падыходаў. І яны, хутчэй за ўсё, будуць яшчэ больш эфектыўныя з пункту гледжання эканоміі дыскавай прасторы, чым кожны паасобку.

Вядома, аперуючы словам "прывітанне", мы выклалі толькі асноўныя прынцыпы працы механізмаў сціску дадзеных. У рэальнасці яны значна складаней. Розныя сістэмы кадавання інфармацыі могуць прапаноўваць неверагодна складаныя механізмы "кампрэсіі" файлаў. Аднак мы бачым, за кошт чаго можна дамагчыся эканоміі дыскавай прасторы, практычна не звяртаючыся да пагаршэння якасці інфармацыі на ПК. Асабліва значная роля сціску дадзеных пры выкарыстанні малюнкаў, аўдыё і відэа - гэтыя віды дадзеных больш за іншых патрабавальныя да рэсурсаў дыска.

Якія яшчэ бываюць "коды"?

Як мы ўжо сказалі ў самым пачатку, кадаванне - гэта складанымі з'ява. Разабраўшыся з базавымі прынцыпамі кадавання лічбавых дадзеных, заснаваных на байтах, мы можам закрануць іншую вобласць. Звязана яна з выкарыстаннем камп'ютэрных кодаў у некалькі іншых значэннях. Тут пад "кодам" мы будзем разумець не паслядоўнасць нулёў і адзінак, а сукупнасць розных літар і сімвалаў (якія, як мы ўжо ведаем, і так зроблены з 0 і 1), якая мае практычную значнасць для жыцця сучаснага чалавека.

праграмны код

У аснове работы любой кампутарнай праграмы - код. Напісаны ён на мове, зразумелай кампутара. ПК, расшыфроўваючы код, выконвае тыя ці іншыя каманды. Адметная асаблівасць кампутарнай праграмы ад іншага тыпу лічбавых дадзеных у тым, што змяшчаецца ў ёй код здольны "дэшыфраваць" сябе сам (карыстачу толькі досыць запусціць гэты працэс).

Яшчэ адна асаблівасць праграм - у адноснай гнуткасці выкарыстоўванага кода. Гэта значыць даваць кампутара адны і тыя ж заданні чалавек можа, карыстаючыся дастаткова вялікім наборам "фраз", а пры неабходнасці - і на іншай мове.

Код разметкі дакументаў

Іншая практычна значная вобласць ужывання літарнага кода - стварэнне і фарматаванне дакументаў. Як правіла, простага адлюстравання знакаў на экране недастаткова з пункту гледжання практычнай значнасці карыстання ПК. У большасці выпадкаў тэкст павінен быць пабудаваны пры дапамозе шрыфта пэўнага колеру і памеру, суправаджацца дадатковымі элементамі (такімі як, напрыклад, табліцы). Усе гэтыя параметры задаюцца, гэтак жа як і ў выпадку з праграмамі, на асаблівых мовах, зразумелых кампутара. ПК, распазнаўшы "каманды", адлюстроўвае дакументы менавіта так, як жадае карыстальнік. Акрамя таго, тэксты могуць быць аднолькава адфарматаваны, падобна таму, як гэта адбываецца з праграмамі, пры дапамозе розных набораў "фраз" і нават на розных мовах.

Аднак ёсць прынцыповае адрозненне паміж кодамі для дакументаў і камп'ютэрных праграм. Яна складаецца з таго, што першыя не здольныя дэшыфраваць сябе самі. Для адкрыцця файлаў з адфарматаваны тэкст заўсёды патрабуюцца іншыя праграмы.

шыфраванне дадзеных

Яшчэ адна інтэрпрэтацыя тэрміна "код" у дачыненні да кампутараў - гэта шыфраванне дадзеных. Вышэй мы ўжывалі гэтае слова як сінонім тэрміну "кадаванне", і гэта дапушчальна. У дадзеным выпадку пад шыфраваннем мы будзем разумець іншага роду з'ява. А менавіта кадаваньне лічбавых дадзеных з мэтай забароны да іх доступу з боку іншых людзей. Абарона кампутарных файлаў - важнейшы напрамак дзейнасці ў IT-сферы. Гэта фактычна асобная навуковая дысцыпліна, яе ўключае ў сябе таксама і школьная інфарматыка. Кадаванне файлаў з мэтай спынення несанкцыянаванага доступу - гэта задача, важнасць якой выкладаецца грамадзянам сучасных краін ужо ў дзяцінстве.

Як уладкованыя механізмы, з дапамогай якіх ажыццяўляецца шыфраванне дадзеных? У прынцыпе, так жа проста і зразумела, як і ўсе папярэднія, разгледжаныя намі. Кадаванне - гэта працэс, які лёгка зразумелы з пункту гледжання базавых прынцыпаў логікі.

Выкажам здагадку, нам неабходна перадаць паведамленне "Іваноў ідзе да Пятрову" так, каб ніхто не змог яго прачытаць. Мы давяраем зашыфраваць паведамленне кампутара і бачым вынік: "10-3-1-15-16-3-10-5-7-20-11-17-6-20-18-3-21". Гэты код, вядома, вельмі няхітры: кожная лічба адпавядае парадкаваму нумару літар нашай фразы ў алфавіце. "І" стаіць на 10 месцы, "В" - на 3, "А" - на 1, і т. Д. Але сучасныя кампутарныя сістэмы кадавання могуць шыфраваць дадзеныя так, што падабраць да іх ключ будзе неверагодна складана.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 be.atomiyme.com. Theme powered by WordPress.