OqPoWah.com

ASCII (ameriška standardna koda za izmenjavo informacij) - osnovno kodiranje besedila za latinsko abecedo

Po podatkih Mednarodne telekomunikacijske zveze je leta 2016 internetu z rednim obsegom uživalo tri in pol milijarde ljudi. Večina jih niti ne pomisli, da vsa sporočila, poslana na njih prek osebnega računalnika ali mobilne pripomočke, pa tudi besedila, ki so prikazane na zaslonih vseh vrst, v resnici, je kombinacija 0 in 1. To se imenuje kodiran predstavitev informacij. Zagotavlja in močno olajša izvajanje njegovega shranjevanja, obdelave in prenosa. Leta 1963 je bilo razvito ameriško kodiranje ASCII, ki je predmet tega članka.

ASCII kodiranje

Predstavitev informacij v računalniku

Z vidika katerega koli elektronskega računalnika je besedilo zbirka posameznih simbolov. Vključujejo ne samo črke, vključno z velikimi črkami, ampak tudi ločila, številke. Poleg tega se uporabljajo posebni znaki "=", "", "(" in presledki.

Skupina simbolov, ki sestavljajo besedilo, se imenuje abeceda, njihova številka pa je moč (označena kot N). Če želite to določiti, uporabite izraz N = 2 ^ b, kjer je b število bitov ali informacijska teža določenega simbola.

Dokazano je, da abeceda s kapaciteto 256 znakov vam omogoča, da predstavite vse potrebne simbole.

Ker je 256 osem moči dveh, je težo vsakega simbola 8 bitov.

Merska enota 8 bitov se imenuje 1 bajt, zato je običajno to reči binarna koda Vsak znak v besedilu, shranjenem v računalniku, zavzame en bajt pomnilnika.

Tabela kodiranja ASCII

Kako se kodiranje izvaja

Vsako besedilo, vpisano v spomin PC preko tipk na tipkovnici, na kateri so bili napisani številke, črke, ločila in drugi simboli. V spomin se prenaša v binarni kodi, to je vsak simbol preslika v znano decimalno kodo za osebo, od 0 do 255, kar je skladno z binarno kodo - .. od 00000000 do 11111111.

Kodiranje z bajtnim bajtom omogoča procesorju, ki izvaja obdelavo besedila, za dostop do vsakega znaka posebej. Hkrati je 256 znakov dovolj za predstavitev vseh znakovnih informacij.

Kodiranje besedila ASCII

Kodiranje znakov ASCII

Ta kratica v angleščini pomeni ameriško standardno kodo za izmenjavo informacij.

Tudi na začetku računalništva je postalo očitno, da lahko najdete številne načine za kodiranje informacij. Za prenos podatkov iz enega računalnika na drugega pa je bilo treba razviti enoten standard. Torej, leta 1963 v ZDA je bila ASCII tabela za kodiranje. V njem je vsakemu simbolu računalniške abecede dodeljena serijska številka v binarni predstavitvi. Sprva je bilo kodiranje ASCII uporabljeno le v Združenih državah, nato pa je postalo mednarodni standard za računalnik.

Vsebina tabele

Oznake ASCII so razdeljene na dva dela. Mednarodni standard je le prva polovica te tabele. Vključuje simbole z rednimi številkami od 0 (kodirano kot 00000000) do 127 (oznaka 01111111).

Zaporedna številka

N

Kodiranje besedila ASCII

Simbol

0 - 31

0000 0000 - 0001 1111

Simboli z N od 0 do 31 se imenujejo menedžerji. Njihova funkcija je "voditi" postopek izpisovanja besedila na monitor ali tiskalno napravo, dajanje zvočnega signala itd.

32 - 127

0010 0000 - 0111 1111

Simboli z N od 32 do 127 (standardni del tabele) - velike in male črke latinske abecede, številke 10-nye, ločila, in različni nosilci za trgovine in drugih znakov .. Simbol 32 označuje prostor.




128 - 255

1000 0000 - 1111 1111

Simboli z N od 128 do 255 (alternativni del tabele ali kodne strani) imajo lahko različne različice, od katerih ima vsaka svojo številko. Kodna stran se uporablja za določitev nacionalnih abeced, ki se razlikujejo od latinščine. Zlasti je s svojo pomočjo, da je ASCII kodiran za ruske znake.

V tabeli za kodiranje, velike in male črke male črke pojdite eno za drugo po abecednem redu in številke - v naraščajočih vrednostih. To načelo je ohranjeno tudi za rusko abecedo.

Kontrolni znaki

Tabela za kodiranje ASCII je bila prvotno ustvarjena za sprejemanje in pošiljanje podatkov na napravi, ki je bila dolgo ne uporabljana, na primer teletype. V tem pogledu so bili v niz znakov vključeni ne-tiskanje, ki se uporabljajo kot ukazi za nadzor te naprave. Podobni ukazi so bili uporabljeni v takšnih metodah prekomprometnih sporočil kot Morseova koda itd.

Najpogostejši simbol "teletype" je NUL (00, "nič"). Še vedno se uporablja v večini programskih jezikov, označuje konec vrstice.

v ASCII kodiranju, vsak znak

Kjer se uporablja kodiranje ASCII

Ameriška standardna koda ni potrebna samo za vnos besedilnih informacij s tipkovnice. Uporablja se tudi v grafikah. Zlasti v programu ASCII Art Maker slike različnih razširitev predstavljajo vrsto ASCII simbolov znakov.

Podobni izdelki sta dve vrsti: izvajanje funkcije grafičnih urednikov s pretvorbo slik v besedilo in pretvarjanje "risb" v grafiko ASCII. Na primer, dobro znana smeška je živahen primer simbola kodiranja.

ASCII lahko uporabite tudi pri ustvarjanju dokumenta HTML. V tem primeru lahko vnesete določen niz znakov in ko si ogledate stran, se na zaslonu prikaže simbol, ki ustreza tej kodi.

ASCII je prav tako potreben za ustvarjanje večjezičnih strani, saj znake, ki niso del določene nacionalne tabele, zamenjamo s kodami ASCII.

za kodiranje besedilnih informacij v kodiranju ASCII

Nekatere funkcije

Za kodiranje besedilnih informacij v kodiranju ASCII je bilo prvotno uporabljenih 7 bitov (ena je bila prazna), danes pa deluje kot 8-bitna.

Črke v stolpcih na vrhu in na dnu se med seboj razlikujejo le z enim samim bitom. To močno zmanjša zapletenost preverjanja.

Uporaba ASCII v programu Microsoft Office

Če je potrebno, se ta vrsta kodiranja besedilnih informacij lahko uporablja v Microsoftovih urejevalnikih besedil, kot sta Notepad in Office Word. Vendar pri tipkanju v tem primeru ni mogoče uporabiti nekaterih funkcij. Na primer, ne boste mogli narediti izbrane krepko, saj kodiranje ASCII ohranja samo pomen informacij, ne glede na njegov splošni videz in obliko.

ASCII kodiranje ruskih znakov

Standardizacija

ISO je sprejel standarde ISO 8859. Ta skupina definira osem-bitna kodiranja za različne jezikovne skupine. Zlasti je ISO 8859-1 razširjen ASCII, ki je tabela za Združene države in države zahodne Evrope. ISO 8859-5 je tabela, ki se uporablja za cirilico, vključno z rusko.

Zaradi številnih zgodovinskih razlogov standard ISO 8859-5 ni bil uporabljen zelo dolgo.

Za ruski jezik v tem trenutku se kodiranje res uporablja:

  • CP866 (Code Page 866) ali DOS, ki se pogosto imenuje alternativno kodiranje GOST. Aktivno se je uporabljala do sredine devetdesetih let prejšnjega stoletja. Trenutno se skoraj ne uporablja.
  • KOI-8. Kodiranje je bilo razvito v sedemdesetih in osemdesetih letih in trenutno je standard za e-poštna sporočila v RuNetu. To se pogosto uporablja v operacijskem sistemu OS družine Unix, vključno z Linuxom. "Ruska" različica KOI-8 se imenuje KOI-8R. Poleg tega obstajajo različice za druge cirilske jezike, na primer ukrajinske.
  • Stran 1251 (CP 1251, Windows - 1251). Razvil ga je Microsoft Corporation za podporo ruskem jeziku v okolju Windows.

Glavna prednost prvega standarda CP866 je bila ohranitev psevdograficnih simbolov na istih mestih kot v razširjenem ASCII. To je omogočilo izvajanje nespremenjenih besedilnih programov, tuje produkcije, kot je znani Norton Commander. Trenutno se CP866 uporablja za programe, razvite v okolju Windows, ki delujejo v celotnem besedilnem načinu ali v besedilnih oknih, vključno z upraviteljem FAR.

Računalniške besedila napisana v CP866 kodiranje, v zadnjem času so zelo redki, vendar se uporablja za ruskih imen v "Vindous".

"Unicode"

Trenutno je to kodiranje najbolj razširjeno. Kode Unicode so razdeljene na regije. Prvi (od U ​​+ 0000 do U + 007F) vključuje znake iz nabora ASCII s kodami. Nato sledite področjem znakov različnih nacionalnih scenarijev, ločil in tehničnih simbolov. Poleg tega je del kod Unicode rezerviran, če je v prihodnosti treba vključiti nove simbole.

kodiranje znakov ASCII

Zdaj veste, da je v kodiranju ASCII vsak znak predstavljen kot kombinacija 8 ničel in enih. Za nestrokovnjake se te informacije morda zdijo nepotrebne in nezanimive, vendar ne želite vedeti, kaj se dogaja v "možganih" vašega računalnika?!

Zdieľať na sociálnych sieťach:

Príbuzný