OqPoWah.com

Kodiranje besedilnih informacij na računalniku

Računalnik je zapletena naprava, s katero lahko ustvarjate, pretvarjate in shranjevanje podatkov. Vendar pa nam računalnik ne dela precej razumljivo za nas - grafični, besedilni in numerični podatki so shranjeni kot nizi binarnih kodiranje besedilnih informacijštevilke. V tem članku bomo preučili, kako se kodirajo informacije o besedilu.

Kaj je besedilo za nas je zaporedje simbolov za računalnik. Vsak simbol predstavlja poseben nabor ničl in tisti. S simboli so mišljeni ne le z malimi in velikimi črkami latinske črke abeceda, pa tudi ločila, aritmetične znake, simboli storitev, posebni simboli in celo prostor.

Binarno kodiranje besedilnih informacij

Ko pritisnete določeno tipko, se električnemu signalu pošlje notranji kontroler, ki se pretvori v binarna koda. Koda se ujema z določenim znakom, ki je prikazan. Za zastopanje Latinska abeceda V digitalni obliki je bil ustvarjen mednarodni kodirni sistem ASCII. Zahteva 1 bajt za pisanje enega znaka, zato simbol sestoji iz osemmestnega zaporedja ničelnih in ničelnih. Interval snemanja je od 00000000 do 11111111, to pomeni, da kodiranje besedilnih informacij s tem sistemom omogoča predstavitev 256 simbolov. V večini primerov je to dovolj.binarno kodiranje besedilnih informacij




ASCII je razdeljen na dva dela. Prvih 127 znakov (od 00000000 do 01111111) so mednarodne in predstavljajo posebne znake in črke angleške abecede. Drugi del - razširitev (od 10.000.000 do 11111111) - je namenjena predstavitvi nacionalne abecede, katere pisanje se razlikuje od latinščine.

Informacije kodiranje besedila v ASCII temelji na načelu naraščajoče zaporedje, torej, večja je zaporedje število črk, večja je vrednost njegovega ASCII-kodo. Številke in ruski del tabele so zgrajeni na istem principu.

Vendar pa je v svetu obstaja več vrst kodiranja za cirilici pisem. Najpogostejši - je KOI-8 (osem-bitno kodiranje, ki je bil uporabljen v 70-ih letih v prvi ruifitsirovannyh Unix operacijski sistem), ISO 8859-5 (Mednarodni standardizacijo uradu razviti), CP 1251 (kodiranje tekstovno informacije uporabljajo v kodiranje in obdelava besedilnih informacijsodoben operacijski sistem Windows), kot tudi 2-bajtno kodiranje Unicode, s katerim lahko pošljete 65.536 znakov. Taka različica kodiranja je posledica dejstva, da so bili razviti v različnih časih, za različne operacijske sisteme in iz različnih razlogov. Zaradi tega pogosto pri prenosu besedila iz enega medija v drugo - če se kodiranje ne ujema, bo uporabnik videl samo niz nerazumljivih ikon. Kako lahko popravite to situacijo? V Wordu, na primer, ko odprete dokument, prejmete sporočilo o težavah pri prikazovanju besedila in ponuja več možnosti za transkodiranje.

Torej je kodiranje in obdelava besedilnih informacij v globinah računalnika precej zapleten in dolgotrajen proces. Vsi simboli katere koli abecede predstavljajo le določeno zaporedje številk binarni sistem, ena celica je en bajt informacij.

Zdieľať na sociálnych sieťach:

Príbuzný