lki@lki.lt lki@lki.lt   EN  
   
 
LIKIT » Standartai » Koduotės

Standartai » Koduotės


Nuo 2000 m. buvo atnaujinti ženklų kodavimo standartai. Juose likviduota anksčiau buvusi nepagrįsta kodų lentelių įvairovė, kėlusi chaosą lietuviškų raidžių kodavime. Sudaryta sisteminga kodų standartų šeima. Todėl galima sakyti esminės kodavimo standartų problemos jau išspręstos. Dar kuriami standartai darniai įsilieja į jau esamą standartų sistemą ir didesnių problemų nekelia, išskyrus dar kai kurias šriftų problemas su kirčiuotomis raidėmis.

LST ISO/IEC 8859-13

Lietuvos standartas LST ISO/IEC 8859-13. Informacijos technologija. 8 bitais koduotų ženklų rinkiniai. 13 dalis. Lotynų 7-oji abėcėlė (tapatus ISO/IEC 8859-13:1998).

Rašto ženklų kodavimą 8 bitais apibrėžia tarptautinis standartas ISO/IEC 8859. Jį sudaro atskiros dalys, kurių kiekviena dalis apibrėžia kodų lentelę, pritaikytą tam tikros kalbų grupės rašto ženklams koduoti. Standartas yra atviras, t.y. gali būti papildomas naujomis dalimis. Dabar yra 15 dalių.

Standarto 13-oji dalis ISO/IEC 8859-13 apibrėžia lotynų 7-osios abėcėlės ženklų rinkinį, turintį lietuviškus rašto ženklus. Ji išversta į lietuvių kalbą ir priimta Lietuvos standartu, kuriam suteiktas žymuo LST ISO/IEC 8859-13:2000. Šio standarto apibrėžta kodų lentelė kompiuteriuose žymima trumpiau – ISO-8859-13. Tai pagrindinis Lietuvos rašto ženklų kodavimo 8 bitais standartas ir naudotinas duomenų mainams tarp įvairių terpių (operacinių sistemų) bei kaip pagrindas kuriant kitus kodavimo standartus.

Pasaulyje serijos ISO/IEC 8859 standartai tiesiogiai (be pakeitimų) naudojami „Unix“ genties operacinėse sistemose (pvz. „Linux“). Dėl to Lietuvoje šiose sistemose taikytinas standartas LST ISO/IEC 8859-13.

Standartas LST ISO/IEC 8859-13 nuo 2000 m. pakeitė iki tol galiojusį standartą LST 1282, kuris apibrėžė kodų lentelę, vadinamą „Baltic Rim“. Tačiau iš tikrųjų pasikeitė tik aprašymo pavidalas, o visų ženklų kodai išliko tie patys.

LST 1564

Lietuvos standartas LST 1564. Informacijos technologija. Ženklų kodavimas 8 bitais. Lietuviškų kirčiuotų raidžių rinkinys

Kirčiuotų raidžių standartas apibrėžia kodų lentelę, kurios lietuviškų rašto ženklų aibė papildyta kirčiuotomis raidėmis. Šioje kodų lentelėje pagrindinių (nekirčiuotų) lietuviškos abėcėlės raidžių ir visų kitų ženklų, išskyrus kirčiuotas raides, kodai sutampa su standarto LST ISO/IEC 8859-13 kodais.

Šis standartas yra pagrindinis kirčiuotų raidžių standartas. Jis tiesiogiai (be pakeitimų) vartotinas UNIX genties operacinėse sistemose. Remiantis šiuo standartu sudaromi kirčiuotų raidžių kodavimo standartai kitoms operacinėms sistemoms.

LST 1590

Lietuvos standartas LST 1590. Informacijos technologija. Ženklų kodavimas 8 bitais

Šis standartas apibrėžia ženklų rinkinius, turinčius lietuviškus rašto ženklus, ir jų kodavimą atskirose operacinėse sistemose. Jį sudaro atskiros dalys, kurių kiekviena dalis apibrėžia kodų lentelę, skirtą tam tikros genties operacinėms sistemoms, o taip pat atskiras dalis pagrindinei lietuvių kalbos abėcėlei ir lietuvių kalbos abėcėlei, papildytai kirčiuotomis raidėmis. Standartas yra atviras, t.y. gali būti papildomas naujomis dalimis. Dabar yra 4 dalys:

  • LST 1590-1. Informacijos technologija. Ženklų kodavimas 8 bitais. Grafinių ženklų rinkinys DOS terpei. Standartas apibrėžia lotynų 7-osios abėcėlės ( Latin 7 ) ženklų rinkinį (tą patį, kurį apibrėžia pagrindinis standartas LST ISO/IEC 8859-13), papildytą operacinei sistemai DOS būdingais pseudografikos ženklais. Šio standarto apibrėžiamas kodavimas žinomas kodų lentelės 775 vardu.
  • LST 1590-2. Informacijos technologija. Ženklų kodavimas 8 bitais. Lietuviškų kirčiuotų raidžių ir fonetinių ženklų rinkinys DOS terpei. Kirčiuotų raidžių standartas apibrėžia kodų lentelę, kurios lietuviškų rašto ženklų aibė papildyta kirčiuotomis raidėmis bei fonetiniais ženklais. Šioje kodų lentelėje pagrindinių (nekirčiuotų) lietuviškos abėcėlės raidžių ir kitų ženklų kodai sutampa su standarto LST 1590-1 kodais.
  • LST 1590-3. Informacijos technologija. Ženklų kodavimas 8 bitais. Grafinių ženklų rinkinys Windows terpei. Standartas apibrėžia lietuviškų raidžių kodavimą „Windows“ genties operacinėse sistemose (Windows 95, Windows 98, Windows 2000, Windows NT). Jo apibrėžiama kodų lentelė kitaip žinoma 1257 vardu. Šioje lentelėje visų lietuviškos abėcėlės raidžių kodai sutampa su standarto LST ISO/IEC 8859-13 apibrėžiamais kodais. Skiriasi tik 4 skyrybos ženklų (kabučių ir apostrofo) kodavimas, atsiradęs dėl korporacijos „Microsoft“ savitų kodavimo principų.
  • LST 1590-4. Informacijos technologija. Ženklų kodavimas 8 bitais. Lietuviškų kirčiuotų raidžių ir fonetinių ženklų rinkinys „Windows“ terpei. Kirčiuotų raidžių standartas apibrėžia kodų lentelę, kurios lietuviškų rašto ženklų aibė papildyta kirčiuotomis raidėmis bei fonetiniais ženklais. Šioje kodų lentelėje pagrindinių (nekirčiuotų) lietuviškos abėcėlės raidžių ir visų kitų ženklų, išskyrus kirčiuotas raides ir fonetinius ženklus, kodai sutampa su standarto LST 1590-3 kodais.

LST ISO/IEC 10646-1

Lietuvos standartas LST ISO/IEC 10646-1. Universalus keliais baitais koduotų ženklų rinkinys. 1 dalis. Sandara ir pagrindinė daugiakalbė lentelė.

Standartas ISO/IEC 10646 apibrėžia ženklų kodavimą 32 bitais (4 baitais). Jis yra Unikodo, apibrėžiančio ženklų kodavimą 16 bitų (2 baitais), viršaibis.

Unikodą kuria „Unicode“ konsorciumas (www.unicode.org), kuris nepriklauso Tarptautinei standartų organizacijai. Todėl Unikodas nelaikomas tarptautiniu standartu. Tačiau abi organizacijos glaudžiai bendradarbiauja. Dėl to ženklų kodavimas standarte ISO/IEC 10646 ir Unikode yra suderintas. Visi Unikodo ženklai yra standarte ISO/IEC 10646, visų jų kodų pirmieji 16 bitų lygūs nuliui, o kitų 16 bitų Unikodo kodai sutampa su ISO/IEC 10646 kodais. Todėl nėra esminių skirtumų tarp šių dviejų kodavimų.

Lietuvoje yra priimtas standartas ISO/IEC 10646-1 viršelio būdu ir jam suteiktas žymuo LST ISO/IEC 10646-1.

Standarte LST ISO/IEC 10646 yra visos pagrindinės ir 33 kirčiuotos lietuviškos abėcėlės raidės. Likusias 35 kirčiuotas raides galima išreikšti kompozicinėmis sekomis. Yra deramasi su standarto ISO/IEC 10646 kūrėjais dėl visų kirčiuotų lietuviškų raidžių tiesioginio įtraukimo į standartą ISO/IEC 10646 bei Unikodą.



 

 
   
 
© 2001–2014 Lietuvių kalbos institutas
Atnaujinta 2010-02-25