UTF
Från Rilpedia
UTF, akronym för Unicode Transformation Format, universellt teckenkodningsformat, format för att representera teckenkoder (Unicode) i multiplar av oktetter (bytes) i datorer och datamedia. Sådana format behövs för att Unicode behöver 21 bitar för att representera alla tecken, men datorer hellre hanterar data i enheter om 8, 16 eller 32 bitar.
Standarden definierar olika metoder att översätta en teckenkod i Unicode till en sekvens av oktetter, vilket är nödvändigt för att utvidga datorernas förmåga att representera världens olika skriftsystem men samtidigt bibehålla kompatibilitet av gamla representationer, som i huvudsak är av varianten ASCII (sju bitar varav en oanvänd.) Samtliga teckensymboler (glyfer) av dagens existerande skriftspråk kan representeras i samtliga UTF-varianter.
Följande varianter av UTF finns:
Endast UTF-16 och UTF-8 beskrivs i ISO/IEC 10646, och är de enda som i praktiken används i filer.
Alla varianter utom UTF-32 innebär att ett tecken översätts till ett variabelt antal bitar. I UTF-8 kan ett Unicode-tecken kodas med antingen 8, 16, 24 eller 32 bitar beroende på vilket tecken det är. I UTF-16 kodas tecknen med 16 eller 32 bitar (16 bitar för alla tecken med kod upp till FFFF hex).