Palomino
Från Rilpedia
Stilguide | |
---|---|
Innehåll
Formatering Struktur Länkar |
Se även den engelska texten om specialtecken på Meta-Wiki: m:Help:Special characters
Innehåll |
Teckenkodningssystem
Från och med MediaWiki 1.5 använder alla projekten teckenkodningen UTF-8 (Unicode).
Innan denna nya version började användas i Wikimedia-projeten i slutet av juni 2005 använde den svenska, den danska, den engelska och den tyska Wikipedian teckenkodningen windows 1252 (de uppgav sig använda ISO-8859-1, men i praktiken likställer webbläsare dessa två, och MediaWiki-mjukvaran hindrade inte uppladdning av windows-1252-koder). Wikitexter från tiden före uppgraderingen sparas i windows-1252-format och konverteras till UTF-8 när den laddas ned. Nya redigeringar sparas som UTF-8 i databasen. Dessa konverteringar är osynliga för användarna.
- Unicode (UTF-8)
- varierande antal bytes per tecken
- specialtecken, inklusive kinesiska, japanska och koreanska tecken, kan behandlas som vilka tecken som helst; inte bara på webbsidorna, utan även i redigeringsrutan. Det är även möjligt att använda html-entiteter för att representera tecken - dessa konverteras inte automatiskt i redigeringsrutan.
- ISO 8859-1
- en byte per tecken
- specialtecken som inte finns tillgängliga i den begränsade teckenuppsättningen sparas som HTML-entiteter i någon av dessa tre varianter: namnreferens (€), decimalreferens (€) eller hexadecimalreferens (€). De tre exemplen inom parentes motsvarar alla eurosymbolen (€). Redigeringsrutan visar den inmatade koden och webbsidan det önskade tecknet.
Redigering av specialtecken
Många tecken utöver de vanliga ASCII- och ISO-8859-1-tecknen är användbara – till och med nödvändiga – i Wikipedia. Det finns flera sätt att mata in dessa i wikisidorna:
- Mata in tecknet i redigeringsrutan från ett tangentbord som innehåller det sökta tecknet.
- Klipp-och-klistra in tecknet i redigeringsrutan från en webbsida, ett dokument eller en tabell som innehåller det sökta tecknet.
- Använd en funktion i ditt operativsystem för att mata in specialtecken i redigeringsrutan (till exempel hålla ned Alt och slå in en kod på numeriska tangentbordet i Windows)
- Mata in tecknet som en HTML-teckenreferens, så kallad HTML-entitet, och förhandsgranska för att se om det lyckats. HTML-entiteter kan vara namngivna, till exempel å producerar ett å, ° producerar ett grad-tecken: °. Man kan även använda en numerisk HTML-entitet där numret hänvisar till tecknets position i Unicode-tabellerna. En numerisk HTML-entitet kan skrivas decimalt som Ӓ där 1234 är efterfrågad position eller hexadecimalt som ꯍ där ABCD är den hexadecimala positionen.
Notera att numeriska referenser mellan 128 och 159 (decimalt) inte motsvarar några tecken i Unicode-standarden (de finns i Windows-1252) och ska därför inte användas. Tänk också på att den som läser artiklarna inte nödvändigtvis har en lika komplett uppsättning typsnitt som du har och därmed inte kan se de allra exklusivaste tecknen trots att dessa syns för dig.
Esperanto
I redigeringsrutan | I databasen och på webbsidan |
---|---|
S | S |
Sx | Ŝ |
Sxx | Sx |
Sxxx | Ŝx |
Sxxxx | Sxx |
Sxxxxx | Ŝxx |
Mediawiki-installationer för esperanto använder UTF-8 för lagring och visning. Vid redigering används dock ett format som underlättar inmatning med de flesta tangentbord.
Detta gäller tecknen Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ, ĉ, ĝ, ĥ, ĵ, ŝ samt ŭ. Den som har möjlighet kan mata in tecknen direkt, men dessa tecken kommer vid nästa redigering uppträda som Cx, Gx etc. i editeringsrutan. Denna metod att representera tecknen kallas x-sistemo eller x-kodo. Efter tecknen C, G, H, J, S, U, c, g, h, j, s, u dubbleras antalet x i editeringsrutan jämfört med vad som lagras i databasen av kompabilitetsskäl.
Ett exempel: en språklänk till [[sv:Luxor]] måste matas in som [[sv:Luxxor]] i den esperantiska Wikipedian. Detta kan ställa till det för automatiska språklänksrobotar.
Webbläsarproblem
Vissa webbläsare är ökända för att göra tråkiga saker med texten i redigeringsrutan. Ibland konverterar dessa tecknen till en teckentabell som används på dess plattform. Sedan låter webbläsaren användaren redigera texten för att sedan konvertera tillbaka texten till webbplatsens teckenkodning. Resultatet blir då att alla tecken som inte finns i den lokala teckentabellen ersätts med något som finns (vanligtvis ett frågetecken men åtminstone en webbläsare har observerats transliterera texten!).
Internet Explorer för Macintosh v.?
Denna webbläsare konverterar text till MacRoman i redigeringsrutan med resultatet att den förstör de flesta specialtecken.
Netscape 4.x
Samma problem som för IE för Mac, men med andra teckentabeller än mac-roman.
Terminal/kommandoprompt/konsol-webbläsare
De textbaserade webbläsarna lynx och links samt w3m är beroende av använda teckeninställningar (locale etc.). Använder terminalen UTF-8 ska det fungera bra.
En sorts lösning
I databasen och editerings- rutan för normala webbläsare |
I redigeringsrutan för dåliga webbläsare |
---|---|
œ | œ |
œ | œ |
œ | œ |
När de sista Wikipediorna bytte till UTF-8 och språklänkarna efterhand byttes till ren Unicode började problemet med webbläsare som sabbar specialtecken bli stort. För att komma runt problemet utarbetades en funktion som behandlar vissa webbläsare annorlunda än övriga. Webbläsare som är listade i inställningen $wgBrowserBlackList får specialtecknen levererade som HTML-entiteter även om de är lagrade i rent UTF-8-format. Existerande hexadecimala HTML-entiteter får en extra inledande nolla. För närvarande är endast IE mac och en särskild variant av Netscape 4.x för Linux listade som förstörande webbläsare.
Att visa specialtecken
De flesta av dagens webbläsare kan hantera specialtecken, men vissa gör det bättre än andra. Det vanligaste problemet är att Internet Explorer förlitar sig på förkonfigurerade typsnittstabeller i registret, snarare än att själv välja ett typsnitt som innehåller de efterfrågade tecknen. Detta innebär att IE måste tvingas (av webbsidan) till att använda vissa typsnitt. På de olika Wikipediorna finns mallar som försöker underlätta teckenvisningen för användare av IE. Exempel på detta är Mall:IPA (se respektive malls diskussionssida för råd och tips). Specialtecken som ingår i teckenlistan WGL4 bör fungera i IE utan hjälp av specialmallar.
Har du problem att se tecken på ett speciellt språk kan detta för det mesta lösas genom att ladda ner Code 2000. Observera att teckenuppsättningen är shareware, och upphovsrättsmannen väntar sig få betalt efter en viss prövotid. All denna info framgår på sidan i fråga. När du laddat ner programmet, lägg filen code2000.ttf i (din windowskatalog)\fonts. Starta sedan om datorn. Detta förutsätter att du använder dig av någon version av Microsoft Windows.
Tecken som bilder
Nabla är en symbol som inte stödjs av Windows 95 och 98. Man kan i stället använda en bild genom att skriva [[Fil:Del.gif]], vilket ger: Fil:Del.gif. För just nabla kan man även änvända matematisk typsättning <math>\nabla</math> vilket får Wikipedia att skapa bilden.
Aktuella bibliotek av teckenbilder på svenska wikipedia: Rilpedia:Rytmbibliotek.
Se även
Externa länkar
- Unicode-resurser, samtliga på engelska:
- http://www.unicode.org/charts/ Unicodes teckenlistor; (PDF-filer visar tecknen oavsett webbläsare)
- Tabell över tecknen i Unicode från nummer 1 till 65535
- HTML 4.0 Character Entity References - namngivna HTML-referenser
- FileFormat.Info - detaljerad information om många Unicodetecken
- Alan Wood's Unicode Resources - omfattande webbresurs med testsidor för alla Unicode-listor, OS-specifik information och länkar till verktyg och typsnitt för de mer obskyra skriftspråken.