Diakritiskt tecken
Från Rilpedia
Diakritiskt tecken är små skrivtecken som läggs till en bokstav (över, under eller ovanpå) som har en särskiljande funktion (d.v.s. bokstavens uttal ändras). I många språk finns det bokstäver med vad som ser ut som diakritiska tecken, men formellt räknas som egna bokstäver. Ibland talar man om diakritiska tecken i en vidare mening och räknar ändå in dessa och dessutom apostrofen ('), accenter och skiljetecken. [1] Detta gör man till exempel i sammanhang då man diskuterar stavning av utländska ord eller tekniska lösningar utan att vilja komma in på (eller känna till) teknikaliteter om hur symbolen räknas i respektive språk.
I det svenska språket används inte diakritiska tecken särskilt ofta, men förekommer i tecknet é, t.ex. i idé och armé, plus en del lånord. Ringen i å och prickarna i ä och ö är ursprungligen diakritiska tecken över bokstäverna a respektive o, men i och med att å, ä och ö blivit egna bokstäver, räknas inte tecknen som diakritiska.
I språk som franska har man diakritiska tecken som kallas accenter. I andra språk som tyska räknas tecken som ä/ö/ü som självständiga bokstäver även om de i t.ex. sortering hanteras som varianter av a/o/u.
Även språk med andra alfabet än latinska alfabetet kan ha diakritiska tecken, t.ex. grekiska. Ryska och andra språk med kyrilliska alfabetet har självständiga bokstäver med vad som ser ut som diakritiska tecken (й, ё, ђ, ѓ, ї, ћ, ќ, ў, ґ, ғ)
Innehåll |
Lista över diakritiska tecken till latinska bokstäver
Här listas de efter utseende, och denna lista avser endast de som används med latinska tecken. De kallas ofta helt olika saker i olika språk, och ses ofta inte som diakritiska tecken.
Tecken | Namn | Används i följande språk | Förklaring / Exempel |
---|---|---|---|
á, é, ć, í, ĺ, ń, ó, ŕ, ś, ú, ý, ź | akut accent | franska, isländska, polska, spanska, danska, norska, tjeckiska, slovakiska m.fl. | É markerar i svenskan (endast lånord) betoning på sista stavelsen, som i armé. Á uttalas /aʊ/ på isländska. På färöiska är í ett eget tecken medan á, ó och ú är bokstäver som kan kompletteras med diakritiska tecken. Danska och norska kan ha ´ över särskilt betonade vokaler, såsom i räkneordet én, till skillnad från obestämda artikeln en. |
ő, ű | dubbel akut accent | ungerska | Markerar lång version av bokstäver med trema (ö, ü). |
à, è, ì, ò, ù | grav accent | franska, italienska m.fl. | Markerar i franskan att 'e' ska uttalas /ɛ/, samt innehar en grammatisk funktion på 'a' och 'u'. |
ä, ë, ï, ö, ü, ÿ | trema | franska, tyska, holländska, isländska svenska, spanska, turkiska m.fl. | Markerar i franskan m.fl. dieresis, dvs att två bredvid varandra stående vokaler skall uttalas separat, ej som ett gemensamt ljud, t ex i franskan Citroën, Noël, Anaïs. Markerar i tyskan ett särskilt uttal orsakat av en historisk assimilationsprocess. |
â, ĉ, ê, ĝ, ĥ, î, ĵ, ô, ŝ, û, ŷ | cirkumflex | franska, esperanto m.fl. | I franskan en rest av ett bortfallet -s- |
ã, ñ, ĩ, õ, ũ | tilde | spanska, portugisiska, bretonska, estniska m. fl. | Markerar i spanskan att "n" ska uttalas "nj" som i señor (muljering). Markerar i diverse språk nasal vokal. |
ç, ķ, ļ, ņ, ŗ, ş, ţ | cedilj | franska, portugisiska, katalanska, lettiska, turkiska m.fl. | Markerar i franskan att "c" ska uttalas "s", även före hård vokal, som i portugisiska Moçambique. Ş uttalas sch i turkiska. I vissa centraleuropeiska språk används cediljer som inte "sitter fast" på bokstaven. |
ģ | cedilj över | lettiska | I lettiska har man ģ men dess motsvarande stora bokstav skrivs Ģ. En cedilj under g passar inte bra typografiskt, så den placeras över istället. |
ș, ț | komma | rumänska |
På rumänska vill man ha s och t med komma under för typografisk korrekthet, men får acceptera ş och ţ (med cedilj) i datorer (och datorutskrifter) eftersom det är vad som stöds. Skillnaden är liten och ingen risk för missförstånd. En lösning är att ha rumänskt typsnitt i datorn som ger rumänskt utseende på Ş. Ş kommer från turkiska, ett traditionellt inte så populärt land hos rumäner. |
č, ě, ň, ř, š, ž | hake | tjeckiska, kroatiska, litauiska, slovakiska m.fl. | På tjeckiska uttalas c som ts (ts) medan č är t följt av ett främre sje-ljud (tʃ); s är ett rent s (s) medan š är ett sje-ljud (ʃ). Exempel på detta är Česká republika och Škoda. |
ą, ę, į, ų | svans | litauiska, polska | Markerar i polskan att en vokal ska uttalas nasalt. Kallas också ogonek. |
ă, ğ, ĭ, ŭ | brevis | rumänska, turkiska m.fl. | Markerar i rumänskan att "ă" ska uttalas /ə/ (schwa). |
ā, ē, ī, ō, ū | streck ovanför | lettiska | Markerar i lettiskan lång vokal, som i Rīga. |
ċ, ė, i, ġ, ż | punkt | litauiska, polska, turkiska. | I turkiska är İi och Iı skilda bokstäver. |
å, ů | ring | svenska, tjeckiska m.fl. | Markerar i tjeckiskan långt /u/. |
ď, ľ, ť | apostrof | tjeckiska, slovakiska m.fl. | Dessa apostrofer "sitter ihop" med bokstaven, och är egentligen en hake i stil med č och ě, fast haken får inte plats. Att skriva med lös apostrof d', l', t' är fel. Lösa apostrofer är vanliga i många andra språk, särskilt i engelska och franska. |
ø, ł | snedstreck | danska, norska, polska | Snedstrecket sitter tvärs över bokstaven. |
đ, ħ, ŧ | vågrätt streck ovanpå | samiska, kroatiska | |
många, t.ex. ẻ,ế,ệ,ễ | vietnamesiska | I vietnamesiska används latinska alfabetet med en rik flora diakritiska tecken, ofta två per bokstav. De markerar tonfall och liknande som är betydelseskiljande på vietnamesiska. I Unicode har man ett tecken per kombination, såsom för europeiska språk, fast det är mer än 200 kombinationer unika för vietnamesiska. | |
fler | Det finns fler diakritiska tecken som används i mindre språk, oftast utanför Europa. |
Tecken stödda i Unicode
Latinska bokstäver med diakritiska tecken:
U+00C0: ÀÁÂÃÄÅÇÈÉÊËÌÍÎÏÑÒÓÔÕÖØÙÚÛÜÝ
U+00E0: àáâãäåçèéêëìíîïñòóôõöøùúûüýÿ
U+0100: ĀāĂ㥹ĆćĈĉĊċČčĎďĐđĒēĔĕĖėĘęĚěĜĝĞğĠġĢģĤĥĦħĨĩĪīĬĭĮįİĴĵĶķĹĺĻ
U+0140: ļĽľĿŀŁłŃńŅņŇňʼnŌōŎŏŐőŔŕŖŗŘřŚśŜŝŞşŠšŢţŤťŦŧŨũŪūŬŭŮůŰűŲųŴŵŶŷŸŹźŻżŽŽ
U+0180: ƂƃƇƈƋƌƑƒƓƘƙƝƠơƣƤƥƨƫƬƭƮƯưƳƴƵƶ
U+01C0: ǍǎǏǐǑǒǓǔǕǖǗǘǙǚǛǜǝǞǟǠǡǤǥǦǧǨǩǪǫǬǭǰǴǵǸǹǺǻǾǿ
U+0200: ȀȁȂȃȄȅȆȇȈȉȊȋȌȍȎȏȐȑȒȓȔȕȖȗȘșȚțȞȟȤȥȦȧȨȩȪȫȬȭȮȯȰȱȲȳ
U+1E00: ḀḁḂḃḄḅḆḇḈḉḊḋḌḍḎḏḐḑḒḓḔḕḖḗḘḙḚḛḜḝḞḟḠḡḢḣḤḥḦḧḨḩḪḫḬḭḮḯḰḱḲḳḴḵḶḷḸḹḺḻḼḽḾḿ
U+1E40: ṀṁṂṃṄṅṆṇṈṉṊṋṌṍṎṏṐṑṒṓṔṕṖṗṘṙṚṛṜṝṞṟṠṡṢṣṤṥṦṧṨṩṪṫṬṭṮṯṰṱṲṳṴṵṶṷṸṹṺṻṼṽṾṿ
U+1E80: ẀẁẂẃẄẅẆẇẈẉẊẋẌẍẎẏẐẑẒẓẔẕẖẗẘẙẚẠạẢảẤấẦầẨẩẪẫẬậẮắẰằẲẳẴẵẶặẸẹẺẻẼẽẾế
U+1EC0: ỀềỂểỄễỆệỈỉỊịỌọỎỏỐốỒồỔổỖỗỘộỚớỜờỞởỠỡỢợỤụỦủỨứỪừỬửỮữỰựỲỳỴỵỶỷỸỹ
Grekiska bokstäver med diakritiska tecken:
U+0380: ΆΈΉΊΌΎΏΐΪΫάέήίΰϊϋόύώ
Kyrilliska bokstäver med diakritiska tecken:
U+0400: ЀЁЂЃЇЌЍЎЙйѐёђѓїќѝўѢѣѯѶѷѼѽѾѿҎҏҐґҒғҙӂӑӓӗӝӟӣӥ
Se även
Referenser
- ↑ Nationalencyklopedin på internet den 29 november 2006, uppslagsord Diakritiskt tecken