Arabiska alfabetet

Från Rilpedia

Hoppa till: navigering, sök
Wikipedia_letter_w.pngTexten från svenska WikipediaWikipedialogo_12pt.gif
rpsv.header.diskuteraikon2.gif

Arabiska alfabetet används för att skriva det arabiska språket, liksom ett antal andra språk som persiska, urdu och uiguriska. Det har historiskt sett används för att skriva ett större antal språk, men många av dessa har under 1900-talet övergått till latinska eller kyrilliska alfabet. Ett exempel är turkiska som efter 1928 övergick till att skriva med det latinska alfabetet.

Det arabiska alfabetet skrivs från höger till vänster. Bokstäverna i ett ord skrivs vanligen samman så att de blir en sammanhängande enhet. Rent praktiskt använder man vid typsättning initiala (oftast längst till höger i ordet), mediala och finala (oftast längst till vänster i ordet) former för respektive bokstav (till skillnad från dess isolerade form). Vissa bokstäver har dock inga initiala och mediala former (se nedan), men kan förekomma i början eller mitt i ord ändå. Då används den självständiga respektive den avslutande formen. Tecknet efter ska då inte heller bindas med det föregående.

Det arabiska alfabetet är en abjad, det vill säga en konsonantskrift där vokaler är frivilliga och markeras med diakritiska tecken. Det är dock inte en "ren" abjad; långa vokaler skrivs alltid ut men inte de korta.

Innehåll

Ordning

De arabiska bokstäverna kan sorteras på två olika sätt. Den ursprungliga abjadī-ordningen härstammar från det feniciska alfabetet och påminner därför om bokstavsordningen i exempelvis hebreiska. Hijāʼī-ordningen grupperar tecken med liknande utseende. Abjadī används vid numrering medan hijāʼī används då listor över namn eller ord ska sorteras, exempelvis telefonkataloger och ordlistor.

Bokstäver

placering i ordet namn transkription uttal
isolerat finalt medialt initialt
ʾalif ʾ, ā [a:]
bāʾ b [b]
tāʾ t [t]
ṯāʾ ṯ, th [θ]
ǧīm ǧ, j, dj [dʒ]
ḥāʾ [ħ]
ḫāʾ ḫ, ẖ, kh, x [x]
dāl d [d]
ḏāl ḏ, dh, ð [ð]
rāʾ r [r]
zai z [z]
sīn s [s]
šīn š, sh [ʃ]
ṣād [sˁ]
ﺿ ḍād [dˁ], [ðˤ]
ṭāʾ [tˁ]
ẓāʾ [zˁ], [ðˁ]
ʿayn ʿ [ʕ]
ġayn ġ, gh [ɣ]
fāʾ f [f]
qāf q [q]
kāf k [k]
lām l [l]
mīm m [m]
nūn n [n]
hāʾ h [h]
wāw w, ū [w], [u:]
yāʾ y, ī [j], [i:]
  • Ursprungligen stod bokstaven ʾalif för en glottal stöt. Numera används den i likhet med yāʾ och wāw för att representera en lång vokal.
  • Numera skrivs glottal stöt med hamza. Den skiljer sig från andra bokstäver genom att den både kan skrivas ensam och som ett diakritisk tecken.

Vokaler

Korta vokaler

Korta vokaler skrivs i arabiska med diakritiska tecken kallade harakat ovanför eller under föregående konsonant.

För att markera att en konsonant inte följs av en vokal kan den markeras med ett sukūn.

med ب namn transkription uttal
بَ fatḥa a [a]
بُ ḍamma u [u]
بِ kasra i [i]

Långa vokaler

Långt a skrivs, efter alla konsonanter utom hamza, med tecknet för kort a följt av ett ʾalif. Långt i skrivs med tecknet för kort i följt av ett yāʾ. Långt u skrivs med tecknet för kort u följt av ett wāw.

I texter där korta vokaler inte skrivs ut så representeras de långa vokalerna av enbart konsonanttecknen ʾalif, yāʾ och wāw. Ett viktigt undantag är den bestämda artikeln al där a uttalas kort trots att den skrivs med ʾalif.

med ب namn transkription uttal
بَا fatḥa ʾalif ā [a:]
بَى fatḥa ʾalif maqṣūra ā, aỳ [a:]
بُو ḍamma wāw ū, uw [u:]
بِي kasra yāʾ ī, iy [i:]

Siffror

I arabiskan finns det två sorters siffror: standardarabiska samt så kallad nordarabiska som används i Iran, Pakistan samt i Indien.

Siffror skrivs från vänster till höger och skrivs alltså inte åt samma håll som bokstäverna.

Europeiska Standardarabiska Nordarabiska
0 ٠ ۰
1 ١ ۱
2 ٢ ۲
3 ٣ ۳
4 ٤ ۴
5 ٥ ۵
6 ٦ ۶
7 ٧ ۷
8 ٨ ۸
9 ٩ ۹

Talet 2009 skrivs alltså på arabiska ٢٠٠۹

Hantering i datorer

Teckenkodningen Unicode stöder det arabiska alfabetet. Det finns teckenkoder både för nominella arabiska bokstäver (som ska formas vid utskrift, så att de binds ihop med intilliggande bokstäver) och även för förformade bokstäver och ligaturer. De förformade arabiska bokstäverna finns med som teckenkoder för kompatibilitet med äldre teckenstandarder, och bör inte användas i nyskrivna texter. De nominella bokstäverna skrivs ut med olika utformning, och eventuellt olika placering i höjdled, beroende på intilliggande bokstäver. Moderna fonter (enligt t.ex. OpenType eller AAT) för arabiska innehåller flera former för varje nominell arabisk bokstav (plus ev. ankarpunkter för placering i höjdled), och utskriftsystemet väljer form beroende på grannbokstäver. Teckenkoderna för de förformade bokstäverna används då inte, och en hel del utökade arabiska bokstäver har inga kodpunkter för förformade varianter. Även ligaturer, speciellt för den obligatoriska lam-alif-ligaturen, formas med hjälp av data i fonten, inte via teckenkoder för arabiska ligaturer.

En annan svårighet är att skrivriktningen för arabisk text är från höger till vänster. Enligt Unicode ska arabisk text lagras i läsordning, och sedan skrivas ut höger-till-vänster. Så om en text bara innehåller arabiska bokstäver och några skiljetecken är det lätt, man vänder på tecknens ordning vid utskrift (om man måste skriva ut från vänster till höger), eller helt enkelt skriver ut dem höger-till-vänster, samtidigt som vissa tecken, bl.a. parenteser, speglas. Men om texten även innehåller, t.ex., ord skrivna i ett alfabet där skrivriktningen är vänster-till-höger, nummer, även arabiska nummer, blir det mer komplicerat. Unicode-standarden innehåller en, tyvärr ganska komplicerad, algoritm för detta som datorutvecklare kan använda. Resultatet blir inte alltid perfekt, så det finns även styrkoder med vars hjälp utskriften kan förbättras, t.ex. för parenterser, citat och dylikt. I HTML finns istället attribut för detta som bör användas iställer för styrkoderna.

Även äldre 8-bitskodningar för arabiska bokstäver och siffror finns, som använts före Unicode och delvis fortfarande, till exempel ISO/IEC 8859-6. Det stödjer engelska och arabiska, men inte fullt ut persiska, urdu m.fl.

Personliga verktyg