HTML

Från Rilpedia

Hoppa till: navigering, sök
Wikipedia_letter_w.pngTexten från svenska WikipediaWikipedialogo_12pt.gif
rpsv.header.diskuteraikon2.gif
HTML
Html-source-code3.png
Ett exempel på en bit HTML-kod med färgmarkerad syntax och radnummer
Filändelse: .html, .htm
MIME-typ: text/html
Typkod: TEXT
Uniform typidentifierare: public.html
Utvecklad av: W3C
Typ av format: märkspråk
Utökad från: SGML
Utökad till: XHTML
Standard: HTML 4.01
HTML
Rendering
Relaterat innehåll
 Denna tabell: visa  diskussion  redigera 

HTML, HyperText Markup Language, är ett märkspråk och webbstandard för strukturering av text, hypertext, media och inbyggda objekt på exempelvis webbsidor och i epostmeddelanden.

Innehåll

Historik

Hypertext som begreppet och dess moderna användning kan man hänvisa till omkring 1945, då Vannevar Bush beskrev ett informationssystem där man inte längre behövde läsa texter från början och till slut utan fritt kunde följa det spår som intresserade en som läsare. Här myntades även begrepp som hem, vilket är den plats man återvänder till efter avslutad läsning. Den första tillämpningen som på allvar försökte införa hypertext var ett program som hette guide, som aldrig riktigt slog igenom. Apple var den första något lyckade med sitt program HyperCard, men många ansåg att det inte var riktig HyperText. Det var när Tim Berners-Lee tog fram webbläsaren som HyperText slog igenom hos allmänheten. Det har även inneburit att HTML mer och mer tar avsteg från HyperText och mera liknar ett programmeringsspråk för HyperMedia. Begreppet hemsida är idag ibland hos medelanvändare synonymt med till exempel ett företags ansikte utåt och inte den punkt man återgår till efter avslutad läsning.

Dokumentformatering

HTML är ett format där dokumentets struktur och logik bestäms av författaren, medan läsaren styr hur texten kommer att presenteras. Numera är det dock vanligt att författaren själv styr presentationen av dokumentet med så kallade stilmallar, CSS. Tillägg programmerade i skriptspråk (exempelvis JavaScript) används ibland för att skapa dynamiska och interaktiva webbplatser.

Denna webbsida och de flesta andra är helt eller delvis skrivna i detta märkspråk. I de flesta webbläsare kan man se källkoden till webbsidan som visas genom att gå till "Visa" i huvudmenyn och sedan "Källa" eller "Källkod".

Filer med filnamnstillägget .htm eller .html brukar vara HTML-dokument. Filerna innehåller förutom text så kallade taggar, vilka talar om för webbläsaren hur informationen ska presenteras för användaren. Alla element startas med hjälp av ett 'mindre än'-tecken (<) följt av taggnamnet varav det följs av ett 'större än'-tecken (>), många element måste dessutom stängas med hjälp av en sluttagg. Denna sluttagg innehåller endast taggnamnet och är uppbyggt utav </ följt av taggnamnet varefter >.

Olika webbläsare tolkar HTML-kod på olika sätt och detta har varit ett problem gällande för världens webbutvecklare. Gemensamma standarder växer fram genom World Wide Web Consortium(W3C). Genom att följa dessa standarder ökar chansen att webbsidan ser likadan ut i moderna webbläsare. Dessutom kan sidorna bli mer tillgängliga för besökare som har någon funktionsnedsättning och få en högre rankning på sökmotorer.

Den senaste versionen av HTML är HTML 4.01 och den fastställdes 1997 av W3C. HTML 4.01 finns i tre olika former, nämligen Strict, Transitional och Frameset. Dessa skiljer sig mest huruvida HTML-koden får innehålla äldre, utgångna taggar som endast används i presentationssyfte. Det är rekommenderat att använda Strict till nyutvecklade webbplatser. Transitional innehåller alla taggar som Strict gör inklusive äldre så kallade presentationstaggar. Frameset innehåller allt från Transitional och är den enda varianten som tillåter användandet av ramar.

Arbete pågår för närvarande med standardiseringen av HTML 5, som kommer att inkludera nya element för att utvidga semantiken i märkspråket, förbättrade formulär med Web forms 2.0, element för ljud, video och grafik och i mycket större utsträckning definiera förväntat beteende hos en webbläsare när koden tolkas. Dagens standarder är ofta tvetydiga, och tvingar programmerarna av webbläsare att gissa sig till beteendet i olika situationer.

För att ange vilken version av HTML som dokumentet är byggt efter så lägger man högst upp i varje dokument en dokumentmall, vilken man oftast brukar låna de engelska termerna för, nämligen DTD eller DOCTYPE. Moderna webbläsare använder denna för att kontrollera om sidan är kodad efter moderna standarder eller inte. Om DTD saknas, eller är gammal, så går webbläsaren in i det så kallade "Quirks Mode" och använder då en bakåtkompatibel renderingsmotor för att kunna visa äldre sidor någorlunda korrekt[1]. Skillnaden mellan standardläge och "quirks läge" rör framförallt den s.k. boxmodellen.

Elementtyper

Det finns fyra kategorier av elementtyper i HTML:

  • Strukturmärken, som beskriver syftet med texten, till exempel <h1>Golf</h1>, som tolkas som högsta rubriknivå.
  • Presentationsmärkning, som beskriver textens stil, till exempel <b>fetstil</b>, som resulterar i fet text. Många webbutvecklare har idag upptäckt fördelarna med att separera presentation och struktur så dessa taggar är oftast icke-rekommenderade att använda. Istället används så kallade stilmallar för att presentera data på sidan.
  • Hyperlänkmärkningar, som länkar till ett dokument eller till en sektion i aktuellt dokument eller annat dokument, till exempel <a href="http://wikipedia.org">Wikipedia</a>, som skriver ut ordet Wikipedia med understrykning som standard. Vid aktivering av länken öppnar webbläsaren sidan http://wikipedia.org.
  • Interaktiva element, som skapar interaktiva objekt, till exempel knappar och listor.

Ordet "tagg" överanvänds ofta när diskussioner om HTML-relaterade ämnen uppstår. Det är inte ovanligt att ordet "tagg" används för att referera till allt från DOCTYPE-deklarationen till olika attribut, vilket naturligtvis inte är korrekt.[2][3]

  • <strong> och </strong> är ett exempel två taggar, närmare bestämt en starttagg följt av motsvarande sluttagg.
  • <strong></strong> är ett exempel på ett element.
  • <abbr title="HyperText Markup Language">HTML</abbr> är ett exempel på ett element som använder ett attribut med namnet title och värdet HyperText Markup Language.

Lista över vanligt förekommande elementtyper

  • a, används för att skapa hyperlänkar
  • br, skapar en radbrytning
  • div och span, element utan semantisk mening, används oftast för att koppla CSS till dokumentet.
  • dl, dt och dd, är de olika delarna av en definitionslista
  • h1, h2, h3, h4, h5, h6, huvudrubrik och ner till sjätte nivån av underrubriker
  • img, infogar en bild i dokumentet
  • ol och ul, skapar en sorterad respektive osorterad lista
  • p, märker upp ett textstycke
  • table, tabell, där varje tabellrad omsluts av tr och td skapar en tabellcell
  • strong och em, markerar olika sorters betoning
  • hr, skapar en horisontell linje

Ramar

I HTML 4.0 och XHTML 1.0, finns en funktion för att skapa en sida där webbläsaren visar sitt fönster i flera delar. Den får så att säga flera ramar. Ramar är inte i den vanliga taggen <body>, utan istället är de flesta ramtaggarna i taggen <frameset>.

Ramtaggar

Här kommer flera ramtaggar. Om inget annat har angetts, är alla taggar i taggen <frameset>:

Taggen: Används till:
<frameset> Det är tänkt att ramdokumentet ska startas med den taggen.
<frame /> En ram
<noframes> Text för de som inte vet vad en ram är. Den får innehålla text och de vanliga taggarna.
<iframe> Denna tagg finns i <body> och har ramar inbäddade i sidan. I den taggen, skall man ha alternativ text för de som inte stödjer såna här "flytande" ramar.

Borttagna ramar

I XHTML 1.1 och HTML 4.01 Strict, är alla dessa funktioner borta. I (X)HTML 5, är också alla dessa funktioner borta. Bara <iframe> är kvar. [4]

Exempel på ett enkelt dokument

Här följer ett exempel på ett enkelt dokument. Dokumentet har titeln "Sidan har flyttats" och visar en förklarande text (p-element) för besökaren om att sidan har flyttats, i slutet av textstycket finns även en länk (a-elementet) som pekar till http://example.org; sidans nya adress.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
  <title>Sidan har flyttats</title>
</head>
<body>
  <p>Denna sida har flyttats till <a href="http://example.org">example.org</a>.</p>
</body>
</html>

Ovanstående visar även att vissa element inte uttryckligen behöver avslutas med en sluttagg, p-elementet börjar vid <p>-taggen och webbläsaren som tolkar dokumentet räknar själv ut var elementet ska sluta.

HTML, XHTML och framtiden

HTML 4.01 är formellt en applikation av SGML, även om i princip inga webbläsare hanterar detta faktum korrekt. I praktiken har alltså HTML fungerat som en helt egen teknik och webbläsarna har inkluderat en stor mängd logik för att hantera brister i en sidas uppmärkning.

För att råda bot på detta, samt öppna en möjlighet att kombinera märkspråk från skilda namnrymder, så skapades XHTML, som är en omformulering av HTML som en applikation av XML. För att en sidas skall tolkas som äkta XHTML, så skall detta anges i HTTP-huvudet, med en s.k. MIME-deklaration. Dock stödjer inte Internet Explorer XHTML, vilket inneburit att i princip alla webbplatser idag skickar sina sidor som HTML, även om de har en XHTML DTD.

Eftersom elementnamn och attributnamn är identiska mellan XHTML 1.0 och HTML 4.01, så skriver man ibland (X)HTML, för att markera att båda teknikerna avses.

(X)HTML5-projektet

Arbetet med det som numera kallas (X)HTML5 påbörjades 2004 av en grupp webbutvecklare, främst med anknytning till Mozilla, Opera (webbläsare) och Apple. Man antog namnet "Web Hypertext Application Technology Working Group" - eller kortare WHATWG.

"Web Applications 1.0" som (X)HTML5 också kallas är tänkt att ersätta både HTML 4 och XHTML 1. Gruppen avser att specificera en ny och enhetlig DOM som skall fungera både för XML-baserade och HTML-baserade serialiseringar av (X)HTML5. En av grundtankarna i (X)HTML5 är alltså att en författare skall kunna välja om denne vill använda HTML- eller XML-syntax för sina webbsidor och att sidorna skall kunna hanteras i princip likvärdigt av skript när dessa är inlästa i en webbläsares internminne oavsett vilket serialiseringsformat som valts.[5]

W3C:s arbetsgrupp för utveckling av HTML

Arbetet från WHATWG blev officiellt grunden för nästa standard, när W3C i mars 2007 startade en arbetsgrupp för vidareutveckling av HTML. Denna grupp innehåller, förutom representanter för samtliga större webbläsarleverantörer (Microsoft, Opera, Mozilla och Apple), inklusive flera av de drivande krafterna bakom WHATWG. HTML5 blev Working Draft vid W3C i januari 2008.

Se även

Källor

  1. Activating Browser Modes with Doctype av Henri Sivonen
  2. It’s alt attribute, not alt tag
  3. HTML Tags
  4. Rolf Staflin - HTML- och CSS-boken upplaga 6
  5. HTML 5, one vocabulary, two serializations, W3C Questions and Answers blog

Externa länkar

Wikibooks-logo.svg
Wikibooks har relaterade böcker. Se: HTML

(engelska)

Personliga verktyg