Om "underlige" tegn

Alle, der har lavet websider, er vist før eller siden stødt ind i det lille problem med, at browseren ikke kan vise et <-tegn eller et >-tegn.

Og hvordan er det nu lige, du skriver "grader Celcius", hvis du vil bruge et gradtegn (ºC); Eller du har brug for at skrive "Mañana", så dine spanske venner også kan forstå det, etc. etc.

Og var der forresten ikke noget med de særlige danske bogstaver æøå og ÆØÅ?

Tegnkodetabeller

Jo, der er noget med de danske tegn; og de svenske, tjekkiske og portugisiske, for slet ikke at tale om de vietnamesiske og arabiske.

Hvis du skriver æ, ø eller å på din webside, vil din læser i Amerika ikke kunne se disse bogstaver overhovedet.

Det har for så vidt ikke noget at gøre med hverken din webside, Internet eller med webbrowseren, men nok så meget med, at ingen PC er sat op til at kunne vise alle verdens forskellige bogstaver.

En computer er normalt konfigureret til at kunne læse ét eller to "tegnsæt". I Danmark er computere f.eks. sat op til at benytte en såkaldt tegnkodetabel, der rummer de specielle danske bogstaver og andre specialtegn, der anses for at være danske eller nordiske specialiteter.

I Portugal, derimod, er computeren sat op til en anden tegnkodetabel, der ikke rummer de danske bogstaver, men de særlige portugiske bogstaver og andre specialtegn, der anses for at være portugisiske eller romanske specialiteter.

I korthed: Hvis ikke den særlige danske/nordiske tegnkodetabel er indlæst på computeren, kan den ikke vise de tegn, vi benytter til hverdag.

HTML tegnelementer (Character Entities)

Hvis vi gerne vil ha' at vore venner i udlandet skal kunne læse vore dansksprogede sider på deres computere uden at kende stort til tegnkodetabeller, er vi nødt til at anvende HTML tegnelementer (Character Entities).

Et par stykker af disse er vi nødt til at bruge, hvis vi vil anvende de indledningsvis omvendte skarpe parenteser. Tegnkoderne for disse er hhv &gt; og &lt;.

De er mange tusinde forskellige tegn, der har hver deres HTML tegnelementkode. Heldigvis kan vi indskrænkes os til at anvende dem, der har betydning for visningen af de vesturopæiske alfabeter. Hermed er begge amerika'er også dækket ind. Dermed når vi ned på et par hundrede stykker.

W3C - World Wide Web Consortium - har nogle udmærkede sider om disse forhold. Den, der er lettest at have med at gøre, finder du på adressen: http://www.w3.org/TR/WD-html40-970708/sgml/entities.html

Substansen af disse sider gengiver jeg på to yderligere sider om dette emne, nemlig websiden "Navngivne tegn for udvidede tegnsæt" og "Navngivne tegn for matematiske, græske og symbol-tegnsæt"

For megen yderligere forklaring og teori, må du klikke dig ind på W3C's websted. Jeg holder mig til nogle almindeligheder:

  1. Heldigvis har de fleste HTML-editorer en funktion, der i ét hug kan konvertere de fleste specielle tegn til deres HTML-tegnelement ækivivalent - og vice versa. Det betyder, at du ikke behøver at lære dig særlig meget vedr. disse tegnelementer.
  2. Når du kigger de to ovennævnte lister igennem, vil du - især fsv angår symbol-tegnsæt - opdage, at browsernes fortolkning af tegnelementerne lader noget tilbage at ønske. Tegn som punkttegn &bull; og dobbeltpile, f.eks &lArr;, vil ikke vises i selv moderne browsere. En kontrol i begge browsere er også nødvendig. Fordi et tegn kan vises i den ene browser er det ikke ensbetydende med, at det også kan vises i den anden browser.

I oversigterne på de to nævnte sider står tegnelementerne i "nummerorden". F.eks. svarer &nbsp; til ASCII-værdien 160. Skrivemåden for dette tegn kan således enten være &nbsp; eller &#160; - det er ligefedt. Faktisk er tegn-repræsentationerne i de to oversigter lavet ved hjælp af ASCII-værdierne.

Senest opdateret: 11. juni 2003.

Denne side er senest opdateret: 25. June, 2008