Wikipedia:Specialtecken
FrÄn Wikipedia
InnehÄll
- Vad Àr en artikel?
- Hur man skriver en bra artikel
- Skriv ut det sjÀlvklara
- Kontrollera fakta
- KÀllhÀnvisningar
- Illustrera artikeln
- SprÄkvÄrd
Formatering
- Disposition
- KrÄngla inte till det
- Specialtecken
Struktur
LĂ€nkar
Se Àven den engelska texten om specialtecken pÄ Meta-Wiki: m:Help:Special characters
InnehÄll |
[redigera] Teckenkodningssystem
FrÄn och med MediaWiki 1.5 anvÀnder alla projekten teckenkodningen UTF-8 (Unicode).
Innan denna nya version började anvÀndas i Wikimedia-projeten i slutet av juni 2005 anvÀnde den svenska, den danska, den engelska och den tyska Wikipedian teckenkodningen windows 1252 (de uppgav sig anvÀnda ISO-8859-1, men i praktiken likstÀller webblÀsare dessa tvÄ, och MediaWiki-mjukvaran hindrade inte uppladdning av windows-1252-koder). Wikitexter frÄn tiden före uppgraderingen sparas i windows-1252-format och konverteras till UTF-8 nÀr den laddas ned. Nya redigeringar sparas som UTF-8 i databasen. Dessa konverteringar Àr osynliga för anvÀndarna.
- Unicode (UTF-8)
- varierande antal bytes per tecken
- specialtecken, inklusive kinesiska, japanska och koreanska tecken, kan behandlas som vilka tecken som helst; inte bara pÄ webbsidorna, utan Àven i redigeringsrutan. Det Àr Àven möjligt att anvÀnda html-entiteter för att representera tecken - dessa konverteras inte automatiskt i redigeringsrutan.
- ISO 8859-1
- en byte per tecken
- specialtecken som inte finns tillgĂ€ngliga i den begrĂ€nsade teckenuppsĂ€ttningen sparas som HTML-entiteter i nĂ„gon av dessa tre varianter: namnreferens (€), decimalreferens (€) eller hexadecimalreferens (€). De tre exemplen inom parentes motsvarar alla eurosymbolen (âŹ). Redigeringsrutan visar den inmatade koden och webbsidan det önskade tecknet.
[redigera] Redigering av specialtecken
MĂ„nga tecken utöver de vanliga ASCII- och ISO-8859-1-tecknen Ă€r anvĂ€ndbara â till och med nödvĂ€ndiga â i Wikipedia. Det finns flera sĂ€tt att mata in dessa i wikisidorna:
- Mata in tecknet i redigeringsrutan frÄn ett tangentbord som innehÄller det sökta tecknet.
- Klipp-och-klistra in tecknet i redigeringsrutan frÄn en webbsida, ett dokument eller en tabell som innehÄller det sökta tecknet.
- AnvÀnd en funktion i ditt operativsystem för att mata in specialtecken i redigeringsrutan (till exempel hÄlla ned Alt och slÄ in en kod pÄ numeriska tangentbordet i Windows)
- Mata in tecknet som en HTML-teckenreferens, sĂ„ kallad HTML-entitet, och förhandsgranska för att se om det lyckats. HTML-entiteter kan vara namngivna, till exempel å producerar ett Ă„, ° producerar ett grad-tecken: °. Man kan Ă€ven anvĂ€nda en numerisk HTML-entitet dĂ€r numret hĂ€nvisar till tecknets position i Unicode-tabellerna. En numerisk HTML-entitet kan skrivas decimalt som Ӓ dĂ€r 1234 Ă€r efterfrĂ„gad position eller hexadecimalt som ꯍ dĂ€r ABCD Ă€r den hexadecimala positionen.
Notera att numeriska referenser mellan 128 och 159 (decimalt) inte motsvarar nÄgra tecken i Unicode-standarden (de finns i Windows-1252) och ska dÀrför inte anvÀndas. TÀnk ocksÄ pÄ att den som lÀser artiklarna inte nödvÀndigtvis har en lika komplett uppsÀttning typsnitt som du har och dÀrmed inte kan se de allra exklusivaste tecknen trots att dessa syns för dig.
[redigera] Esperanto
| i redigeringsrutan | i databasen och pÄ webbsidan |
| S | S |
| Sx | Ć |
| Sxx | Sx |
| Sxxx | Ćx |
| Sxxxx | Sxx |
| Sxxxxx | Ćxx |
Mediawiki-installationer för esperanto anvÀnder UTF-8 för lagring och visning. Vid redigering anvÀnds dock ett format som underlÀttar inmatning med de flesta tangentbord.
Detta gĂ€ller tecknen Ä, Ä, Ä€, ÄŽ, Ć, ĆŹ, Ä, Ä, Ä„, Ä”, Ć samt Ć. Den som har möjlighet kan mata in tecknen direkt, men dessa tecken kommer vid nĂ€sta redigering upptrĂ€da som Cx, Gx etc. i editeringsrutan. Denna metod att representera tecknen kallas x-sistemo eller x-kodo. Efter tecknen C, G, H, J, S, U, c, g, h, j, s, u dubbleras antalet x i editeringsrutan jĂ€mfört med vad som lagras i databasen av kompabilitetsskĂ€l.
Ett exempel: en sprÄklÀnk till [[sv:Luxor]] mÄste matas in som [[sv:Luxxor]] i den esperantiska Wikipedian. Detta kan stÀlla till det för automatiska sprÄklÀnksrobotar.
[redigera] WebblÀsarproblem
Vissa webblÀsare Àr ökÀnda för att göra trÄkiga saker med texten i redigeringsrutan. Ibland konverterar dessa tecknen till en teckentabell som anvÀnds pÄ dess plattform. Sedan lÄter webblÀsaren anvÀndaren redigera texten för att sedan konvertera tillbaka texten till webbplatsens teckenkodning. Resultatet blir dÄ att alla tecken som inte finns i den lokala teckentabellen ersÀtts med nÄgot som finns (vanligtvis ett frÄgetecken men Ätminstone en webblÀsare har observerats transliterera texten!).
[redigera] Internet Explorer för Macintosh v.?
Denna webblÀsare konverterar text till MacRoman i redigeringsrutan med resultatet att den förstör de flesta specialtecken.
[redigera] Netscape 4.x
Samma problem som för IE för Mac, men med andra teckentabeller Àn mac-roman.
[redigera] Terminal/kommandoprompt/konsol-webblÀsare
De textbaserade webblÀsare som körs i ett terminalfönster Àr helt beroende av terminalens teckenuppsÀttning. AnvÀnder terminalen UTF-8 ska det fungera bra.
[redigera] En sorts lösning
| I databasen och editerings- rutan för normala webblÀsare |
I editeringsrutan för dÄliga webblÀsare |
| Ć | œ |
| œ | œ |
| œ | œ |
NÀr de sista Wikipediorna bytte till UTF-8 och sprÄklÀnkarna efterhand byttes till ren Unicode började problemet med webblÀsare som sabbar specialtecken bli stort. För att komma runt problemet utarbetades en funktion som behandlar vissa webblÀsare annorlunda Àn övriga. WebblÀsare som Àr listade i instÀllningen $wgBrowserBlackList fÄr specialtecknen levererade som HTML-entiteter Àven om de Àr lagrade i rent UTF-8-format. Existerande hexadecimala HTML-entiteter fÄr en extra inledande nolla. För nÀrvarande Àr endast IE mac och en sÀrskild variant av Netscape 4.x för Linux listade som förstörande webblÀsare.
[redigera] Att visa specialtecken
De flesta av dagens webblÀsare kan hantera specialtecken, men vissa gör det bÀttre Àn andra. Det vanligaste problemet Àr att Internet Explorer förlitar sig pÄ förkonfigurerade typsnittstabeller i registret, snarare Àn att sjÀlv vÀlja ett typsnitt som innehÄller de efterfrÄgade tecknen. Detta innebÀr att IE mÄste tvingas (av webbsidan) till att anvÀnda vissa typsnitt. PÄ de olika Wikipediorna finns mallar som försöker underlÀtta teckenvisningen för anvÀndare av IE. Exempel pÄ detta Àr Mall:IPA (se respektive malls diskussionssida för rÄd och tips). Specialtecken som ingÄr i teckenlistan WGL4 bör fungera i IE utan hjÀlp av specialmallar.
Har du problem att se tecken pÄ ett speciellt sprÄk kan detta för det mesta lösas genom att ladda ner Code 2000. Observera att teckenuppsÀttningen Àr shareware, och upphovsrÀttsmannen vÀntar sig fÄ betalt efter en viss prövotid. All denna info framgÄr pÄ sidan i frÄga. NÀr du laddat ner programmet, lÀgg filen code2000.ttf i (din windowskatalog)\fonts. Starta sedan om datorn. Detta förutsÀtter att du anvÀnder dig av nÄgon version av Microsoft Windows.
[redigera] Tecken som bilder
Nabla Àr en symbol som inte stödjs av Windows 95 och 98. Man kan i stÀllet anvÀnda en bild genom att skriva [[Image:Del.gif]], vilket ger:
. För just nabla kan man Àven ÀnvÀnda matematisk typsÀttning <math>\nabla</math> vilket fÄr Wikipedia att skapa bilden.
Aktuella bibliotek av teckenbilder pÄ svenska wikipedia: Wikipedia:Rytmbibliotek.
[redigera] Se Àven
[redigera] Externa lÀnkar
- Unicode-resurser, samtliga pÄ engelska:
- http://www.unicode.org/charts/ Unicodes teckenlistor; (PDF-filer visar tecknen oavsett webblÀsare)
- Tabell över tecknen i Unicode frÄn nummer 1 till 65535
- HTML 4.0 Character Entity References - namngivna HTML-referenser
- FileFormat.Info - detaljerad information om mÄnga Unicodetecken
- Alan Wood's Unicode Resources - omfattande webbresurs med testsidor för alla Unicode-listor, OS-specifik information och lÀnkar till verktyg och typsnitt för de mer obskyra skriftsprÄken.