HTMLtypo

Ten skrypt poprawia dwa typowe błędy twórców HTML. Po pierwsze zamienia "angielskie" cudzysłowy na „polskie”. Po drugie zamiast dywizów ('-') wstawia pauzy (dłuższą i węższą kreskę) tam gdzie to potrzebne (wtrącenia, oznaczenia dialogów itp.).

Zestaw znaków Unicode zawiera znaki odpowiednie do polskiej typografii, a więc „polskie” i >>francuskie<< cudzysłowy oraz pauzę. Jednak stosowanie ich bezpośrednio w tekście który tworzymy jest niewygodne, ze względu na sposób ich wprowadzania (przez encje). Dlatego też głównym przeznaczeniem tego skryptu jest końcowa obróbka tekstu w którym stosowano zwykłe "cudzysłowy" i 'cudzysłowy' oraz dywizy.

Treść

Cudzysłowy

Poza zwykłymi cudzysłowami, które są zamieniane tak jak pokazano we wstępie, zamieniane są również cudzysłowy zagnieżdżone. W tekście należy stosować znak apostrofu ('). Np. "I powiedział: 'Do diaska!'" zostanie zamieniony na: „I powiedział: >>Do diaska!<<”.

Niezagnieżdżone 'cudzysłowy' nie są zamieniane (to poprawny zapis, choć nie rozpowszechniony).

Tekst pomiędzy tagami <pre></pre> nie jest zmieniany.

Pauzy

Jeśli dywiz jest otoczony spacjami, to oznacza, że ma być w tym miejscu pauza. Stosowanie dywizu w złączeniach, np. biało-czerwony, jest jak najbardziej prawidłowe.

Można wymusić wstawienie pauzy wpisując dwa dywizy, czyli '--'. To może być dobre rozwiązanie np. przy zapisywaniu dat (1280--1324).

Twarda spacja

Podając opcję -t wszystkie wystąpienia tyldy (~) są zamieniane na twardą spację. Słowa połączone twardą spacją nie są dzielone pomiędzy liniami. Pomyślane do zapisu dat, gdzie oznaczanie r. (np. 2005~r.) powinno być przenoszone razem z rokiem; także zapis tytułów naukowych wymaga, by tytuł występował zawsze przed nazwiskiem.

Dzielenie liczb na klasy

Liczby reprezentowane przez więcej niż cztery cyfry powinny być grupowane po trzy i rozdzielane spacją; spacja w tym przypadku powinna być wąska. W HTML-u jest odpowiedni znak (&thinsp;), ale prawdopodobnie nie każdy font zainstalowany w przeglądarce go posiada. Stąd dwie opcje:

  1. -n — używane są niełamliwe spacje (&nbsp;)
  2. -N — używane są wąskie spacje (&thinsp;)

Historia zmian

05.02.2005
  • użytkownik jest ostrzegany, gdy nie zamknięto ostatniego cudzysłowu; to zwykle oznacza, że gdzieś wcześniej brakuje znaku " lub jest jakiś nadmiarowy
  • kilka drobnych poprawek
19.01.2005
  • tekst zamknięty pomiędzy tagami <pre>/</pre> nie jest zmieniany
17.01.2005
  • dodane grupowanie cyfr w klasy, w liczbach, które składają się z więcej niż 5 cyfr (opcje -n i -N)

Autor

Wojciech Muła, wojciech_mula#poczta!onet!pl ('#' = '@', '!' = '.')