l2html.pdf
(
211 KB
)
Pobierz
1998
GUST, Zeszyt 10
37
Kiedy mo»e si¦ przyda¢ L
A
T
E
X2HTML.
Tworz e-
nie dokumentów hipertekstowych przy pomocy
systemu pierwotnie przeznaczonego do składu
tekstu wydaje si¦ rozwi¡zaniem nieco dysku-
syjnym. Bez w¡tpienia jest to metoda idealna
dla kogo± kto zna i u»ywa L
A
T
E
X-a i musi
szybko przygotowa¢ jaki± dokument nie tylko
do druku, ale tak»e do wykorzystania w serwi-
sie WWW. Teoretycznie L
A
T
E
X2HTML umo»liwia
tworzenie stron WWW bez potrzeby znajomo±ci
j¦zyka HTML. Efektywne wykorzystanie pakietu
mo»e jednak wymaga¢ od u»ytkownika znajomo-
±ci specyfiki dokumentów hipertekstowych, mi-
nimalnej chocia» znajomo±ci j¦zyka HTML oraz,
w przypadku potrzeby zmodyfikowania domy±l-
nego sposobu działania pakietu, tak»e j¦zyka Perl,
w którym jest napisany pakiet L
A
T
E
X2HTML. Zna-
jomo±¢ Perla b¦dzie tak»e konieczna w przypadku
potrzeby dodania obsługi niestandardowych makr
u»ywanych w przetwarzanym dokumencie.
L
A
T
E
X2HTML mo»e by¢ tak»e niezast¡pionym
narz¦dziem dla osób tworz¡cych dokumentacj¦ do
programów, która ma by¢ dost¦pna w formie
drukowanej w wersji hipertekstowej w formacie
HTML. U»ycie pakietu L
A
T
E
X2HTML mo»e by¢
w takim przypadku sposobem na osi¡gni¦cie
celu stosunkowo niewielkim kosztem. „Ideolo-
gicznie” lepsz¡ metod¡ byłoby wtedy tworzenie
dokumentacji w SGML-u, zastosowanie pakietu
L
A
T
E
X2HTML mo»e by¢ jednak prostsze i w wielu
przypadkach wystarczaj¡ce.
L
A
T
E
X2HTML mo»e by¢ tak»e najlepszym
rozwi¡zaniem problemu publikacji dokumentów
wcze±niej zło»onych w L
A
T
E
X-u, które trzeba opu-
blikowa¢ w WWW. Oczywi±cie w takim przy-
padku innym rozwi¡zaniem mo»e by¢ tak»e
umieszczenie dokumentu w formacie PDF. Cz¦-
sto jednak dobrze jest udost¦pni¢ dokumenty
w ró»nych postaciach tak, »eby odbiorca sam
mógł wybra¢ najbardziej odpowiadaj¡c¡ mu form¦
prezentacji. Ocena potrzeb i wybór odpowiednich
technik prezentacji i narz¦dzi do przygotowania
dokumentów zale»y od ka»dego przedsi¦wzi¦cia
zwi¡zanego z publikacj¡ dokumentów w wielu
postaciach.
L
A
T
E
X2HTML
Piotr Bolek
Streszczenie
Pakiet L
A
T
E
X2HTML oferuje dosy¢ specyficzny,
cho¢ nie pozbawiony pewnych zalet sposób two-
rzenia dokumentów hipertekstowych umo»liwia-
j¡c konwersj¦ dokumentów L
A
T
E
X-owych na format
HTML. Omówione zostan¡ instalacja i konfigura-
cja pakietu, pokazane b¦d¡ przykłady konwersji
ró»nych klas dokumentów L
A
T
E
X-owych (doku-
menty „czysto tekstowe”, dokumenty z ilustra-
cjami, dokumenty ze wzorami matematycznymi).
Omówione zostan¡ tak»e mo»liwo±ci zmiany do-
my±lnych ustawie« pakietu pozwalaj¡ce wpływa¢
na wygl¡d dokumentów HTML-owych generowa-
nych przy pomocy pakietu.
Wprowadzenie
Co to jest L
A
T
E
X2HTML.
L
A
T
E
X2HTML jest na-
rz¦dziem słu»¡cym do konwersji dokumentów
L
A
T
E
X-owych do formatu HTML. Pakiet ten po-
zwala wykorzysta¢ mo»liwo±ci jakie daje j¦zyk
makrodefinicji T
E
X-owych przy tworzeniu doku-
mentów hipertekstowych. Umo»liwia tak»e łatwe
tworzenie stron WWW wszystkim u»ytkownikom
L
A
T
E
X-a.
Dokument ¹ródłowy w L
A
T
E
X-u jest prze-
kształcany na zbiór poł¡czonych dokumentów
HTML-owych. L
A
T
E
X2HTML automatycznie ł¡czy
poszczególne dokumenty mi¦dzy sob¡ generuj¡c
odpowiednie odno±niki hipertekstowe. Wszystkie
odno±niki wewn¡trz dokumentu, takie jak odwo-
łania do sekcji, ilustracji, tabel, wzorów, nume-
rów stron pozycji bibliograficznych, przypisy itp.
s¡ przekształcane na odno±niki hipertekstowe.
Elementy typograficzne definiowane za po-
moc¡ polece« L
A
T
E
X-a, które maj¡ swoje odpo-
wiedniki w HTML-u (np. akapity, wyró»nienia
tekstu, wyliczenia) s¡ zamieniane na odpowia-
daj¡ce im znaczniki HTML-owe. Elementy doku-
mentu L
A
T
E
X-owego, które nie maj¡ bezpo±redniej
reprezentacji w j¦zyku HTML (np. wzory mate-
matyczne, rysunki, tabele) mog¡ by¢ automatycz-
nieprzekształconenamapybitoweiumieszczone
w odpowiednich miejscach w dokumencie HTML.
Mo»liwo±ci pakietu.
Pakiet L
A
T
E
X2HTML udost¦p-
nia nast¦puj¡ce mo»liwo±ci:
Podział dokumentu ¹ródłowego na oddzielne
strony HTML-owe poł¡czone odno±nikami hi-
© Copyright by Grupa U»ytkowników Systemu T
E
X 1998
http://www.GUST.org.pl
38
GUST, Zeszyt 10
1998
pertekstowymi. Stopie« „fragmentacji” mo»e
by¢ okre±lony przez u»ytkownika.
nam program L
A
T
E
X2HTML mówi¡c mu ewen-
tualnie, »e mo»na go ±ci¡gn¡¢ z najbli»szego
serwera zawieraj¡cego kopi¦ archiwum CTAN :::
i czekamy na załatwienie sprawy.
Je±li chcemy u»ywa¢ pakietu na naszym kom-
puterze osobistym, gdzie mamy zainstalowanego
np.Linuxasprawajestniecobardziejskom-
plikowana. Przede wszystkim musimy wcze±niej
zainstalowa¢ (lub upewni¢ si¦, »e mamy ju» za-
instalowane) pewne programy, z których korzysta
L
A
T
E
X2HTML:
Realizacja paneli nawigacyjnych, które mog¡
by¢ w prosty sposób modyfikowane przez
u»ytkownika. Panele takie s¡ automatycznie
umieszczane na ka»dej generowanej stronie.
Przetwarzanie dowolnych wzorów matema-
tycznych, automatyczna numeracja wzorów,
tabele,
rysunki
oraz
mo»liwo±¢
u»ywania
dowolnych ±rodowisk.
Mo»liwo±¢ dowolnego skalowania i obracania
rysunków.
Perl w wersji 5.002 lub wy»szej (dost¦pn¡
w systemie wersj¦ Perla mo»na sprawdzi¢
wywołuj¡c:
perl -v
);
Automatyczne rozwijanie definicji nowych po-
lece«, nawet je±li s¡ umieszczone w oddziel-
nym pliku – daje to mo»liwo±¢ tworzenia makr
HTML-owych w L
A
T
E
X-u.
oczywi±cie instalacja T
E
X-azL
A
T
E
X-em w wer-
sji L
A
T
E
X2" i programem dvips w wersji 5.58
lub wy»szej;
Obsługa przypisów, spisów tabel i rysunków,
bibliografii i indeksów.
interpreter Postsciptu Ghostscript w wersji
4.02 lub wy»szej;
Automatyczne przekształcanie odno±ników
i odwoła« do literatury w odno±niki hiper-
tekstowe. Rozszerzenie mo»liwo±ci definio-
wania odwoła« o obsług¦ odwoła« mi¦dzy
dokumentami.
pakiet programów do konwersji grafiki
netpbm
wersjaz1marca1994 (
pnmfile
-version
).
Procedura instalacyjna.
W celu zainstalowania
pakietu nale»y wykona¢ nast¦puj¡ce czynno±ci:
1.
Konstrukcje warunkowe umo»liwiaj¡ce de-
finiowanie oddzielnych fragmentów doku-
mentu umieszczanych w wersji hipertekstowej
albo papierowej.
Rozpakowa¢ pakiet dystrybucyjny. W syste-
mie Linux (i wsz¦dzie tam gdzie jest dost¦pny
program
tar
w wersji GNU) nale»y wywoła¢:
tar zxvf latex2html-
h
Mo»liwo±¢ umieszczania wstawek bezpo±red-
nio w j¦zyku HTML (np. w celu definiowania
formularzy).
xx
i
.tar.gz
W
innych
systemach
nale»y
rozpakowa¢
Ró»ne mechanizmy przetwarzania wzorów
matematycznych: przekształcanie całych wzo-
rów na grafik¦ (GIF lub PNG), etykiety
HTML-owe (HTML 3.0), przekształcanie na
grafik¦ cz¦±ci wzorów, których nie da si¦
zdefiniowa¢ tekstowo.
pakiet poleceniem:
gzip -cd latex2html-
h
xx
i
.gz \
| tar xvf -
Po rozpakowaniu, w bie»¡cym katalogu po-
jawi si¦ podkatalog
latex2html
, w którym
znajduj¡ si¦ wszystkie pliki nale»¡ce do pa-
kietu. Pakiet mo»e by¢ rozpakowany w do-
wolnym katalogu. W czasie instalacji w pli-
kach konfiguracyjnych i w samym skrypcie
latex2html
zostanie zapisana ±cie»ka do tego
katalogu.
Instalacja
Pakiet L
A
T
E
X2HTML jest przeznaczony dla syste-
mów unixopodobnych. Został on tak»e przenie-
siony do systemu Windows NT, ale ta wersja nie
jest jeszcze doł¡czona do „oficjalnego” pakietu
dystrybucyjnego. Tutaj zajmiemy si¦ wył¡cznie
wersj¡ unixow¡ (v. 98.1).
Instalacja pakietu L
A
T
E
X2HTML jest niezwykle
prosta, zwłaszcza je±li pracujemy w systemie, któ-
rym nie administrujemy. W takim przypadku zgła-
szamy administratorowi systemu, »e potrzebny jest
2.
Ustali¢ poło»enie programu Perl w systemie
(
which perl
,ij iró»ni ¦onood
tego co jest podane w pierwszym wierszu
plików
latex2html
,
texexpand
,
pstoimg
,
install-test
i
makemap
, to we wszystkich
tych plikach nale»y odpowiednio wiersz ten
zmieni¢.
1998
GUST, Zeszyt 10
39
Pierwszy dokument
3.
Skopiowa¢ pliki, które b¦d¡ u»ywane przez
L
A
T
E
X-a (czyli zawarto±¢ katalogu
texinputs
)
w miejsce, które jest przeszukiwane przez
L
A
T
E
X-a w czasie działania.
Spróbujmy wi¦c dokona¢ konwersji pierwszego
prostego dokumentu. Dokument ¹ródłowy jest
nast¦puj¡cy:
\documentclass{article}
\usepackage{polski}
\author{Piotr Bolek}
\title{Pierwszy dokument}
\begin{document}
\maketitle
\thispagestyle{empty}
To jest nasz pierwszy pro±ciutki dokument
\LaTeX-owy przeznaczony do
konwersji na HTML.
4.
Uruchomi¢ skrypt
install-test
. Skrypt ten
wykonuje wła±ciw¡ procedur¦ instalacyjn¡:
zapami¦tuje miejsce instalacji pakietu, spraw-
dza czy s¡ dost¦pne wszystkie programy
potrzebne do działania pakietu L
A
T
E
X2HTML
i zapisuje w pliku konfiguracyjnym
local.pm
±cie»ki do wszystkich zewn¦trznych progra-
mów wykorzystywanych przez pakiet. Skrypt
ten zadaje tak»e pytanie o format, w jakim
maj¡ by¢ generowane fragmenty tekstu repre-
zentowane jako grafika. Do wyboru s¡ dwa
formaty:
GIF
albo
PNG
. Obecnie w wi¦kszo-
±ci przypadków nale»y wybra¢ format
GIF
,
poniewa» jeszcze nie wszystkie przegl¡darki
WWW obsługuj¡ format
PNG
(
Netscape
ju»
tak).
\textbf{Kilka akapitów:}
Siaªa baba mak, nie wiedziaªa jak.
Siaªa baba mak, nie wiedziaªa jak.
...
5.
Teraz mo»na skopiowa¢ plik
latex2html
do katalogu, który nale»y do ±cie»ki po-
szukiwa« programów wykonywalnych (np.
/usr/local/bin
).
A dziad wiedziaª, nie powiedziaª.
A dziad wiedziaª, nie powiedziaª.
...
\emph{I próba wzoru}:
\begin{equation}
\Delta Q_1 = a_1 S_1
\sqrt{\frac2{\varrho p_{10}}}
\Delta p_1
\end{equation}
\end{document}
6.
Mo»na teraz tak»e zmodyfikowa¢ plik
la-
tex2html.config
dostosowuj¡c go do swo-
ich potrzeb. W przypadku instalowania pa-
kietu dla wielu u»ytkowników, w tym pliku
powinny by¢ ustawione globalne parametry
domy±lne, wspólne dla wszystkich u»ytkow-
ników. Ka»dy z u»ytkowników mo»e pó¹-
niej zast¡pi¢ je ustawieniami w prywatnych
plikach konfiguracyjnych
latex2html.init
w katalogach roboczych, albo w katalogach
domowych.
Efekt działania programu nie jest niestety ide-
alny. Co prawda program poradził sobie ze
wzorem zamieniaj¡c go na grafik¦, ale s¡ pro-
blemy z j¦zykiem polskim – zamiast polskich
literek pojawiły si¦ dziwne krzaczki. Nie jest
to na szcz¦±cie wielki problem, bo jak si¦ łatwo
domy±li¢ przyczyn¡ jest zadeklarowanie w pliku
wynikowym niewła±ciwego zestawu znaków. Do-
my±lnym zestawem znaków programu jest bo-
wiem
iso-8859-1
czyli
latin1
. Na szcz¦±cie
istnieje mo»liwo±¢ łatwej zmiany domy±lnego
zestawu znaków. Mo»na to zrobi¢ opcj¡ wywo-
łania, albo (lepiej) zmian¡ domy±lnego zestawu
znaków w pliku konfiguracyjnym.
Drugim problemem, ju» nie tak krytycznym,
s¡ angielskie napisy pojawiaj¡ce si¦ w panelu na-
wigacyjnym i na przyciskach. To tak»e mo»na sto-
sunkowo łatwo zmieni¢. Wymaga to umieszczenia
Po zainstalowaniu mo»na ju» zacz¡¢ u»ywa-
nie pakietu. Je±li mamy dokument L
A
T
E
X-owy,
który chcemy przetworzy¢ na HTML wystarczy
wywoła¢ polecenie:
latex2html
h
nazwa-pliku
i
gdzie
jest nazw¡ pliku ¹ródłowego
(mo»na pomin¡¢ w niej rozszerzenie
.tex
).
Po sko«czeniu działania programu w bie»¡cym
katalogu powstanie podkatalog
h
nazwa-pliku
i
(bez
rozszerzenia), zawieraj¡cy wersj¦ HTML-ow¡
naszego dokumentu. Sprawa wi¦c wygl¡da na
niezbyt skomplikowan¡. S¡ jednak jeszcze drobne
problemy.
h
nazwa-pliku
i
40
GUST, Zeszyt 10
1998
odpowiednie definicje zmieniaj¡ce te nazwy na
polskie znajduj¡ si¦ w pakiecie
polski
wł¡-
czanym do naszego dokumentu w nagłówku.
W konfiguracji programu L
A
T
E
X2HTML dost¦pna
jest zmienna
$TITLES_LANGUAGE
okre±laj¡ca w ja-
kim j¦zyku maj¡ by¢ generowane napisy. Obecnie
w standardowej wersji programu L
A
T
E
X2HTML do-
st¦pne jest wsparcie dla j¦zyka angielskiego, fran-
cuskiego i niemieckiego. Dodanie nowego j¦zyka
jest jednak spraw¡ stosunkowo prost¡.
Wprogramie
A
T
E
X2HTML mo»na tak»e de-
finiowa¢ pakiety perlowe obsługuj¡ce u»ywane
w dokumentach pakiety L
A
T
E
X-owe. Obsługa wielu
pakietów standardowych jest ju» zaimplemento-
wana – pakiet
polski
nie jest jeszcze niestety
traktowany jako standardowy. Przykład gene-
rowania dokumentów z uwzgl¦dnieniem j¦zyka
polskiego b¦dzie pokazany dalej.
Konguracja programu
Rys. 1.
Program L
A
T
E
X2HTML ma bardzo du»e mo»liwo-
±ci konfiguracyjne. Wiele parametrów konfigura-
cyjnych mo»na podawa¢ jako opcje wywołania
konwertera. Wszystkie te opcje maj¡ swoje odpo-
wiedniki w parametrach konfiguracyjnych, które
mo»na umieszcza¢ w globalnym pliku konfigura-
cyjnym (
latex2html.config
), w plikach konfigu-
racyjnych u»ytkowników (
.latex2html-init
)albo
w plikach podawanych w opcjach
-init_file
.
Wszystkie pliki konfiguracyjne s¡ przy wywoła-
niu programu interpretowane jako zwyczajny kod
perlowy. Zawieraj¡ one najcz¦±ciej po prostu przy-
pisania warto±ci pewnym zmiennym, które wpły-
waj¡ na działanie konwertera. Pliki konfiguracyjne
s¡ wł¡czane do programu głównego perlowym
poleceniem
require
na pocz¡tku działania kon-
wertera. Typowe pozycje w pliku konfiguracyjnym
wygl¡daj¡ nast¦puj¡co:
odpowiednich deklaracji w pliku konfiguracyjnym
i przygotowania własnych, spolszczonych wersji
przycisków.
L
A
T
E
X2HTML a sprawa polska
Definitywne rozwi¡zanie problemu polskiego
w pakiecie L
A
T
E
X2HTML jest spraw¡ prost¡.
Twórcy pakietu przewidzieli, »e b¦d¡ go u»ywa¢
tak»e ludzie posługuj¡cy si¦ nie tylko j¦zykiem
angielskim
i
zaimplementowali
odpowiednie
mechanizmy.
Przede wszystkim dost¦pna jest opcja o na-
zwie
-html_version
,którejjednymzparame-
trów jest zestaw znaków u»ywany w dokumen-
cie. Mo»liwe jest konwertowanie dokumentów
zakodowanych z wykorzystaniem standardów
ISO-Latin-[123456] oraz cz¦±ciowa obsługa stan-
dardu Unicode. Dodanie do opcji
-html_version
warto±ci
latin2
, spowoduje »e w nagłówku
dokumentu HTML-owego pojawi si¦ deklaracja:
<META HTTP-EQUIV="Content-Type"
CONTENT="text/html;
charset=iso-8859-2">
$PARAMETR_PIERWSZY = 1;
$PARAMETR_DRUGI = "tekst";
1;
Zmienne w Perlu zawsze zaczynaj¡ si¦ znakiem
dolara, a kolejne instrukcje rozdzielane s¡ znakiem
±rednika. Warto±¢ parametru mo»e by¢ liczb¡,
albo ci¡giem znaków. W ostatnim wierszu pliku
konfiguracyjnego musi znajdowa¢ si¦ liczba 1
(jeden) i ±rednik.
Poniewa» pliki konfiguracyjne s¡ zwyczajnymi
fragmentami kodu w Perlu, to mo»na w nich tak»e
Mo»liwe jest tak»e spolszczenie napisów genero-
wanych, czyli uzyskanie:
Spis tre±ci
zamiast
Con-
tents
,
Bibliografia
zamiast
References
itd. W L
A
T
E
X-u
1998
GUST, Zeszyt 10
41
definiowa¢ procedury. Jest to wykorzystywane np.
przy definiowaniu nowej wersji j¦zykowej oraz
przy definiowaniu własnych nagłówków i stopek
ka»dej strony.
Skongurowanie pakietu do obsªugi j¦zyka
polskiego
Aby L
A
T
E
X2HTML poprawnie obsługiwał doku-
menty w j¦zyku polskim trzeba nieco pogrzeba¢
w konfiguracji. Trzeba b¦dzie zdefiniowa¢ kilka
zmiennych i co najmniej jedn¡ procedur¦.
Oto plik konfiguracyjny modyfikuj¡cy podsta-
wowe zachowanie konwertera tak aby generował
on dokumenty w j¦zyku polskim:
$CHARSET="iso_8859_2";
$HTML_VERSION="3.2,latin2";
$TITLES_LANGUAGE='polish';
sub polish_titles {
$toc_title = "Spis tre±ci";
$lof_title = "Spis rysunków";
$lot_title = "Spis tabel";
$idx_title = "Skorowidz";
$ref_title = "Bibliografia";
$bib_title = "Bibliografia";
$abs_title = "Streszczenie";
$app_title = "Dodatek";
$pre_title = "Przedmowa";
$fig_name = "Rysunek";
$tab_name = "Tabela";
$part_name = "Cz¦±¢";
$prf_name = "Dowód";
$child_name = "Podrozdziaªy";
$info_title="Informacje o dokumencie";
@Month = ('', 'stycze«', 'luty',
'marzec', 'kwiecie«', 'maj',
'czerwiec', 'lipiec', 'sierpie«',
'wrzesie«', 'pa¹dziernik',
'listopad', 'grudzie«');
Rys. 2.
przez konwerter jest polski. Poniewa» domy±l-
nie w programie L
A
T
E
X2HTML nie s¡ zdefinio-
wane polskie tytuły, to musimy zrobi¢ to sami.
W tym celu definiujemy procedur¦ o nazwie
polish_titles
. Procedura ta zostanie automa-
tycznie wywołana przez konwerter na pocz¡tku
działania, dzi¦ki czemu zmienne okre±laj¡ce ge-
nerowane przez konwerter teksty b¦d¡ miały
jako warto±ci odpowiednie słowa polskie. Dodat-
kowo na ko«cu procedury jest definiowana tablica
z polskimi nazwami miesi¦cy.
Na samym ko«cu naszego pliku konfigura-
cyjnego jest umieszczona procedura słu»¡ca do
definiowania wygl¡du panelu steruj¡cego. Nie po-
daj¦ tutaj jej definicji, poniewa» jest to ona skopio-
wana z oryginalnego pliku konfiguracyjnego
la-
tex2html.config
, ze zmienionymi napisami:
Next
na
Nast¦pny
itd.
Je±li
}
sub top_navigation_panel {
...
}
zapiszemy
t¦
konfiguracj¦
w
pliku
pl1.cnf
iwywołamykonwerter:
latex2html -init_file pl1.cnf test2
W tym przykładzie na pocz¡tku definiujemy ko-
dowanie u»ywanego zestawu znaków. Dla po-
prawnego ustawienia u»ywanego w dokumencie
kodowania wystarczy u»ycie jednej z podanych
konstrukcji. W trzecim wierszu podajemy, »e j¦-
zykiem w jakim b¦d¡ pisane tytuły generowane
to mo»emy otrzyma¢ stron¦ jak na rys. 2. Wida¢
tam, »e zamiast
Next
pojawiło si¦ słowo
Nast¦pny
,
zamiast
Abstract
–
Streszczenie
i zamiast
About
this document... Informacje o dokumencie
.Niestety
w j¦zyku angielskim s¡ jeszcze napisy na ikonach
Plik z chomika:
grzegorj
Inne pliki z tego folderu:
01-pt.pdf
(180 KB)
02-ab.pdf
(109 KB)
02-mw1.pdf
(145 KB)
02-pt.pdf
(219 KB)
03-bj.pdf
(51 KB)
Inne foldery tego chomika:
__Programy
_Asembler
_Asp
_Basic
_C
Zgłoś jeśli
naruszono regulamin