xml-szybki-start-wydanie-ii-kevin-howard-goldberg

Tytuł oryginału: XML Visual QuickStart Guide (2nd Edition) Tłumaczenie: Lech Lachowski ISBN: 978-83-246-8240-9 Authorized translation from the English...

13 downloads 25 Views 13MB Size

Download PDF

Tytuł oryginału: XML Visual QuickStart Guide (2nd Edition) Tłumaczenie: Lech Lachowski ISBN: 978-83-246-8240-9 Authorized translation from the English language edition, entitled: XML: VISUAL QUICKSTART GUIDE, Second Edition; ISBN 0321559673; by Kevin Howard Goldberg; published by Pearson Education, Inc, publishing as Peachpit Press. Copyright © 2009 by Kevin Howard Goldberg and Elizabeth Castro. All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means, electronic or mechanical including photocopying, recording or by any information storage retrieval system, without permission from Pearson Education, Inc. Polish language edition published by HELION S.A., Copyright © 2014. Wszelkie prawa zastrzeżone. Nieautoryzowane rozpowszechnianie całości lub fragmentu niniejszej publikacji w jakiejkolwiek postaci jest zabronione. Wykonywanie kopii metodą kserograficzną, fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym lub innym powoduje naruszenie praw autorskich niniejszej publikacji. Wszystkie znaki występujące w tekście są zastrzeżonymi znakami firmowymi bądź towarowymi ich właścicieli. Autor oraz Wydawnictwo HELION dołożyli wszelkich starań, by zawarte w tej książce informacje były kompletne i rzetelne. Nie biorą jednak żadnej odpowiedzialności ani za ich wykorzystanie, ani za związane z tym ewentualne naruszenie praw patentowych lub autorskich. Autor oraz Wydawnictwo HELION nie ponoszą również żadnej odpowiedzialności za ewentualne szkody wynikłe z wykorzystania informacji zawartych w książce. Wydawnictwo HELION ul. Kościuszki 1c, 44-100 GLIWICE tel. 32 231 22 19, 32 230 98 63 e-mail: [email protected] WWW: http://helion.pl (księgarnia internetowa, katalog książek) Drogi Czytelniku! Jeżeli chcesz ocenić tę książkę, zajrzyj pod adres http://helion.pl/user/opinie/xmlss2_ebook Możesz tam wpisać swoje uwagi, spostrzeżenia, recenzję. Pliki z przykładami omawianymi w książce można znaleźć pod adresem: ftp://ftp.helion.pl/przyklady/xmlss2.zip Printed in Poland.  Poleć książkę na Facebook.com

 Księgarnia internetowa

 Kup w wersji papierowej

 Lubię to! » Nasza społeczność

 Oceń książkę

Dedykacja Książkę tę dedykuję mojej żonie Lainie. W zamian za męczące weekendy, namiastki wieczorów i przepełnioną sypialnię, oferuję jej tę książkę. Jestem prawdziwym wybrańcem losu.

Podziękowania Dla Michaela Weissa, mojego partnera biznesowego (od ponad jedenastu lat), a jednocześnie szwagra i przyjaciela. Jego wsparcie w całym tym procesie, niesamowita zdolność widzenia rzeczy z perspektywy czytelnika i chęć do robienia tego, co należy, kiedy ja okazywałem się czasem zbyt zajęty, były dla mnie bezcenne. Dla Chrisa Hare, mojego redaktora technicznego, za podjęcie ryzyka związanego z tematem XML. Za nauczenie mnie subtelności związanych z interpunkcją (dwukropki, średniki i wyrażenia w nawiasach — o rany!) i za tak dużą skrupulatność, że kiedy otrzymywałem materiały z mniej niż tuzinem poprawek na stronie, byłem zaniepokojony. Dla pracowników Imagistic (Chris, Heidi, Robert, Sam, Tamara oraz Will), którzy mimo że nie wiedzieli, co się święci, z gracją i humorem zajmowali się wszystkimi sprawami. Dla Davida Van Ness, nadzwyczajnego redaktora nadzorującego w Peachpit, który był tak bardzo pomocny, pomysłowy, uczynny, dostępny i cierpliwy. Dla Nancy Davis, redaktor naczelnej w Peachpit, za dostrzeganie wszystkich możliwości i wspieranie tego złożonego procesu do samego końca. Na koniec specjalne podziękowania dla Elizabeth Castro, której otwartość, szczerość i uczciwość oraz pierwsze wydanie tej książki umożliwiły powstanie wydania drugiego.

Przedmowa Elizabeth Castro Język XML przebył długą drogę od czasu, kiedy pisałam pierwsze wydanie tej książki. Jest on teraz tak powszechny, jak egzotyczny był wtedy. W zeszłym roku podczas wizyty w Kalifornii wpadłam na mojego przyjaciela Kevina Goldberga. Poznaliśmy się na studiach i niegdyś podczas pobytu w Barcelonie sporo graliśmy razem w Boggle. Kiedy zaoferował mi pomoc przy korekcie merytorycznej mojej książki, od razu przyjęłam propozycję. Kevin pracuje w branży komputerowej od ponad dwudziestu lat. Swoją karierę rozpoczynał jako programista i producent gier wideo. Od roku 1997 Kevin jest partnerem oraz dyrektorem ds. technologii w zlokalizowanej w południowej Kalifornii firmie Imagistic, która zajmuje się tworzeniem stron i świadczeniem usług internetowych i była wielokrotnie nagradzana za swoje osiągnięcia. W tej roli regularnie udziela pomocy klientom w zakresie określania ich potrzeb biznesowych oraz wyjaśniania natury i przydatności potencjalnych rozwiązań technologicznych, co w pewnym sensie można potraktować jako demaskowanie samej technologii. Poza tymi wszystkimi zaletami, Kevin jest świetnym facetem. Jest bystry, sumienny, kreatywny, nie wspominając już o jego dbałości o szczegóły. Poza aktualizacją zawartości oraz przykładów z tej książki, Kevin dodał rozdziały na temat XSL-FO, najnowszych rekomendacji W3C (XSLT 2.0, XPath 2.0 oraz XQuery 1.0), a także poświęcony realnym przykładom rozdział pod tytułem „XML w praktyce”. Jestem przekonana, że XML. Szybki start okaże się doskonałym podręcznikiem do nauki języka XML. Elizabeth Castro Autorka książki Po prostu XML

O autorze Kevin Howard Goldberg pracuje z komputerami od 1976 r., kiedy to nauczył się języka BASIC na komputerze PDP 11/70 w szkole podstawowej. Od tego czasu kariera Kevina wiązała się z doradztwem w zakresie zarządzania wykorzystującym symulacje biznesowe oraz z rozwijaniem oprogramowania licznych gier wideo w wielomilionowych projektach firm Film Roman i Lionsgate (poprzednio Trimark). Jego obecnym zadaniem jest prowadzenie operacji technologicznych dla światowej klasy firmy działającej na rynku strategii, marketingu i rozwoju internetowego, a zlokalizowanej w Westlake Village w Kalifornii. Kevin zasiada w radzie doradczej informatyki i systemów informatycznych przy uniwersytecie w Santa Monica i jako ekspert z zakresu rozwoju i produkcji aplikacji internetowych został zaproszony do wystąpienia na konferencji ACLU Nationwide Staff Conference. Kevin posiada tytuł licencjata w dziedzinie ekonomiki zarządzania przedsiębiorstwami zdobyty w Wharton School of Business na Uniwersytecie Pensylwanii i jest kandydatem do tytułu magistra w dziedzinie informatyki na Uniwersytecie Kalifornijskim w Los Angeles.

Prawa autorskie do ilustracji  Fotografia głowy Herodota w Stoi Attalosa (nr inw. S270) autorstwa Samuela Provosta.  Obrazy siedmiu cudów starożytnego świata autorstwa szesnastowiecznego holenderskiego

artysty Martena Jacobszoona Heemskerka van Veen, należą do dziedzictwa powszechnego.

Spis treści Spis treści

Wprowadzenie

Część I

XML

Rozdział 1.

Pisanie dokumentów XML

11

19 21

Część II

XSL

35

Rozdział 2.

XSLT

37

Spis treści

Przykładowy dokument XML . ...........................................................................................22 Zasady pisania dokumentów XML . ....................................................................................23 Elementy, atrybuty i wartości . ...........................................................................................24 Jak zacząć . ............................................................................................................................25 Tworzenie elementu głównego . .........................................................................................26 Pisanie elementów-dzieci . ..................................................................................................27 Zagnieżdżanie elementów . .................................................................................................28 Dodawanie atrybutów . ........................................................................................................29 Stosowanie pustych elementów . ........................................................................................30 Pisanie komentarzy . ............................................................................................................31 Encje predefiniowane — pięć znaków specjalnych ...........................................................32 Wyświetlanie elementów w postaci tekstu .........................................................................33

Przekształcanie dokumentów XML za pomocą XSLT .......................................................38 Inicjowanie arkusza stylów XSLT . .....................................................................................40 Tworzenie szablonu głównego . ..........................................................................................41 Uzyskiwanie pliku wyjściowego HTML .............................................................................42 Wyświetlanie wartości . .......................................................................................................44 Zapętlanie węzłów . ..............................................................................................................46 Warunkowe przetwarzanie węzłów . ..................................................................................48 Dodawanie wyborów warunkowych ...................................................................................49 Sortowanie węzłów przed przetworzeniem ........................................................................50 Generowanie atrybutów wyjściowych . ..............................................................................51 Tworzenie i stosowanie szablonów .....................................................................................52

5

Spis treści Rozdział 3.

Wzorce i wyrażenia XPath

55

Lokalizowanie węzłów . .......................................................................................................56 Ustalanie bieżącego węzła . .................................................................................................58 Odwoływanie się do węzła bieżącego .................................................................................59 Wybieranie dzieci danego węzła . .......................................................................................60 Wybieranie rodzica lub rodzeństwa danego węzła ............................................................61 Wybieranie atrybutów węzła . .............................................................................................62 Warunkowe wybieranie węzłów . .......................................................................................63 Tworzenie bezwzględnych ścieżek lokalizacji ....................................................................64 Wybieranie wszystkich potomków . ....................................................................................65

Spis treści

Rozdział 4.

Funkcje XPath

67

Porównywanie dwóch wartości . .........................................................................................68 Testowanie pozycji . .............................................................................................................69 Mnożenie, dzielenie, dodawanie i odejmowanie ...............................................................70 Liczenie węzłów . .................................................................................................................71 Formatowanie liczb . ............................................................................................................72 Zaokrąglanie liczb . ..............................................................................................................73 Wyodrębnianie podciągów . ................................................................................................74 Zmienianie wielkości znaków w ciągu . ...........................................................................75 Sumowanie wartości . ...........................................................................................................76 Więcej funkcji języka XPath . ..............................................................................................77

Rozdział 5.

XSL-FO

79

Dwie części dokumentu XSL-FO . .....................................................................................80 Tworzenie dokumentu XSL-FO ..........................................................................................81 Tworzenie i stylizowanie bloków zawartości strony ...........................................................82 Dodawanie obrazków . .........................................................................................................83 Definiowanie szablonu strony . ...........................................................................................84 Tworzenie nagłówka szablonu strony .................................................................................85 Tworzenie dokumentów XSL-FO za pomocą XSLT .........................................................86 Wstawianie podziałów stron . ..............................................................................................87 Wyświetlanie zawartości strony w kolumnach ...................................................................88 Dodawanie szablonu nowej strony . ....................................................................................89

Część III

DTD

91

Rozdział 6.

Tworzenie dokumentów DTD

93

Praca z dokumentami DTD . ...............................................................................................94 Definiowanie elementu zawierającego tekst ......................................................................95 Definiowanie pustego elementu .........................................................................................96 Definiowanie elementu, który zawiera element-dziecko ..................................................97 Definiowanie elementu, który zawiera kilka elementów-dzieci .......................................98 Definiowanie liczby wystąpień . ..........................................................................................99

6

Spis treści Definiowanie wyborów . ....................................................................................................100 Definiowanie elementu, który ma dowolną zawartość ....................................................101 Kilka słów o atrybutach . ....................................................................................................102 Definiowanie atrybutów . ..................................................................................................103 Definiowanie wartości domyślnych . ................................................................................104 Definiowanie atrybutów z wyborami . .................................................................................105 Definiowanie atrybutów z wartościami unikatowymi ......................................................106 Odwoływanie się do atrybutów z wartościami unikatowymi ...........................................107 Ograniczanie atrybutów do poprawnych nazw XML ......................................................108

Rozdział 7.

Encje i notacje w dokumentach DTD

109

Tworzenie encji ogólnej . ...................................................................................................110 Korzystanie z encji ogólnych . ...........................................................................................111 Tworzenie zewnętrznej encji ogólnej . ..................................................................................112 Korzystanie z zewnętrznych encji ogólnych .....................................................................113 Tworzenie encji dla zawartości nieparsowanej ................................................................114 Wstawianie zawartości nieparsowanej ..............................................................................116 Tworzenie i wykorzystywanie encji parametrycznych .................................................118 Tworzenie zewnętrznej encji parametrycznej ..................................................................119

Walidacja i używanie DTD

121

Spis treści

Rozdział 8.

Tworzenie zewnętrznego dokumentu DTD .....................................................................122 Deklarowanie zewnętrznego DTD . .................................................................................123 Deklarowanie i tworzenie wewnętrznego DTD ..............................................................124 Walidacja dokumentów XML względem DTD ...............................................................125 Nazywanie publicznego zewnętrznego DTD ...................................................................126 Deklarowanie publicznego zewnętrznego DTD ..............................................................127 Wady i zalety DTD . ..........................................................................................................128

Część IV

XML Schema

Rozdział 9.

Podstawy XML Schema

129 131

Praca z XML Schema . .......................................................................................................132 Rozpoczynanie prostego dokumentu XML Schema ........................................................134 Wiązanie XML Schema z dokumentem XML .................................................................135 Dodawanie adnotacji do schematów . ..................................................................................136

Rozdział 10.

Definiowanie typów prostych

137

Definiowanie elementu jako typu prostego ......................................................................138 Używanie typów daty i czasu . ...........................................................................................140 Używanie typów liczbowych . ...........................................................................................142 Predefiniowanie zawartości elementu ..............................................................................143 Wywodzenie niestandardowych typów prostych .............................................................144 Wywodzenie nazwanych typów niestandardowych .........................................................145

7

Spis treści Określanie zakresu dopuszczalnych wartości ...................................................................146 Określanie zbioru dopuszczalnych wartości .....................................................................148 Ograniczanie długości elementu . .....................................................................................149 Określanie wzorca dla elementu . .....................................................................................150 Ustawianie limitu cyfr w liczbie . ......................................................................................152 Wywodzenie typu listy . .....................................................................................................153 Wywodzenie typu łączonego . ...........................................................................................154

Rozdział 11.

Definiowanie typów złożonych

155

Spis treści

Podstawy typów złożonych . ..............................................................................................156 Wywodzenie anonimowych typów złożonych ..................................................................158 Wywodzenie nazwanych typów złożonych .......................................................................159 Definiowanie typów złożonych, które zawierają elementy-dzieci ..................................160 Ustalanie określonej sekwencji dla występowania elementów-dzieci ............................161 Dopuszczanie, aby elementy-dzieci pojawiały się w dowolnej kolejności ........................162 Tworzenie zbioru wyborów . .............................................................................................163 Definiowanie elementów zawierających wyłącznie tekst ................................................164 Definiowanie pustych elementów .....................................................................................165 Definiowanie elementów z zawartością mieszaną ...........................................................166 Wywodzenie typów złożonych z innych istniejących typów złożonych ......................167 Odwoływanie się do elementów zdefiniowanych globalnie ............................................168 Kontrolowanie liczby wystąpień . .....................................................................................169 Definiowanie nazwanych grup modelowych ....................................................................170 Odwoływanie się do nazwanej grupy modelowej ............................................................171 Definiowanie atrybutów . ..................................................................................................172 Wymaganie atrybutu . ........................................................................................................173 Predefiniowanie zawartości atrybutu . ..............................................................................174 Definiowanie grup atrybutów . .........................................................................................175 Odwoływanie się do grup atrybutów . .................................................................................176 Lokalne i globalne definicje . .............................................................................................177

Część V

Przestrzenie nazw

Rozdział 12.

Przestrzenie nazw XML

179 181

Projektowanie nazwy przestrzeni nazw ............................................................................182 Deklarowanie domyślnej przestrzeni nazw ......................................................................183 Deklarowanie prefiksu nazwy przestrzeni nazw ..............................................................184 Oznaczanie elementów prefiksem przestrzeni nazw .......................................................185 W jaki sposób przestrzenie nazw wpływają na atrybuty ..................................................186

Rozdział 13.

Używanie przestrzeni nazw XML

187

Wypełnianie przestrzeni nazw XML ................................................................................188 Dokumenty XML Schema, dokumenty XML oraz przestrzenie nazw . ..........................189 Odwoływanie się do komponentów XML Schema w przestrzeniach nazw ......................190

8

Spis treści Przestrzenie nazw i walidacja dokumentów XML ...........................................................191 Dodawanie wszystkich elementów zdefiniowanych lokalnie ..........................................192 Dodawanie poszczególnych elementów zdefiniowanych lokalnie .....................................193 Definicje XML Schema w kilku plikach ...........................................................................194 Dokumenty XML Schema z kilkoma przestrzeniami nazw ............................................195 Schemat schematów jako ustawienie domyślne ...............................................................196 Przestrzenie nazw i dokumenty DTD . ................................................................................197 XSLT i przestrzenie nazw . ................................................................................................198

Część VI

Najnowsze rekomendacje W3C

Rozdział 14.

XSLT 2.0

199 201

Rozdział 15.

XPath 2.0

211

XPath 1.0 i XPath 2.0 . .......................................................................................................212 Uśrednianie wartości w sekwencji ....................................................................................214 Wyznaczanie wartości minimalnej lub maksymalnej .......................................................215 Formatowanie ciągów znaków . .........................................................................................216 Testowanie warunków . .....................................................................................................217 Kwantyfikacja warunku . ....................................................................................................218 Usuwanie zduplikowanych pozycji ...................................................................................219 Zapętlanie sekwencji . ........................................................................................................220 Używanie bieżącej daty i czasu . .......................................................................................221 Pisanie komentarzy . ..........................................................................................................222 Przetwarzanie danych wejściowych typu nie-XML .........................................................223

Rozdział 16.

XQuery 1.0

225

XQuery 1.0 a XSLT 2.0 . ....................................................................................................226 Redagowanie dokumentu XQuery . ..................................................................................227 Identyfikowanie dokumentu źródłowego XML ...............................................................228 Używanie wyrażeń ścieżkowych . .....................................................................................229 Pisanie wyrażeń FLWOR . ................................................................................................230 Testowanie za pomocą wyrażeń warunkowych ................................................................232 Łączenie dwóch powiązanych źródeł danych ...................................................................233 Tworzenie i wywoływanie funkcji definiowanych przez użytkownika ...........................234 XQuery i bazy danych . ......................................................................................................235

9

Spis treści

Rozszerzanie XSLT . ..........................................................................................................202 Tworzenie uproszczonego arkusza stylów ........................................................................203 Generowanie dokumentów wynikowych XHTML ..........................................................204 Generowanie wielu dokumentów wynikowych ................................................................205 Tworzenie funkcji definiowanych przez użytkownika .....................................................206 Wywoływanie funkcji definiowanych przez użytkownika ...............................................207 Grupowanie danych wynikowych na podstawie wspólnych wartości .............................208 Walidacja plików wynikowych XSLT ...............................................................................209

Spis treści

Część VII XML w praktyce Rozdział 17.

Ajax, RSS, SOAP i inne zastosowania języka XML

237 239

Podstawy technologii Ajax . ...............................................................................................240 Przykłady zastosowania techniki Ajax ............................................................................242 Podstawy RSS . ...................................................................................................................245 Schematy RSS . ..................................................................................................................246 Rozszerzanie RSS . .............................................................................................................247 SOAP i usługi internetowe . ..............................................................................................249 Schemat komunikatu SOAP . ............................................................................................250 WSDL . ...............................................................................................................................251 Podstawy KML . .................................................................................................................253 Prosty plik KML . ...............................................................................................................254 ODF i OOXML . ................................................................................................................255 eBook, ePub itp. . ...............................................................................................................257 Narzędzia dla XML-a w praktyce .....................................................................................259

Spis treści

Dodatki Dodatek A

Narzędzia XML

261 263

Edytory XML . ...................................................................................................................264 Dodatkowe edytory XML . ................................................................................................266 Narzędzia i zasoby XML . ..................................................................................................267

Dodatek B

Zestawy znaków i encje

269

Określanie sposobu kodowania znaków ............................................................................270 Używanie numerycznych odwołań znakowych ................................................................271 Korzystanie z referencji encji . ..........................................................................................272 Znaki Unicode . ..................................................................................................................273

Skorowidz

10

275

Wprowadzenie

W

Wprowadzenie Czas internetu — wyrażenie, którego znaczenie szybko stało się jasne: rzeczy dzieją się znacznie szybciej, niż standardowo można by oczekiwać. Pierwsza strona WWW została uruchomiona online w 1991 r. Obecnie, czyli ponad 20 lat później, liczbę stron WWW działających online szacuje się na mniej więcej sto milionów. Ilość informacji dostępnych za pośrednictwem internetu stała się praktycznie niemożliwa do określenia. Większość z tych informacji została napisana w języku HTML (ang. HyperText Markup Language), który jest prostym, ale eleganckim sposobem prezentowania danych w przeglądarkach internetowych. Prostota HTML-a pomogła zwiększyć popularność sieci WWW. Jednak w zestawieniu z ogromną i nadal rosnącą ilością informacji dostępnych w internecie, język ten okazał się mieć pewne realne ograniczenia.

Na początku tej książki zaprezentowane zostaną podstawy języka XML. Następnie na bazie tej wiedzy omówione będą dodatkowe i uzupełniające języki oraz systemy. Aby wynieść z lektury tej książki jak najwięcej, powinieneś w pewnym stopniu znać język HMTL, nie musisz jednak w żadnym wypadku być ekspertem od programowania. Żadna inna wiedza z tego zakresu nie będzie konieczna.

11

Wprowadzenie

W ciągu siedmiu lat od opublikowania pierwszego wydania tej książki język XML (ang. eXtensible Markup Language) zajął poczesne miejsce obok HMTL-a, jako podstawowy język w internecie. Zastosowanie XML-a stało się bardzo popularną metodą przechowywania danych i najpopularniejszą metodą przesyłania danych pomiędzy różnego rodzaju systemami i aplikacjami. Jest to spowodowane tym, że o ile HMTL został zaprojektowany do prezentowania informacji, to XML powstał w celu zarządzania nimi.

Wprowadzenie

Czym jest XML? XML (ang. eXtensible Markup Language, czyli rozszerzalny język znaczników) to specyfikacja dotycząca przechowywania informacji. Jest to również specyfikacja opisująca strukturę tych informacji. Jednak choć XML jest językiem znaczników (podobnie jak HTML), nie posiada swoich własnych znaczników. Pozwala to osobie przygotowującej kod XML tworzyć własne znaczniki według potrzeb. W przypadku nowo tworzonych znaczników jedynym warunkiem jest ich zgodność z regułami specyfikacji XML. Co to wszystko oznacza? OK, dość gadania. Spróbuj zapoznać się z przykładowym dokumentem XML z rysunku W.1 i odpowiedzieć na następujące pytania: 1. Jakie informacje są przechowywane w tym dokumencie? 2. Jaka jest struktura tych informacji?

Czym jest XML?

3. Jakie znaczniki zostały utworzone do opisania tych informacji i ich struktury? Jak pewnie zauważyłeś, informacje przechowywane w tym dokumencie dotyczą moich dzieci. Jeśli chodzi o strukturę tych informacji, to każde dziecko posiada opis zawierający imię, płeć i wiek. I wreszcie znaczniki, które utworzyłem do opisania tych informacji i ich struktury, to: moje_dzieci, dziecko, imie, plec oraz wiek. Czym więc właściwie jest XML? Jest to zbiór reguł dotyczących definiowania niestandardowych języków znaczników. Specyfikacja XML pozwala użytkownikom zdefiniować własne języki znaczników. Następnie, korzystając z tych języków, ci sami lub inni użytkownicy mogą tworzyć dokumenty XML. Przykład zaprezentowany na rysunku W.1 to dokument XML utworzony przeze mnie za pomocą języka znaczników XML, który sam zdefiniowałem. Dokument ten przechowuje informacje o moich dzieciach, korzystając ze struktury i niestandardowych znaczników XML, które zaprojektowałem.

12

Rysunek W.1. Oto przykładowy dokument XML. Analizując niestandardowe znaczniki, które utworzyłem, możesz stwierdzić, że jest to dokument XML dotyczący moich dzieci. Ponadto możesz również powiedzieć, ile mam dzieci, jakie są ich imiona, jakiej są płci oraz ile mają lat

Wprowadzenie

Potęga XML-a Jaki jest więc powód korzystania z języka XML? Czym różni się on od innych istniejących technologii i języków? Po pierwsze, XML został specjalnie zaprojektowany pod kątem przechowywania i przesyłania danych. XML wygląda podobnie do HTML-a, wliczając w to znaczniki, atrybuty i wartości (rysunek W.2). Jednak zamiast służyć jako język prezentowania informacji, XML jest raczej językiem przechowywania i przenoszenia informacji.

Rysunek W.2. Na pierwszy rzut oka dokument XML zdaje się nie różnić znacząco od HTML-a: jest wypełniony znacznikami, atrybutami i wartościami. Zwróć jednak uwagę, że znaczniki różnią się od tych wykorzystywanych w języku HTML, co w szczególności jest widoczne w sposobie, w jaki te znaczniki opisują zawartość, którą obejmują. Dokument XML jest również napisany bardziej rygorystycznie, co wynika z reguł, które omówimy w rozdziale 1.

Kolejnym powodem, aby korzystać z języka XML, jest łatwość jego rozszerzania i dostosowywania. XML jest wykorzystywany do projektowania własnych niestandardowych języków znaczników, które są następnie stosowane do przechowywania określonych informacji. Twój niestandardowy język znaczników będzie zawierał znaczniki, które rzeczywiście opisują zawarte w nich dane. Ponadto znaczniki te mogą być ponownie wykorzystane w innych aplikacjach języka XML, a w razie potrzeby ich liczba może być zmniejszana lub zwiększana.

Wreszcie XML jest specyfikacją niezastrzeżoną i może z niej bezpłatnie skorzystać każdy, kto tylko ma na to ochotę. Została ona przygotowana przez międzynarodowe konsorcjum W3C (http://www.w3.org/), które jest przede wszystkim odpowiedzialne za rozwój niezależnych platformowo standardów i specyfikacji WWW. Ten otwarty standard pozwolił dużym i małym organizacjom korzystać z XML-a jako środka dzielenia się informacjami. Dzięki temu wsparcie otrzymały również szeroko zakrojone międzynarodowe wysiłki mające na celu tworzenie nowych aplikacji opartych na standardzie XML, co pomogło pokonywać bariery w handlu stworzone przez niezależnie opracowywane standardy i regulacje prawne.

13

Potęga XML-a

XML może być również wykorzystywany do wymiany danych pomiędzy różnymi systemami i organizacjami. Jest to możliwe dzięki temu, że dokument XML jest po prostu plikiem tekstowym i niczym więcej. Dokument taki jest dobrze zorganizowany, łatwy do zrozumienia, prosty w parsowaniu, łatwy do przekształcania i jest uważany za „czytelny dla ludzi” (np. jesteś w stanie przeczytać i najprawdopodobniej zrozumieć przykłady z rysunków W.1 i W.2).

Wprowadzenie

Rozszerzanie XML-a Istotnym spostrzeżeniem dotyczącym języka XML (rysunek W.3) jest to, że o ile HTML jest wykorzystywany do formatowania danych w celu ich prezentacji (rysunek W.4), to XML opisuje dane i sam sobie te dane stanowi.

Rozszerzanie XML-a

Ponieważ znaczniki XML są tworzone od podstaw, nie posiadają żadnego naturalnego formatowania. Przeglądarka nie wie, jak wyświetlić np. znacznik . Dlatego też Twoim zadaniem jest określenie sposobu, w jaki powinny być wyświetlane dokumenty XML. Możesz to zrobić, wykorzystując XSL (ang. eXtensible Stylesheet Language), czyli rozszerzalny język arkuszy stylów. XSL w rzeczywistości składa się z trzech języków: XSLT — dla przekształceń dokumentów XML, XPath — dla identyfikacji różnych fragmentów dokumentu XML, oraz XLS-FO — dla formatowania dokumentów XML. XSL pozwala Ci przekształcać informacje zawarte w dokumencie XML na dowolny format, którego potrzebujesz. Najczęściej jest to format HTML lub dokument XML o odmiennej od oryginału strukturze. Język XSL został opisany szczegółowo w części II tej książki. Poza możliwością wyświetlania dokumentu XML, istnieją sposoby definiowania struktury takiego dokumentu. Takie strukturalne definicje (lub schematy) napisane za pomocą DTD (ang. Document Type Definition) lub XML Schema (schemat XML) określają znaczniki, które można zastosować w dokumentach XML, oraz zawartość i atrybuty ujęte w tych znacznikach. Więcej na temat DTD dowiesz się w części III, na temat XML Schema w części IV, a wykorzystanie przestrzeni nazw XML do rozszerzania schematów XML zostanie objaśnione w części V tej książki. Podobnie jak w przypadku większości technologii, dla języka XML cały czas tworzone są liczne nowe rozszerzenia. W części VI omówione zostaną niektóre z takich najnowszych rozwinięć, w tym XSLT 2.0 wraz z XPath 2.0 oraz rozszerzenie XQuery wykorzystywane do kwerendowania XML-a i baz danych.

14

Rysunek W.3. Ten fragment kodu XML to dane opisujące posąg Zeusa w Olimpii, będący jednym z siedmiu cudów starożytnego świata

Rysunek W.4. Ten plik HTML jest tylko jednym z przykładów tego, co można zrobić za pomocą transformacji XSL z dokumentem XML przedstawionym na rysunku W.3

Wprowadzenie

XML w praktyce Od czasu ukazania się pierwszego wydania tej książki język XML został zaadaptowany na wiele istotnych sposobów. Dziś wszystkie standardowe przeglądarki mogą czytać dokumenty XML, korzystać ze schematów XML (DTD i XML Schema) oraz interpretować XSL w celu formatowania i wyświetlania dokumentów XML. Mimo to powszechny niegdyś pogląd, że XML może zastąpić HTML w kwestii obsługi stron WWW, jest zupełnie nieuprawniony. Osiągnięcie tego wymagałoby przyjęcia na całym świecie nowych przeglądarek obsługujących dodatkowe technologie XML, a webmasterzy musieliby podjąć się olbrzymiego zadania ponownego napisania swoich stron w formacie XML.

Rysunek W.6. Niektórzy uważają, że narzędzie sugerowania witryn Google (Google Suggest) odegrało znaczącą rolę w wypromowaniu techniki Ajax w kręgach związanych z tworzeniem stron WWW. Idea jest prosta. Kiedy wpisujesz fragment jakiejś frazy, narzędzie sugerowania witryn wybiera odpowiadające jej terminy wyszukiwania, które możesz wybrać zamiast kończenia swojej frazy. Wypróbuj to narzędzie!

Poza tym, że XML jest już w pełni czytelny dla przeglądarek, został również zaadaptowany w wielu innych aplikacjach w realnym świecie. Dwa z najbardziej rozpoznawalnych zastosowań to RSS i Ajax. RSS (ang. Really Simple Syndication) jest formatem XML używanym do rozpowszechniania takich zawartości witryn WWW jak artykuły prasowe, podcasty i wpisy na blogach (rysunek W.5). Ajax (ang. Asynchronous JavaScript and XML), czyli asynchroniczny JavaScript i XML, jest techniką programowania sieciowego, umożliwiającą tworzenie ulepszonego interfejsu użytkownika na stronach WWW (rysunek W.6). Jest to rezultat połączenia języków HTML i JavaScript z XML-em. Ajax umożliwia przeglądarkom internetowym pobieranie z serwera WWW nowych danych bez konieczności odświeżania za każdym razem całej strony WWW. Zwiększa to szybkość reagowania i użyteczność takiej witryny. O tych i innych zastosowaniach języka XML możesz przeczytać w części VII.

15

XML w praktyce

Rysunek W.5. RSS (ang. Really Simple Syndication) jest prostym sposobem na „subskrybowanie” wiadomości, podcastów oraz innych zawartości stron WWW, które oferują kanały RSS. Po zasubskrybowaniu swoich ulubionych kanałów RSS nie będziesz już musiał bezpośrednio przeglądać wybranych stron, ponieważ informacje z nich zostaną dostarczone bezpośrednio do Ciebie

Ponieważ XML nie zastąpi HTML-a, to, co początkowo traktowane było jako rozwiązanie tymczasowe, stało się uznanym standardem: zastosowanie XML-a do zarządzania informacjami i ich organizowania oraz wykorzystanie XSL-a do konwersji formatu XML na HTML. W ten sposób można skorzystać z możliwości XML-a w zakresie przechowywania i przesyłania danych, a następnie dzięki uniwersalności HTML-a formatować i wyświetlać te dane.

Wprowadzenie

Na temat tej książki Książka została podzielona na siedem części. Każda z nich obejmuje co najmniej jeden rozdział z instrukcjami objaśniającymi krok po kroku, jak wykonywać zadania związane z XML-em. Wszędzie tam, gdzie jest to możliwe, prezentowane są przykłady omawianych koncepcji i wyróżnione są te fragmenty przykładów, na których powinieneś się skupić.

Na temat tej książki

Na jednej stronie często znajdują się nawet więcej niż dwa różne przykłady, chociażby arkusz stylów XSL oraz dokument XML, który ma być za pomocą tego arkusza przekształcany. Typ przykładu możesz rozpoznać po nagłówku (por. rysunki W.7 oraz W.8). W całej książce użyte zostały następujące konwencje. Kiedy powinieneś wpisać przytoczony fragment tekstu, jest on zapisany pogrubioną czcionką o stałej szerokości znaków. Jeśli za jakiś fragment tekstu powinieneś podstawić własne wyrażenie, jest on zaznaczony pogrubioną i pochyloną czcionką o stałej szerokości znaków. Wreszcie, kiedy wprowadzam nowe pojęcia lub podkreślam znaczenie jakichś terminów, są one zaznaczone pogrubioną czcionką.

Rysunek W.7. Po nagłówku możesz rozpoznać, że jest to przykład kodu XML (prawdopodobnie i tak z łatwością rozpoznałbyś ten przykład, ale w przypadku wątpliwości jest to dodatkowa wskazówka)

Przewodnik po książce Kolejność tematów poruszanych w tej książce jest celowa. Część I dotyczy tworzenia dokumentów XML. Sama w sobie część ta jest dość prosta, a z pewnością okaże się jeszcze łatwiejsza, jeśli posiadasz jakąś wiedzę na temat języka HTML. Część II koncentruje się na XSL-u, który jest zbiorem języków zaprojektowanych do przekształcania dokumentów XML w dokumenty takie jak HTML, PDF czy też inne dokumenty XML. Pamiętaj, że język XML został opracowany w celu przechowywania i transportowania danych, a nie do ich wyświetlania. W częściach III i IV omówione zostały języki DTD i XML Schema, które zaprojektowano w celu definiowania struktury dokumentu XML. W połączeniu z przestrzeniami nazw XML (cześć V książki), zastosowanie tych języków pozwala zagwarantować zgodność dokumentów XML z predefiniowaną strukturą, bez względu na to, czy dokumenty te będą tworzone przez Ciebie, czy przez inne osoby.

16

Rysunek W.8. Ten przykładowy schemat DTD opisuje dokument XML przedstawiony na rysunku W.7. Nie przejmuj się tym, że na razie wydaje Ci się mało zrozumiały. Ten temat został szczegółowo opisany w części III

Wprowadzenie Część VI omawia szczegółowo niektóre z dobrze zapowiadających się języków powiązanych z XML-em oraz kilka nowych wersji już istniejących języków. Wreszcie w części VII opisano kilka dobrze znanych zastosowań języka XML we współczesnym świecie, a niektóre z nich mogą być dla Ciebie zaskakujące.

Towarzysząca książce strona internetowa Wszystkie przykłady zamieszczone w tej książce możesz pobrać ze strony http://www.helion.pl/ksiazki/xmlss2.htm. Gorąco polecam, abyś to zrobił i prześledził je w postaci elektronicznej lub drukowanej. W wielu przypadkach nie jest możliwe pokazanie całego przykładu na stronach książki, a z pewnością pomocna okaże się znajomość przykładów w całości. Doskonałym rozwiązaniem jest wyświetlanie przykładów w edytorze XML. Wskazówki dotyczące wyboru edytorów XML znajdziesz w dodatku A. Jeśli jednak nie skorzystasz z tej sugestii, równie pomocne może okazać się posługiwanie przykładami w formie drukowanej.

Książka ta jest aktualizacją i rozszerzeniem opublikowanej w roku 2001 pozycji Po prostu XML autorstwa Elizabeth Castro. Liz napisała wiele bestsellerów na temat różnych technologii i jestem zachwycony oraz zaszczycony, mając możliwość aktualizowania jej pracy. Mam nadzieję, że będziesz bawił się równie dobrze podczas nauki języka XML, jak ja podczas pisania tej książki.

17

Na temat tej książki

Od roku 2001 do 2008

Wprowadzenie

Czym nie jest ta książka

Czym nie jest ta książka

XML jest niezwykle wszechstronnym systemem służącym do zarządzania informacjami. Możesz wykorzystywać go w kombinacji z wieloma innymi technologiami. Powinieneś wiedzieć, że ta książka nie jest, i wcale nie stara się być, wyczerpującym poradnikiem na temat XML-a. Jest raczej przeznaczona dla początkujących użytkowników i omawia podstawowe narzędzia i języki XML-a. W książce tej nie znajdziesz informacji na temat SAX, OPML czy XML-RPC, ani nie nauczysz się języków JavaScript, Java czy PHP, choć są one zazwyczaj wykorzystywane w połączeniu z językiem XML. Wiele z tych tematów zasługuje na osobne pozycje (których się zresztą doczekały). Chociaż istnieje wiele dodatkowych technologii, które umożliwiają współpracę z dokumentami XML, ta książka koncentruje się na podstawowych elementach XML-a, przekształceniach XML oraz schematach. Są to podstawowe tematy, które musisz opanować, aby zacząć tworzyć własne dokumenty XML i z nich korzystać. Czasem — szczególnie coś zaczynasz — bardziej pomocne są jasne, konkretne i łatwe do przyswojenia informacje na temat mniejszych grup tematycznych zamiast ogólnego, szerokiego spektrum danych na temat wszystkich rzeczy pod słońcem. Mam nadzieję, że ta książka zapewni Ci solidne podstawy z zakresu języka XML i jego głównych technologii, co pozwoli Ci przejść do bardziej zaawansowanej układanki zwanej XML, kiedy będziesz już na to gotowy.

18

Rysunek W.9. Organizacja W3C (ang. World Wide Web Consortium) wytycza główne standardy dla sieci WWW. Na stronie tej organizacji (www.w3.org) znajdziesz oficjalne specyfikacje dla wszystkich języków omówionych w tej książce, w tym XML, XSL, DTD i XML Schema. Znajdziesz tam również informacje dotyczące zaawansowanych i dodatkowych tematów, takich jak XSL-FO, XQuery oraz oczywiście HTML i XHTML

XML

I

Część I XML

Rozdział 1.

Pisanie dokumentów XML

21

19

Rozdział x.

20

Pisanie dokumentów XML

1

Rozdział 1. Pisanie dokumentów XML Specyfikacja XML określa sposób pisania dokumentów w formacie XML. Trzeba wyjaśnić, że XML nie jest językiem sam w sobie. Mówiąc ściśle, dokumenty XML są pisane w języku znaczników niestandardowych (ang. custom markup language), zgodnie ze specyfikacją XML. Moglibyśmy mieć na przykład języki znaczników niestandardowych opisujące dane genealogiczne, chemiczne lub biznesowe i w każdym z nich mógłbyś pisać dokumenty XML. Każdy język znaczników niestandardowych stworzony z wykorzystaniem specyfikacji XML musi stosować się do bazowej gramatyki XML. Dlatego właśnie zaczynam tę książkę od związanych z tym kwestii. W niniejszym rozdziale poznasz ogólne zasady pisania dokumentów XML, niezależne od wybranego języka znaczników niestandardowych, w którym piszesz.

Narzędzia służące do pisania dokumentów XML Dokumenty XML, podobnie jak dokumenty HTML, można pisać za pomocą dowolnego edytora tekstu lub procesora tekstu. Istnieje również wiele edytorów XML, które powstały od czasu ukazania się pierwszej edycji tej książki. Edytory te oferują różne funkcje, takie jak sprawdzanie poprawności dokumentu XML w trakcie jego pisania (patrz dodatek A). Pisząc tę książkę, zakładam, że potrafisz tworzyć nowe dokumenty, otwierać stare w celu edycji oraz zapisywać je po skończonej pracy. Pamiętaj tylko, żeby wszystkie swoje dokumenty XML zapisywać z rozszerzeniem .xml.

21

Pisanie dokumentów XML

Oficjalnie języki znaczników niestandardowych utworzone za pomocą XML-a są zwane aplikacjami XML (ang. XML applications). Innymi słowy, te języki znaczników niestandardowych są zastosowaniami XML-a, takimi jak XSLT, RSS, SOAP itd. Jednak dla mnie aplikacja to pełnowartościowe oprogramowanie, takie jak Photoshop. Uważam ten termin za tak mało precyzyjny, że zazwyczaj staram się go unikać.

Rozdział 1.

Przykładowy dokument XML Podobnie jak dokumenty HTML, dokumenty XML składają się ze znaczników oraz danych. Istnieje jednak pewna zasadnicza różnica pomiędzy tymi dwoma typami dokumentów. Znaczniki wykorzystywane w dokumentach XML są tworzone przez ich autorów. Kolejną istotną różnicą jest to, że dokumenty XML jedynie przechowują i opisują określone dane. Nie przetwarzają one danych w żaden inny sposób, czyli nie wyświetlają ich, tak jak to ma miejsce w przypadku dokumentów HTML.

Rysunek 1.1. Dokument XML opisujący Kolos Rodyjski, jeden z siedmiu cudów świata. Dokument ten zawiera nazwę cudu, a także jego lokalizację oraz wysokość w metrach

Dokumenty XML powinny być raczej oczywiste, co oznacza, że znaczniki powinny opisywać dane, które zawierają (rysunek 1.1).

Przykładowy dokument XML

Pierwszy wiersz tego dokumentu, , to deklaracja XML (ang. XML declaration), która określa zastosowaną wersję XML-a. Kolejny wiersz, , rozpoczyna część z danymi dokumentu i zwany jest elementem głównym (ang. root element). W każdym dokumencie XML może być tylko jeden element główny. Kolejne trzy wiersze to tzw. elementy-dzieci (ang. child elements). Opisują one element główny bardziej szczegółowo. Kolos Rodyjski Rodos, Grecja 33

Ostatni element-dziecko, czyli wysokosc, zawiera atrybut o nazwie jednostka, który jest wykorzystywany do przechowywania określonych jednostek pomiaru wysokości. Atrybuty są używane do załączenia dodatkowych informacji do danego elementu bez konieczności dodawania tekstu do samego elementu. Ostatecznie dokument XML kończy się zamknięciem znacznika elementu głównego, w postaci . Jest to kompletny i poprawny strukturalnie dokument XML. Nie trzeba nic więcej dopisywać, dodawać, objaśniać ani komplikować. Kropka.

22

Rysunek 1.2. Tutaj rozszerzyłem dokument XML z rysunku 1.1 w taki sposób, aby obsługiwał kilka elementów . Odbyło się to poprzez utworzenie nowego elementu głównego , który może zawierać tyle elementów , ile zechcesz. Teraz ten dokument XML zawiera informacje o Kolosie Rodyjskim oraz o piramidzie Cheopsa, która zlokalizowana jest w Gizie w Egipcie i ma wysokość 139 m

Pisanie dokumentów XML

Zasady pisania dokumentów XML

Rysunek 1.3. W poprawnym składniowo dokumencie XML musi być jeden element (cud), który zawiera wszystkie pozostałe elementy. Nazywamy go elementem głównym. Pierwszy wiersz tego dokumentu XML jest wyjątkiem, ponieważ jest to instrukcja przetwarzania, a nie część danych XML

XML ma niezwykle regularną i przewidywalną strukturę. Jest ona definiowana przez zestaw reguł, z których najważniejsze zostały opisane poniżej. Jeśli Twój dokument spełnia te wymogi, może być uznany za poprawny składniowo (ang. well-formed). Dokument poprawny składniowo może być wykorzystywany na wiele różnych sposobów.

Element główny jest wymagany Każdy dokument XML musi posiadać jeden i tylko jeden element główny. Taki element główny zawiera wszystkie pozostałe elementy danego dokumentu. Jedyne fragmenty XML-a dopuszczalne poza obszarem elementu głównego (poprzedzające go) to komentarze i instrukcje przetwarzania (rysunek 1.3).

Znaczniki zamykające są niezbędne Każdy element musi mieć znacznik zamykający. Puste elementy (patrz podrozdział „Stosowanie pustych elementów”) mogą wykorzystywać osobne znaczniki zamknięcia, lub też otwierające i zamykające znaczniki typu „wszystko-w-jednym”, zawierające ukośnik umieszczony przed końcowym nawiasem trójkątnym > (patrz rysunek 1.4 oraz podrozdział „Zagnieżdżanie elementów” w dalszej części rozdziału).

Elementy muszą być odpowiednio zagnieżdżone Jeśli rozpoczynasz element A, a następnie rozpoczynasz element B, musisz najpierw zamknąć element B przed zamknięciem elementu A (rysunek 1.4). Rysunek 1.5. Górny przykład to prawidłowy dokument XML, choć może on być trochę mylący. Dwa widoczne tam elementy (nazwa i Nazwa) są w rzeczywistości całkowicie różne i niezależne. Dolny przykład jest niepoprawny, ponieważ znacznik otwierający nie jest taki sam jak znacznik zamykający

Rysunek 1.6. Znaki cudzysłowu są wymagane. Mogą to być cudzysłowy pojedyncze lub podwójne, pod warunkiem że obydwa będą takie same. Zwróć uwagę, że wartość atrybutu plik nie musi koniecznie odnosić się do pliku obrazu. Równie dobrze może być to prosty tekst, np. "Fotka z ostatnich wakacji"

Wielkość liter ma znaczenie W dokumentach XML istotna jest wielkość liter. Elementy o nazwach cud, CUD oraz Cud są traktowane jako całkowicie osobne i niezwiązane ze sobą (rysunek 1.5).

Wartości muszą być podawane w cudzysłowie Wartość atrybutu musi być zawsze zamykana w dwóch takich samych znakach pojedynczego lub podwójnego cudzysłowu (rysunek 1.6).

23

Zasady pisania dokumentów XML

Rysunek 1.4. Każdy element musi być umieszczony pomiędzy odpowiadającymi sobie znacznikami, tak jak ma to miejsce w przypadku elementu nazwa. Puste elementy, takie jak obrazek_glowny, mogą mieć otwierający i zamykający znacznik typu „wszystko w jednym”, zawierający końcowy ukośnik. Zwróć uwagę, że wszystkie elementy są prawidłowo zagnieżdżone, czyli żaden z nich nie zachodzi na inny

Rozdział 1.

Elementy, atrybuty i wartości

Elementy, atrybuty i wartości

XML wykorzystuje te same elementy składowe co HTML: znaczniki określające elementy, wartości tych elementów oraz atrybuty. Element XML jest najbardziej podstawową jednostką dokumentu. Może on zawierać tekst, atrybuty oraz inne elementy. Każdy element ma znacznik otwierający z nazwą umieszczoną pomiędzy lewym (<) i prawym (>) nawiasem trójkątnym (rysunek 1.7). Nazwa, którą wymyślasz sam, powinna opisywać przeznaczenie danego elementu i, w szczególności, jego zawartość. Element zasadniczo zakończony jest znacznikiem zamykającym, składającym się z tej samej nazwy poprzedzonej prawym ukośnikiem i umieszczonej, jak uprzednio, pomiędzy lewym i prawym nawiasem trójkątnym. Wyjątek stanowi tzw. pusty element, który może być „samozamykający się” i został omówiony w podrozdziale „Stosowanie pustych elementów”. Elementy mogą posiadać atrybuty. Atrybuty, które umieszczone są w obrębie znacznika otwierającego elementu, zawierają ujęte w znak cudzysłowu wartości dokładniej opisujące przeznaczenie i zawartość (jeśli taka istnieje) konkretnego elementu (rysunek 1.8). Informacje zawarte w atrybucie są zasadniczo traktowane jako metadane, czyli informacje o danych znajdujących się w tym elemencie, w przeciwieństwie do danych samych w sobie. Element może posiadać tyle atrybutów, ile jest potrzebnych, pod warunkiem że każdy z nich posiada unikatową nazwę.

Rysunek 1.7. Typowy element składa się ze znacznika otwierającego, zawartości oraz znacznika zamykającego. Widoczny na przykładzie element wysokosc zawiera tekst

Rysunek 1.8. Element wysokosc ma teraz atrybut o nazwie jednostka, którego wartością jest metr. Zwróć uwagę, że słowo metr nie jest częścią zawartości elementu wysokosc. Nie oznacza to, że wartość elementu wysokosc wynosi 33 m. Raczej atrybut jednostka opisuje zawartość elementu wysokosc

Reszta tego rozdziału poświęcona jest pisaniu elementów, atrybutów i wartości.

Białe znaki Wokół elementów w swoim kodzie XML możesz umieszczać dodatkowe białe znaki (ang. white space), w tym znaki nowej linii. Ułatwia to edycję i przeglądanie dokumentu (rysunek 1.9). O ile białe znaki są widoczne w pliku i podczas przekazywania do innych aplikacji, to są one ignorowane przez procesor XML, podobnie jak w przypadku kodu HTML w przeglądarce.

24

Rysunek 1.9. Przedstawiony w tym przykładzie element cud zawiera trzy inne elementy (nazwa, lokalizacja i wysokosc), ale nie ma żadnego własnego tekstu. Elementy nazwa, lokalizacja i wysokosc mają tekst, ale nie zawierają innych elementów. Element wysokosc jako jedyny ma atrybut. Zwróć uwagę, że dodałem też białe znaki (na rysunku oznaczone kolorem ciemnoszarym), aby kod był bardziej czytelny

Pisanie dokumentów XML

Jak zacząć Rysunek 1.10. Ponieważ deklaracja XML jest instrukcją przetwarzania, a nie elementem, nie zawiera znacznika zamykającego

Zasadniczo każdy dokument XML powinien rozpoczynać się deklaracją, która wskazuje zastosowaną wersję XML-a. Taki wiersz nazywany jest deklaracją XML (rysunek 1.10).

Aby zadeklarować wersję XML-a, z której korzystasz: 1. Na samym początku dokumentu, przed wszystkimi innymi elementami, umieść tekst , aby zakończyć deklarację.

Wskazówki  W 2006 r. W3C opublikowało rekomendację dla XML-a w wersji 1.1 (ang. Recommendation for XML Version 1.1), ale oferuje ona niewiele korzyści i trudno o jakiekolwiek wsparcie programistyczne dla niej.  Pamiętaj, żeby umieścić numer wersji w pojedynczych lub podwójnych znakach cudzysłowu (nieważne w jakich, o ile obydwa będą takie same).

 Instrukcje przetwarzania XML mogą również wskazywać kodowanie znaków (UTF-8, ISO-8859-1 itd.) zastosowane dla danego dokumentu. Kodowanie znaków zostało omówione w dodatku B.

25

Jak zacząć

 Znaczniki rozpoczynające się od nazywane są instrukcjami przetwarzania (ang. processing instructions). Poza deklarowaniem wersji XML-a, instrukcje przetwarzania są wykorzystywane m.in. do określania arkusza stylów, który należy zastosować. Arkusze stylów zostały omówione szczegółowo w części II, „XSL”.

Rozdział 1.

Tworzenie elementu głównego Każdy dokument XML musi posiadać jeden i tylko jeden element, który całkowicie zawiera w sobie wszystkie pozostałe elementy. Taki „wszystko obejmujący” element-rodzic (ang. parent element) zwany jest elementem głównym (ang. root element).

Aby utworzyć element główny: 1. Na początku swojego dokumentu XML napisz , gdzie element_główny to nazwa elementu, który będzie zawierał resztę elementów znajdujących się w danym dokumencie (rysunek 1.11). 2. Zostaw kilka pustych wierszy na pozostałą część dokumentu XML. 3. Na koniec napisz , stosując tę samą nazwę, którą przyjąłeś w punkcie 1.

Wskazówki

Tworzenie elementu głównego

 Wielkość znaków ma znaczenie. to nie to samo co lub .  Nazwy elementów (i atrybutów) powinny być krótkie i opisowe.  Nazwy elementów i atrybutów muszą rozpoczynać się literą, podkreślnikiem lub dwukropkiem. Nazwy rozpoczynające się literami xml (w dowolnej kombinacji małych i wielkich liter) są zarezerwowane i nie mogą być stosowane.  Nazwy elementów i atrybutów mogą zawierać dowolną liczbę liter, cyfr, podkreśleń oraz kilku innych znaków interpunkcyjnych.  Zastrzeżenie: chociaż dwukropki, myślniki i kropki są prawidłowymi znakami w nazwach elementów i atrybutów, nie zalecam ich stosowania, ponieważ są one używane w określonych okolicznościach (np. dla identyfikacji przestrzeni nazw, odejmowania oraz właściwości obiektów, w tej właśnie kolejności).  Żadne elementy nie mogą znajdować się poza znacznikami głównymi (otwierającym i zamykającym). Wyjątek stanowią instrukcje przetwarzania (patrz podrozdział „Jak zacząć”).

26

Rysunek 1.11. W języku HTML elementem głównym jest zawsze . W XML-u dla elementu głównego możesz zastosować każdą poprawną nazwę, taką jak w naszym przykładzie. Żadna inna zawartość ani żadne inne elementy nie są dopuszczalne przed znacznikiem otwierającym oraz po znaczniku zamykającym

Pisanie dokumentów XML

Pisanie elementów-dzieci

Rysunek 1.12. Prosty element XML składa się ze znacznika otwierającego, zawartości (która może zawierać tekst, inne elementy lub być pusta) oraz znacznika zamykającego. Ten ostatni różni się od znacznika otwierającego jedynie prawym ukośnikiem na początku

Jeśli utworzyłeś już element główny, możesz utworzyć dowolny element-dziecko (ang. child element). Chodzi tu o określoną relację pomiędzy elementem głównym lub rodzicem, którą określa właśnie element-dziecko. Tworząc element-dziecko, stosuj nazwy, które jasno identyfikują zawartość, aby łatwiej było przetworzyć dane informacje w późniejszym terminie.

Aby napisać element-dziecko: 1. Napisz znacznik , gdzie nazwa określa zawartość, która ma się pojawić dalej, i jest nazwą elementu-dziecka. 2. Utwórz zawartość.

Rysunek 1.13. Każdy element Twojego dokumentu XML musi być zawarty pomiędzy znacznikiem otwierającym i zamykającym elementu głównego

3. Na koniec napisz , stosując tę samą nazwę, którą przyjąłeś w punkcie 1. (rysunki 1.12 i 1.13).

Wskazówki  Znacznik zamykający nigdy nie jest opcjonalny (jak to czasem ma miejsce w HTML-u). W XML-u elementy muszą zawsze mieć znacznik zamykający.

 Nazwy nie muszą być zapisane w języku polskim ani nawet w alfabecie łacińskim, jeśli jednak Twoje oprogramowanie nie obsługuje zastosowanych znaków, mogą one nie być poprawnie wyświetlane lub przetwarzane.  Jeśli dla swoich elementów zastosujesz nazwy opisowe, łatwiej będzie wykorzystać dane dokumenty XML do innych zastosowań.

27

Pisanie elementów-dzieci

 Reguły nazywania elementów-dzieci są takie same jak dla elementów głównych. Wielkość znaków ma znaczenie. Nazwy muszą zaczynać się literą, podkreślnikiem lub dwukropkiem i mogą zawierać litery, cyfry lub podkreślniki. Mimo że nie jest to zabronione, nie zalecam stosowania dwukropków, kresek i kropek. Ponadto nie można używać nazw rozpoczynających się od liter xml w żadnej kombinacji wielkich i małych znaków.

Rozdział 1.

Zagnieżdżanie elementów Tworząc dokument XML, często będziesz chciał podzielić dane na mniejsze fragmenty. W XML-u możesz budować elementy-dzieci elementów-dzieci kolejnych elementów-dzieci itd. Możliwość zagnieżdżania wielu poziomów elementów-dzieci pozwala Ci identyfikować poszczególne fragmenty danych, pracować z nimi oraz ustanawiać hierarchiczną relację pomiędzy tymi poszczególnymi fragmentami.

Aby zagnieździć elementy:

Rysunek 1.14. Aby upewnić się, że znaczniki są odpowiednio zagnieżdżone, połącz każdy zestaw linią. Żaden zestaw znaczników nie powinien zachodzić na inny. Każdy wewnętrzny zestaw powinien całkowicie zawierać się w swoim najbliższym zestawie zewnętrznym

1. Utwórz znacznik otwierający elementu zewnętrznego w sposób opisany w punkcie 1. podrozdziału „Pisanie elementów potomnych”. 2. Napisz , gdzie wewnętrzny jest nazwą pierwszego indywidualnego fragmentu danych, czyli jest pierwszym elementem potomnym.

Zagnieżdżanie elementów

3. Utwórz zawartość elementu , jeśli taka jest przewidywana. 4. Następnie utwórz znacznik , stosując tę samą nazwę, którą wybrałeś w punkcie 2. 5. W razie potrzeby powtórz czynności opisane w punktach 2. – 4. 6. Na koniec utwórz znacznik zamykający dla elementu zewnętrznego w sposób opisany w punkcie 3. podrozdziału „Pisanie elementów potomnych”.

Wskazówki  Istotne jest, aby każdy z elementów w całości zawierał się w innym. Innymi słowy, nie możesz wstawiać znacznika zamykającego dla elementu zewnętrznego, dopóki nie zostanie zamknięty element wewnętrzny. W przeciwnym wypadku dokument nie zostanie uznany za poprawny składniowo, co spowoduje zwrócenie błędu przez procesor XML (rysunek 1.14).  Zagnieżdżać możesz tyle poziomów elementów, ile chcesz (rysunek 1.15).  Najlepszą praktyką przy zagnieżdżaniu elementów jest wstawianie w dokumencie wcięć dla elementów-dzieci. Dzięki temu można łatwo rozpoznać rodzica, dziecko i wzajemne relacje między nimi. Większość edytorów XML automatycznie zrobi to za Ciebie.

28

Rysunek 1.15. Teraz element cud jest zagnieżdżony jako dziecko elementu cuda_starozytnosci, a nazwa, lokalizacja i wysokosc są zagnieżdżone jako elementy-dzieci elementu cud

Pisanie dokumentów XML

Dodawanie atrybutów

Rysunek 1.16. Atrybuty to pary nazwa-wartość, które zawierają się w obrębie znacznika otwierającego. Wartość musi być ujęta w dwa identyczne cudzysłowy (pojedyncze lub podwójne)

Atrybut przechowuje dodatkowe informacje na temat elementu, bez konieczności dodawania tekstu do zawartości samego elementu. Atrybuty są znane jako „pary nazwa-wartość” i zawierają się w obrębie znacznika otwierającego danego elementu (rysunek 1.16).

Aby dodać atrybut: 1. Przed nawiasem zamykającym (>) znacznika otwierającego wstaw atrybut=, gdzie atrybut jest słowem określającym dane dodatkowe. 2. Następnie wpisz "wartość", gdzie wartość to wskazane dane dodatkowe. Cudzysłów jest wymagany.

Wskazówki  Nazwy atrybutów muszą spełniać te same wymagania co nazwy elementów (patrz punkt „Wskazówki” w podrozdziale „Pisanie elementów potomnych”). Rysunek 1.17. Atrybuty pozwalają dodawać informacje na temat zawartości elementu

 W danym elemencie nie mogą się znaleźć dwa atrybuty o tej samej nazwie.

 Jeśli wartość atrybutu zawiera podwójny cudzysłów, zastosuj znak pojedynczego cudzysłowu do zamknięcia w nim tej wartości (i odwrotnie), np. komentarz= 'Powiedziała: "Kolos upadł!"'.  Atrybuty powinny być stosowane jako „metadane”, czyli dane o danych. Innymi słowy — atrybuty powinny być wykorzystywane do przechowywania informacji o zawartości elementu, a nie do przechowywania samej zawartości (rysunek 1.17).  Dodatkowym sposobem oznaczania i identyfikacji odrębnych informacji jest zagnieżdżanie elementów (patrz podrozdział „Zagnieżdżanie elementów”).

29

Dodawanie atrybutów

 W przeciwieństwie do języka HTML, wartości atrybutów muszą, powtarzam: muszą być ujęte w cudzysłów. Może to być pojedynczy lub podwójny cudzysłów, pod warunkiem że oba cudzysłowy danego atrybutu są takie same.

Rozdział 1.

Stosowanie pustych elementów Puste elementy (ang. empty elements) to elementy, które nie posiadają żadnej własnej zawartości. Zamiast tego mają one atrybuty przechowujące dane na temat tych elementów. Przykładem może być element obrazek_glowny z atrybutem zawierającym nazwę pliku tego obrazka, przy czym element ten nie posiada żadnej zawartości.

Aby napisać pusty element za pomocą pojedynczego znacznika otwierającego i zamykającego:

Rysunek 1.18. Puste elementy mogą łączyć znacznik otwierający i zamykający w jeden, tak jak pokazano na tym przykładzie. Mogą też składać się ze znacznika otwierającego i następującego zaraz po nim znacznika zamykającego, tak jak widać na kolejnym przykładzie

1. Wpisz
Stosowanie pustych elementów

3. Wpisz />, aby zakończyć ten element (rysunek 1.18).

Aby napisać pusty element za pomocą osobnego znacznika otwierającego i zamykającego: 1. Wpisz , aby zakończyć znacznik otwierający. 4. Następnie, aby zakończyć ten element, wpisz bez odstępów , stosując tę samą nazwę, którą wybrałeś w punkcie 1.

Wskazówki  W języku XML obydwie opisane wyżej metody są równoważne (rysunek 1.19). Wybór jednej z nich zależy od preferencji stylistycznych. Ja buduję elementy za pomocą pojedynczego znacznika otwierającego-zamykającego.  W przeciwieństwie do języka HTML, niedopuszczalne jest stosowanie znacznika otwierającego bez odpowiadającego mu znacznika zamykającego. Dokument zawierający taki znacznik nie zostanie uznany za poprawny składniowo i spowoduje zwrócenie błędu w procesorze XML.

30

Rysunek 1.19. Typowe puste elementy to zrodlo i obrazek glowny. Zwróć uwagę, że te elementy zawierają dane jedynie w atrybutach. Nie posiadają własnej zawartości. W tym przykładzie wykorzystałem obydwa formaty pustych elementów: pojedynczy znacznik otwierający i zamykający oraz osobny znacznik otwierający i zamykający

Pisanie dokumentów XML

Pisanie komentarzy

Rysunek 1.20. Komentarze w języku XML mają tę samą składnię co w HTML-u

Warto opisywać własne dokumenty XML, aby wiedzieć, dlaczego zastosowany został konkretny element lub co konkretnie oznacza jakiś kawałek informacji. Podobnie jak w przypadku języka HTML, możesz do swoich dokumentów XML wstawiać komentarze. Nie będą one parsowane przez procesor (rysunek 1.20).

Aby napisać komentarz: 1. Wpisz , aby zamknąć dany komentarz.

Wskazówki  Komentarze mogą zawierać spacje, tekst, elementy i znaki nowej linii. Dlatego też mogą zajmować kilka wierszy dokumentu XML.  Pomiędzy podwójnymi myślnikami a treścią samego komentarza nie są wymagane żadne spacje. Konstrukcja jest zatem zupełnie poprawna.  Wewnątrz komentarza nie można używać podwójnych myślników.  Nie można zagnieżdżać komentarzy.  Komentarze można stosować w celu ukrycia fragmentu kodu w trakcie jego rozwijania lub debugowania. Nazywa się to „wykomentowaniem” sekcji. Elementy w obrębie wykomentowanej sekcji wraz z ewentualnymi błędami, które mogą zawierać, nie będą wtedy przetwarzane przez procesor XML.  Komentarze są również użyteczne przy opisywaniu struktury dokumentu XML. Ma to na celu ułatwienie wprowadzania zmian i aktualizacji w przyszłości (rysunek 1.21).

31

Pisanie komentarzy

Rysunek 1.21. Komentarze pozwalają Ci dodawać informacje na temat Twojego kodu. Mogą one być niezwykle użyteczne, kiedy będziesz (Ty lub ktoś inny) musiał wrócić do dokumentu i przeanalizować jego konstrukcję

Rozdział 1.

Encje predefiniowane — pięć znaków specjalnych Encje są rodzajem autotekstu. Są sposobem wprowadzania do dokumentu XML tekstu bez konieczności wpisywania go. Istnieje wiele liter i symboli, które mogą być umieszczane za pomocą encji w dokumentach HTML. W XML-u istnieje jednak tylko pięć predefiniowanych encji (ang. predefined entities).

Aby napisać pięć predefiniowanych encji:  Wpisz &, aby utworzyć znak et (&).  Wpisz <, aby utworzyć znak lewego nawiasu trójkątnego (<).  Wpisz >, aby utworzyć znak prawego nawiasu trójkątnego (>).  Wpisz ", aby utworzyć znak podwójnego cudzysłowu (").

Encje predefiniowane

 Wpisz ', aby utworzyć znak pojedynczego cudzysłowu lub apostrofu (').

Wskazówki  W języku XML encje predefiniowane istnieją, ponieważ każdy z tych znaków ma określone znaczenie. Jeśli użyjesz na przykład znaku < w obrębie wartości tekstowej elementu lub atrybutu, procesor XML uzna, że rozpoczynasz nowy element (rysunek 1.22).  Nie możesz używać znaku < lub & w żadnym miejscu dokumentu XML z wyjątkiem, odpowiednio: początku znacznika lub encji. Jeśli potrzebujesz użyć jednego z tych znaków w obrębie wartości tekstowej elementu lub atrybutu, musisz zastosować jedną z predefiniowanych encji.  Możesz stosować znaki ", ' lub > w obrębie wartości tekstowej elementu lub atrybutu. Jednak używając znaku " lub ', uważaj, aby nieumyślnie nie zamknąć wcześniej otwartego cudzysłowu. Ponadto zawsze zalecam stosowanie predefiniowanej encji dla znaku (>), żeby uniknąć ewentualnych nieporozumień.  Jeśli dla swoich dokumentów XML chcesz utworzyć dodatkowe encje, musisz je w wyraźny sposób zadeklarować (patrz rozdział 7.).

32

Rysunek 1.22. Po sparsowaniu tego dokumentu encja > zostanie wyświetlona jako znak <. Kiedy więc zostanie wyświetlona wartość elementu wysokosc, będzie to prawdopodobnie wyglądało następująco: "<33". Sposób wyświetlenia tych danych będzie zależał od przekształcenia dokumentu XML, co zostało omówione w części II, „XSL”

Pisanie dokumentów XML

Wyświetlanie elementów w postaci tekstu Jeśli chcesz w swoich dokumentach XML pisać o elementach i atrybutach XML, musisz zabronić procesorowi XML interpretowania tych fragmentów, które zamiast tego powinny być wyświetlane jako zwykły tekst. W tym celu musisz umieścić takie informacje w sekcji CDATA (rysunek 1.23).

Aby wyświetlić elementy jako tekst:  Wpisz , żeby zakończyć znacznik.

Wskazówki

 Skrótowiec CDATA pochodzi od angielskiego określenia (unparsed) Character Data (nieparsowane dane znakowe), co oznacza, że zawartość CDATA nie jest interpretowana przez procesor XML. Przeciwieństwem jest pojęcie PCDATA pochodzące od angielskiego określenia Parsed Character Data (parsowane dane znakowe), które zostało omówione w rozdziale 6.  Specjalne znaczenie reprezentowane przez różne symbole jest ignorowane w sekcji CDATA. Aby wyświetlić znaki lewego nawiasu trójkątnego i et, powinieneś napisać < oraz &. Jeśli napiszesz < oraz &, właśnie te ciągi znaków zostaną wyświetlone. Nie zostaną one zastąpione znakami < oraz &.  Sekcji CDATA nie można zagnieżdżać.

Rysunek 1.24. Dokument XML z poprzedniego przykładu wyświetlony w przeglądarce Internet Explorer 8. Widać tutaj, że elementy z sekcji CDATA zostały potraktowane jako tekst, w przeciwieństwie do elementów ksiazka_o_xml, znaczniki oraz wyswietlanie, które zostały sparsowane przez procesor XML

 Sekcje CDATA mogą być umieszczane w dowolnym miejscu elementu głównego dokumentu XML.  Jeśli z jakiegoś powodu chcesz napisać ]]>, ale nie zamykasz sekcji CDATA, znak > musi być zapisany za pomocą encji >. Więcej informacji na temat pisania znaków specjalnych znajdziesz w podrozdziale „Encje predefiniowane — pięć znaków specjalnych” oraz w dodatku B.

33

Wyświetlanie elementów w postaci tekstu

Rysunek 1.23. W tym przykładzie dotyczącym przykładu wykorzystałem sekcję CDATA, aby wyświetlić rzeczywisty kod, niesparsowany przez procesor XML

 Dwa inne typowe zastosowania sekcji CDATA to załączanie kodu HTML i JavaScript w taki sposób, aby nie był on parsowany przez procesor XML.

Rozdział 1.

34

XSL

II

Część II XSL

Rozdział 2.

XSLT

37

Rozdział 3.

Wzorce i wyrażenia XPath

55

Rozdział 4.

Funkcje XPath

67

Rozdział 5.

XSL-FO

79

35

Rozdział x.

36

XSLT

2

Rozdział 2. XSLT Teraz, gdy posiadasz już pewne pojęcie na temat języka XML oraz wiesz, jak tworzyć i czytać dokumenty XML, kolejnym krokiem jest formatowanie tych dokumentów. Szczegóły dotyczące formatowania dokumentów XML pierwotnie zostały zawarte w specyfikacji XSL (ang. eXtensible Style Language — rozszerzalny język arkuszy stylów). Jednak z uwagi na zbyt długi czas oczekiwania na ukończenie tej specyfikacji W3C podzieliło XSL na dwie części: XSLT (ang. for Transformations; dla przekształceń) oraz XSL-FO (ang. for Formatting Objects; dla formatowania obiektów). W tym oraz w dwóch kolejnych rozdziałach objaśnione zostało przekształcanie dokumentów XML za pomocą XSLT. Rezultatem przekształcania może być kolejny dokument XML lub dokument HTML. W rzeczywistości możesz przekształcać dokumenty XML w praktycznie każdy dowolny typ dokumentów. Przekształcanie (ang. transforming) dokumentu XML oznacza zastosowanie XSLT do analizy jego zawartości, a następnie podjęcie konkretnych działań w zależności od tego, jakie elementy zostaną znalezione. XSLT możesz wykorzystywać do zmiany kolejności danych wynikowych na podstawie konkretnych kryteriów, do wyświetlania tylko określonych fragmentów informacji i do wielu innych zastosowań.

Większość przykładów zamieszczonych w tej części książki oparto na pojedynczym pliku XML oraz na zestawie plików XSLT, z których każdy kolejny jest najczęściej zbudowany na bazie poprzedniego. Gorąco polecam pobranie tych przykładów ze strony http://www.helion.pl/ksiazki/xmlss2.htm (wspomnianej we wstępie do książki) i analizowanie ich na bieżąco.

37

XSLT

XSL-FO jest zazwyczaj wykorzystywane do formatowania dokumentów XML dla celów wydruku, np. bezpośrednio do pliku PDF. Język ten nie jest obsługiwany przez żadną przeglądarkę i wymaga specyficznego oprogramowania parsującego. Więcej informacji na temat XSL-FO znajdziesz w rozdziale 5.

Rozdział 2.

Przekształcanie dokumentów XML za pomocą XSLT Rozpocznijmy od przyjrzenia się procesowi przekształcania. Proces ten rozpoczyna się od dwóch dokumentów: dokumentu XML zawierającego dane źródłowe, które mają zostać przekształcone, oraz arkusza stylów XSLT opisującego reguły przekształcania. Co prawda dokument XML może być przekształcany w prawie każdy dowolny format, jednak ja posłużę się przykładami zwracającymi dokument HTML. Do wykonania rzeczywistego przekształcenia niezbędny będzie procesor XSLT lub przeglądarka, która obsługuje XSLT. Większość aktualnych edytorów XML, podobnie jak większość przeglądarek internetowych, posiada wbudowaną obsługę XSLT. Więcej szczegółów na ten temat znajdziesz w dodatku A.

Rysunek 2.1. Podstawowy dokument XML reprezentujący pojedynczy cud świata. Zwróć uwagę na instrukcję przetwarzania xml-stylesheet wiążącą ten dokument XML z arkuszem styl XSLT

Przekształcanie dokumentów XML

Analizowanie źródła XML Na początek musisz powiązać swój dokument XML z arkuszem stylów XSLT za pomocą instrukcji przetwarzania xml-stylesheet (rysunek 2.1). Następnie, kiedy otworzysz swój dokument XML w procesorze XSLT lub w przeglądarce, wspomniana instrukcja nakaże procesorowi wykonanie przekształcenia XSLT przed wyświetleniem danego dokumentu.

Rysunek 2.2. Reprezentacja drzewa węzłów odpowiadającego dokumentowi XML przedstawionemu na rysunku 2.1.

W pierwszym etapie tej transformacji procesor XSLT analizuje dokument XML i konwertuje go do postaci drzewa węzłów (ang. node tree). Takie drzewo stanowi hierarchiczną reprezentację dokumentu XML (rysunek 2.2). W drzewie każdy węzeł (ang. node) jest indywidualną częścią dokumentu XML (taką jak element, atrybut lub pewna zawartość tekstowa).

Odwoływanie się do arkusza stylów XSLT Kiedy procesor zidentyfikuje już węzły w źródłowym dokumencie XML, odwołuje się do arkusza stylów XSLT (rysunek 2.3) w poszukiwaniu instrukcji wskazujących, co należy z tymi węzłami zrobić. Instrukcje te zawarte są w szablonach (ang. templates), które można porównać do funkcji w języku programowania.

38

Rysunek 2.3. Podstawowy dokument XSLT służący do przekształcenia dokumentu XML pokazanego na rysunku 2.1

XSLT Każdy szablon XSLT ma dwie części. Pierwszą z nich jest etykieta, która identyfikuje te węzły w dokumencie XML, do których zastosowanie ma dany szablon. Część druga zawiera instrukcje dotyczące faktycznego przekształcenia, które ma być wykonane. Te instrukcje, czy też reguły, mogą powodować, że węzły z dokumentu źródłowego zostaną potraktowane jako dane wyjściowe lub będą dalej przetwarzane. Instrukcje mogą również zawierać elementy literalne (ang. literal elements), które mają być wyświetlane w takiej formie, w jakiej zostały podane. Rysunek 2.4. Wyświetlony w przeglądarce Internet Explorer 8 plik HTML po finalnej transformacji

Wykonywanie przekształcenia Transformacja XSLT rozpoczyna się od przetworzenia szablonu głównego (ang. root template). Każdy arkusz stylów XSLT musi zawierać szablon główny. Szablon ten odnosi się do węzła głównego źródłowego dokumentu XML. Na rysunku 2.3 szablon główny jest zdefiniowany za pomocą elementu . Wewnątrz szablonu głównego mogą znajdować się inne podszablony, które mają zastosowanie do pozostałych węzłów z dokumentu XML.

XSLT może być używany do konwersji prawie każdego rodzaju dokumentu na inny, jest to jednak dość zawiła procedura. W tej książce skoncentruję się na zastosowaniu XSLT do konwersji dokumentów XML na HTML. Pozwala to wykorzystać mocne strony oraz elastyczność XML-a przy obsłudze danych oraz kompatybilność HTML-a przy przeglądaniu tych danych.

Wskazówki  Arkusze stylów XSLT są plikami tekstowymi i zapisywane są z rozszerzeniem .xsl.  W przypadku niektórych procesorów XSLT nie jest wymagana w dokumencie XML instrukcja xml-stylesheet. Zamiast tego możesz przypisać swój arkusz stylów XSLT do dokumentu XML.  XSLT wykorzystuje język XPath do identyfikacji węzłów. Język XPath jest na tyle złożony, że zasługuje na omówienie w osobnych rozdziałach: 3., „Wzorce i wyrażenia XPath”, oraz 4., „Funkcje XPath”.

39

Przekształcanie dokumentów XML

Transformacja jest kontynuowana, dopóki nie zostanie przetworzona ostatnia instrukcja szablonu głównego. Przekształcony dokument jest następnie zapisywany do innego pliku lub wyświetlany w przeglądarce (rysunek 2.4). Może być też jednocześnie zapisywany i wyświetlany.

Rozdział 2.

Inicjowanie arkusza stylów XSLT Każdy arkusz stylów XSLT jest w rzeczywistości dokumentem XML i dlatego powinien się rozpoczynać standardową deklaracją XML. Kiedy to już jest załatwione, możesz zdefiniować przestrzeń nazw W3C dla arkuszy stylów.

Aby zainicjować arkusz stylów XSLT: 1. Wpisz , żeby wskazać, że dany arkusz stylów XSLT jest dokumentem XML. 2. Wpisz , żeby określić przestrzeń nazw dla arkusza stylów i zadeklarować prefiks (xsl).

3. Zostaw kilka pustych wierszy, które będą tworzyć dany arkusz stylów (za pomocą instrukcji omówionych w tym oraz w dwóch kolejnych rozdziałach).

Inicjowanie arkusza stylów XSLT

4. Na koniec wpisz , żeby zakończyć arkusz stylów (rysunek 2.5).

Wskazówki  Nie ma żadnych spacji w znaczniku xsl:stylesheet (nie zapisujemy go jako xsl:style sheet). Niemniej jednak w tej książce, odnosząc się do arkuszy stylów (ang. style sheets), używam dwóch wyrazów (według konwencji).  Nagłówek arkusza stylów jest prawie zawsze taki sam. Pierwsze dwa wiersze można po prostu kopiować z jednego arkusza stylów do kolejnego.  Więcej informacji na temat przestrzeni nazw znajdziesz w rozdziałach 12. i 13.

40

Rysunek 2.5. Arkusz stylów XSLT jest dokumentem XML i musi być poprawny pod względem składniowym

XSLT

Tworzenie szablonu głównego Pierwszą rzeczą, której szuka procesor XSLT w arkuszu stylów, jest szablon główny (ang. root template). Jest to szablon definiujący zestaw reguł stosowanych do węzła głównego dokumentu XML. Konkretnie opisuje on sposób przetwarzania lub transformacji zawartości z węzła głównego w nowe dane wynikowe. Rysunek 2.6. Szablon główny (match="/") to punkt początkowy dla całego przetwarzania XSLT

Aby utworzyć szablon główny: 1. Wpisz , żeby zamknąć znacznik. 4. Pozostaw kilka pustych wierszy dla sprecyzowania reguł danego szablonu, czyli wskazania, jakiej transformacji ma zostać poddany dokument XML (omówię to w kolejnych fragmentach tego rozdziału). 5. Na koniec wpisz , żeby zakończyć szablon główny (rysunek 2.6).

Wskazówki

 Wszystkie transformacje XSLT muszą rozpoczynać się od szablonu głównego. Jeśli w swoim arkuszu stylów XSLT nie umieścisz szablonu głównego, automatycznie zostanie użyty szablon główny wbudowany w procesor XSLT. Zazwyczaj ten wbudowany szablon powoduje wyświetlenie wszystkich danych z dokumentu XML w postaci zwykłego tekstu (co nie jest prawdopodobnie Twoim zamierzeniem).

41

Tworzenie szablonu głównego

 Chociaż dla procesora XSLT nie jest istotne, w którym miejscu arkusza stylów XSLT pojawia się szablon główny, prawdopodobnie będzie bardziej czytelne dla Ciebie (oraz innych osób analizujących Twój arkusz stylów), jeśli umieścisz go na samym początku.

Rozdział 2.

Uzyskiwanie pliku wyjściowego HTML Skoro utworzyłeś już szablon główny, musisz teraz zdefiniować zestaw reguł dla tego szablonu. Reguły te zostaną zastosowane do zawartości węzła głównego. W szablonie głównym na początku tworzy się zazwyczaj określoną strukturę dla ostatecznego, przekształconego dokumentu. Jeśli finalnym dokumentem ma być HTML, powinieneś co najmniej dodać informacje nagłówka HTML (head, title, body itd.). Oczywiście możesz dodać także nieco więcej kodu HTML, CSS i JavaScript. Aby procesor XSLT utworzył plik wyjściowy w postaci dokumentu HTML, musisz zastosować instrukcję przetwarzania xsl:output (rysunek 2.7). Jako metodę wynikową (ang. output method) możesz ustawić html, xml lub text. Jeśli ta instrukcja zostanie pominięta, procesor domyślnie zwróci plik wyjściowy XML.

Uzyskiwanie pliku wyjściowego HTML

Aby ustawić metodę wynikową procesora jako HTML: 1. Zaraz po elemencie xsl:stylesheet wpisz . W dalszej kolejności, aby dodać HTML do wyświetlanych danych, możesz zastosować elementy literalne (ang. literal elements) będące jednym z komponentów arkusza stylów XSLT. Elementy te to zazwyczaj kod i tekst HTML; są one wyświetlane w taki sposób, w jaki pojawiają się w arkuszu stylów.

Aby dodać tekst HTML do pliku wyjściowego szablonu głównego:  W obrębie reguły szablonu głównego (umieszczonej pomiędzy znacznikami oraz ) dodaj tekst HTML, który ma być wyświetlany w przypadku zastosowania tego szablonu. W szablonach innych niż szablon główny również możesz dodawać HTML do pliku wyjściowego.

42

Rysunek 2.7. Wszystko w obrębie szablonu głównego, co nie jest instrukcją XSLT (czyli elementy literalne), będzie wyświetlane w takiej formie, w jakiej zostało zapisane. Jest to łatwy sposób dodawania znaczników i tekstu HTML do pliku wynikowego

XSLT Aby dodać tekst HTML do pliku wyjściowego dowolnego szablonu:  W obrębie reguły dowolnego szablonu (umieszczonej pomiędzy znacznikami oraz ) dodaj tekst HTML, który ma być wyświetlany w przypadku zastosowania tego konkretnego szablonu.

Wskazówki  Ponieważ wszystkie dokumenty XSLT są dokumentami XML, muszą być poprawne składniowo. W konsekwencji kod HTML zastosowany w dokumencie XSLT również musi być poprawny składniowo. Więcej szczegółów na ten temat znajdziesz w rozdziale 1.  Więcej informacji na temat pisania dokumentów HTML lub XTML znajdziesz w popularnej książce Elizabeth Castro Po prostu HTML, XTML i CSS. Szczegóły dotyczące tej publikacji umieszczone zostały na stronie http://helion.pl/ksiazki/po-prostu-htmlxhtml-i-css-wydanie-vi-elizabeth-castro,pphxc4.htm.

Uzyskiwanie pliku wyjściowego HTML 43

Rozdział 2.

Wyświetlanie wartości Wyświetliłeś tekst HTML, wykorzystując szablon główny, ale Twój arkusz stylów XSLT nadal nie zajął się zawartością XML (rysunek 2.8). Aby rzeczywiście wyświetlić zawartość węzła XML (nazwijmy ją wartością ciągu; ang. string value), powinieneś zastosować element .

Aby wyświetlić zawartość węzła: 1. W razie potrzeby przygotuj kod HTML, który sformatuje daną zawartość (patrz podrozdział „Uzyskiwanie pliku wynikowego HTML”). 2. Wpisz
Wyświetlanie wartości

4. Na koniec wpisz />, aby zamknąć znacznik.

Rysunek 2.8. Chociaż dokument XML został przetworzony, procesor XSLT wciąż nie zajął się samą zawartością tego dokumentu XML. Wyświetlone zostały jedynie znaczniki i tekst HTML. W dalszej części tego rozdziału pokażę Ci, jak wykorzystać XSLT do transformacji źródłowego dokumentu XML do wygenerowania pewnych jego fragmentów w postaci HTML

Rysunek 2.10. Fragment źródłowego dokumentu XML, z którego wynika, że element cud zawiera dwa elementy nazwa oraz dodatkową zawartość

44

Rysunek 2.9. Na razie tak wygląda to w przeglądarce. Efekt nie jest jeszcze zbyt ekscytujący, ale już coś osiągnęliśmy

XSLT Wskazówki  Możesz użyć instrukcji select="." do wyświetlenia zawartości bieżącego węzła. Zostało to omówione szczegółowo w rozdziale 3.  Jeśli wyrażenie select odpowiada więcej niż jednemu węzłowi w dokumencie XML, wyświetlana jest jedynie wartość pierwszego węzła. W przykładzie z rysunku 2.12 wiele węzłów odpowiada wyrażeniu select z rysunku 2.11, ale wyświetlana jest jedynie wartość pierwszego z nich („Kolos z Rodos”).

Rysunek 2.11. W tym przykładzie znacznik xsl:value-of żąda wartości elementu nazwa (zagnieżdżonego w elemencie cud umieszczonym w elemencie cuda_starozytnosci)

 Gdybym chciał działać na wielu węzłach, potrzebowałbym nowego elementu XSLT, który został omówiony w podrozdziale „Zapętlanie węzłów”.  Jeśli w przykładzie z rysunku 2.11 chciałbym zwrócić węzły nazwa, dla których atrybut jezyk równa się polski, napisałbym xsl:value-of select="nazwa[@jezyk='polski']". Więcej informacji na ten temat znajdziesz w podrozdziale „Warunkowe przetwarzanie węzłów”.

 Jeśli wyrażenie select odpowiada pustemu zbiorowi węzłów, nic nie jest wyświetlane. Rysunek 2.12. Kiedy procesor XSLT stosuje szablon główny na rysunku 2.12, najpierw wyświetla cały kod nagłówka HTML. Następnie, kiedy dociera do elementu xsl:value-of, wyświetla jedynie wartość pierwszego znalezionego węzła. Wartością tą jest Kolos Rodyjski. Zwracanie kilku wartości zostało omówione w kolejnym podrozdziale, „Zapętlanie węzłów”

 Jeśli wyrażenie select wskazuje liczbę, liczba ta jest konwertowana na ciąg do wyświetlenia.  Jeśli wyrażenie select wskazuje wartość logiczną (prawda lub fałsz), wyświetlany jest tekst „prawda” lub „fałsz”.

Rysunek 2.13. A teraz procesor XSLT faktycznie wykorzystuje dane wejściowe z dokumentu źródłowego XML

45

Wyświetlanie wartości

 Jeśli wyrażenie select odpowiada określonemu węzłowi, to wyświetlana jest wartość ciągu tego węzła (tekst, który dany węzeł zawiera). W przypadku gdy ten węzeł posiada elementy potomne, plik wynikowy zawiera również tekst umieszczony w tych elementach potomnych.

Rozdział 2.

Zapętlanie węzłów Jak dowiedziałeś się w poprzednim podrozdziale, element xsl:value-of będzie odnosił się tylko do jednego węzła, nawet jeśli odpowiada kilku węzłom. Z kolei element xsl:for-each pozwala Ci działać na wszystkich węzłach, do których pasuje. Przetwarza on wszystkie węzły wskazane atrybutem select, jeden po drugim.

Aby przetwarzać węzły partiami: 1. W obrębie reguły szablonu wpisz , aby zamknąć znacznik. 4. Określ, jaki rodzaj przetwarzania ma być zastosowany.

Zapętlanie węzłów

5. Na koniec wpisz , aby zakończyć instrukcję (rysunek 2.14).

46

Rysunek 2.14. Element xsl:for-each zawiera wszystkie informacje na temat tego, co powinno stać się z każdym węzłem cud w węźle cuda_starozytosci. Pierwszy element xsl:value-of żąda węzła nazwa, dla którego atrybut jezyk równa się polski. Drugi element xsl:value-of żąda ponownie węzła nazwa, ale tym razem atrybut jezyk tego węzła ma nie równać się polski (!= oznacza „nie równa się”)

XSLT Wskazówki  Zasadniczo element xsl:for-each umieszczaj tuż przed regułami, które mają być powtarzane dla każdego znalezionego węzła. Aby dodać tabelę lub innego typu pojemnik, należy to zrobić, odpowiednio: przed znacznikiem otwierającym i po znaczniku zamykającym.  Element xsl:for-each jest często wykorzystywany do tworzenia tabel HTML (rysunek 2.15). Umieść otwierający i zamykający znacznik przed instrukcją oraz po niej, tak jak widać na rysunku 2.14. Następnie zastosuj znaczniki oraz

xml-szybki-start-wydanie-ii-kevin-howard-goldberg

Recommend Documents