2. Terminy i definicje
Ten rozdział ma charakter informacyjny.
Niektóre z terminów są definiowane na miejscu, natomiast poniższe definicje używane są w całym dokumencie. Zaznajomienie się z Rekomendacją W3C XML 1.0 [XML] jest szczególnie zalecane.
- definicja typu dokumentu (DTD, ang. document type definition)
- formalne, odczytywalne przez maszyny wyrażenie struktury XML i reguł składniowych, z którymi egzemplarz dokumentu określonego typu dokumentu musi być zgodny; typ schematu używany XML 1.0 do sprawdzania
poprawności strukturalnej egzemplarza dokumentu pod względem zadeklarowanego typu dokumentu. Ten sam model oznakowania może być wyrażony przez wiele różnych DTD.
- deklaracja oznakowania (ang. markup declaration)
- konstrukcja składniowa wewnątrz DTD deklarująca encję lub definiująca strukturę oznakowania. W ramach DTD XML są określone cztery typy: deklaracja encji definiuje powiązanie pomiędzy mnemonicznym
symbolem a jej zawartością zastępującą; deklaracja elementu zawiera ograniczenia, które z typów elementów mogą pojawić się jako jako elementy potomne wewnątrz elementu (zobacz też: model zawartości); deklaracja wykazu atrybutów
definiuje zbiór atrybutów dla danego typu elementu i może też ustanowić ograniczenia dotyczące typu atrybutów i wartości domyślne; deklaracja notacji definiuje powiązanie pomiędzy nazwą notacji a zewnętrznym
identyfikatorem odnoszącym się do formatu nieparsowanej encji.
- dokument hybrydowy (ang. hybrid document)
- dokument hybrydowy to dokument korzystający z więcej niż jednej przestrzeni nazw XML. Dokumenty hybrydowe mogą być definiowane jako dokumenty zawierające elementy lub atrybuty z hybrydowych typów dokumentu.
- element
- egzemplarz typu elementu.
- encja (ang. entity)
- encja to logiczna lub fizyczna jednostka przechowywania zawierająca treść dokumentu. Encje mogą składać się z parsowalnego oznakowania XML, danych znakowych lub nieparsowanej (np. nie-XML-owej, być może nietekstowej)
zawartości. Zawartość encji może być zdefiniowana albo całkowicie wewnątrz encji dokumentu („encje wewnętrzne”), albo na zewnątrz encji dokumentu („encje zewnętrzne”). W encjach parsowanych tekst zastępujący
może zawierać odwołania do innych encji.
- encja parametryczna (ang. parameter entity)
- encja, której zakres użycia mieści się wewnątrz prologu dokumentu (tj. zewnętrznym lub wewnętrznym podzbiorze DTD). Encje parametryczne są niedozwolone wewnątrz egzemplarza dokumentu.
- identyfikator ogólny (ang. generic identifier)
- nazwa identyfikująca typ danego elementu. Także nazwa typu elementu.
- model dokumentu (ang. document model)
- faktyczna struktura i ograniczenia danego typu dokumentu. Model dokumentu stanowi abstrakcyjną reprezentację fizycznych lub semantycznych struktur klasy dokumentów.
- model modularyzacji (ang. modularization model)
- abstrakcyjny projekt definicji typu dokumentu (DTD) służący osiągnięciu celów modularyzacji, takich jak: możliwość powtórnego użycia, rozszerzalność, ekspresywność, łatwość dokumentowania, wielkość kodu, spójność i
intuicyjność użytkowania. Ważne, by zaznaczyć, że model modularyzacji jest tylko pośrednio powiązany z opisywanym przez niego modelem dokumentu, więc dwa bardzo
różne modele modularyzacji mogą opisywać ten sam typ dokumentu.
- model oznakowania (ang. markup model)
- słownik oznakowania (tj. zbiór nazw elementów i atrybutów, notacji, itd.) i gramatyka (tj. nakazany sposób używania tego słownika) zdefiniowane przez definicję typu dokumentu (tj. schemat).
Model oznakowania jest konkretną reprezentacją w składni oznakowania modelu dokumentu i może być zdefiniowany na różnych poziomach zgodności ze standardem. Ten sam model dokumentu może być wyrażony przez wiele różnych modelów oznakowania.
- model zawartości (ang. content model)
- zadeklarowana struktura oznakowania dozwolona wewnątrz egzemplarzy typu elementu. XML 1.0 rozróżnia dwa typy: elementy zawierające tylko zawartość elementu (żadnych danych znakowych) oraz zawartość mieszaną
(elementy, które mogą zawierać dane znakowe opcjonalnie urozmaicone elementami potomnymi). Te ostatnie charakteryzowane są przez określenie zawartości rozpoczynające się łańcuchem „#PCDATA” (co oznacza dane znakowe).
- modularyzacja (ang. modularization)
- implementacja modelu modularyzacji; proces łączenia lub dzielenia DTD poprzez rozdzielenie jego deklaracji oznakowania na jednostki lub grupy dla osiągnięcia określonych celów. Moduły mogą, lecz nie muszą
być oddzielnymi encjami plikowymi (tj. fizyczne i logiczne struktury DTD mogą się wzajemnie odzwierciedlać, lecz nie jest to konieczne).
- moduł (ang. module)
- abstrakcyjna jednostka wchodząca w skład modelu dokumentu wyrażona jako fragment DTD, używana do konsolidowania deklaracji oznakowania w celu zwiększenia elastyczności, modyfikowalności, możliwości powtórnego użycia i zrozumienia określonych
logicznych lub semantycznych struktur.
- moduł abstrakcyjny (ang. abstract module)
- jednostka specyfikacji typu dokumentu odnosząca się do odrębnego rodzaju zawartości, odpowiadająca konstrukcji oznakowania odzwierciedlającej ten odrębny typ.
- odwołanie do encji (ang. entity reference)
- łatwy do zapamiętania [dla użytkownika języka angielskiego] łańcuch używany jako odwołanie do zawartości zadeklarowanej encji (np.
&
dla „&”, <
dla „<”, ©
dla „©”).
- rodzicielski typ dokumentu (ang. parent document type)
- rodzicielski typ dokumentu dokumentu hybrydowego to typ dokumentu elementu głównego.
- rozwijać (ang. instantiate)
- zamieniać odwołanie do encji na egzemplarz jej zadeklarowanej zawartości.
- sterownik (ang. driver)
- zazwyczaj niewielki plik używany do deklarowania i rozwijania modułów DTD. Dobrze jest przyjąć regułę, że sterownik DTD nie zawiera żadnych deklaracji oznakowania stanowiących jakąkolwiek część modelu dokumentu.
- typ dokumentu (ang. document type)
- klasa dokumentów posiadających wspólną abstrakcyjną strukturę. Definicja ISO 8879 [SGML] jest następująca: „klasa dokumentów mających podobne
właściwości, na przykład dziennik, artykuł, podręcznik czy notatka. (4.102)”
- typ elementu (ang. element type)
- definicja elementu, tj. pojemnik dla różnych klas zawartości dokumentu.
- znacznik (ang. tag)
- opisowe oznakowanie wyznaczające początek i koniec (włączając jego identyfikator ogólny i wszystkie atrybuty) elementu.