Poznanie formatu EPUB: struktura i zawartość

E-booki zrewolucjonizowały sposób, w jaki coraz więcej osób konsumuje treści pisane, umożliwiając wygodny dostęp do ogromnej liczby publikacji na czytnikach e-booków, urządzeniach mobilnych i komputerach. Ale czy kiedykolwiek zastanawialiście się nad technologią, która to wszystko umożliwia?

Istnieje wiele formatów wykorzystywanych do tworzenia e-booków, a jednym z najpopularniejszych jest format EPUB, oparty na standardach. Przyjrzyjmy się, jak działa format EPUB, tworząc własną e-book w tym formacie, a następnie wykorzystując istniejące strony HTML, aby uzupełnić treść.

Czym jest format EPUB?

EPUB® (elektroniczna publikacja) to otwarty standard opracowany przez Międzynarodowe Forum Wydawnictw Cyfrowych (IDPF), służący do tworzenia i dystrybucji publikacji cyfrowych, takich jak e-booki. Treść w formacie EPUB jest "elastyczna", co oznacza, że może być wyświetlana na różnych czytnikach e-booków obsługujących ten standard (Kindle, Sony Reader, Nook, Kobo, itp.), a także na większości smartfonów i tabletów.

Dokument EPUB składa się z elementów takich jak OPS (otwarta struktura publikacji), OPF (otwarty format opakowania), OCF (otwarty format kontenera), XHTML, CSS, SVG, obrazy oraz inne typy plików, zorganizowanych w pojedynczym, uniwersalnym formacie, co ułatwia dystrybucję i publikację.

Edycja i weryfikacja zawartości plików EPUB

Elementy, z których składa się dokument EPUB, są spakowane w archiwum ZIP. Program XMLSpy zawiera Edytor formatu EPUB do przeglądania, dodawania, usuwania, weryfikacji i edycji tych plików i folderów. XMLSpy zawiera nawet przykładową książkę w formacie EPUB, dzięki czemu można łatwo zapoznać się z tą funkcjonalnością. Stwórzmy e-booka od podstaw, aby lepiej przyjrzeć się strukturze i elementom zawartym w każdym dokumencie. W tym przykładzie stworzymy książkę kucharską.

Zacznijmy od wybrania opcji "Nowy" z menu "Plik", a następnie kliknij "Publikacja elektroniczna .epub". Po wprowadzeniu nazwy dla naszej nowej książki elektronicznej i jej zapisaniu, otwiera się ona w widoku archiwum XMLSpy jako szkielet, który zawiera wszystkie pliki i foldery niezbędne do utworzenia prawidłowego dokumentu EPUB.

Jak widać powyżej, każdy plik EPUB ma następującą strukturę i składa się z następujących kluczowych elementów:

|-- Mimetype file (Archive) |-- META-INF folder |             -- container.xml |-- DOCUMENT folder (In the screenshot above, OEBPS is the Document folder.) |             -- contains HTML, CSS, image files, plus OPF and NCX files

Plik OPF, tradycyjnie nazywany content.opf, zawiera metadane cyfrowej książki. Jest on oparty na specyfikacji Open Packaging Format (OPF).

Plik NCX (plik sterowania nawigacji w formacie XML), tradycyjnie nazywany toc.ncx, zawiera spis treści e-booka. Jest on oparty na sekcji NCX specyfikacji OPF.

Folder o nazwie META-INF musi zawierać plik container.xml, który wskazuje na plik definiujący zawartość książki (plik OPF). Plik container.xml określa, w jaki sposób pliki archiwum powinny być zorganizowane, zgodnie z zasadami określonymi w specyfikacji Open Container Format (OCF).

XMLSpy oferuje pomoc w edycji dostosowaną do konkretnego kontekstu oraz przydatne wskazówki dotyczące edycji wszystkich plików zgodnych z danymi standardami. Zacznijmy tworzyć treść naszej książki elektronicznej, klikając dwukrotnie plik "title.html". Po otwarciu go w edytorze HTML w programie XMLSpy, od razu zobaczymy, co należy zaktualizować jako pierwsze.

Dodajmy teraz wstępną treść, wykorzystując elementy zastępcze zawarte w pliku, a także dodajmy znaczniki

i

dla wiadomości powitalnej.

Po zapisaniu tych zmian, możemy powrócić do widoku "Archiwum", aby podglądnąć zawartość naszego dokumentu EPUB do tej pory. Kliknięcie przycisku "Podgląd" generuje plik HTML na podstawie zawartości znajdującej się w archiwum EPUB i wyświetla go w zintegrowanym oknie przeglądarki XMLSpy.

Jak widać, brakuje jeszcze niektórych wymaganych informacji. Kliknijmy dwukrotnie plik content.opf, aby dodać metadane e-booka. Tym razem możemy przełączyć się do widoku siatki, aby wprowadzić dane. Łatwo przełączać się między edycją tekstową a graficzną, w zależności od preferencji.

Ponowne kliknięcie przycisku "Podgląd" potwierdza, że nasze wstępne dane są kompletne.

Zanim przejdziemy dalej, pozwólcie, że Zweryfikuj plik EPUB Aby zapewnić kompatybilność, naciśnij klawisz F8.

Nasz plik jest poprawny i możemy kontynuować dodawanie pozostałej zawartości do archiwum EPUB, aby ukończyć nasz e-book. W przypadku wystąpienia błędów, okno weryfikacji XMLSpy wyświetla listę wszystkich błędów wraz z ich opisem oraz linkiem do miejsca, w którym wystąpiły w pliku, co ułatwia rozwiązywanie problemów.

Ponowne wykorzystanie istniejących treści w formacie EPUB

W dzisiejszych czasach, kiedy czytelnicy mają do dyspozycji tak wiele sposobów na korzystanie z treści pisemnych – od e-booków, przez pliki PDF, po strony internetowe – coraz częściej wymagane jest, aby te same treści były dostępne w wielu różnych formatach. Im łatwiej to osiągnąć, tym lepiej.

W programie XMLSpy łatwo można wykorzystać zawartość HTML z witryny internetowej w dokumencie EPUB. Kontynuując nasz przykład, dodajmy kilka istniejących stron HTML z bloga kulinarnego autora, aby rozbudować treść e-booka.

Możemy dodać te artykuły blogowe, klikając przycisk "Dodaj dokument" w widoku archiwum, a następnie przeglądając dostępne pliki, aby je wybrać.

Musimy również dodać obrazy zawarte w plikach HTML. Ponieważ są to pliki binarne, najlepszym sposobem jest otwarcie dokumentu EPUB za pomocą programu WinZip lub WinRAR i dodanie wymaganych plików do archiwum.

Po zapisaniu archiwum ZIP, dokument EPUB w programie XMLSpy odzwierciedli wprowadzone zmiany.

Następnie zaktualizujmy plik spisu treści (toc.ncx), aby wskazywał na strony HTML, tworząc oddzielne elementy NavPoint i NavLabel dla każdej strony HTML...

...oraz zaktualizować plik content.opf, aby uwzględnić nasze strony HTML jako część manifestu EPUB.

Tym razem, po kliknięciu przycisku "Podgląd", widzimy oba artykuły, które dodaliśmy, i możemy przejść do każdego z nich.

Nasz e-book nabiera kształtu!

Oczywiście, to jest bardzo prosty przykład, ale jest on przydatny do zrozumienia struktury dokumentów EPUB i pokazuje, jak łatwo można ponownie wykorzystać istniejące treści w formacie EPUB. Oprócz intuicyjnego widoku archiwum, program XMLSpy oferuje zaawansowane wsparcie edycji dla technologii niezbędnych do tworzenia najbardziej zaawansowanych prezentacji e-booków: XML, XHTML, HTML, CSS i inne.

Aby zobaczyć strukturę kompletnej książki w formacie EPUB, otwórz plik TheCantervilleGhost.epub w projekcie XMLSpy Examples – lub skorzystaj z jednej z darmowych książek w formacie EPUB dostępnych w Internecie. Doskonałym źródłem jest Project Gutenberg.

Jeśli jeszcze nie jesteś klientem XMLSpy, możesz pobrać Bezpłatna wersja próbna programu XMLSpy Spróbuj tego teraz.