Формат ePub
EPUB представляет собой, по описанию IDPF, «XML-формат цифровых книг и публикаций с плавающей „резиновой“ версткой. EPUB составлен из трех открытых стандартов — Open Publication Structure (OPS), Open Packaging Format (OPF) и Open Container Format (OCF) — и позволяет издателям производить и распространять цифровую публикацию в одном файле, обеспечивая совместимость между программным и аппаратным обеспечением, необходимым для воспроизведения незашифрованных цифровых книг и других публикаций с плавающей версткой». Первоначальный вариант — Open eBook Publication Structure или «OEB» был задуман ещё в 1999 году, релиз ePub — 2007.
Zip-архив контейнера ePub содержит тексты в форматах xHTML, html или pdf россыпью (каждая глава отдельный файл), описание издания в xml — по dublin core, рядом в папках — графика, включая векторную (SVG), и встроенные шрифты (иногда несколько сотен), таблицы стилей и пр. и пр...
Слегка шалеешь, глядя на всё это хозяйство в натуре, и тем более, когда разработчики, объясняя что самый открытый и бесплатный формат, предлагают его редактировать в NotePad'е: мол, подготовь контент, запихни в zip-контейнер каким-нибудь архиватором и переименуй в .epub. Шутники, однако... Тем более, что у Adobe уже есть редактор с опцией экспорта документа в ePub — Adobe InDesign, кстати, и программа для чтения тоже — Adobe Digital Editions, т. е. полный комплект в наличии.
Формат ePub разработан International Digital Publishing Forum (idpf.org, прежнее название Open eBook Forum), организован в свое время при поддержке Adobe и Ассоциации американских издателей. Сторону IDPF представляют мейджоры мирового издательского рынка — Random House, HarperCollins и др. Цель издателей проста — получить электронную книгу, которую можно читать не на отдельном устройстве, а на каком угодно — от окошка мобильного телефона до монитора компьютера и, естественно, на экране букридера.
Лёгкое негодование при обнаружении нескольких метров фонтов проходит, когда вспоминаешь о желании Adobe донести до читателя документ в том виде, в каком его видел автор, и совсем забываешь, увидев замечательное отображение формул, чего нельзя было никоим образом добиться в изрядно кастрированном fb2.
Файл .epub содержит как минимум следующие каталоги и файлы:
- mimetype — сообщает читалке/операционной системе, что находится внутри;
- META-INF каталог — этот каталог содержит, как минимум, файл container.xml, который покажет программе для чтения, где в контейнере найти книгу;
- OEBPS каталог — рекомендованное размещение содержания книги. Он содержит:
- каталог изображений — здесь хранятся иллюстрации;
- Content.opf — XML файл со списком всего-всего в контейнере;
- toc.ncx — а это таблица содержания;
- xhtml файлы — в них содержатся книги.
Приглядимся к ним повнимательнее.
Одно существенное примечание — все названия файлов чувствительны к регистру: это подразумевает, что если у вас есть файл, названный «Chapter1.xhtml», и вы обращаетесь к нему как «chapter1.xhtml» в файле .OPF file или .NCX, то книга не будет отображаться соответствующим образом.
mimetype
Этот файл — просто ASCII текст, содержащий строку:
"application/epub+zip"
Операционная система, увидев этот файл, понимает взамен чего используется расширение файла .epub. Этот файл должен быть первым в zip-файле и не должен быть сжат.
META-INF каталог
Он содержит файл container.xml, который указывает местоположение файла Content.opf. Этот каталог один и тот же для всех e-book.
OEBPS каталог
— images Folder
Если имеются хоть какие-нибудь картинки в книге, то они должны быть здесь.
— Content.opf
Этот файл выдаёт список всех файлов в .epub контейнере, описывая их порядок, и хранит метаданные (автор, жанр, издатель, etc.). Вообще-то в нём может целая куча всего (см. также спецификацю тегов):
- dc:title — название книги;
- dc:language — идентификация языка, используемого в книге, согласно RFC 3066;
- dc:identifier — уникальный идентификатор книги. Спецификация не даёт чётких рекомендаций, поэтому туда можно лепить что угодно хоть ISBN.
Дальше следует manifest. Это всего лишь перечень файлов в контейнере .epub и их типов. Каждому пункту назначается свой ID, используемый в спин-секции content.opf. Этот перечень не имеет какого-то особого порядка.
Спин-секция обозначает порядок чтения содержания. В спин не перечислены всефайлы из манифеста — только порядок чтения. Например, если в манифесте упоминаются иллюстраци, то их, естественно, не будет в спине.
— toc.ncx
Это таблица содержания — оглавление. Этот файл управляет отображением левой панели содержания в читалке Digital Editions
— page-template.xpgt
Этот файл не является частью спецификации IDPF, но Adobe Digital Editions использует его для форматирования. Остальныечиталки могут его проигнорировать.
— Content .xhtml
Файлы содержания — XML 1.1 документы. Возможно хранение всей книги в одном файле с закладками для каждой части или по одной части в отдельном, якобы это лучше для большинства читалок.
Более конкретно со спецификациями можно ознакомиться здесь: Open Publication Structure (OPS), Open Packaging Format (OPF) и Open Container Format (OCF).

ePub EBook в Adobe Digital Editions
Список членов International Digital Publishing Forum
| |
Организация |
Год вступления |
| |
|
|
| |
MVB Marketing |
October 2008 |
| |
Nielsen Bookscan |
October 2008 |
| |
School of Print Media |
October 2008 |
| |
Bonnier Audio |
October 2008 |
| |
Digital Divide Data |
September 2008 |
| |
Libri.de Internet GmbH |
September 2008 |
| |
ReadHowYouWant.com |
August 2008 |
| |
Swets |
August 2008 |
| |
CourseSmart, LLC |
August 2008 |
| |
Landmark Limited |
July 2008 |
| |
Lexcycle LLC |
July 2008 |
| |
Simplicissimus Book Farm |
July 2008 |
| |
Crossway Publications |
June 2008 |
| |
Disruptive Publishing |
June 2008 |
| |
Albec Digital Publishers |
May 2008 |
| |
Quantitative Economic Research Bureau |
May 2008 |
| |
Gibson Publishing Solutions |
May 2008 |
| |
Association of Canadian Publishers |
April 2008 |
| |
Parse Publishing |
April 2008 |
| |
Societe de gestion BTL |
April 2008 |
| |
Digital Media Initiatives |
April 2008 |
| |
RoyaltyShare, Inc. |
March 2008 |
| |
CPI Publishing Solutions |
February 2008 |
| |
Smashwords Inc. |
February 2008 |
| |
Santillana en Red |
January 2008 |
| |
DNAML, Pty Limited |
November 2007 |
| |
Hindawi Publishing Corporation |
August 2007 |
| |
Donald W. Reynolds Journalism Institute |
May 2007 |
| |
O'Reilly Media |
May 2007 |
| |
Dial-a-Book Inc. |
April 2007 |
| |
Barnes & Noble.com |
April 2007 |
Компании — члены IDPF:
| Adobe Systems Incorporated |
www.adobe.com |
| Albec Digital Publishers |
www.albecdigitalpublishers.page.tl |
| AMAC |
www.amac.uga.edu |
| Amazon.com |
www.amazon.com |
| American Booksellers Association |
www.bookweb.org |
| American Library Association, OITP |
www.alawash.org |
| American Printing House for the Blind, Inc. |
www.aph.org |
| Apex Publishing Solutions |
www.apexcovantage.com |
| Aptara |
www.aptaracorp.com |
| Associated Press |
www.ap.org |
| Association of American Publishers |
www.publishers.org |
| Association of Canadian Publishers |
www.publishers.ca |
| Ball State University |
www.bsu.edu |
| Barnes & Noble.com |
www.bn.com |
| Beijing Founder Apabi Technology Limited |
www.founder.com.cn |
| Benetech |
www.benetech.org |
| Bonnier Audio |
www.bonnieraudio.se |
| Book Industry Study Group, Inc. |
www.bisg.org |
| BookNet Canada |
www.booknetcanada.com |
| Books24x7 |
www.books24x7.com |
| BooksOnBoard, Ltd |
www.booksonboard.com |
| Bowker |
www.bowker.com |
| California State University System |
www.calstate.edu |
| Cambridge University Press |
www.cambridge.org |
| Cengage Learning |
www.cengage.com |
| codeMantra, LLC |
www.codemantra.com |
| Corning Inc. |
www.corning.com |
| CourseSmart |
www.coursesmart.com |
| CPI Publishing Solutions |
www.bookbank.com |
| Crossway |
www.crossway.org |
| DAISY Consortium |
www.daisy.org |
| Dial-a-Book Inc. |
www.dialabook.net |
| Digital Divide Data |
www.digitaldividedata.org |
| Digital Library Federation |
www.diglib.org |
| Digital Media Initiatives |
www.DigitalMediaInitiatives.com |
| DigitalPulp Publishing |
www.digitalpulppublishing.com |
| Disruptive Publishing |
www.munseys.com |
| DNAML Pty Limited |
www.dnaml.com |
| Donald W. Reynolds Journalism Institute |
www.journalism.missouri.edu |
| eBook Technologies, Inc. |
www.eBookTechnologies.com |
| E-Reads |
www.ereads.com |
| F.A. Davis |
www.fadavis.com |
| Follett |
www.follett.com |
| Fourteen40 Inc. |
www.fourteen40.com |
| Gibson Publishing Connections |
www.gibsonpublishingconnectins.ca |
| Greenwood Publishing Group |
www.greenwood.com |
| Hachette Book Group |
www.twbg.com |
| Harlequin Enterprises Ltd |
www.eHarlequin.com |
| HarperCollins Publishers |
www.harpercollins.com |
| Hazelden Publishing |
www.hazelden.org |
| Hindawi Publishing Corporation |
www.hindawi.com |
| Holtzbrinck Publishers, LLC |
www.holtzbrinck.com |
| HOV Services, Inc (Ex LASON Systems) |
www.econtentmax.com |
| HSLC |
www.accesspa.state.pa.us |
| Impress Holdings, Inc. |
www.impress.co.jp |
| Innodata Isogen |
www.innodata-isogen.com |
| IRex Technologies bv |
www.irextechnologies.com |
| John Wiley & Sons |
www.wiley.com |
| Klopotek North America |
www.klopotek.com |
| Landmark Limited |
www.landmarkonthenet.com |
| Learning Worlds |
www.learningworlds.com |
| Lerner Publishing Group |
www.lernerbooks.com |
| Lexcycle LLC |
www.lexcycle.com |
| LibreDigital |
www.LibreDigital.com |
| Libri.de Internet GmbH |
www.libri.de |
| Librisite de Mexico S.A. de C.V. |
www.librisite.com |
| Lightning Source Inc. |
www.lightningsource.com |
| Lightspeed, LLC |
|
| LiveInk |
www.liveink.com |
| MBS Direct, LLC |
www.mbsdirect.net |
| McGraw-Hill |
www.books.mcgraw-hill.com |
| Medicos Incorporated |
www.medicos.md |
| Merriam-Webster Inc. |
www.Merriam-Webster.com |
| MOBIPOCKET.COM |
www.mobipocket.com |
| MVB Marketing- und verlagsservice des Buchhandels GmbH |
www.mvb-online.de |
| National Association of College Stores |
www.nacs.org |
| National Geographic Society |
www.nationalgeographic.com |
| NDS |
www.nds.com |
| Nielsen BookScan |
www.nielsen.com |
| OCLC Online Computer Library Center |
www.oclc.org |
| O'Reilly Media |
www.oreilly.com |
| OSoft.com |
www.osoft.com |
| OverDrive, Inc. |
www.overdrive.com |
| Oxford University Press-USA |
www.oup.com/us |
| Parse Publishing |
www.parsepub.com |
| Pearson Education |
www.pearsoned.com |
| Pinion bv |
www.ebook.nl |
| Prime View International Co., Ltd. |
www.pvi.com.tw |
| Publishing Dimensions |
www.pubdimensions.com |
| Quantitative Economic Research Bureau |
www.quanterb.org |
| Random House |
www.randomhouse.com |
| ReadHowYouWant |
www.readhowyouwant.com |
| Recording for the Blind & Dyslexic |
www.rfbd.org |
| Rosetta Solutions, Inc. |
www.RosettaSolutions.com |
| RosettaBooks LLC |
www.rosettabooks.com |
| RoyaltyShare, Inc. |
www.royaltyshare.com |
| Samhain Publishing |
www.samhainpublishing.com |
| Santillana en Red |
www.santillanaenred.es |
| School of Print Media |
www.rit.edu |
| Simon & Schuster, Inc. |
www.simonsays.com |
| Simplicissimus Book Farm |
www.simplicissimus.it |
| Smashwords Inc. |
www.smashwords.com |
| Société de gestion BTLF |
www.mementolivres.com |
| Sony |
www.sony.com |
| Southern Illinois University Edwardsville Lovejoy Library |
www.library.siue.edu/lib |
| Stonehouse Press |
www.warrenadler.com |
| Swets |
www.swets.com |
| TexTech, Inc. |
www.stratfordpublishing.com |
| University of Alberta Bookstore |
www.bookstore.ualberta.ca |
| University of California Press |
www.ucpress.edu |
| University of Montreal |
www.groupelog.umontreal.ca |
| VitalSource Technologies |
www.vitalsource.com |
| Vitrium Systems |
www.vitrium.com |
| World Health Organization |
www.who.int |
Столь солидные списки объясняются легко — акулы почувствовали «запах крови» и, хотя пока денежный оборот невелик, но его динамика весьма впечатляет:
|