Про розмір специфікації OOXML

Жовтень 4th, 2008

Майже випадково натрапив на старий (від першого лютого) пост Мігеля Ікази. Він там висловлює власну думку про війну форматів, і, зокрема, про обсяг специфікації формату, запропонованої Microsoft:

Основне запереченя проти OOXML полягає в тому, що специфікація є “занадто великою”. Нібито 6000 сторінок занадто багато для специфікації і що це заважатиме третім сторонам від реалізовувати підтримку стандарту.

Насправді, це, мабуть, насправді є скоріше перевагою. Варто згадати, що протягом багатьох років ми намагались отримати як можна більше інформації про ці стандарти.

Наприклад, дуже давно, коли я працював над Gnumeric, суттєвою проблемою була відсутність інформації про функції і формули в Excel. В наявній тоді літературі це все було описано дещо неповно.

В описі OOXML опису формул та функцій присвячено 324 сторінки.

В початковому зверненні до робочої групи ECMA TC45 ця інформація була відсутня. Jody Goldberg та Michael Meeks (представники Novell у TC45) запросили її та включили до опису стандарту. Я вважаю це перемогою. Ці 324 сторінки (майже половина опису ODF) — перемога для всіх.

В залежності від того, як рахувати, в ODF на опис формул відведено від 4 до 10 сторінок. Очевидно, геть неможливо написати програму для обробки таблиць, використовуючи лише цей опис.

Щоб написати програму для роботи з таблицями в форматі ODF, доведеться додатково вивчати вихідні коди існуючих реалізацій (OpenOffice.org, Gnumeric), або відкриту документацію Microsoft, або , як це не смішно, OOXML.

Також трохи далі він детальніше розглядає структуру опису OOXML:

  • ~100 page “Fundamentals” document; ~ 100 сторінок “Основи” документа;
  • ~200 page “Packaging Conventions” document; ~ 200 сторінок “Упаковка конвенцій” документ;
  • ~450 page “Primer” document (a tutorial); ~ 450 сторінок “Primer” документ (підручник);
  • ~1850 page Word Processing reference document; ~ 1850 сторінок присвячено роботі з текстовими документами;
  • ~1090 page Spreadsheet Processing reference document; ~ 1090 сторінок — робота з електронними таблицями;
  • ~270 page Presentation Processing reference document; ~ 270 стор присвячено презентаціям;
  • ~1140 page Drawing Processing reference document; ~ 1140 стор огляд роботи з малюнками;
  • ~900 pages for other references (VML, SharedML) ~ 900 сторінок на інші стандарти (VML, SharedML)
  • ~42 future extensibility document. ~ 42 зауваження щодо подальшого розвитку документа.

І ще трохи далі Мігель цитує лист якогось Christian Stefan з аналізом розмірів специфікації ODF

ODF 722 pages
SVG 719
MathML 665
XForms 152 (конвертовано з html з використанням winword, ymmv)
XLink 36 (конвертовано from html з використанням winword, ymmv)
SMIL 537 (конвертовано from html з використанням winword, ymmv)
OpenFormula 371
----
3,202

При цьому все ще пропущено ряд стандартів, які теж могли б додати ще кількасот сторінок (прим. whirlwind: він забув про опис формату JAR – архів, у який запаковані всі ці xml-файли). Здається, збільшивши міжрядковий інтервал до 1.5, можна було б отримати десь біля 6000 сторінок. Що, взагалі то, не дуже дивує (принаймі мене), тому що обидва стандарти схожі завдання приблизно однакової складності

Не знаю, у мене виникає певний сумнів включення опису SVG до цього переліку. Втім, тут абсолютної правди не знайдеш, якась сторона завжди трохи змінює дійсність.

А війна тим часом триває. На Groklaw виникло повідомлення (з коротеньким перекладом на опеннеті) про те, що Microsoft нібито намагається взяти під свій контроль подальшу розробку формату ODF. Типу там десь виплив якийсь лист, в якому йдеться про те, що роботи по супроводженню ODF має виконувати комітет, більшість членів якого працюють у Microsoft. А як ви думаєте, де працюють співголови діючого комітету? Нічого надзвичайного, все закономірно: один у Sun, другий у IBM.

Категорії: linux, програмування | Теґи:, , ,

Залишити коментар