Share via


Glasznoszty (1) - Nyilvánosak az Office bináris fájlformátumai

Az Open XML szabványosítása körüli felhajtásban kicsit elfeledkeztünk a korábbi (bináris) fájlformátumokról. Az új formátum egyik fontos feladata éppen az, hogy modern, helytakarékos*, kiszolgálóbarát alternatívát kínáljon a régi helyett. Apróbb probléma, hogy abban a bizonyos "régi" .DOC, .XLS, .PPT formátumban dokumentumok trilliói találhatók a világ merevlemezein, és a rendelkezésre álló remek eszközökkel is csak ezek kis hányadát konvertálták eddig a cégek és magánszemélyek.

Szerintem kevesen tudják, hogy a bináris fájlformátumok specifikációja ma is elérhető. Az elérés módját a KB840817 tudásbázis-cikk "Microsoft Office Binary File Formats" c. szakasza írja le. A lényeg röviden: a formátumokat e-mailben kell kérni, és meg kell adni az igénylő cég és kapcsolattartó adatait, elérhetőségét (azt viszont nem, mire akarja használni az információt).

Ez a levelezgetés voltaképpen felesleges. Ezért az ECMA, miközben szép sorban megválaszolta az ISO-tagországok Open XML-lel kapcsolatos valamennyi (3 522 db) észrevételét, azt javasolta a Microsoftnak, hogy az tegye közzé a bináris fájlformátumokat a Microsoft Open Specification Promise program keretében. Amint azt Brian Jones jelenti, ez 2008. február 15-ig meg is fog történni.

Mit jelent ez a fejlesztők és vállalati üzemeltetők számára? Azt, hogy februártól - ha minden jól megy - a Microsoft Office még az eddigieknél is nyitottabb lesz:

  • az ISO érdekelt tagországai újabb (még nem végső) szavazást tartanak az Open XML szabvánnyá nyilvánításáról
  • a Microsoft elérhetővé teszi a bináris Office-fájlformátumokat

Magyarország sajnos már korábban elpuskázta a lehetőséget, hogy részt vegyen az ISO szavazásán...


* Egy bemutatóra készülve nemrég kielemeztem, majd automatikusan új formátumúra alakítottam egy évek óta használaton kívüli fájlmegosztás tartalmát. Eredmények:

eredeti fájlmegosztás:

  • 3 241 db Office-dokumentum (Office 95 és későbbi)
  • 3,11 GB összméret

az eredményül kapott fájlmegosztás:

  • 1,91 GB összméret (közel 40%-os megtakarítás)

a konverziós folyamat jellemzői:

  • vizsgálat: 0,15 másodperc / fájl
  • konverzió: kb. 3 másodperc / fájl
  • probléma: a fájlok kb. 5%-ával (hullámjellel kezdődő nevű ideiglenes fájlok, Office 97 előtti formátumok)

Comments

  • Anonymous
    January 17, 2008
    "1,91 GB összméret (közel 40%-os megtakarítás)" És ha csak simán betömörítetted volna a file-okat, akkor mekkora helymegtakaítás jött volna ki? Gondolom az Open XML-t is utolsó lépésben tömörítve tárolják mint minden más XML alapú dolgot.

  • Anonymous
    January 19, 2008
    átcsusszantál néhány részleten:

  • már létezik ISO szabvány dokumentumokra, az ODF, amely a többi ISO szabványt is tiszteletben tartja (pl. naptár). Nem világos, hogy a jelenlegi miért ne lenne jó (azon kívül, h nem az MS diktálja) és hogy miért ne lehetne kijavítani a vélt vagy valós hiányosságait.
  • az MS leírása a gyakorlatban használhatatlan mert:
  1. a SUN már rég visszafejtette és közzétette azt amit lehetett (openoffice.org)
  2. amit nem lehetett, az lényegében abból adódik, hogy ezek a fileok fat16-os logikai filerendszerre dumpolt sorosított MFC ojjektumok. Emulálhatatlan bugkompatibilitás miatt MS MFC nélkül értelmezhetetlenek/használhatatlanok
  3. a gyarkorlatban nem használhatod a leírást, mert nem adhatod tovább, hiába implementálsz egy eszközt, amiben felhasználod a "specifikációt". Magyarul nem GPL kompatibilis. De ha utálod a GPL-t akkor is szarban vagy, sőt, egyedül maradsz a problémáddal, mert nem sublicencelhető. Végül nyisd meg a filejaidat, és ha véletlenül több formázás van valamelyikben, mint egy sima CR/LF, akkor ne lepődj meg, ha nem ismersz rá a doksidra... utsó kérdést: mit kaptál ezért a blogbejegyzésért? Vagy csak simán felvilágosulatlan vagy a témában?
  • Anonymous
    January 21, 2008
    Kedves kecsa: A tartalom ugyanaz, a tömörítési algoritmus is, azaz nyilván kb. azonos méretűek lesznek a WinZip-pel készült fájlok (kipróbáltam, és az Open XML-változat 1,91 GB-jához képest 1,92-t kaptam). A különbség abban jelentkezik, hogy ez a be- és kitömörítés mind a felhasználó, mind pedig a fejlesztő számára transzparens. Előbbi csak az Office alkalmazások Mentés és Megnyitás gombjával, utóbbi a .NET System.IO.Packaging csomagjával találkozik.

  • Anonymous
    January 21, 2008
    Kedves - (kötőjel? gondolatjel? Senkise? utóbbihoz lásd még Odüsszeusz esetét a Küklopsz ellen :-) )! Mindazt, amit itt felvetettél, részletesen kitárgyalta a világ szaksajtója az utóbbi másfél évben. De nem baj, érdemes ismét tisztázni, miről is van szó az ODF kontra Open XML ügyben. Persze nem ebben a megjegyzésben: terjedelmi okokból inkább egy önálló bejegyzésben írom meg a véleményemet.