Glasznoszty (1) - Nyilvánosak az Office bináris fájlformátumai
Az Open XML szabványosítása körüli felhajtásban kicsit elfeledkeztünk a korábbi (bináris) fájlformátumokról. Az új formátum egyik fontos feladata éppen az, hogy modern, helytakarékos*, kiszolgálóbarát alternatívát kínáljon a régi helyett. Apróbb probléma, hogy abban a bizonyos "régi" .DOC, .XLS, .PPT formátumban dokumentumok trilliói találhatók a világ merevlemezein, és a rendelkezésre álló remek eszközökkel is csak ezek kis hányadát konvertálták eddig a cégek és magánszemélyek.
Szerintem kevesen tudják, hogy a bináris fájlformátumok specifikációja ma is elérhető. Az elérés módját a KB840817 tudásbázis-cikk "Microsoft Office Binary File Formats" c. szakasza írja le. A lényeg röviden: a formátumokat e-mailben kell kérni, és meg kell adni az igénylő cég és kapcsolattartó adatait, elérhetőségét (azt viszont nem, mire akarja használni az információt).
Ez a levelezgetés voltaképpen felesleges. Ezért az ECMA, miközben szép sorban megválaszolta az ISO-tagországok Open XML-lel kapcsolatos valamennyi (3 522 db) észrevételét, azt javasolta a Microsoftnak, hogy az tegye közzé a bináris fájlformátumokat a Microsoft Open Specification Promise program keretében. Amint azt Brian Jones jelenti, ez 2008. február 15-ig meg is fog történni.
Mit jelent ez a fejlesztők és vállalati üzemeltetők számára? Azt, hogy februártól - ha minden jól megy - a Microsoft Office még az eddigieknél is nyitottabb lesz:
- az ISO érdekelt tagországai újabb (még nem végső) szavazást tartanak az Open XML szabvánnyá nyilvánításáról
- a Microsoft elérhetővé teszi a bináris Office-fájlformátumokat
Magyarország sajnos már korábban elpuskázta a lehetőséget, hogy részt vegyen az ISO szavazásán...
* Egy bemutatóra készülve nemrég kielemeztem, majd automatikusan új formátumúra alakítottam egy évek óta használaton kívüli fájlmegosztás tartalmát. Eredmények:
eredeti fájlmegosztás:
- 3 241 db Office-dokumentum (Office 95 és későbbi)
- 3,11 GB összméret
az eredményül kapott fájlmegosztás:
- 1,91 GB összméret (közel 40%-os megtakarítás)
a konverziós folyamat jellemzői:
- vizsgálat: 0,15 másodperc / fájl
- konverzió: kb. 3 másodperc / fájl
- probléma: a fájlok kb. 5%-ával (hullámjellel kezdődő nevű ideiglenes fájlok, Office 97 előtti formátumok)
Comments
Anonymous
January 17, 2008
"1,91 GB összméret (közel 40%-os megtakarítás)" És ha csak simán betömörítetted volna a file-okat, akkor mekkora helymegtakaítás jött volna ki? Gondolom az Open XML-t is utolsó lépésben tömörítve tárolják mint minden más XML alapú dolgot.Anonymous
January 19, 2008
átcsusszantál néhány részleten:
- már létezik ISO szabvány dokumentumokra, az ODF, amely a többi ISO szabványt is tiszteletben tartja (pl. naptár). Nem világos, hogy a jelenlegi miért ne lenne jó (azon kívül, h nem az MS diktálja) és hogy miért ne lehetne kijavítani a vélt vagy valós hiányosságait.
- az MS leírása a gyakorlatban használhatatlan mert:
- a SUN már rég visszafejtette és közzétette azt amit lehetett (openoffice.org)
- amit nem lehetett, az lényegében abból adódik, hogy ezek a fileok fat16-os logikai filerendszerre dumpolt sorosított MFC ojjektumok. Emulálhatatlan bugkompatibilitás miatt MS MFC nélkül értelmezhetetlenek/használhatatlanok
- a gyarkorlatban nem használhatod a leírást, mert nem adhatod tovább, hiába implementálsz egy eszközt, amiben felhasználod a "specifikációt". Magyarul nem GPL kompatibilis. De ha utálod a GPL-t akkor is szarban vagy, sőt, egyedül maradsz a problémáddal, mert nem sublicencelhető. Végül nyisd meg a filejaidat, és ha véletlenül több formázás van valamelyikben, mint egy sima CR/LF, akkor ne lepődj meg, ha nem ismersz rá a doksidra... utsó kérdést: mit kaptál ezért a blogbejegyzésért? Vagy csak simán felvilágosulatlan vagy a témában?
Anonymous
January 21, 2008
Kedves kecsa: A tartalom ugyanaz, a tömörítési algoritmus is, azaz nyilván kb. azonos méretűek lesznek a WinZip-pel készült fájlok (kipróbáltam, és az Open XML-változat 1,91 GB-jához képest 1,92-t kaptam). A különbség abban jelentkezik, hogy ez a be- és kitömörítés mind a felhasználó, mind pedig a fejlesztő számára transzparens. Előbbi csak az Office alkalmazások Mentés és Megnyitás gombjával, utóbbi a .NET System.IO.Packaging csomagjával találkozik.Anonymous
January 21, 2008
Kedves - (kötőjel? gondolatjel? Senkise? utóbbihoz lásd még Odüsszeusz esetét a Küklopsz ellen :-) )! Mindazt, amit itt felvetettél, részletesen kitárgyalta a világ szaksajtója az utóbbi másfél évben. De nem baj, érdemes ismét tisztázni, miről is van szó az ODF kontra Open XML ügyben. Persze nem ebben a megjegyzésben: terjedelmi okokból inkább egy önálló bejegyzésben írom meg a véleményemet.