Računalniki Windows internet

Kaj so besedilni dokumenti. Razširitev besedilne datoteke: vrste in osnovni vidiki ugotavljanja pripadnosti programom


Zakaj potrebujete besedilo?

Danes obstajajo trije najpogostejši besedilni formati - TXT, RTF in DOC. Kakšna je njihova razlika in kaj ju združuje? Imajo eno skupno stvar: vsi shranjujejo besedilne informacije. Razlika je v tem, kakšne zmožnosti oblikovanja in obdelave besedil zagotavljajo, pa tudi v tem, kako dostopne so informacije, ki jih imajo v zvezi z združljivostjo programov.

Najpreprostejši format besedila

Najstarejši in najbolj skromen format glede na funkcije. Vse, kar lahko storite z besedilom v tej obliki, je, da sami vnesete besedilo in shranite prelome odstavkov. Ta preprostost v določenih situacijah prevzame pomen vsestranskosti in preglednosti: TXT je zlahka berljiv v različnih aplikacijah in na različnih platformah. Poleg tega lahko številni programi, ki nimajo niti neposredne naloge dela z besedilom, shranijo besedilo v formatu TXT.

TXT procesorji

Od časov DOS-a se mnogi spominjajo urejevalnika besedil Lexicon, ki je dobro obvladoval format TXT visoka stopnja... Danes je glavno orodje za delo s TXT standard Beležnica Windows... Vsak, ki mu njegove funkcije ne zadostujejo, lahko vedno najde urednika za svoj okus in potrebe svetovni splet, vključno z brezplačnim. Na primer, z brezplačnim programom Vega Konstantina Šeremetjeva verjetno ne boste videli sporočila, da je odprta besedilna datoteka prevelika; po avtorjevih zagotovilih Vega različica 2.04 odpira datoteke do 2 Gb (!), sam program pa zavzame le 9,5 kb (primerjaj, Notepad v operacijskem sistemu Windows XP "tehta" približno 65 kb); hkrati je Vega še bolj priročna kot Notepad in ne zahteva namestitve. In tukaj je še en primer možnosti obdelave " golo besedilo". Besedilo, ki ga berete, je bilo vneseno v procesor UltraEdit podjetja IDM Computer Solutions. Njegova močna točka je poseben prikaz in obdelava sintakse programskih jezikov, a tudi z najbolj preprostim besedilom lahko dela čudeže. Poznavalci priročnih rusificiranih programov, ergonomskih in, kar je najpomembneje, "ki vedo veliko" o posebnostih cirilice, bi se morali seznaniti s programom Patriot.

Oblikovanje in vsestranskost

Format obogatenega besedila - tako je kratica v imenu formata, ki ga je ustvaril Microsoft. RTF je besedilo, označeno s posebnimi "nadzornimi besedami", ki vam omogoča izvajanje in shranjevanje precej zapletenega oblikovanja, vstavljanje opomb, glav in nog, slik, tabel in formul, čeprav je RTF pri obdelavi teh dodatnih predmetov slabši od formata DOC. Po velikosti datotek je slabši od DOC: uporaba "kontrolnih besed" za oblikovanje besedila namesto slogovnega lista ne vodi do kompaktnosti. Vendar RTF zmaga v varnostnem sporu z DOC, ker njegova notranja organizacija ne predvideva shranjevanja makrokode in je zato imun na makro viruse.

RTF procesorji

RTF se uporablja kot primarna ali podprta oblika v mnogih, če ne v večini programov za obdelavo besedil. Dobro orodje je lahko na primer Hieroglif Mihaila Morozova. Ta program ne izvaja samo preverjanja črkovanja ruskega jezika, temveč tudi funkcijo samodejnega spreminjanja jezikovne postavitve tipkovnice. Program za obdelavo besedil Atlantis podjetja Rising Sun Solutions, ki obstaja tako v komercialnih kot v brezplačne različice, bo zagotovo ustrezal številnim uporabnikom s premišljenostjo vmesnika, prisotnostjo velikega števila bližnjice, zamenljivo orodno vrstico in druge funkcije. Že omenjeni urejevalnik Patriot je sposoben delati tudi z RTF.

"Največja" oblika besedila

Format DOC vključuje najobsežnejše zmožnosti obdelave in oblikovanja besedila, vključno z ustvarjanjem opomb in komentarjev, pa tudi zmožnost ustvarjanja, postavljanja in urejanja tabel, grafikonov, slik in drugih elementov. Res je, da so v celoti in najbolj pravilno vse te funkcije implementirane le v MS Wordu, kar olajša stališče Microsofta, ki ne razkriva trenutnih specifikacij priljubljene oblike. Kljub temu, da DOC "razumejo" tudi drugi programi, njihovi proizvajalci ne morejo vedno zagotoviti njegovega pravilnega prepoznavanja. Za razliko od TXT in RTF je DOC binarni format, zaradi česar je neberljiv v preprostih urejevalnikih besedil, poleg tega pa ne zagotavlja popolne združljivosti lastnih različic.

DOC procesorji

Glavni in glede na zgoraj navedene razloge "nenadomestljiv" urejevalnik besedil za delo z DOC je MS Word, ki najbolj v celoti izvaja vse možnosti tega formata. Veliko produktivnosti in funkcionalnosti dodajajo Wordu razvoj tretjih oseb - vse vrste dodatkov, makrov in programov obstajajo v velikih količinah v prostranstvu omrežja. Konkurenco zagotavljajo na primer WordPerfect iz Corela, StarOffice iz Sun Microsystems in brezplačni OpenOffice.org. Pri delu v Wordu in drugih programih se morate zavedati vprašanja združljivosti formatov in dokument shraniti v DOC le, če ste prepričani, da do nezdružljivosti ne bo prišlo.

Uporabnost formatov

Neutemeljeno je trditi, da je eden od obravnavanih formatov slabši od drugih, ne da bi upoštevali posebnosti nalog, za reševanje katerih bi jih bilo treba uporabiti. Ker si ne bomo zadali pisanja v urejevalniku besedil, je izbira skoraj nedvoumna. Za pripravo obsega besedila od srednje do zelo velikega in za zagotavljanje "popolnega razumevanja", ki ga tipka kateri koli program za montažo, se zdi najbolj priročno uporabiti najpreprostejše, najbolj kompaktno in vsestransko sredstvo za tipkanje in shranjevanje besedila - format TXT. Kar se tiče uporabe pri postavitvi drugih besedilnih formatov, potem je veliko odvisno od implementacije njihove podpore v določenem programu za izdelavo prototipov.
OpenOffice.org je mednarodni odprtokodni projekt, ki je namenjen ustvarjanju univerzalnega pisarniški apartma delujejo na različnih operacijskih platformah, imajo odprt API in format datoteke, ki temelji na XML. V bistvu je OpenOffice.org zbirka programov, razvitih znotraj tega projekta... Vključuje: urejevalnik besedil, preglednice, grafični urejevalnik, predstavitveni sistem in sistem za dostop do podatkov. Po svojih zmožnostih je primerljiv s podobnimi komercialnimi programi in se lahko obravnava kot alternativa njim. OpenOffice.org ima trenutno dvojno licenco pod GPL in SISSL. Kljub razlikam v teh licencah je OpenOffice.org brezplačen za končnega uporabnika.

OpenOffice.org izvira iz pisarniškega paketa StarOffice, ki ga je sredi devetdesetih let prejšnjega stoletja razvilo nemško podjetje StarDivision. Jeseni 1999 je Sun prevzel StarDivision. Junija 2000 je že pod blagovno znamko Sun izšel StarOffice 5.2 za MS Windows, Linux in Solaris. 13. oktobra 2000 je bil StarOffice odprtokoden (razen nekaterih modulov tretjih oseb) in je uradno rojstni dan OpenOffice.org. Danes tako prostovoljci z vsega sveta kot programerji Sun delajo na kodi OpenOffice.org.

Trenutno od enega izvorno kodo, ki ga je razvila skupnost OpenOffice.org, sta izdana dva izdelka: StarOffice, ki dodaja komponente pod lastniško licenco, in brezplačni OpenOffice.org. V OpenOffice.org so večino lastniških komponent, ki jih najdemo v StarOffice, zamenjale njihove brezplačne različice.

(Po podatkih cnews.ru.)

Nabor pravil, po katerih so podatki shranjeni v datoteki, se imenuje format datoteke. Različne vrste datoteke, kot so besedilne datoteke, bitne grafike itd., uporabljajo različne formate. Na splošno je za isto vrsto datoteke mogoče definirati več različnih formatov, čeprav se pogosto razumeta, da sta vrsta in oblika datoteke ista stvar. Oblika datoteke je identificirana s pripono imena datoteke, ki je dodana imenu datoteke, ko je shranjena v določeni obliki, kot so DOC, GIF itd.

Običajno so formati datotek ustvarjeni za uporabo v dobro definiranem aplikacijskem programu. Na primer, grafični predmeti, ustvarjeni v dobro znanem paketu vektorska grafika CorelDRAW se shrani kot datoteke CDR, medtem ko so slike, ki jih upodablja drug grafični paket, CorelXara, zapisane na disk kot datoteke XAR. Nekateri formati niso povezani s posebnimi aplikacijami, torej so univerzalni. Eden najbolj znanih univerzalni formati je format TXT (format besedilne datoteke DOS).

Stiskanje računalniških datotek se pogosto uporablja za prihranek prostora za shranjevanje. Obstaja veliko načinov stiskanja datotek. Te metode so odvisne od izvirni format datoteke. Na splošno velja, da višje ko je razmerje stiskanja, počasnejši so postopki branja in pisanja.

Kar zadeva algoritme stiskanja, obstajajo tako algoritmi stiskanja brez izgub kot algoritmi, ki lahko povzročijo izgubo podatkov.



Stiskanje brez izgub zagotavlja, da so vsi podatki, ki so bili v datoteki pred stiskanjem, prisotni po razpakiranju datoteke. Mehanizmi stiskanja brez izgub se uporabljajo pri shranjevanju besedilnih ali številskih podatkov, kot so preglednice ali dokumentne datoteke. Primeri algoritmov stiskanja brez izgub so dobro znani ZIP, ARJ in drugi.

dajmo Kratek opis glavni uporabljeni formati:

§ Ameriška standardna koda za izmenjavo informacij ASCII (TXT). Oblika besedilne datoteke, ki jo je razvil ameriški nacionalni inštitut za standarde. Podprto z vsemi operacijskimi sistemi in vsemi programi. Je besedilna datoteka v DOS-kodiranju, ni funkcije za vstavljanje slike, ni formatiranja, deluje na vseh strojih, mogoče je ustvariti samo majhne datoteke.

§ ANSI (TXT). Oblika besedilnih datotek v ANSI kodiranje(za kodno stran Microsoft Windows)

§ MsWord za DOS, Windows (.DOC). Format dokumenta, ki ga je razvila Microsoft Corporation, podpirajo programi MS-DOS in večina urejevalnikov besedil. Ohrani izvirno oblikovanje dokumenta in sloge znakov. razen besedilne informacije, datoteke tega formata lahko vsebujejo grafične slike z različnimi parametri. Podpira 256 barv. Ne podpira stiskanja. Uporablja se predvsem za izmenjavo formatiranih besedilnih podatkov med različnimi platformami in aplikacijami.

Hypertext Markup Language HTML (HTM, HTML). Označevalni jezik za hiperbesedilne dokumente. Vse strani na internetu so ustvarjene s tem posebnim jezikom. Dokumenti HTML so datoteke ASCII, ki si jih lahko ogledate in urejate s katerim koli urejevalnikom besedil. Razlika od običajne besedilne datoteke je v tem, da dokumenti HTML vsebujejo posebne ukaze oznak, ki določajo pravilo za oblikovanje dokumenta. Če obvladate jezik HTML, lahko ustvarite strani za internet. Z dodajanjem oznak (oznak) navadnemu besedilu prisilite gledalca, da to besedilo prikaže na določen način in postavi slike na stran. Če ste se naučili Jave in JavaScripta, veste, kako razširiti moč HTML-ja z vstavljanjem skriptnih ukazov v oznake.

§ Portable Document Format PDF (.PDF). Ta format za shranjevanje dokumentov, ki ga je razvil Adobe, trdi, da je odprt tipografski standard za splet. Videti je kot alternativo HTML. Pomanjkljivost HTML-ja je v tem, da dokumenti, prevedeni v HTML, običajno ne ohranijo svoje prvotne oblike, HTML pa ponuja zelo omejeno število pisav pri ogledu. Nasprotno pa uporabniki orodij Acrobat in PDF za ustvarjanje, distribucijo in ogled dokumentov v izvirni obliki vedo, da bodo bralci videli publikacijo točno takšno, kot je bila narejena. Format PDF je nepogrešljiv, če ga potrebujete natančna kopija zahtevani dokument. Kot primer uspešne uporabe PDF-ja za dokumente v ruščini naj navedemo strežnik "Moscow News" na internetu. Predstavljeno na njem v v elektronski obliki materiali v celoti ponavljajo papirnati izvirnik, natisnjen s tipografsko metodo.

§ Standardni generalizirani označevalni jezik (SGML). Razvoj HTML je preveden kot standardni generični označevalni jezik. Je zbirka orodij za ustvarjanje strukturiranih dokumentov, označenih z deskriptorji (oznaki). V primerjavi s HTML ponuja bolj prilagodljive in vsestranske možnosti oblikovanja na spletu. Vendar je SGML tudi hitrejši, zato se PDF uporablja kot enostavnejše orodje. Moč SGML je v njegovem večplatformskem strukturiranem pristopu k opisovanju vsebine dokumentov. SGML je pravzaprav metajezik, t.j. je namenjen opisu označevalnih jezikov, ki se uporabljajo pri ustvarjanju dokumentov.

Vsak uporabnik osebnega računalnika se nenehno sooča z različnimi formati besedilnih datotek, vendar skoraj ne razmišlja o tem, kako bogata je zgodovina teh formatov in programov, ki so dali človeku možnost branja knjig, dela z besedilom in ustvarjanja vse potrebne dokumentacije neposredno na računalnik.

Zgodovina besedilnih datotek ni veliko mlajša od njih samih osebni računalniki- že so bile njihove mojstrovine zapisane v prvih analogih sodobnega "beležnice". Kakšni so torej formati besedilnih datotek in programov za delo z njimi? Najprej morate razumeti, čemu služijo besedilne datoteke, kakšne so razlike med njimi in kaj imajo skupnega. Združuje absolutno vse besedilne formate, njihova glavna naloga je ohraniti besedilne informacije. Razlikujejo se po zmožnostih obdelave in tudi po dostopu do informacij, shranjenih v datotekah, glede združljivosti z drugimi programi.

Tradicionalno je najpreprostejši format besedila format TXT. Je tudi najbolj skromen po lastnostih in najstarejši format besedila. Zaradi svoje preprostosti (zmožnosti TXT so omejene na tipkanje in razčlenjevanje na odstavke) ta format pogosto uporablja ogromno aplikacij in programov na različnih platformah.

S širjenjem osebnih računalnikov in povečanjem njihove prodaje Microsoft ustvarja še eno priljubljeno obliko, imenovano Rich Text Format (ali preprosto RTF). To je besedilo, ki je označeno z določenimi "kontrolnimi besedami", ki omogočajo ne samo izdelavo, temveč tudi shranjevanje kompleksnih oblikovnih elementov in vstavljanje formul, tabel, številk, glav in nog ter opomb v besedilo.

Vendar je RTF po zmogljivostih precej slabši od formata DOC, ki ga je prav tako ustvaril Microsoft posebej za programski paket, imenovan Microsoft Office... DOC, ki je nastal pred več kot petnajstimi leti, vključuje ogromno možnosti za oblikovanje in obdelavo besedila, ustvarjanje, urejanje in postavitev slik, grafikonov, tabel in drugih elementov. Treba je opozoriti, da bodo te funkcije najbolj pravilno delovale le v MS Wordu. To je predvsem posledica dejstva, da Microsoft nima trenutnih specifikacij za format DOC in svojim konkurentom in neodvisnim razvijalcem ne dovoljuje, da bi v celoti izkoristili zmogljivosti tega formata. Prav to dejstvo je eden od glavnih razlogov, da se v našem času poleg formata DOC pogosto uporabljajo tudi drugi formati besedilnih datotek.

Glavna razlika med formatom DOC in besedilom ter TXT je njegova binarna narava, zaradi česar postane neberljiv v tako preprostih, kot so Wordpad, Lexicon, Atlantis. Poleg tega lahko v nekaterih primerih opazite nezdružljivost datotek DOC, ustvarjenih v različnih različicah MS Word.

Formate besedilnih datotek je mogoče odpreti in urejati v velikem številu programov. Poleg prej omenjenega MS Worda so najpogostejši StarOffice iz Sun Microsystems, WordPerfect iz Corel in brezplačen paket OpenOffice.org.

S širjenjem elektronskih bralnih naprav postajajo vse bolj priljubljeni drugi formati besedilnih datotek, na primer FB2 in LRF.

Za uporabo različnih besedilnih formatov na različnih platformah je bilo ustvarjenih veliko število programov, imenovanih pretvorniki. Pretvorniki besedilnih datotek vam omogočajo, da shranite izvirno besedilo iz ene oblike v drugo in jo uporabite pozneje različne naprave in platforme.

Pretvorniki se ne uporabljajo samo za shranjevanje besedila iz ene oblike v drugo, temveč tudi za ustvarjanje datotek, ki jih je za razliko od njihovih virov mogoče uporabiti na napravah, ki ne morejo »brati« izvirnih datotek. Nekatere e-knjige, ki ne podpirajo priljubljenih formatov besedilnih datotek, lahko na primer zlahka prepoznajo formate LRF ali FB2, pridobljene iz izvirnih datotek s programi za pretvorbo.

Skoraj vsak dan naletimo na besedilne datoteke (dokumente). Vendar pa v tej zadevi ne smete zamenjevati razširitve besedilne datoteke in besedilne oblike podatkov, gre za različne stvari. Poskusimo ugotoviti, katere datoteke te vrste so in kaj so.

Končnica besedilne datoteke: kaj je to?

Začnimo z dejstvom, da ima večina datotek te vrste praviloma tričrkovno končnico za ločilo (piko). Najenostavnejša in najpogostejša vrsta so datoteke s pripono .txt, odprte v isti Windows sistemi z uporabo standardne "Beležnice".

Kljub splošno sprejetim pravilom pa lahko razširitve datotek besedilnih dokumentov vsebujejo ne tri črke, ampak več (njihovo število lahko doseže dvanajst, vendar ne več), na primer datoteke e-knjige.djvu. Poleg tega so lahko v razširitvi prisotne številke.

Kaj nam daje obravnavo klasifikacije besedilne datoteke (dokumenta) glede na njihovo identifikacijo? In dejstvo, da vam en pogled omogoča, da takoj rešite pomembno vprašanje: kakšno razširitev imajo besedilne datoteke, takšen je program, ki je z njimi povezan za odpiranje ali urejanje. V mnogih primerih lahko skoraj vedno prepoznate izvirno aplikacijo, v kateri je bila taka datoteka ustvarjena.


Vendar ne pozabite, da lahko danes najdete precej veliko datotek z enakimi priponami, vendar ustvarjenih v drugih aplikacijah ali povezanih z različnimi programi. Zdi se, da navadna datoteka s pripono .doc (.docx) na začetku ustreza urejevalniku besedil Microsoft Word... Lahko pa ga odprete ali v tej obliki shranite v drugo, tudi na "jabolčnih" računalnikih. To vključuje tudi tako rekoč datoteke mešanega tipa - .pdf, ki ne vsebujejo le besedila, temveč tudi grafiko. Ampak navsezadnje Word dokumenti lahko vsebuje vstavljene slike.

Ravno to je pokazatelj, da razširitev besedilne datoteke priča o univerzalnosti samega formata, ki je najbolj »berljiv« ne glede na celo uporabljeno operacijski sistem... Enako velja za katero koli vrsto.

Vrste razširitev datotek: besedilo

Na splošno je danes znano tako ogromno besedilnih formatov in njihovih razširitev, da se verjetno skoraj noben strokovnjak ne bo lotil štetja njihovega celotnega števila.


Ja, seveda, univerzalnost takih dokumentov je nedvomna, še posebej, če uporabljajo najpreprostejše, včasih pa je težava lahko v tem, da določen sistem ali program ne podpira vsakega kodiranja. Zato se na zaslonu namesto običajnih črk prikaže nabor simbolov.

Kar zadeva vrste besedilnih datotek, jih ne morete našteti vseh. Najpogostejši so .txt, .doc, .tex, .text, .pdf, .log, .apt, .ttf, .err, .sub, .djvu, .odt, .rtf in številni drugi. Seznam je neskončen.

Najbolj zanimivo je, da imajo številne od teh vrst datotek različne vloge v sistemu. Na primer, poleg običajne datoteke s podnapisi .sub, je lahko običajen besedilni dokument .txt odgovoren za ogled pri odpiranju videoposnetka in v zvezi s tem je veliko formatov zamenljivih.


Opazi celo izvedljive datoteke lahko ima besedilo kot vsebino. Najenostavnejši primer- datoteka .bat, ustvarjena v običajnem "Beležnici" in vsebuje besedilo v obliki niza ukazov. Ob zagonu se ukazi izvedejo, meni "Odpri z ..." pa se uporablja za urejanje, razen če je ta postopek prvotno povezan z drugim dejanjem.


Podobno situacijo opazimo pri dokumentih, ki uporabljajo označevalne ali programske jezike, na primer datoteke .html, .htm, .xml itd. Celo spletne strani je mogoče izvorno odpreti v številnih urejevalnikih kot besedilne datoteke, ki vsebujejo elemente tretjih oseb.

Spreminjanje razširitev besedilnih datotek

Kar se tiče spreminjanja razširitve, jo je včasih mogoče spremeniti, na primer .txt v .doc in obratno. Word urejevalnik bo odprl katero koli vrsto. Enako velja za par .txt - .bat, ko se odpre v beležnici. Toda v drugih primerih je bolje, da ne izvajate takšnih manipulacij, preprosto ne bo privedlo do ničesar in druga aplikacija ne bo mogla odpreti preimenovane datoteke. Spreminjanje formata bo treba opraviti s pomočjo posebnih programov za pretvorbo.

Namesto pogovora

Kot je že jasno, ima razširitev besedilne datoteke lahko veliko različic, odvisno od programa, v katerem je bil dokument ustvarjen. Toda, tako kot v drugih primerih, je s samo razširitvijo skoraj vedno mogoče določiti aplikacijo, ki je bila z njo prvotno povezana, v skrajnih primerih jo odprete s katerim koli drugim programom, ki podpira delo s to vrsto podatkov, tudi če je izvirna aplikacija odsoten na računalniku. In kot je verjetno že jasno, so prav besedilne datoteke tiste, ki so v računalniškem svetu pravzaprav najbolj razširjene in univerzalne, ne glede na uporabljene programske pakete in operacijske sisteme.

Najpogosteje uporabljena vrsta podatkov v računalniškem svetu in na internetu je besedilo. Video in grafika sta veliko bolj barvita in na splošno je bolje videti enkrat kot slišati stokrat. No, tudi to je dobro slišati – za ta primer obstajajo formati zvočnih podatkov. Vendar pa računalniški krogli vladajo nezahtevne in skromne črke in številke. Brez njih ne morete niti dati imena drugi datoteki. Besedilni podatki so pomembni in raznoliki - to so knjige, dokumenti in programsko kodo... In obstajajo različne možnosti formata za vsak namen. O njih bomo razpravljali v tem članku. Res je, treba je takoj narediti eno rezervacijo - ta pregled se ne bo dotaknil formatov e-knjig, zaslužijo si ločeno razpravo. Tukaj bomo govorili o formatih dokumentov.

Oblika besedila - TXT (PlainText)

Torej - najpreprostejši možni format TXT. To je besedilo v svoji v bistvu čisti in nezapleteni obliki. Vsebuje samo vsebino besedila in absolutni minimum servisnih podatkov - znake za začetek in konec besedila, vrnitev nosilca in podobno.

Kljub skoraj špartanski preprostosti format ni brez variacij in razlik. Prvič, obstaja nekaj razlik med Windows, Unix in MacOS različice, ki uporabljajo različne končnice vrstic. Razlike so lahko tudi posledica uporabe 8-bitnih (ASCII) ali 16-bitnih (UNICODE) kodnih strani.

Kljub temu pa je format TXT izjemno vsestranski, zaradi česar je zelo priljubljen med programerji in sistemskimi skrbniki.

Formati in analogi dokumentov MS Office - DOC, DOCX, RTF, ODT

Pri vsej svoji vsestranskosti in preprostosti je TXT absolutno neprimeren za ustvarjanje dejanskih dokumentov – besedil, namenjenih tiskanju v skladu z določenimi pravili in predpisi. Ker morajo takšni dokumenti poleg samega besedila vsebovati tudi veliko informacij o oblikovanju in oblikovanju besedila. In tudi o formatu in velikosti lista papirja, kamor naj bodo nameščeni.

V te namene je bilo ustvarjenih kar nekaj formatov različnih pisarniških paketov. Najbolj priljubljene in pravzaprav blizu univerzalne lahko štejemo formate MS Word - doc in docx. Prvi je posebna zaprta oblika, ki jo je ustvaril Microsoft za svoj urejevalnik besedil (natančneje, cela vrsta formatov - v času svojega obstoja je bila večkrat izboljšana). Ob njem je na začetku razvoja podjetja v sodelovanju s korporacijo Adobe nastal format RTF (Rich Text Format). Za razliko od DOC je struktura tega formata na voljo in ga uspešno podpirajo skoraj vsi obstoječi urejevalniki besedil... Čeprav je glede na nabor razpoložljivih funkcij nekoliko slabši od DOC.

Zaprta narava Microsoftovega razvoja je privedla do oblikovanja zbirke odprte pisarne, Open Office. Za katerega je bil razvit lastniški format ODT ( Besedilo OpenDocument Oblika). Format ni dobro podprt s strani komercialnih urednikov, vključno z MS Word in se lahko odpre z napakami.

Končno se je Microsoft leta 2007 odločil opustiti stavo na format DOC in razvil družino formatov Office Open XML, ki vključuje DOCX, ki je postal glavni format za nove različice MS Word.

format PDF

Adobe je zavrnil sodelovanje z Microsoftom in se je premaknil po svoji poti. Razvila se je format PDF ki je bil format ne toliko za razvijanje dokumentov kot za ogled in tiskanje. Za razliko od prejšnje skupine, ki predstavlja formatirano besedilo, katerega videz se kljub temu lahko spreminja glede na to, na katerem stroju je prikazano ali natisnjeno, je PDF format dokumenta, ki je v osnovi nespremenjen in ohranja videz in postavitev v kakršnih koli pogojih. Podpira tudi precej širok nabor tiskarskih elementov in dodatnih storitev (npr zaščita dokumenta z geslom od urejanja ali tiskanja itd.). Vse to naredi PDF bolj format za distribucijo zapletenih in strokovno izvedenih dokumentov in celo knjig.