أجهزة الكمبيوتر شبابيك إنترنت

تنسيقات الملفات النصية وبرامج للعمل معهم: التاريخ وأيامنا. امتداد الملف النصي: الأنواع والجوانب الرئيسية لتحديد الانتماء للبرنامج

تسمى مجموعة القواعد التي يتم من خلالها تخزين البيانات في ملف تنسيق الملف. أنواع مختلفةملفات مثل الملفات النصية ، الرسومات النقطيةوما شابه ذلك ، استخدم تنسيقات مختلفة. بشكل عام ، يمكن تعريف العديد من التنسيقات المختلفة لنوع الملف نفسه ، على الرغم من أنه غالبًا ما يتم فهم نفس التنسيق من خلال نوع الملف وتنسيقه. يتم تحديد تنسيق الملف بملحق اسم الملف الذي تمت إضافته إلى اسم الملف عند حفظه بتنسيق معين ، مثل DOC و GIF وما إلى ذلك.

كقاعدة عامة ، يتم إنشاء تنسيقات الملفات للاستخدام في برنامج تطبيق جيد التحديد. على سبيل المثال ، الكائنات الرسومية التي تم إنشاؤها في الحزمة المعروفة رسومات فيكتوريتم حفظ CorelDRAW كملفات بامتداد تمديد CDR، بينما تتم كتابة الصور التي تم إنشاؤها بواسطة حزمة رسومات أخرى ، CorelXara ، على القرص كملفات XAR. لا ترتبط بعض التنسيقات بتطبيقات محددة ، أي أنها عالمية. واحدة من الاكثر شهرة تنسيقات عالميةهو تنسيق TXT (تنسيق ملفات نصية DOS).

غالبًا ما تستخدم لضغط ملفات الكمبيوتر لتوفير مساحة على الوسائط. هناك طرق عديدة لضغط الملفات. تعتمد هذه الطرق على تنسيق الملف الأصلي. بشكل عام ، كلما زادت نسبة الضغط ، كانت عمليات القراءة والكتابة أبطأ.

بالنسبة لخوارزميات الضغط ، هناك خوارزميات وخوارزميات ضغط بدون فقدان يمكن أن تسبب فقدان البيانات.



يضمن الضغط بدون فقدان البيانات أن جميع البيانات التي كانت موجودة في الملف قبل الضغط ستكون موجودة بعد فك ضغط الملف. تُستخدم آليات الضغط بدون فقدان البيانات عند تخزين نص أو بيانات رقمية ، مثل جداول البيانات أو ملفات المستندات. من أمثلة خوارزميات الضغط بدون فقد الخوارزميات المعروفة ZIP و ARJ وغيرها.

هيا نعطي وصف قصيرالتنسيقات الرئيسية المستخدمة:

§ الكود القياسي الأمريكي لتبادل المعلومات ASCII (TXT). تنسيق ملف نصي تم تطويره بواسطة المعهد القومي الأمريكي للمعايير. بدعم من الجميع أنظمة التشغيلوجميع البرامج. إنه ملف نصي مشفر بنظام DOS ، ولا توجد وظيفة لإدراج صورة ، ولا يوجد تنسيق ، ويعمل في جميع الأجهزة ، ومن الممكن إنشاء ملفات صغيرة فقط.

§ ANSI (TXT). تنسيق الملف النصي بتنسيق ترميز ANSI(لصفحة الرموز مايكروسوفت ويندوز)

§ MSWord for DOS، Windows (.DOС). يتم دعم تنسيق المستند الذي طورته شركة Microsoft Corporation بواسطة برامج MS-DOS ومعظم معالجات النصوص. يحافظ على التنسيق الأصلي للمستندات بالإضافة إلى أنماط الأحرف. بالإضافة إلى المعلومات النصية ، يمكن أن تحتوي الملفات بهذا التنسيق على صور بيانية بمعلمات مختلفة. يدعم 256 لون. لا يدعم الضغط. يتم استخدامه بشكل أساسي لتبادل البيانات النصية المنسقة بين الأنظمة الأساسية والتطبيقات المختلفة.

§ لغة ترميز النص الفائق HTML (HTM ، HTML). لغة الترميز لمستندات النص التشعبي. يتم إنشاء جميع الصفحات على الإنترنت باستخدام هذه اللغة الخاصة. مستندات HTML هي ملفات ASCII يمكن عرضها وتحريرها في أي ملف محرر النص. يتمثل الاختلاف عن ملف نصي عادي في أن مستندات HTML تحتوي على أوامر علامات خاصة تحدد قاعدة تنسيق المستند. إذا تمكنت من إتقان لغة HTML ، فيمكنك إنشاء صفحات للإنترنت. من خلال إضافة علامات (تسميات) إلى نص عادي ، فإنك تجبر العارض على عرض ذلك النص بطريقة معينة ووضع الصور على الصفحة. إذا كنت قد تعلمت Java و JavaScript ، فأنت تعرف كيفية توسيع قوة HTML عن طريق وضع أوامر مكتوبة بلغة برمجة نصية داخل العلامات.

§ تنسيق المستند المحمول PDF (.PDF). يدعي تنسيق تخزين المستندات هذا ، الذي طورته Adobe ، أنه معيار مطبعي مفتوح للويب. يُنظر إليه على أنه بديل لـ HTML. عيب HTML هو أن المستندات المحولة إلى HTML عادةً لا تحتفظ بتنسيقها الأصلي ، وتوفر HTML عددًا محدودًا جدًا من الخطوط عند عرضها. في المقابل ، يعرف مستخدمو Acrobat ومجموعة أدوات PDF لإنشاء ومشاركة وعرض المستندات بتنسيقهم الأصلي أن القراء سيرون المنشور تمامًا كما تم إنشاؤه. تنسيق PDFلا غنى عنه إذا كنت بحاجة إلى الحصول عليها نسخة طبق الأصلملفات مطلوبه. كمثال على الاستخدام الناجح لملفات PDF للمستندات باللغة الروسية ، سنستشهد بخادم أخبار موسكو على الإنترنت. قدمت عليه في في شكل إلكترونيالمواد تكرر تمامًا الورق الأصلي ، وتطبع بطريقة مطبعية.

§ لغة التوصيف المعممة القياسية (SGML). تطوير HTML يترجم إلى لغة الترميز القياسية العامة. إنها مجموعة من الآليات لإنشاء مستندات منظمة تم ترميزها باستخدام واصفات (علامات). مقارنةً بـ HTML ، فإنه يوفر خيارات تنسيق أكثر مرونة وتنوعًا على الويب. ومع ذلك ، فإن SGML أسرع أيضًا ، لذلك يتم استخدام PDF كأداة أبسط. تكمن قوة SGML في منهجها المنظم عبر الأنظمة الأساسية لوصف محتوى المستندات. SGML هي في الواقع لغة معدنية ، أي الغرض منه هو وصف لغات الترميز المستخدمة لإنشاء المستندات.

يواجه كل مستخدم للكمبيوتر الشخصي باستمرار تنسيقات ملفات نصية مختلفة ، لكنه بالكاد يفكر في مدى ثراء تاريخ هذه التنسيقات والبرامج ، مما منح الشخص الفرصة لقراءة الكتب والعمل مع النص وإنشاء جميع الوثائق اللازمة مباشرة على الحاسوب.

تاريخ الملفات النصية ليس أصغر بكثير من أنفسهم حواسيب شخصية- بالفعل تم كتابة روائعهم في أول نظائرها من "دفتر الملاحظات" الحديث. إذن ما هي تنسيقات الملفات النصية والبرامج للعمل معها؟ تحتاج أولاً إلى فهم الغرض من الملفات النصية ، وما هي الاختلافات بينها وما هو مشترك بينها. فهو يجمع بين جميع تنسيقات النص تمامًا ، وتتمثل مهمتهم الرئيسية في حفظ المعلومات النصية. وهي تختلف في إمكانيات المعالجة والوصول إلى المعلومات المخزنة في الملفات من حيث التوافق مع البرامج الأخرى.

أبسط تنسيق نص هو تنسيق TXT تقليديًا. وهو أيضًا الأكثر تواضعًا من حيث الإمكانيات وأقدم تنسيق نص. نظرًا لبساطته (تقتصر إمكانات TXT على كتابته وتقسيمه إلى فقرات) ، غالبًا ما يستخدم هذا التنسيق عدد كبير من التطبيقات والبرامج على مجموعة متنوعة من الأنظمة الأساسية.

مع انتشار أجهزة الكمبيوتر الشخصية وزيادة مبيعاتها ، قامت Microsoft بإنشاء تنسيق شائع آخر يسمى Rich Text Format (أو ببساطة RTF). إنه نص تم ترميزه ببعض "كلمات التحكم" التي لا تسمح فقط بإنتاج عناصر التنسيق المعقدة ، ولكن أيضًا لحفظ عناصر التنسيق المعقدة وإدراج الصيغ والجداول والأشكال والعناوين والحواشي السفلية في النص.

ومع ذلك ، فإن RTF أقل شأناً في القدرات من تنسيق DOC ، الذي أنشأته Microsoft أيضًا خصيصًا لحزمة برامج تسمى مايكروسوفت أوفيس. تم إنشاء DOC منذ أكثر من خمسة عشر عامًا ، وهو يتضمن عددًا كبيرًا من الاحتمالات لتنسيق ومعالجة النص وإنشاء وتحرير ووضع الصور والمخططات والجداول والعناصر الأخرى. وتجدر الإشارة إلى أن هذه الوظائف ستعمل بشكل صحيح في برنامج MS Word فقط. هذا يرجع في المقام الأول إلى حقيقة أن Microsoft ليس لديها المواصفات الحالية لتنسيق DOC ولا تسمح لمنافسيها والمطورين المستقلين باستخدام الإمكانات الكاملة لهذا التنسيق. هذه الحقيقة هي أحد الأسباب الرئيسية لاستخدام تنسيقات الملفات النصية الأخرى على نطاق واسع في عصرنا ، بالإضافة إلى تنسيق DOC.

يتمثل الاختلاف الرئيسي بين تنسيق DOC والنص وتنسيق TXT في ثنائيته ، مما يجعله غير قابل للقراءة في صيغ بسيطة مثل Wordpad و Lexicon و Atlantis. علاوة على ذلك ، في بعض الحالات ، يمكن أيضًا ملاحظة عدم توافق ملفات DOC التي تم إنشاؤها في إصدارات مختلفة من MS Word.

يمكن فتح تنسيقات الملفات النصية وتحريرها في عدد كبير من البرامج. بالإضافة إلى MS Word المذكورة سابقًا ، فإن أكثرها شيوعًا هي StarOffice من Sun Microsystems و WordPerfect من Corel و حزمة مجانية openoffice.org.

مع انتشار أجهزة القراءة الإلكترونية ، تكتسب تنسيقات الملفات النصية الأخرى أيضًا شعبية ، على سبيل المثال ، FB2 و LRF.

من أجل أن تكون قادرة على استخدام مختلف تنسيقات النصعلى منصات مختلفة ، تم إنشاء عدد كبير من البرامج تسمى المحولات. تسمح لك محولات الملفات النصية بحفظ النص المصدر من تنسيق إلى آخر واستخدامه لاحقًا أجهزة مختلفةوالمنصات.

لا تستخدم المحولات فقط لحفظ النص من تنسيق إلى آخر ، ولكن أيضًا لإنشاء ملفات يمكن استخدامها ، على عكس أكواد المصدر الخاصة بها ، على الأجهزة التي لا تستطيع "قراءة" الملفات الأصلية. على سبيل المثال ، بعض الكتب الإلكترونية، التي لا تدعم تنسيقات الملفات النصية الشائعة ، قادرة على التعرف بسهولة على تنسيقات LRF أو FB2 التي تم الحصول عليها من ملفات المصدر باستخدام برامج التحويل.


لماذا تحتاج نص؟

يوجد اليوم ثلاثة تنسيقات نصية شائعة - TXT و RTF و DOC. ما هو اختلافهم وما الذي يوحدهم؟ لديهم شيء واحد مشترك: إنهم جميعًا يحتفظون به معلومات نصية. يكمن الاختلاف في إمكانات التنسيق ومعالجة النصوص التي توفرها ، فضلاً عن مدى سهولة الوصول إلى المعلومات التي يخزنونها فيما يتعلق بتوافق البرنامج.

أبسط تنسيق نص

الأقدم والأكثر تواضعًا من حيث الإمكانيات. كل ما يمكنك فعله باستخدام نص بهذا التنسيق هو القيام بالكتابة الخاصة بك وحفظ فواصل الفقرات. تأخذ هذه البساطة ، في مواقف معينة ، أهمية العالمية والشفافية: يمكن قراءة TXT بسهولة في تطبيقات مختلفة وعلى منصات مختلفة. بالإضافة إلى ذلك ، يمكن للعديد من البرامج التي ليس لديها حتى مهمتها الفورية للعمل مع النص حفظ النص بتنسيق TXT.

معالجات TXT

منذ زمن DOS ، يتذكر الكثير من الناس معالج الكلمات Lexicon ، والذي كان قادرًا على معالجة تنسيق TXT تمامًا مستوى عال. اليوم ، الأداة الرئيسية للعمل مع TXT هي المعيار ويندوز المفكرة. يمكن لأي شخص لا يعتقد أن وظائفه كافية أن يجد دائمًا محررًا يناسب ذوقه واحتياجاته شبكة الانترنت، بما في ذلك مجانًا. على سبيل المثال ، باستخدام برنامج Vega المجاني بواسطة Konstantin Sheremetyev ، من غير المحتمل أن ترى رسالة تفيد بأن الملف النصي الذي يتم فتحه كبير جدًا ؛ وفقًا للمؤلف ، يفتح الإصدار 2.04 من Vega ملفات تصل إلى 2 جيجا بايت (!) ، بينما يأخذ البرنامج نفسه 9.5 كيلو بايت فقط (قارن Notepad في Windows XP "يزن" حوالي 65 كيلو بايت) ؛ بينما يعتبر Vega أكثر ملاءمة من Notepad ولا يتطلب التثبيت. وهنا مثال آخر لإمكانيات المعالجة " نص عادي". تمت كتابة النص الذي تقرأه في معالج UltraEdit من IDM Computer Solutions. له موطن- عرض خاص ومعالجة بناء جملة لغات البرمجة ، ولكن حتى مع النص الأكثر وضوحًا ، يمكن أن يعمل العجائب. يجب أن يتعرف خبراء البرامج المريحة التي ينالون الجنسية الروسية ، والمريحة ، والأهم من ذلك ، "المطلعين" في تفاصيل الترميزات السيريلية ، على برنامج باتريوت.

التنسيق والتنوع

تنسيق نص منسق - هذا هو الاختصار الموجود في اسم التنسيق الذي أنشأته شركة Microsoft Corporation. RTF هو نص تم ترميزه بـ "كلمات تحكم" خاصة ، مما يسمح لك بإنتاج وحفظ تنسيق معقد للغاية وإدراج الحواشي السفلية والرؤوس والتذييلات والأشكال والجداول والصيغ ، على الرغم من أن RTF أدنى من DOC في معالجة هذه الكائنات الإضافية. كما أنه أدنى من DOC من حيث حجم الملف: استخدام "كلمات التحكم" لتنسيق النص بدلاً من ورقة الأنماط لا يؤدي إلى الضغط. ومع ذلك ، فإن RTF يفوز بالجدل مع DOC فيما يتعلق بالأمن ، مثل تنظيمها الداخلي لا ينص على تخزين الكود الكلي وبالتالي فهي غير معرضة لفيروسات الماكرو.

معالجات RTF

يتم استخدام RTF كتنسيق أساسي أو مدعوم في العديد من برامج معالجة الكلمات إن لم يكن معظمها. أداة جيدةيمكن أن يخدم ، على سبيل المثال ، الهيروغليف ميخائيل موروزوف. لا ينفذ هذا البرنامج مدققًا إملائيًا للغة الروسية فحسب ، بل ينفذ أيضًا وظيفة تغيير تخطيط لغة لوحة المفاتيح تلقائيًا. معالج الكلمات Atlantis من Rising Sun Solutions ، متوفر في كل من الشركات التجارية و إصدارات مجانية، بالتأكيد سوف يناسب العديد من المستخدمين مع تفكير الواجهة ، ووجود عدد كبير من اختصارات لوحة المفاتيحوشريط الأدوات القابل للتبديل والوظائف الأخرى. يمكن لمحرر باتريوت المذكور بالفعل العمل مع RTF.

تنسيق النص "الأكبر"

يتضمن تنسيق DOC أوسع نطاق من إمكانيات معالجة النصوص والتنسيق ، بما في ذلك إنشاء الحواشي السفلية والتعليقات ، فضلاً عن القدرة على إنشاء الجداول والمخططات والصور وعناصر أخرى وتحديد موضعها وتحريرها. صحيح ، يتم تنفيذ كل هذه الميزات بالكامل وبشكل صحيح فقط في برنامج MS Word ، وهو ما يسهله موقف Microsoft ، الذي لا يكشف عن المواصفات الحالية للتنسيق الشائع. على الرغم من حقيقة أن DOC "مفهوم" من قبل البرامج الأخرى ، فإن مصنعيها ليسوا دائمًا قادرين على ضمان الاعتراف الصحيح بها. على عكس TXT و RTF ، فإن DOC هو تنسيق ثنائي ، مما يجعله غير قابل للقراءة في برامج تحرير النصوص البسيطة ، علاوة على ذلك ، لا يضمن التوافق الكامل لإصداراته الخاصة.

معالجات DOC

في ضوء الأسباب المذكورة أعلاه ، فإن معالج الكلمات "الذي لا غنى عنه" للعمل مع DOC هو MS Word ، والذي ينفذ بشكل كامل جميع إمكانيات هذا التنسيق. تضيف تطويرات الجهات الخارجية الكثير من الإنتاجية والوظائف إلى Word - توجد جميع أنواع الوظائف الإضافية ووحدات الماكرو والبرامج بكميات كبيرة على الإنترنت. يتم توفير مسابقة Word ، على سبيل المثال ، بواسطة Corel's WordPerfect و StarOffice من Sun Microsystems و OpenOffice.org المجاني. عند العمل في Word والبرامج الأخرى ، يجب أن تكون على دراية بمشكلة توافق التنسيق وحفظ المستند في DOC فقط إذا كنت متأكدًا من عدم حدوث عدم التوافق.

قابلية تطبيق التنسيقات

من غير المعقول الادعاء بأن أحد التنسيقات المدروسة أسوأ من غيرها ، دون مراعاة تفاصيل المهام التي يجب استخدامها من أجلها. نظرًا لأننا لن نحدد لأنفسنا مهمة التخطيط في معالج النصوص ، فإن الاختيار يكاد يكون واضحًا. لإعداد أحجام نصية تتراوح من المتوسط ​​إلى الكبير جدًا ولضمان "الفهم الكامل" لما يكتبه أي برنامج تخطيط ، يبدو أنه من الأنسب استخدام أبسط الوسائل وأكثرها إحكامًا وتعددًا لاستخدامات كتابة النص وتخزينه - تنسيق TXT. بالنسبة لاستخدام تنسيقات نصية أخرى في التخطيط ، يعتمد الكثير على تنفيذ دعمها في برنامج تخطيط معين.
OpenOffice.org هو مشروع دولي مفتوح المصدر يهدف إلى خلق عالم جناح المكتب، تعمل على منصات تشغيل مختلفة ، بعد فتح APIوتنسيق ملف مستند إلى XML. بشكل أساسي ، OpenOffice.org عبارة عن مجموعة من البرامج التي تم تطويرها تحت هذا المشروع. يشمل: معالج الكلمات وجداول البيانات محرر الرسوماتونظام العرض ونظام الوصول إلى البيانات. من حيث قدراتها ، يمكن مقارنتها بالبرامج التجارية المماثلة ويمكن اعتبارها بديلاً لها. تم إصدار OpenOffice.org حاليًا بموجب تراخيص مزدوجة: GPL و SISSL. على الرغم من الاختلافات في هذه التراخيص ، فإن OpenOffice.org مجاني للمستخدم النهائي.

يتتبع موقع OpenOffice.org أصوله إلى مجموعة مكتب StarOffice ، التي طورتها الشركة الألمانية StarDivision في منتصف التسعينيات. في خريف عام 1999 ، اشترت شركة Sun Corporation StarDivision. في يونيو 2000 ، تم إصدار StarOffice 5.2 تحت العلامة التجارية Sun لـ MS Windows و Linux و Solaris. في 13 أكتوبر 2000 ، تم فتح الكود المصدري لـ StarOffice (باستثناء كود بعض الوحدات التي طورتها جهات خارجية) ، ويعتبر هذا اليوم رسميًا عيد ميلاد OpenOffice.org. اليوم ، يتم ترميز OpenOffice.org بواسطة متطوعين من جميع أنحاء العالم ومبرمجين من شركة Sun Corporation.

حاليا من واحد مصدر الرمز، تم تطويره بواسطة مجتمع OpenOffice.org ، تم إصدار منتجين: StarOffice ، الذي يضيف مكونات بموجب ترخيص الملكية ، و OpenOffice.org المجاني. في OpenOffice.org ، تم استبدال معظم مكونات الملكية الموجودة في StarOffice بنظيراتها المجانية.

(وفقًا لـ cnews.ru.)