أجهزة الكمبيوتر شبابيك إنترنت

ما هي الوثائق النصية. امتداد ملف نصي: أنواعه وأساسياته في تحديد الانتماء للبرامج


لماذا تحتاج نص؟

يوجد اليوم ثلاثة تنسيقات نصية شائعة - TXT و RTF و DOC. ما هو اختلافهم وما الذي يوحدهم؟ لديهم شيء واحد مشترك: إنهم يخزنون جميعًا المعلومات النصية. يكمن الاختلاف في إمكانات التنسيق ومعالجة الكلمات التي توفرها ، فضلاً عن مدى سهولة الوصول إلى المعلومات التي بحوزتهم فيما يتعلق بتوافق البرنامج.

أبسط تنسيق نص

الشكل الأقدم والأكثر تواضعًا من حيث الميزات. كل ما يمكنك فعله باستخدام النص بهذا التنسيق هو القيام بإدخال النص الخاص بك وحفظ فواصل الفقرات. تأخذ هذه البساطة في مواقف معينة أهمية التنوع والشفافية: يمكن قراءة TXT بسهولة في تطبيقات مختلفة وعلى منصات مختلفة. بالإضافة إلى ذلك ، فإن العديد من البرامج التي ليس لديها حتى مهمتها الفورية للعمل مع النص قادرة على حفظ النص بتنسيق TXT.

معالجات TXT

منذ أوقات DOS ، يتذكر الكثيرون معالج الكلمات Lexicon ، والذي كان قادرًا على التعامل مع تنسيق TXT تمامًا مستوى عال... اليوم ، الأداة الرئيسية للعمل مع TXT هي المعيار ويندوز المفكرة... يمكن لأي شخص لا تكفي وظائفه أن يجد محررًا يناسب ذوقه واحتياجاته شبكة الانترنت، بما في ذلك مجانًا. على سبيل المثال ، باستخدام البرنامج المجاني Vega بواسطة Konstantin Sheremetyev ، من غير المحتمل أن ترى رسالة مفادها أن الملف النصي المفتوح كبير جدًا ؛ وفقًا لتأكيدات المؤلف ، يفتح الإصدار 2.04 من Vega ملفات تصل إلى 2 جيجابايت (!) ، ويستهلك البرنامج نفسه 9.5 كيلو بايت فقط (قارن ، "يزن" برنامج Notepad في نظام التشغيل Windows XP حوالي 65 كيلو بايت) ؛ في نفس الوقت يعتبر Vega أكثر ملاءمة من Notepad ولا يتطلب التثبيت. وهنا مثال آخر على إمكانيات المعالجة " نص عادي". تمت كتابة النص الذي تقرأه في معالج UltraEdit من IDM Computer Solutions. تتمثل نقطة قوتها في العرض الخاص ومعالجة بناء جملة لغات البرمجة ، ولكن حتى مع النص الأكثر وضوحًا ، يمكن أن تعمل العجائب. يجب أن يتعرف خبراء البرامج المريحة التي ينالون الجنسية الروسية والمريحة ، والأهم من ذلك ، "الذين يعرفون الكثير" عن تفاصيل الترميزات السيريلية ، على برنامج باتريوت.

التنسيق والتنوع

تنسيق نص منسق - هكذا يقف الاختصار في اسم التنسيق الذي أنشأته Microsoft. RTF عبارة عن نص تم ترميزه بـ "كلمات تحكم" خاصة ، مما يسمح لك بإجراء تنسيق معقد وحفظه ، وإدراج الحواشي السفلية ، والرؤوس والتذييلات ، والأشكال ، والجداول ، والصيغ ، على الرغم من معالجة هذه الكائنات الإضافية ، يكون RTF أدنى من تنسيق DOC. إنه أدنى من DOC في حجم الملفات: استخدام "كلمات التحكم" لتنسيق النص بدلاً من ورقة الأنماط لا يؤدي إلى الضغط. ومع ذلك ، فإن RTF يفوز بالنزاع الأمني ​​مع DOC بسبب لا يوفر تنظيمه الداخلي إمكانية تخزين الكود الكلي ، وبالتالي فهو محصن ضد فيروسات الماكرو.

معالجات RTF

يتم استخدام RTF كتنسيق أساسي أو مدعوم في العديد من برامج معالجة الكلمات ، إن لم يكن معظمها. يمكن أن تكون الأداة الجيدة ، على سبيل المثال ، الهيروغليفية لميخائيل موروزوف. لا ينفذ هذا البرنامج المدقق الإملائي للغة الروسية فحسب ، بل ينفذ أيضًا وظيفة تغيير تخطيط لغة لوحة المفاتيح تلقائيًا. معالج الكلمات Atlantis من Rising Sun Solutions ، الموجود في كلٍ من المجال التجاري و إصدارات مجانية، بالتأكيد سوف يناسب العديد من المستخدمين مع تفكير الواجهة ، وجود عدد كبير الاختصاراتوشريط الأدوات القابل للاستبدال والوظائف الأخرى. محرر باتريوت المذكور سابقًا قادر أيضًا على العمل مع RTF.

تنسيق النص "الأكبر"

يتضمن تنسيق DOC إمكانات معالجة النصوص وتنسيقها الأكثر شمولاً ، بما في ذلك إنشاء الحواشي السفلية والتعليقات ، فضلاً عن القدرة على إنشاء ووضع وتحرير الجداول والمخططات والصور والعناصر الأخرى. صحيح ، بشكل كامل وصحيح ، يتم تنفيذ جميع هذه الميزات فقط في MS Word ، وهو ما يسهله موقف Microsoft ، الذي لا يكشف عن المواصفات الحالية للتنسيق الشائع. على الرغم من حقيقة أن DOC "مفهومة" أيضًا من قبل البرامج الأخرى ، فإن مصنعيها ليسوا دائمًا قادرين على ضمان الاعتراف الصحيح بها. على عكس TXT و RTF ، فإن DOC هو تنسيق ثنائي ، مما يجعله غير قابل للقراءة في برامج تحرير النصوص البسيطة ، علاوة على ذلك ، لا يوفر توافقًا كاملاً مع إصداراته الخاصة.

معالجات DOC

في ضوء الأسباب المذكورة أعلاه ، معالج الكلمات "الذي لا يمكن الاستغناء عنه" للعمل مع DOC هو MS Word ، والذي ينفذ بشكل كامل جميع إمكانيات هذا التنسيق. تمت إضافة الكثير من الإنتاجية والوظائف إلى Word من خلال تطويرات الجهات الخارجية - توجد جميع أنواع الوظائف الإضافية ووحدات الماكرو والبرامج بكميات كبيرة في اتساع الشبكة. يتم توفير المنافسة بواسطة WordPerfect من Corel و StarOffice من Sun Microsystems و OpenOffice.org المجاني ، على سبيل المثال. عند العمل في Word وفي البرامج الأخرى ، يجب أن تكون على دراية بمسألة توافق التنسيق وحفظ المستند في DOC فقط إذا كنت متأكدًا من عدم حدوث عدم التوافق.

قابلية تطبيق التنسيقات

لا أساس للتأكيد على أن أحد التنسيقات المدروسة أسوأ من الأشكال الأخرى ، دون مراعاة خصوصيات المهام التي ينبغي استخدامها لحلها. نظرًا لأننا لن نحدد لأنفسنا مهمة التنضيد في معالج الكلمات ، فإن الاختيار يكاد يكون واضحًا. لإعداد أحجام من النص من المتوسط ​​إلى الكبير جدًا ولتوفير "فهم كامل" مكتوب بواسطة أي برنامج تنضيد ، يبدو أنه من الأنسب استخدام أبسط الوسائل وأكثرها تنوعًا في كتابة النص وتخزينه - تنسيق TXT. أما بالنسبة للاستخدام في تخطيط الآخرين تنسيقات النص، ثم يعتمد الكثير على تنفيذ دعمهم في برنامج نماذج أولية محدد.
OpenOffice.org هو مشروع دولي مفتوح المصدر يهدف إلى خلق عالم جناح المكتبتعمل على منصات تشغيل مختلفة ، مع وجود فتح APIوتنسيق ملف على أساس XML. في الأساس ، OpenOffice.org عبارة عن مجموعة من البرامج التي تم تطويرها بداخلها من هذا المشروع... وهي تشمل: معالج النصوص وجداول البيانات محرر الرسوماتونظام العرض ونظام الوصول إلى البيانات. من حيث قدراتها ، يمكن مقارنتها بالبرامج التجارية المماثلة ويمكن اعتبارها بديلاً لها. OpenOffice.org حاليًا مرخص مزدوج بموجب GPL و SISSL. على الرغم من الاختلافات في هذه التراخيص ، فإن OpenOffice.org مجاني للمستخدم النهائي.

يتتبع موقع OpenOffice.org أصوله إلى مجموعة مكتب StarOffice ، التي طورتها الشركة الألمانية StarDivision في منتصف التسعينيات. في خريف عام 1999 ، استحوذت Sun على StarDivision. في يونيو 2000 ، تم إصدار StarOffice 5.2 بالفعل تحت علامة Sun التجارية لنظام التشغيل MS Windows و Linux و Solaris. في 13 أكتوبر 2000 ، كان StarOffice مفتوح المصدر (باستثناء بعض وحدات الطرف الثالث) وهو رسميًا عيد ميلاد OpenOffice.org. اليوم ، يعمل كل من المتطوعين من جميع أنحاء العالم ومبرمجي Sun على كود OpenOffice.org.

حاليا من واحد مصدر الرمز، تم تطويره بواسطة مجتمع OpenOffice.org ، تم إصدار منتجين: StarOffice ، الذي يضيف مكونات بموجب ترخيص خاص ، و OpenOffice.org المجاني. في OpenOffice.org ، تم استبدال معظم مكونات الملكية الموجودة في StarOffice بنظيراتها المجانية.

(وفقًا لمعلومات cnews.ru.)

تسمى مجموعة القواعد التي يتم من خلالها تخزين البيانات في ملف تنسيق الملف. أنواع مختلفةتستخدم الملفات مثل الملفات النصية والرسومات النقطية وما إلى ذلك ، مجموعة متنوعة من التنسيقات. بشكل عام ، يمكن تعريف العديد من التنسيقات المختلفة لنوع الملف نفسه ، على الرغم من أنه غالبًا ما يتم فهم نوع الملف وتنسيقه على أنهما نفس الشيء. يتم تحديد تنسيق الملف بملحق اسم الملف الذي يتم إلحاقه باسم الملف عند حفظه بتنسيق معين ، مثل DOC و GIF وما إلى ذلك.

عادةً ما يتم إنشاء تنسيقات الملفات للاستخدام في برنامج تطبيق جيد التحديد. على سبيل المثال ، الكائنات الرسومية التي تم إنشاؤها في الحزمة المعروفة رسومات فيكتوريتم حفظ CorelDRAW كملفات CDR ، بينما تتم كتابة الصور المقدمة بواسطة حزمة رسومات أخرى ، CorelXara ، على القرص كملفات XAR. لا ترتبط بعض التنسيقات بتطبيقات محددة ، أي أنها عالمية. واحدة من الاكثر شهرة تنسيقات عالميةهو تنسيق TXT (تنسيق ملفات نصية DOS).

غالبًا ما يتم استخدام ضغط ملفات الكمبيوتر لتوفير مساحة التخزين. هناك طرق عديدة لضغط الملفات. تعتمد هذه الأساليب على التنسيق الأصليالملفات. بشكل عام ، كلما زادت نسبة الضغط ، كانت عمليات القراءة والكتابة أبطأ.

بالنسبة لخوارزميات الضغط ، هناك خوارزميات وخوارزميات ضغط بدون فقدان يمكن أن تسبب فقدان البيانات.



يضمن الضغط بدون فقدان البيانات أن جميع البيانات التي كانت موجودة في الملف قبل الضغط موجودة بعد فك ضغط الملف. تُستخدم آليات الضغط بدون فقدان البيانات عند تخزين نص أو بيانات رقمية مثل جداول البيانات أو ملفات المستندات. من أمثلة خوارزميات الضغط بدون فقدان بيانات ZIP و ARJ وغيرها.

هيا نعطي وصف قصيرالتنسيقات الرئيسية المستخدمة:

§ الكود القياسي الأمريكي لتبادل المعلومات ASCII (TXT). تنسيق ملف نصي تم تطويره بواسطة المعهد القومي الأمريكي للمعايير. مدعوم بجميع أنظمة التشغيل وجميع البرامج. إنه ملف نصي بترميز DOS ، ولا توجد وظيفة لإدراج صورة ، ولا تنسيق ، ويعمل في جميع الأجهزة ، ومن الممكن إنشاء ملفات صغيرة فقط.

§ ANSI (TXT). تنسيق الملفات النصية بتنسيق ترميز ANSI(لصفحة الرموز مايكروسوفت ويندوز)

§ MSWord for DOS، Windows (.DOC). يتم دعم تنسيق المستند ، الذي طورته شركة Microsoft Corporation ، بواسطة برامج MS-DOS ومعظم معالجات النصوص. إنه يحافظ على تنسيق المستند الأصلي وكذلك أنماط الأحرف. إلا معلومات نصية، يمكن أن تحتوي الملفات بهذا التنسيق على صور رسومية بمعلمات مختلفة. يدعم 256 لون. لا يدعم الضغط. يتم استخدامه بشكل أساسي لتبادل البيانات النصية المنسقة بين الأنظمة الأساسية والتطبيقات المختلفة.

لغة ترميز النص التشعبي HTML (HTM ، HTML). لغة الترميز لمستندات النص التشعبي. يتم إنشاء جميع الصفحات على الإنترنت باستخدام هذه اللغة الخاصة. مستندات HTML هي ملفات ASCII يمكن عرضها وتحريرها باستخدام أي محرر نصوص. يتمثل الاختلاف عن ملف نصي عادي في أن مستندات HTML تحتوي على أوامر علامات خاصة تحدد قاعدة تنسيق المستند. إذا كنت قد أتقنت لغة HTML ، فيمكنك إنشاء صفحات للإنترنت. من خلال إضافة علامات (تسميات) إلى نص عادي ، فإنك تجبر العارض على عرض ذلك النص بطريقة معينة ووضع الصور على الصفحة. إذا كنت قد تعلمت Java و JavaScript ، فأنت تعرف كيفية توسيع قوة HTML عن طريق وضع أوامر البرمجة النصية داخل العلامات.

§ تنسيق المستند المحمول PDF (.PDF). يدعي تنسيق تخزين المستندات هذا ، الذي طورته Adobe ، أنه معيار مطبعي مفتوح للويب. يُنظر إليه على أنه بديل لـ HTML. عيب HTML هو أن المستندات المترجمة إلى HTML عادةً لا تحتفظ بتنسيقها الأصلي ، وتوفر HTML عددًا محدودًا جدًا من الخطوط عند عرضها. في المقابل ، يعرف مستخدمو أدوات Acrobat و PDF لإنشاء وتوزيع وعرض المستندات بتنسيقهم الأصلي أن القراء سيرون المنشور تمامًا كما تم إنشاؤه. تنسيق PDF لا غنى عنه إذا كنت تريد استلامه نسخة طبق الأصلملفات مطلوبه. كمثال على الاستخدام الناجح لملف PDF للوثائق باللغة الروسية ، دعونا نستشهد بخادم "أخبار موسكو" على الإنترنت. قدمت عليه في في شكل إلكترونيالمواد تكرر تمامًا الورق الأصلي ، مطبوعًا بطريقة الطباعة.

§ لغة التوصيف المعممة القياسية (SGML). يتم ترجمة تطور HTML كلغة ترميز عامة قياسية. إنها مجموعة أدوات من آليات إنشاء مستندات منظمة ، مع تمييزها بالعلامات الوصفية (العلامات). مقارنةً بـ HTML ، فإنه يوفر خيارات تنسيق أكثر مرونة وتنوعًا على الويب. ومع ذلك ، فإن SGML أسرع أيضًا ، لذلك يتم استخدام PDF كأداة أبسط. تكمن قوة SGML في منهجها المنظم عبر الأنظمة الأساسية لوصف محتوى المستندات. SGML هي في الواقع لغة معدنية ، أي الغرض منه هو وصف لغات الترميز المستخدمة عند إنشاء المستندات.

يواجه كل مستخدم للكمبيوتر الشخصي باستمرار تنسيقات مختلفة من الملفات النصية ، ولكن لا يفكر كثيرًا في مدى ثراء تاريخ هذه التنسيقات والبرامج ، مما يمنح الشخص القدرة على قراءة الكتب والعمل مع النص وإنشاء جميع الوثائق اللازمة مباشرة على الحاسوب.

تاريخ الملفات النصية ليس أصغر بكثير من أنفسهم حواسيب شخصية- بالفعل تم كتابة روائعهم في أول نظائرها من "دفتر الملاحظات" الحديث. إذن ما هي تنسيقات الملفات النصية والبرامج للعمل معها؟ تحتاج أولاً إلى فهم الغرض من الملفات النصية ، وما هي الاختلافات بينها وما هو مشترك بينها. إنه يوحد جميع تنسيقات النص تمامًا ، وتتمثل مهمتهم الرئيسية في الحفاظ على معلومات النص. وهي تختلف في إمكانيات المعالجة وأيضًا في الوصول إلى المعلومات المخزنة في الملفات من حيث التوافق مع البرامج الأخرى.

تقليديا ، أبسط تنسيق نص هو تنسيق TXT. وهو أيضًا الأكثر تواضعًا في الميزات وأقدم تنسيق نص. نظرًا لبساطته (تقتصر إمكانات TXT على كتابتها وتقسيمها إلى فقرات) ، غالبًا ما يستخدم هذا التنسيق عدد كبير من التطبيقات والبرامج على مجموعة متنوعة من الأنظمة الأساسية.

مع انتشار أجهزة الكمبيوتر الشخصية وزيادة مبيعاتها ، تقوم Microsoft بإنشاء تنسيق شائع آخر يسمى Rich Text Format (أو ببساطة RTF). إنه نص تم ترميزه ببعض "كلمات التحكم" التي لا تسمح فقط بإنتاج عناصر التنسيق المعقدة ، ولكن أيضًا حفظها وإدراج الصيغ والجداول والأشكال والرؤوس والتذييلات والحواشي السفلية في النص.

ومع ذلك ، فإن RTF أقل شأناً في القدرات من تنسيق DOC ، الذي أنشأته Microsoft أيضًا خصيصًا لحزمة برامج تسمى مايكروسوفت أوفيس... تم إنشاء DOC منذ أكثر من خمسة عشر عامًا ، وهو يتضمن عددًا كبيرًا من الخيارات لتنسيق النص ومعالجته وإنشاء وتحرير ووضع الصور والمخططات والجداول والعناصر الأخرى. وتجدر الإشارة إلى أن هذه الوظائف ستعمل بشكل صحيح في برنامج MS Word فقط. هذا يرجع في المقام الأول إلى حقيقة أن Microsoft ليس لديها المواصفات الحالية لتنسيق DOC ولا تسمح لمنافسيها والمطورين المستقلين باستخدام إمكانات هذا التنسيق على أكمل وجه. هذه الحقيقة هي أحد الأسباب الرئيسية لاستخدام تنسيقات الملفات النصية الأخرى على نطاق واسع في عصرنا ، بالإضافة إلى تنسيق DOC.

يتمثل الاختلاف الرئيسي بين تنسيق DOC والنص و TXT في طبيعته الثنائية ، مما يجعله غير قابل للقراءة في مثل هذه الأشكال البسيطة مثل Wordpad و Lexicon و Atlantis. علاوة على ذلك ، في بعض الحالات ، يمكنك ملاحظة عدم توافق ملفات DOC التي تم إنشاؤها في إصدارات مختلفة من MS Word.

يمكن فتح تنسيقات الملفات النصية وتحريرها في عدد كبير من البرامج. إلى جانب برنامج MS Word المذكور سابقًا ، فإن الأكثر شيوعًا هي StarOffice من Sun Microsystems و WordPerfect من Corel و حزمة مجانية OpenOffice.org.

مع انتشار أجهزة القراءة الإلكترونية ، تكتسب تنسيقات الملفات النصية الأخرى شعبية ، على سبيل المثال ، FB2 و LRF.

من أجل التمكن من استخدام تنسيقات نصية مختلفة على أنظمة أساسية مختلفة ، تم إنشاء عدد كبير من البرامج ، تسمى المحولات. تسمح لك محولات الملفات النصية بحفظ النص الأصلي من تنسيق إلى آخر واستخدامه لاحقًا أجهزة مختلفةوالمنصات.

لا تستخدم المحولات فقط لحفظ النص من تنسيق إلى آخر ، ولكن أيضًا لإنشاء ملفات يمكن استخدامها ، بخلاف مصادرها ، على الأجهزة التي لا تستطيع "قراءة" الملفات الأصلية. على سبيل المثال ، يمكن لبعض الكتب الإلكترونية التي لا تدعم تنسيقات الملفات النصية الشائعة التعرف بسهولة على تنسيقات LRF أو FB2 التي تم الحصول عليها من الملفات الأصلية باستخدام برامج التحويل.

نصادف ملفات نصية (مستندات) كل يوم تقريبًا. ومع ذلك ، في هذا الصدد ، لا ينبغي للمرء أن يخلط بين امتداد الملف النصي وتنسيق نص البيانات ، فهما شيئان مختلفان. دعنا نحاول تحديد ما هي الملفات من هذا النوع وما هي.

امتداد الملف النصي: ما هو؟

لنبدأ بحقيقة أن معظم الملفات من هذا النوع لها امتداد من ثلاثة أحرف بعد الفاصل (نقطة) ، كقاعدة عامة. النوع الأبسط والأكثر شيوعًا هو الملفات ذات الامتداد .txt ، والمفتوحة بنفس الطريقة أنظمة النوافذباستخدام "المفكرة" القياسية.

ومع ذلك ، على الرغم من القواعد المقبولة عمومًا ، لا يمكن أن تحتوي امتدادات ملفات المستندات النصية على ثلاثة أحرف ، ولكن أكثر (يمكن أن يصل عددهم إلى اثني عشر ، ولكن ليس أكثر) ، على سبيل المثال ، الملفات الكتب الإلكترونية.djvu. بالإضافة إلى ذلك ، قد تكون الأرقام موجودة في الامتداد.

ما الذي يعطينا اعتبارًا لتصنيف ملف نصي (مستند) من حيث تحديده؟ وحقيقة أن نظرة واحدة تتيح لك حل سؤال مهم على الفور: ما هو الامتداد الذي تمتلكه الملفات النصية ، مثل البرنامج المرتبط بها للفتح أو التحرير. في كثير من الحالات ، يمكنك دائمًا تحديد التطبيق الأصلي الذي تم إنشاء هذا الملف فيه.


ومع ذلك ، لا تنس أنه يمكنك اليوم العثور على عدد كبير نسبيًا من الملفات بنفس الامتدادات ، ولكن تم إنشاؤها في تطبيقات أخرى أو مرتبطة ببرامج مختلفة. يبدو أن الملف العادي بالملحق .doc (.docx) يتوافق مبدئيًا مع محرر نصوص مايكروسوفت وورد... ولكن يمكنك فتحه أو حفظه بهذا الشكل في نموذج آخر ، حتى على أجهزة كمبيوتر "آبل". يتضمن هذا أيضًا ، إذا جاز التعبير ، نوعًا مختلطًا - ملفات .pdf لا تحتوي على نص فحسب ، بل تحتوي أيضًا على رسومات. ولكن بعد كل شيء مستندات Wordقد تحتوي على صور مدرجة.

هذا هو بالضبط ما يعمل كمؤشر على أن امتداد ملف نصي يشهد على عالمية التنسيق نفسه ، وهو الأكثر "قابلية للقراءة" بغض النظر حتى عن الصيغة المستخدمة نظام التشغيل... الشيء نفسه ينطبق على أي نوع.

أنواع امتدادات الملفات: نص

بشكل عام ، يُعرف اليوم هذا العدد الهائل من تنسيقات النص وامتداداتها ، ومن المحتمل أنه لن يقوم أي متخصص عمليًا بحساب عددهم الكامل.


نعم ، بالطبع ، لا شك في أن عالمية مثل هذه المستندات لا شك فيها ، خاصة إذا كانت تستخدم أبسطها ، ولكن في بعض الأحيان قد تكون المشكلة هي أنه لا يتم دعم كل ترميز بواسطة نظام أو برنامج معين. هذا هو سبب ظهور مجموعة من الرموز على الشاشة بدلاً من الأحرف المعتادة.

بالنسبة لأنواع الملفات النصية ، لا يمكنك سردها جميعًا. الأكثر شيوعًا هي .txt ، .doc ، .tex ، .text ، .pdf ، .log ، .apt ، .ttf ، .err ، .sub ، .djvu ، .odt ، .rtf وغيرها الكثير. القائمة لا حصر لها.

الأكثر إثارة للاهتمام ، أن العديد من هذه الأنواع من الملفات لها أدوار مختلفة في النظام. على سبيل المثال ، بالإضافة إلى ملف الترجمة.


لاحظ حتى الملفات القابلة للتنفيذيمكن أن تحتوي على نص كمحتوى. أبسط مثال- ملف .bat تم إنشاؤه في "Notepad" عادي ويحتوي على نص في شكل مجموعة من الأوامر. عند بدء التشغيل ، يتم تنفيذ الأوامر ، ويتم استخدام قائمة "فتح باستخدام ..." للتحرير ، ما لم تكن هذه العملية مرتبطة في البداية بإجراء آخر.


لوحظ موقف مشابه مع المستندات التي تستخدم لغات الترميز أو البرمجة ، على سبيل المثال ، ملفات .html ، .htm ، .xml ، إلخ. حتى صفحات الويب يمكن فتحها أصلاً في العديد من المحررين كملفات نصية تحتوي على عناصر تابعة لجهات خارجية.

تغيير امتدادات الملفات النصية

بالنسبة لتغيير الامتداد ، في بعض الأحيان يمكن تغييره ، على سبيل المثال ، .txt إلى .doc والعكس صحيح. محرر Word سيفتح أي نوع. الأمر نفسه ينطبق على زوج .txt - .bat عند فتحه في برنامج "المفكرة". لكن في حالات أخرى ، من الأفضل عدم إجراء مثل هذه التلاعبات ، فهي ببساطة لن تؤدي إلى أي شيء ، ولن يتمكن تطبيق آخر من فتح الملف المعاد تسميته. يجب أن يتم تغيير التنسيق بمساعدة برامج التحويل الخاصة.

بدلا من خاتمة

كما هو واضح بالفعل ، يمكن أن يحتوي امتداد الملف النصي على العديد من الاختلافات ، اعتمادًا على البرنامج الذي تم إنشاء المستند فيه. ولكن ، كما هو الحال في حالات أخرى ، من خلال الامتداد نفسه ، من الممكن دائمًا تحديد التطبيق المرتبط به في البداية ، في الحالات القصوى ، قم بفتحه بأي برنامج آخر يدعم العمل مع هذا النوع من البيانات ، حتى إذا كان التطبيق الأصلي غائب على الكمبيوتر. وكما هو واضح بالفعل ، فإن الملفات النصية هي ، في الواقع ، هي الأكثر انتشارًا وعالمية في عالم الكمبيوتر ، بغض النظر عن حزم البرامج وأنظمة التشغيل المستخدمة.

النص هو النوع الأكثر استخدامًا من البيانات في عالم الكمبيوتر وعلى الإنترنت. تتميز مقاطع الفيديو والرسومات بالألوان أكثر بكثير وبشكل عام من الأفضل أن ترى مرة واحدة بدلاً من سماع مئات المرات. حسنًا ، من الجيد أيضًا أن تسمع - في هذه الحالة ، توجد تنسيقات بيانات صوتية. ومع ذلك ، فإن الأحرف والأرقام المتواضعة والمتواضعة تحكم كرة الكمبيوتر. بدونها ، لا يمكنك حتى تسمية ملف آخر. تعتبر البيانات النصية مهمة ومتنوعة - وهذه هي الكتب والمستندات و كود البرنامج... وهناك خيارات تنسيق مختلفة لكل غرض. إنه عنهم الذي سيتم مناقشته في هذه المقالة. صحيح ، يجب على المرء إجراء حجز واحد على الفور - لن تتطرق هذه المراجعة إلى تنسيقات الكتب الإلكترونية ، فهي تستحق مناقشة منفصلة. هنا سنتحدث عن تنسيقات المستندات.

تنسيق النص - TXT (نص عادي)

لذلك - أبسط تنسيق ممكن ، تنسيق TXT. هذا هو النص في شكله النقي وغير المعقد أساسًا. يحتوي فقط على محتوى النص والحد الأدنى المطلق لبيانات الخدمة - الأحرف الخاصة ببداية النص ونهايته ، وحرف الإرجاع ، وما شابه.

على الرغم من بساطته شبه المتقشف ، فإن التنسيق لا يخلو من الاختلافات والاختلافات. أولا ، هناك بعض الاختلافات بين شبابيك، وإصدارات Unix و MacOS التي تستخدم فواصل أسطر مختلفة. أيضًا ، قد تكون الاختلافات بسبب استخدام صفحات الرموز 8 بت (ASCII) أو 16 بت (UNICODE).

ومع ذلك ، على الرغم من ذلك ، فإن تنسيق TXT متعدد الاستخدامات للغاية ، وهو يحظى بشعبية كبيرة بين المبرمجين ومسؤولي النظام.

تنسيقات مستندات MS Office ونظائرها - DOC و DOCX و RTF و ODT

على الرغم من تعدد استخداماتها وبساطتها ، فإن TXT غير مناسبة تمامًا لإنشاء المستندات الفعلية - النصوص المعدة للطباعة وفقًا لقواعد ولوائح معينة. نظرًا لأن مثل هذه المستندات ، بالإضافة إلى النص نفسه ، يجب أن تحتوي أيضًا على الكثير من المعلومات حول تصميم وتنسيق النص. وأيضًا حول تنسيق وحجم الورقة حيث يجب وضعها.

لهذه الأغراض ، تم إنشاء تنسيقات عديدة جدًا لمجموعات المكاتب المختلفة. يمكن اعتبار تنسيقات MS Word الأكثر شيوعًا والقريبة من العالمية - doc و docx. الأول هو تنسيق مغلق خاص أنشأته Microsoft لمحرر النصوص الخاص بها (بتعبير أدق ، مجموعة كاملة من التنسيقات - أثناء وجودها ، تم تحسينها عدة مرات). إلى جانب ذلك ، في فجر تطوير الشركة ، تم إنشاء تنسيق RTF (Rich Text Format) بالتعاون مع شركة Adobe. على عكس DOC ، فإن هيكل هذا التنسيق متاح ويتم دعمه بنجاح بواسطة جميع العناصر الموجودة تقريبًا محرري النصوص... على الرغم من أنه أدنى إلى حد ما من DOC من حيث مجموعة الوظائف المتاحة.

أدت الطبيعة المغلقة لتطورات Microsoft إلى إنشاء مجموعة مكاتب مفتوحة ، Open Office. التي تم تطويرها شكل الملكية ODT ( نص OpenDocumentصيغة). التنسيق غير مدعوم بشكل جيد من قبل المحررين التجاريين ، بما في ذلك مايكروسوفت اوفيسوقد تفتح مع وجود أخطاء.

أخيرًا ، في عام 2007 ، قررت Microsoft التخلي عن الرهان على تنسيق DOC وطوّرت عائلة تنسيق Office Open XML ، والتي تتضمن DOCX ، والتي أصبحت التنسيق الرئيسي للإصدارات الجديدة من MS Word.

تنسيق PDF

رفضت Adobe التعاون مع Microsoft ، تحركت بطريقتها الخاصة. تطورت تنسيق PDFوالذي لم يكن تنسيقًا لتطوير المستندات بقدر ما هو لعرضها وطباعتها. على عكس المجموعة السابقة ، وهي عبارة عن نص منسق ، قد يتغير مظهره مع ذلك اعتمادًا على الجهاز المعين الذي يتم عرضه أو طباعته عليه ، فإن PDF هو تنسيق مستند لا يتغير جوهريًا ويحتفظ به مظهر خارجيوالتخطيط بأي حال من الأحوال. كما أنه يدعم مجموعة واسعة إلى حد ما من عناصر الطباعة والخدمات الإضافية (على سبيل المثال حماية كلمة السر للمستند من التحرير أو الطباعة ، وما إلى ذلك). كل هذا يجعل PDF أكثر تنسيقًا لتوزيع المستندات المعقدة والمنفذة باحتراف وحتى الكتب.