คอมพิวเตอร์ Windows อินเทอร์เน็ต

เอกสารข้อความคืออะไร ส่วนขยายของไฟล์ข้อความ: ประเภทและลักษณะพื้นฐานของการพิจารณาว่าเป็นของโปรแกรม


ทำไมคุณถึงต้องการข้อความ

ปัจจุบันมีรูปแบบข้อความทั่วไปสามรูปแบบ ได้แก่ TXT, RTF และ DOC อะไรคือความแตกต่างและสิ่งที่รวมเข้าด้วยกัน? พวกเขามีสิ่งหนึ่งที่เหมือนกัน: พวกเขาทั้งหมดเก็บข้อมูลข้อความ ความแตกต่างอยู่ที่ความสามารถในการจัดรูปแบบและการประมวลผลคำที่มีให้ ตลอดจนความสามารถในการเข้าถึงข้อมูลที่เก็บไว้เกี่ยวกับความเข้ากันได้ของโปรแกรม

รูปแบบข้อความที่ง่ายที่สุด

รูปแบบที่เก่าแก่ที่สุดและเจียมเนื้อเจียมตัวที่สุดในแง่ของคุณสมบัติ สิ่งที่คุณทำได้กับข้อความในรูปแบบนี้คือป้อนข้อความของคุณเองและบันทึกตัวแบ่งย่อหน้า ความเรียบง่ายในบางสถานการณ์ขึ้นอยู่กับความสำคัญของความเก่งกาจและความโปร่งใส: TXT สามารถอ่านได้ง่ายในแอปพลิเคชันต่างๆ และบนแพลตฟอร์มต่างๆ นอกจากนี้ หลายโปรแกรมที่ไม่ได้ทำงานทันทีกับข้อความก็สามารถบันทึกข้อความในรูปแบบ TXT ได้

โปรเซสเซอร์ TXT

ตั้งแต่สมัยของ DOS หลายคนจำโปรแกรมประมวลผลคำ Lexicon ซึ่งสามารถจัดการกับรูปแบบ TXT ได้ค่อนข้างมาก ระดับสูง... วันนี้เครื่องมือหลักในการทำงานกับ TXT คือมาตรฐาน Windows Notepad... ใครก็ตามที่หน้าที่ของมันไม่เพียงพอสามารถค้นหาบรรณาธิการสำหรับรสนิยมและความต้องการของเขาได้ตลอดเวลาใน เวิลด์ไวด์เว็บรวมทั้งฟรี ตัวอย่างเช่น การใช้โปรแกรมฟรีแวร์ Vega โดย Konstantin Sheremetyev คุณไม่น่าจะเห็นข้อความว่าไฟล์ข้อความที่เปิดมีขนาดใหญ่เกินไป ตามคำรับรองของผู้เขียน Vega เวอร์ชัน 2.04 เปิดไฟล์สูงสุด 2 Gb (!) และโปรแกรมนั้นใช้เวลาเพียง 9.5 kb (เปรียบเทียบ Notepad ใน Windows XP "น้ำหนัก" ประมาณ 65 kb); ในขณะเดียวกัน Vega ก็สะดวกกว่า Notepad และไม่ต้องติดตั้ง และนี่คืออีกตัวอย่างหนึ่งของความเป็นไปได้ในการประมวลผล " ข้อความธรรมดา". ข้อความที่คุณกำลังอ่านถูกพิมพ์ในตัวประมวลผล UltraEdit จาก IDM Computer Solutions จุดแข็งของมันคือการแสดงพิเศษและการประมวลผลไวยากรณ์ของภาษาโปรแกรม แต่ถึงแม้จะเป็นข้อความที่ตรงไปตรงมาที่สุด ก็สามารถทำงานได้อย่างมหัศจรรย์ ผู้ที่ชื่นชอบโปรแกรม Russified ที่สะดวกสบายการยศาสตร์และที่สำคัญที่สุด "ผู้รู้มาก" เกี่ยวกับลักษณะเฉพาะของการเข้ารหัส Cyrillic ควรทำความคุ้นเคยกับโปรแกรม Patriot

การจัดรูปแบบและความเก่งกาจ

รูปแบบ Rich Text - นี่คือลักษณะย่อในชื่อของรูปแบบที่สร้างโดย Microsoft RTF คือข้อความที่ทำเครื่องหมายด้วย "คำควบคุม" พิเศษ ซึ่งช่วยให้คุณดำเนินการและบันทึกการจัดรูปแบบที่ค่อนข้างซับซ้อน แทรกเชิงอรรถ ส่วนหัวและส่วนท้าย ตัวเลข ตาราง และสูตร แม้ว่าในการประมวลผลวัตถุเพิ่มเติมเหล่านี้ RTF จะด้อยกว่ารูปแบบ DOC ขนาดของไฟล์ด้อยกว่า DOC: การใช้ "คำควบคุม" ในการจัดรูปแบบข้อความแทนสไตล์ชีตไม่ได้ทำให้เกิดความกะทัดรัด อย่างไรก็ตาม RTF ชนะข้อพิพาทด้านความปลอดภัยกับ DOC เพราะ องค์กรภายในไม่ได้จัดให้มีการจัดเก็บมาโครโค้ด ดังนั้นจึงไม่มีภูมิคุ้มกันไวรัสมาโคร

โปรเซสเซอร์ RTF

RTF ถูกใช้เป็นรูปแบบหลักหรือรูปแบบที่รองรับในหลาย ๆ โปรแกรมประมวลผลคำส่วนใหญ่ เครื่องมือที่ดีอาจเป็นเช่น Hieroglyph ของ Mikhail Morozov โปรแกรมนี้ไม่เพียงแต่ใช้เครื่องตรวจการสะกดของภาษารัสเซียเท่านั้น แต่ยังใช้ฟังก์ชันของการเปลี่ยนรูปแบบภาษาของแป้นพิมพ์โดยอัตโนมัติด้วย โปรแกรมประมวลผลคำ Atlantis จาก Rising Sun Solutions ซึ่งมีอยู่ในเชิงพาณิชย์และ รุ่นฟรี, จะเหมาะกับผู้ใช้จำนวนมากอย่างแน่นอนด้วยความเอาใจใส่ของอินเทอร์เฟซ, การมีอยู่จำนวนมาก ทางลัด, แถบเครื่องมือที่เปลี่ยนได้และฟังก์ชันอื่นๆ บรรณาธิการผู้รักชาติที่กล่าวถึงแล้วยังสามารถทำงานกับ RTF ได้

รูปแบบข้อความ "ใหญ่ที่สุด"

รูปแบบ DOC ประกอบด้วยความสามารถในการประมวลผลข้อความและการจัดรูปแบบที่ครอบคลุมที่สุด รวมถึงการสร้างเชิงอรรถและความคิดเห็น ตลอดจนความสามารถในการสร้าง วาง และแก้ไขตาราง แผนภูมิ รูปภาพ และองค์ประกอบอื่นๆ จริงอยู่เต็มและถูกต้องที่สุดคุณสมบัติเหล่านี้ใช้งานได้เฉพาะใน MS Word ซึ่งอำนวยความสะดวกโดยตำแหน่งของ Microsoft ซึ่งไม่เปิดเผยข้อกำหนดปัจจุบันของรูปแบบยอดนิยม แม้ว่าโปรแกรมอื่น ๆ จะ "เข้าใจ" DOC ก็ตาม แต่ผู้ผลิตก็ไม่สามารถรับรองการจดจำที่ถูกต้องได้เสมอไป DOC เป็นรูปแบบไบนารีซึ่งแตกต่างจาก TXT และ RTF ซึ่งทำให้ไม่สามารถอ่านได้ในโปรแกรมแก้ไขข้อความทั่วไป และยิ่งกว่านั้น ไม่ได้ให้ความเข้ากันได้อย่างสมบูรณ์กับเวอร์ชันของตัวเอง

โปรเซสเซอร์ DOC

เหตุผลหลักและจากเหตุผลข้างต้น โปรแกรมประมวลผลคำที่ "ไม่สามารถถูกแทนที่" สำหรับการทำงานกับ DOC คือ MS Word ซึ่งส่วนใหญ่ใช้ความเป็นไปได้ทั้งหมดของรูปแบบนี้อย่างเต็มที่ ความสามารถในการทำงานและการทำงานจำนวนมากถูกเพิ่มเข้ามาใน Word โดยการพัฒนาของบริษัทอื่น - ส่วนเสริม มาโคร และโปรแกรมทุกประเภทมีอยู่ในปริมาณมากในเครือข่ายอันกว้างใหญ่ การแข่งขันจัดทำโดย WordPerfect จาก Corel, StarOffice จาก Sun Microsystems และ OpenOffice.org ฟรี เป็นต้น เมื่อทำงานใน Word และในโปรแกรมอื่นๆ คุณควรตระหนักถึงปัญหาของความเข้ากันได้ของรูปแบบ และบันทึกเอกสารใน DOC เฉพาะเมื่อคุณแน่ใจว่าจะไม่เกิดความไม่ลงรอยกัน

การบังคับใช้รูปแบบ

ไม่มีเหตุผลที่จะยืนยันว่ารูปแบบใดรูปแบบหนึ่งที่ถือว่าแย่กว่ารูปแบบอื่น โดยไม่คำนึงถึงลักษณะเฉพาะของงานสำหรับโซลูชันที่ควรใช้ เนื่องจากเราจะไม่กำหนดงานการเรียงพิมพ์ในโปรแกรมประมวลผลคำ ทางเลือกจึงแทบไม่คลุมเครือ เพื่อเตรียมข้อความจำนวนมากจากขนาดกลางถึงขนาดใหญ่มากและเพื่อให้ "ความเข้าใจที่สมบูรณ์" ในการพิมพ์โดยโปรแกรมการเรียงพิมพ์ใดๆ ดูเหมือนว่าจะสะดวกที่สุดที่จะใช้วิธีการพิมพ์และจัดเก็บข้อความที่ง่ายที่สุด กะทัดรัด และใช้งานได้หลากหลายที่สุด - รูปแบบ TXT สำหรับการใช้งานในเลย์เอาต์ของผู้อื่น รูปแบบข้อความมากขึ้นอยู่กับการดำเนินการสนับสนุนในโปรแกรมสร้างต้นแบบเฉพาะ
OpenOffice.org เป็นโครงการโอเพ่นซอร์สระดับสากลที่มุ่งสร้างสากล ชุดสำนักงานปฏิบัติการบนแพลตฟอร์มปฏิบัติการต่างๆ โดยมี เปิด APIและรูปแบบไฟล์ตาม XML โดยทั่วไป OpenOffice.org เป็นชุดโปรแกรมที่พัฒนาขึ้นภายใน ของโครงการนี้... ประกอบด้วย: โปรแกรมประมวลผลคำ สเปรดชีต ตัวแก้ไขกราฟิก, ระบบการนำเสนอ และระบบการเข้าถึงข้อมูล ในแง่ของความสามารถ มันเปรียบได้กับโปรแกรมเชิงพาณิชย์ที่คล้ายคลึงกันและอาจได้รับการพิจารณาเป็นทางเลือกแทน ปัจจุบัน OpenOffice.org ได้รับอนุญาตแบบคู่ภายใต้ GPL และ SISSL แม้จะมีความแตกต่างในใบอนุญาตเหล่านี้ แต่ OpenOffice.org นั้นฟรีสำหรับผู้ใช้ปลายทาง

OpenOffice.org ติดตามที่มาของชุดโปรแกรมสำนักงาน StarOffice ซึ่งพัฒนาโดยบริษัท StarDivision ของเยอรมันในช่วงกลางปี ​​1990 ในฤดูใบไม้ร่วงปี 2542 ซันเข้าซื้อกิจการสตาร์ดิวิชั่น ในเดือนมิถุนายน พ.ศ. 2543 ภายใต้เครื่องหมายการค้าของซัน StarOffice 5.2 ได้เปิดตัวสำหรับ MS Windows, Linux และ Solaris เมื่อวันที่ 13 ตุลาคม พ.ศ. 2543 StarOffice เป็นโอเพ่นซอร์ส (ไม่รวมโมดูลของบุคคลที่สามบางส่วน) และเป็นวันเกิดของ OpenOffice.org อย่างเป็นทางการ วันนี้ ทั้งอาสาสมัครจากทั่วโลกและโปรแกรมเมอร์ของ Sun ทำงานในโค้ด OpenOffice.org

ปัจจุบันจากหนึ่ง รหัสแหล่งที่มาซึ่งพัฒนาโดยชุมชน OpenOffice.org มีการเปิดตัวผลิตภัณฑ์สองรายการ: StarOffice ซึ่งเพิ่มส่วนประกอบภายใต้ลิขสิทธิ์ที่เป็นกรรมสิทธิ์ และ OpenOffice.org ฟรี ใน OpenOffice.org ส่วนประกอบที่เป็นกรรมสิทธิ์ส่วนใหญ่ที่พบใน StarOffice ถูกแทนที่ด้วยส่วนประกอบที่ไม่เสียค่าใช้จ่าย

(ตามข้อมูล cnews.ru)

ชุดของกฎที่ข้อมูลถูกเก็บไว้ในไฟล์เรียกว่ารูปแบบไฟล์ หลากหลายชนิดไฟล์ต่างๆ เช่น ไฟล์ข้อความ กราฟิกบิตแมป เป็นต้น ใช้งานได้หลากหลายรูปแบบ โดยทั่วไป ไฟล์ประเภทเดียวกันสามารถกำหนดรูปแบบที่แตกต่างกันได้หลายรูปแบบ แม้ว่าบ่อยครั้งที่ประเภทและรูปแบบไฟล์จะเข้าใจว่าเป็นสิ่งเดียวกัน รูปแบบไฟล์จะถูกระบุโดยนามสกุลไฟล์ที่ต่อท้ายชื่อไฟล์เมื่อบันทึกในรูปแบบเฉพาะ เช่น DOC, GIF เป็นต้น

โดยปกติ รูปแบบไฟล์จะถูกสร้างขึ้นเพื่อใช้ในโปรแกรมแอปพลิเคชันที่กำหนดไว้อย่างดี ตัวอย่างเช่น วัตถุกราฟิกที่สร้างขึ้นในแพ็คเกจที่รู้จักกันดี กราฟิกแบบเวกเตอร์ CorelDRAW จะถูกบันทึกเป็นไฟล์ CDR ในขณะที่ภาพที่แสดงผลโดยแพ็คเกจกราฟิกอื่น CorelXara จะถูกเขียนลงดิสก์เป็นไฟล์ XAR บางรูปแบบไม่เกี่ยวข้องกับแอปพลิเคชันเฉพาะ กล่าวคือ เป็นรูปแบบสากล ที่มีชื่อเสียงที่สุดคนหนึ่ง รูปแบบสากลเป็นรูปแบบ TXT (format ไฟล์ข้อความดอส).

การบีบอัดไฟล์คอมพิวเตอร์มักใช้เพื่อประหยัดพื้นที่จัดเก็บ มีหลายวิธีในการบีบอัดไฟล์ วิธีการเหล่านี้ขึ้นอยู่กับ รูปแบบเดิมไฟล์. โดยทั่วไป ยิ่งอัตราส่วนการบีบอัดสูงเท่าใด การอ่านและเขียนก็จะยิ่งช้าลงเท่านั้น

สำหรับอัลกอริธึมการบีบอัด มีทั้งอัลกอริธึมการบีบอัดแบบไม่สูญเสียข้อมูลและอัลกอริธึมที่อาจทำให้ข้อมูลสูญหายได้



การบีบอัดแบบไม่สูญเสียข้อมูลช่วยให้มั่นใจได้ว่าข้อมูลทั้งหมดที่อยู่ในไฟล์ก่อนการบีบอัดจะมีอยู่หลังจากที่ไฟล์ถูกคลายการบีบอัดแล้ว กลไกการบีบอัดแบบไม่สูญเสียข้อมูลจะใช้เมื่อจัดเก็บข้อความหรือข้อมูลตัวเลข เช่น สเปรดชีตหรือไฟล์เอกสาร ตัวอย่างของอัลกอริธึมการบีบอัดแบบไม่สูญเสียข้อมูล ได้แก่ ZIP, ARJ และอื่นๆ ที่เป็นที่รู้จัก

ให้ คำอธิบายสั้นรูปแบบหลักที่ใช้:

§ American Standard Code สำหรับการแลกเปลี่ยนข้อมูล ASCII (TXT) รูปแบบไฟล์ข้อความที่พัฒนาโดย American National Standards Institute รองรับทุกระบบปฏิบัติการและทุกโปรแกรม เป็นไฟล์ข้อความในการเข้ารหัส DOS ไม่มีฟังก์ชั่นแทรกรูปภาพ ไม่มีการจัดรูปแบบ ใช้งานได้กับทุกเครื่อง สร้างได้เฉพาะไฟล์ขนาดเล็กเท่านั้น

§ ANSI (TXT) รูปแบบของไฟล์ข้อความใน การเข้ารหัส ANSI(สำหรับโค้ดเพจ Microsoft Windows)

§ MSWord สำหรับ DOS, Windows (.DOC) รูปแบบเอกสารที่พัฒนาโดย Microsoft Corporation ได้รับการสนับสนุนโดยโปรแกรม MS-DOS และโปรแกรมประมวลผลคำส่วนใหญ่ โดยจะคงรูปแบบเอกสารดั้งเดิมและลักษณะอักขระไว้ ยกเว้น ข้อมูลข้อความ, ไฟล์รูปแบบนี้สามารถมีภาพกราฟิกที่มีพารามิเตอร์ต่างกันได้ รองรับ 256 สี ไม่รองรับการบีบอัด ส่วนใหญ่จะใช้เพื่อแลกเปลี่ยนข้อมูลข้อความที่จัดรูปแบบระหว่างแพลตฟอร์มและแอปพลิเคชันต่างๆ

ภาษามาร์กอัปไฮเปอร์เท็กซ์ HTML (HTM, HTML) ภาษามาร์กอัปสำหรับเอกสารไฮเปอร์เท็กซ์ หน้าทั้งหมดบนอินเทอร์เน็ตถูกสร้างขึ้นโดยใช้ภาษาพิเศษนี้ เอกสาร HTML คือไฟล์ ASCII ที่สามารถดูและแก้ไขได้ด้วยโปรแกรมแก้ไขข้อความ ความแตกต่างจากไฟล์ข้อความปกติคือเอกสาร HTML มีคำสั่งแท็กพิเศษที่กำหนดกฎสำหรับการจัดรูปแบบเอกสาร หากคุณเชี่ยวชาญภาษา HTML คุณสามารถสร้างเพจสำหรับอินเทอร์เน็ตได้ การเพิ่มแท็ก (ป้ายกำกับ) ให้กับข้อความธรรมดา แสดงว่าคุณบังคับให้ผู้ดูแสดงข้อความนั้นในวิธีเฉพาะและวางรูปภาพบนหน้า หากคุณได้เรียนรู้ Java และ JavaScript คุณจะรู้วิธีขยายประสิทธิภาพของ HTML โดยการวางคำสั่งสคริปต์ไว้ในแท็ก

§รูปแบบเอกสารแบบพกพา PDF (.PDF) รูปแบบการจัดเก็บเอกสารนี้ซึ่งพัฒนาโดย Adobe อ้างว่าเป็นมาตรฐานการพิมพ์แบบเปิดสำหรับเว็บ มันถูกมองว่าเป็นทางเลือกแทน HTML ข้อเสียของ HTML คือเอกสารที่แปลเป็น HTML มักจะไม่คงรูปแบบเดิมไว้ และ HTML มีแบบอักษรจำนวนจำกัดเมื่อดู ในทางตรงกันข้าม ผู้ใช้เครื่องมือ Acrobat และ PDF ในการสร้าง แจกจ่าย และดูเอกสารในรูปแบบดั้งเดิมจะทราบดีว่าผู้อ่านจะเห็นสิ่งพิมพ์ตรงตามที่จัดทำขึ้น รูปแบบ PDF เป็นสิ่งที่ขาดไม่ได้หากคุณต้องการรับ สำเนาถูกต้องเอกสารที่จำเป็น เป็นตัวอย่างของความสำเร็จในการใช้ PDF สำหรับเอกสารในภาษารัสเซีย ให้เราอ้างอิงเซิร์ฟเวอร์ "Moscow News" บนอินเทอร์เน็ต นำเสนอใน ในรูปแบบอิเล็กทรอนิกส์วัสดุทำซ้ำกระดาษต้นฉบับโดยสมบูรณ์พิมพ์ด้วยวิธีการพิมพ์

§ ภาษามาร์กอัปทั่วไปแบบมาตรฐาน (SGML) วิวัฒนาการของ HTML ได้รับการแปลเป็นภาษามาร์กอัปทั่วไปมาตรฐาน เป็นชุดเครื่องมือของกลไกสำหรับการสร้างเอกสารที่มีโครงสร้างซึ่งมีการทำเครื่องหมายด้วยคำอธิบาย (แท็ก) เมื่อเทียบกับ HTML จะมีตัวเลือกการจัดรูปแบบที่หลากหลายและยืดหยุ่นกว่าบนเว็บ อย่างไรก็ตาม SGML นั้นเร็วกว่าด้วย ดังนั้น PDF จึงถูกใช้เป็นเครื่องมือที่ง่ายกว่า พลังของ SGML อยู่ในแนวทางที่มีโครงสร้างข้ามแพลตฟอร์มเพื่ออธิบายเนื้อหาของเอกสาร SGML เป็นภาษาเมตาจริง ๆ เช่น มีวัตถุประสงค์เพื่ออธิบายภาษามาร์กอัปที่ใช้ในการสร้างเอกสาร

ผู้ใช้พีซีแต่ละรายต้องเผชิญกับไฟล์ข้อความรูปแบบต่างๆ อย่างต่อเนื่อง แต่แทบจะไม่เคยคิดว่าประวัติของรูปแบบและโปรแกรมเหล่านี้สมบูรณ์เพียงใด ซึ่งทำให้บุคคลสามารถอ่านหนังสือ ทำงานกับข้อความ และสร้างเอกสารที่จำเป็นทั้งหมดได้บน คอมพิวเตอร์.

ประวัติของไฟล์ข้อความไม่ได้อายุน้อยกว่าตัวเองมากนัก คอมพิวเตอร์ส่วนบุคคล- แล้วผลงานชิ้นเอกของพวกเขาถูกเขียนขึ้นในแอนะล็อกแรกของ "โน้ตบุ๊ก" ที่ทันสมัย ดังนั้นรูปแบบของไฟล์ข้อความและโปรแกรมสำหรับทำงานกับไฟล์เหล่านี้คืออะไร? ก่อนอื่น คุณต้องเข้าใจก่อนว่าไฟล์ข้อความมีไว้เพื่ออะไร อะไรคือความแตกต่างระหว่างไฟล์เหล่านี้กับสิ่งที่เหมือนกัน รวมรูปแบบข้อความทั้งหมดเข้าด้วยกันงานหลักคือการรักษาข้อมูลข้อความ แตกต่างกันในด้านความสามารถในการประมวลผลและการเข้าถึงข้อมูลที่จัดเก็บไว้ในไฟล์ในแง่ของความเข้ากันได้กับโปรแกรมอื่นๆ

ตามเนื้อผ้า รูปแบบข้อความที่ง่ายที่สุดคือรูปแบบ TXT นอกจากนี้ยังเป็นคุณลักษณะที่เจียมเนื้อเจียมตัวที่สุดและรูปแบบข้อความที่เก่าที่สุด เนื่องจากความเรียบง่าย (ความสามารถของ TXT จำกัดเฉพาะการพิมพ์และแบ่งออกเป็นย่อหน้า) รูปแบบนี้มักถูกใช้โดยแอปพลิเคชันและโปรแกรมจำนวนมากบนแพลตฟอร์มที่หลากหลาย

ด้วยการเพิ่มจำนวนคอมพิวเตอร์ส่วนบุคคลและยอดขายที่เพิ่มขึ้น Microsoft กำลังสร้างรูปแบบยอดนิยมอีกรูปแบบหนึ่งที่เรียกว่า Rich Text Format (หรือเพียงแค่ RTF) เป็นข้อความที่ทำเครื่องหมายด้วย "คำควบคุม" บางคำที่ไม่เพียงแต่อนุญาตให้สร้าง แต่ยังบันทึกองค์ประกอบการจัดรูปแบบที่ซับซ้อนและการแทรกสูตร ตาราง ตัวเลข ส่วนหัวและส่วนท้าย และเชิงอรรถลงในข้อความ

อย่างไรก็ตาม RTF ค่อนข้างด้อยความสามารถในรูปแบบ DOC ซึ่งสร้างโดย Microsoft โดยเฉพาะสำหรับแพ็คเกจซอฟต์แวร์ที่เรียกว่า Microsoft Office... DOC สร้างขึ้นเมื่อ 15 ปีที่แล้ว มีตัวเลือกมากมายสำหรับการจัดรูปแบบและประมวลผลข้อความ การสร้าง แก้ไข และการวางรูปภาพ แผนภูมิ ตาราง และองค์ประกอบอื่นๆ ควรสังเกตว่าฟังก์ชันเหล่านี้จะทำงานได้อย่างถูกต้องที่สุดใน MS Word เท่านั้น สาเหตุหลักมาจากข้อเท็จจริงที่ว่า Microsoft ไม่มีข้อกำหนดในปัจจุบันสำหรับรูปแบบ DOC และไม่อนุญาตให้คู่แข่งและนักพัฒนาอิสระใช้ความสามารถของรูปแบบนี้อย่างเต็มที่ ความจริงข้อนี้เป็นหนึ่งในสาเหตุหลักที่นอกเหนือจากรูปแบบ DOC แล้ว รูปแบบไฟล์ข้อความอื่นๆ ยังใช้กันอย่างแพร่หลายในสมัยของเรา

ความแตกต่างที่สำคัญระหว่างรูปแบบ DOC กับข้อความและ TXT คือลักษณะไบนารี เนื่องจากไม่สามารถอ่านในรูปแบบง่ายๆ เช่น Wordpad, Lexicon, Atlantis นอกจากนี้ ในบางกรณี คุณสามารถสังเกตความไม่เข้ากันของไฟล์ DOC ที่สร้างใน MS Word เวอร์ชันต่างๆ

รูปแบบไฟล์ข้อความสามารถเปิดและแก้ไขได้ในโปรแกรมจำนวนมาก นอกจาก MS Word ที่กล่าวถึงก่อนหน้านี้แล้ว สิ่งที่พบได้บ่อยที่สุดคือ StarOffice จาก Sun Microsystems, WordPerfect จาก Corel และ แพ็คเกจฟรี OpenOffice.org

ด้วยการเพิ่มจำนวนอุปกรณ์การอ่านอิเล็กทรอนิกส์ รูปแบบไฟล์ข้อความอื่นๆ กำลังได้รับความนิยม เช่น FB2 และ LRF

เพื่อให้สามารถใช้รูปแบบข้อความที่แตกต่างกันบนแพลตฟอร์มที่แตกต่างกัน มีการสร้างโปรแกรมจำนวนมากที่เรียกว่าตัวแปลง ตัวแปลงไฟล์ข้อความช่วยให้คุณสามารถบันทึกข้อความต้นฉบับจากรูปแบบหนึ่งไปยังอีกรูปแบบหนึ่งและใช้ในภายหลังได้ อุปกรณ์ต่างๆและแพลตฟอร์ม

ตัวแปลงใช้ไม่เพียงเพื่อบันทึกข้อความจากรูปแบบหนึ่งไปยังอีกรูปแบบหนึ่ง แต่ยังเพื่อสร้างไฟล์ที่สามารถใช้บนอุปกรณ์ที่ไม่สามารถ "อ่าน" ไฟล์ต้นฉบับได้ ตัวอย่างเช่น หนังสืออิเล็กทรอนิกส์บางเล่มที่ไม่สนับสนุนรูปแบบไฟล์ข้อความยอดนิยมสามารถจดจำรูปแบบ LRF หรือ FB2 ที่ได้รับจากไฟล์ต้นฉบับได้อย่างง่ายดายโดยใช้โปรแกรมแปลงไฟล์

เราเจอไฟล์ข้อความ (เอกสาร) แทบทุกวัน อย่างไรก็ตาม ในเรื่องนี้ เราไม่ควรสับสนระหว่างนามสกุลของไฟล์ข้อความและรูปแบบข้อความของข้อมูล สิ่งเหล่านี้ต่างกัน ลองพิจารณาว่าไฟล์ประเภทนี้คืออะไรและคืออะไร

นามสกุลไฟล์ข้อความ: มันคืออะไร?

เริ่มจากข้อเท็จจริงที่ว่า ตามกฎแล้ว ไฟล์ประเภทนี้ส่วนใหญ่มีนามสกุลสามตัวอักษรหลังตัวคั่น (จุด) ประเภทที่ง่ายที่สุดและพบบ่อยที่สุดคือไฟล์ที่มีนามสกุล .txt ซึ่งเปิดในไฟล์เดียวกัน ระบบ Windowsโดยใช้ "Notepad" มาตรฐาน

อย่างไรก็ตาม แม้จะมีกฎที่ยอมรับกันโดยทั่วไป นามสกุลไฟล์ของเอกสารข้อความสามารถมีตัวอักษรได้ไม่เกินสามตัว แต่มีมากกว่านั้น (ตัวเลขสามารถถึงสิบสองแต่ไม่เกิน) ตัวอย่างเช่น ไฟล์ e-books.djvu นอกจากนี้ อาจมีตัวเลขอยู่ในส่วนขยาย

อะไรทำให้เราพิจารณาการจัดประเภทของไฟล์ข้อความ (เอกสาร) ในแง่ของการระบุตัวตน และการมองแวบเดียวทำให้คุณสามารถไขคำถามสำคัญได้ทันที: ไฟล์ข้อความมีนามสกุลอะไร เช่น โปรแกรมที่เกี่ยวข้องกับการเปิดหรือแก้ไข ในหลายกรณี คุณสามารถระบุแอปพลิเคชันดั้งเดิมที่สร้างไฟล์ดังกล่าวได้เกือบทุกครั้ง


อย่างไรก็ตาม อย่าลืมว่าวันนี้ คุณสามารถค้นหาไฟล์ที่มีนามสกุลเดียวกันจำนวนมาก แต่สร้างในแอปพลิเคชันอื่นหรือเชื่อมโยงกับโปรแกรมต่างๆ ดูเหมือนว่าไฟล์ปกติที่มีนามสกุล .doc (.docx) จะสัมพันธ์กับโปรแกรมแก้ไขข้อความ ไมโครซอฟ เวิร์ด... แต่คุณสามารถเปิดหรือบันทึกในรูปแบบนี้ในเครื่องอื่นได้ แม้แต่ในคอมพิวเตอร์ "apple" ซึ่งรวมถึงไฟล์ .pdf แบบผสม ซึ่งไม่เพียงแต่ประกอบด้วยข้อความเท่านั้น แต่ยังรวมถึงกราฟิกด้วย แต่สุดท้าย เอกสาร Wordอาจมีภาพที่แทรก

นี่คือสิ่งที่ทำหน้าที่เป็นตัวบ่งชี้ว่านามสกุลของไฟล์ข้อความเป็นเครื่องยืนยันถึงความเป็นสากลของรูปแบบเอง ซึ่งเป็นสิ่งที่ "อ่านได้" มากที่สุดโดยไม่คำนึงถึงการใช้ ระบบปฏิบัติการ... เช่นเดียวกับประเภทใดก็ได้

ประเภทนามสกุลไฟล์: text

โดยทั่วไป ทุกวันนี้รูปแบบข้อความจำนวนมากและส่วนขยายเป็นที่ทราบกันดีอยู่แล้วว่าอาจไม่มีผู้เชี่ยวชาญคนใดที่จะดำเนินการนับจำนวนเต็มของพวกเขา


ใช่ แน่นอน ความเป็นสากลของเอกสารดังกล่าวไม่ต้องสงสัยเลย โดยเฉพาะอย่างยิ่ง ถ้าเอกสารเหล่านี้ใช้แบบง่ายที่สุด แต่บางครั้ง ปัญหาอาจอยู่ที่การเข้ารหัสบางตัวไม่ได้รับการสนับสนุนโดยระบบหรือโปรแกรมเฉพาะ นั่นคือเหตุผลที่ชุดของสัญลักษณ์ปรากฏบนหน้าจอแทนที่จะเป็นตัวอักษรปกติ

สำหรับไฟล์ข้อความประเภทต่างๆ คุณไม่สามารถแสดงรายการทั้งหมดได้ ไฟล์ที่พบบ่อยที่สุดคือ .txt, .doc, .tex, .text, .pdf, .log, .apt, .ttf, .err, .sub, .djvu, .odt, .rtf และอื่นๆ อีกมากมาย รายการไม่มีที่สิ้นสุด

สิ่งที่น่าสนใจที่สุดคือ ไฟล์หลายประเภทเหล่านี้มีบทบาทที่แตกต่างกันในระบบ ตัวอย่างเช่น นอกเหนือจากไฟล์คำบรรยาย .sub ปกติแล้ว เอกสารข้อความปกติ .txt สามารถรับผิดชอบในการดูเมื่อเปิดวิดีโอ และในเรื่องนี้ หลายรูปแบบสามารถใช้แทนกันได้


แจ้งให้ทราบแม้ ไฟล์ปฏิบัติการสามารถมีข้อความเป็นเนื้อหาได้ ตัวอย่างที่ง่ายที่สุด- ไฟล์ .bat ที่สร้างใน "Notepad" ปกติและมีข้อความในรูปแบบของชุดคำสั่ง เมื่อเริ่มต้น คำสั่งจะถูกดำเนินการ และเมนู "เปิดด้วย ..." ใช้สำหรับแก้ไข เว้นแต่ว่ากระบวนการนี้จะเชื่อมโยงกับการดำเนินการอื่นในขั้นต้น


สถานการณ์ที่คล้ายคลึงกันนั้นพบได้ในเอกสารที่ใช้มาร์กอัปหรือภาษาโปรแกรม เช่น ไฟล์ .html, .htm, .xml เป็นต้น แม้แต่หน้าเว็บก็สามารถเปิดได้เองในเครื่องมือแก้ไขหลายๆ ตัว เช่น ไฟล์ข้อความที่มีองค์ประกอบของบุคคลที่สาม

การเปลี่ยนนามสกุลของไฟล์ข้อความ

สำหรับการเปลี่ยนนามสกุล บางครั้งสามารถเปลี่ยนแปลงได้ เช่น .txt เป็น .doc และในทางกลับกัน โปรแกรมแก้ไข Word จะเปิดประเภทใดก็ได้ เช่นเดียวกับคู่ .txt - .bat เมื่อเปิดใน Notepad แต่ในกรณีอื่น เป็นการดีกว่าที่จะไม่ดำเนินการจัดการดังกล่าว มันจะไม่นำไปสู่สิ่งใดๆ และแอปพลิเคชันอื่นจะไม่สามารถเปิดไฟล์ที่เปลี่ยนชื่อได้ การเปลี่ยนรูปแบบจะต้องทำโดยใช้โปรแกรมแปลงพิเศษ

แทนที่จะเป็นคำต่อท้าย

เนื่องจากชัดเจนอยู่แล้ว นามสกุลของไฟล์ข้อความจึงสามารถมีได้หลายรูปแบบ ขึ้นอยู่กับโปรแกรมที่สร้างเอกสาร แต่เช่นเดียวกับในกรณีอื่น ๆ โดยส่วนขยายเองเกือบทุกครั้งจะเป็นไปได้ที่จะกำหนดแอปพลิเคชันที่เกี่ยวข้องกับมันในตอนแรก ในกรณีร้ายแรง ให้เปิดด้วยโปรแกรมอื่น ๆ ที่รองรับการทำงานกับข้อมูลประเภทนี้แม้ว่าแอปพลิเคชันดั้งเดิมจะเป็น ไม่อยู่ในคอมพิวเตอร์ และเนื่องจากอาจมีความชัดเจนอยู่แล้ว ไฟล์ข้อความจึงเป็นไฟล์ที่แพร่หลายและเป็นสากลที่สุดในโลกของคอมพิวเตอร์ โดยไม่คำนึงถึงแพ็คเกจซอฟต์แวร์และระบบปฏิบัติการที่ใช้

ประเภทข้อมูลที่ใช้บ่อยที่สุดในโลกคอมพิวเตอร์และบนอินเทอร์เน็ตคือข้อความ วิดีโอและกราฟิกมีสีสันมากกว่ามาก และโดยทั่วไปแล้ว จะดีกว่าที่จะเห็นหนึ่งครั้งมากกว่าฟังร้อยครั้ง ก็ยังดีที่จะได้ยิน - สำหรับกรณีนี้มีรูปแบบข้อมูลเสียง อย่างไรก็ตาม ตัวอักษรและตัวเลขที่ไม่โอ้อวดและเจียมเนื้อเจียมตัวจะครองบอลคอมพิวเตอร์ หากไม่มี คุณจะไม่สามารถตั้งชื่อให้กับไฟล์อื่นได้ ข้อมูลข้อความมีความสำคัญและหลากหลาย - เหล่านี้คือหนังสือและเอกสารและ รหัสโปรแกรม... และมีตัวเลือกรูปแบบที่แตกต่างกันสำหรับแต่ละวัตถุประสงค์ เกี่ยวกับพวกเขาที่จะกล่าวถึงในบทความนี้ จริงอยู่ ควรทำการจองหนึ่งครั้ง - บทวิจารณ์นี้จะไม่พูดถึงรูปแบบของ e-book แต่ควรแยกอภิปรายแยกกัน ที่นี่เราจะพูดถึงรูปแบบของเอกสาร

รูปแบบข้อความ - TXT (ข้อความธรรมดา)

ดังนั้น - รูปแบบ TXT ที่ง่ายที่สุด นี่คือข้อความในรูปแบบที่บริสุทธิ์และไม่ซับซ้อน ประกอบด้วยเฉพาะเนื้อหาของข้อความและข้อมูลการบริการขั้นต่ำสุด - อักขระสำหรับจุดเริ่มต้นและจุดสิ้นสุดของข้อความ การขึ้นบรรทัดใหม่ และอื่นๆ

แม้จะมีความเรียบง่ายแบบสปาร์ตัน แต่รูปแบบก็ไม่ได้ปราศจากความแตกต่างและความแตกต่าง ประการแรก มีความแตกต่างบางประการระหว่าง Windows, รุ่น Unix และ MacOS ที่ใช้ตัวยุติบรรทัดต่างกัน นอกจากนี้ ความแตกต่างอาจเกิดจากการใช้หน้ารหัส 8 บิต (ASCII) หรือ 16 บิต (UNICODE)

อย่างไรก็ตาม ถึงกระนั้น รูปแบบ TXT ก็มีความหลากหลายมาก ซึ่งเป็นที่นิยมอย่างมากในหมู่โปรแกรมเมอร์และผู้ดูแลระบบ

รูปแบบเอกสาร MS Office และแอนะล็อก - DOC, DOCX, RTF, ODT

เพื่อความอเนกประสงค์และความเรียบง่าย TXT ไม่เหมาะอย่างยิ่งสำหรับการสร้างเอกสารจริง - ข้อความสำหรับการพิมพ์ตามกฎและข้อบังคับบางประการ เนื่องจากเอกสารดังกล่าว นอกจากตัวข้อความเองแล้ว จะต้องมีข้อมูลมากมายเกี่ยวกับการออกแบบและการจัดรูปแบบของข้อความด้วย และยังเกี่ยวกับรูปแบบและขนาดของแผ่นกระดาษที่ควรวาง

สำหรับวัตถุประสงค์เหล่านี้ มีการสร้างรูปแบบต่างๆ ของชุดโปรแกรมสำนักงานต่างๆ รูปแบบที่ได้รับความนิยมมากที่สุดและใกล้เคียงกับสากลถือได้ว่าเป็นรูปแบบ MS Word - doc และ docx รูปแบบแรกคือรูปแบบปิดพิเศษที่สร้างโดย Microsoft สำหรับโปรแกรมแก้ไขข้อความ ในช่วงเริ่มต้นของการพัฒนาบริษัท รูปแบบ RTF (Rich Text Format) ถูกสร้างขึ้นโดยความร่วมมือกับบริษัท Adobe โครงสร้างของรูปแบบนี้ไม่เหมือนกับ DOC และได้รับการสนับสนุนโดยเกือบทั้งหมดที่มีอยู่ โปรแกรมแก้ไขข้อความ... แม้ว่าจะค่อนข้างด้อยกว่า DOC ในแง่ของชุดของฟังก์ชันที่พร้อมใช้งาน

ลักษณะที่ปิดสนิทของการพัฒนาของ Microsoft นำไปสู่การสร้างชุดสำนักงานแบบเปิดที่เรียกว่า Open Office ที่ได้รับการพัฒนา รูปแบบที่เป็นกรรมสิทธิ์อ.ต.ค. ( ข้อความ OpenDocumentรูปแบบ). รูปแบบนี้ไม่ได้รับการสนับสนุนอย่างดีจากบรรณาธิการเชิงพาณิชย์ ซึ่งรวมถึง MS Wordและอาจเปิดขึ้นโดยมีข้อผิดพลาด

ในที่สุด ในปี 2550 Microsoft ตัดสินใจที่จะละทิ้งการเดิมพันในรูปแบบ DOC และพัฒนาตระกูลรูปแบบ Office Open XML ซึ่งรวมถึง DOCX ซึ่งได้กลายเป็นรูปแบบหลักสำหรับ MS Word เวอร์ชันใหม่

รูปแบบ PDF

Adobe ปฏิเสธที่จะร่วมมือกับ Microsoft ได้ย้ายวิธีการของตนเอง เธอพัฒนา รูปแบบ PDFซึ่งเป็นรูปแบบที่ไม่มากนักสำหรับการพัฒนาเอกสารสำหรับการดูและพิมพ์เอกสาร ต่างจากกลุ่มก่อนหน้าซึ่งมีการจัดรูปแบบข้อความ ลักษณะที่ปรากฏสามารถเปลี่ยนแปลงได้ขึ้นอยู่กับเครื่องใดที่จะแสดงหรือพิมพ์ PDF เป็นรูปแบบเอกสารที่ไม่มีการเปลี่ยนแปลงโดยพื้นฐานและคงไว้ รูปร่างและการจัดวางในทุกสภาวะ นอกจากนี้ยังรองรับองค์ประกอบการพิมพ์และบริการเพิ่มเติมที่หลากหลายพอสมควร (เช่น การป้องกันรหัสผ่านของเอกสาร จากการแก้ไขหรือการพิมพ์ เป็นต้น) ทั้งหมดนี้ทำให้ PDF มีรูปแบบมากขึ้นสำหรับการกระจายเอกสารที่ซับซ้อนและดำเนินการอย่างมืออาชีพและแม้แต่หนังสือ