คอมพิวเตอร์ Windows อินเทอร์เน็ต

ตาราง Ansi สำหรับตัวอักษรรัสเซีย การเข้ารหัส: ข้อมูลที่เป็นประโยชน์และการย้อนหลังโดยสังเขป

บางครั้งแม้แต่ผู้เชี่ยวชาญที่มีประสบการณ์พอสมควรก็จะไม่บอกคุณทันทีว่าค่าความดันหรือความยาวในระบบใดระบบหนึ่งสอดคล้องกับค่าในระบบค่าอื่น

ถึง อำนวยความสะดวกคุณงานนี้เราขอเสนอตารางอัตราส่วนของค่าความดันและความยาวในระบบยุโรปและอเมริกาที่มีขนาดเล็ก คำอธิบาย... แต่ก่อนอื่น คำสองสามคำเกี่ยวกับมาตรฐานนั้นเอง


DINเป็นมาตรฐานเยอรมัน (ย่อมาจาก Deutsches Institut สำหรับ Normungนั่นคือพัฒนาโดยสถาบันมาตรฐานเยอรมัน) ซึ่งได้รับการพัฒนาอย่างเคร่งครัดภายในกรอบของบทบัญญัติขององค์การระหว่างประเทศเพื่อการมาตรฐาน - ISO (องค์การระหว่างประเทศเพื่อการมาตรฐาน)


ANSI- มาตรฐานที่นำมาใช้ในสหรัฐอเมริกา หมายถึง สถาบันมาตรฐานแห่งชาติอเมริกันนั่นคือมาตรฐานของ American National Standards Institute

ดังนั้นมาตรฐาน ANSI จึงถูกกำหนดโดยสถาบันนี้และไกล ไม่เสมอระหว่างมาตรฐาน DINและ ANSIที่แน่นอน ความสอดคล้องในด้านต่างๆ

การแปลงหน่วยแรงดันจาก ANSI เป็น DIN

ทุกอย่างง่ายที่นี่: ถ้ามาตรฐาน ANSIตัวเลข 150 อยู่ตรงข้ามกับแรงดัน - ซึ่งหมายความว่าแรงดันเล็กน้อย (ซึ่งได้รับการออกแบบวาล์ว) คือ 20 บาร์, 300 - 50 บาร์ ฯลฯ ค่าสูงสุดโดย ANSI คลาส- 2500 จะเท่ากับ 420 บาร์ ตามมาตรฐานยุโรป DIN.


โดยใช้ตารางนี้ ไม่ยากแปลค่าความดันและย้อนกลับ: จาก DINวี ANSIถึงแม้ว่าวิศวกรของเราจะต้องทำการแปลขนาดนี้ ไม่บ่อย.

การแปลงหน่วยความยาวจากระบบอเมริกันเป็นยุโรป (รัสเซีย)

อย่างที่ทราบกันดีว่า ชาวอเมริกันทุกอย่างมีหน่วยวัดเป็นนิ้วและฟุต และเราและ ชาวยุโรป- มิลลิเมตร เซนติเมตร และเมตร นั่นคือเหมือนรัฐส่วนใหญ่ในโลกที่เราอาศัยอยู่ metricระบบหน่วย


วิธีการแปลงนิ้วเข้าไปมิลลิเมตร? อันที่จริงมันก็ไม่ยากเหมือนกัน แค่จำไว้ว่า 1 นิ้ว เท่ากับ 25.4 มม. อย่างไรก็ตาม มักจะเป็นตัวเลขหลังจุดทศนิยม ละเลยและแม้แต่การนับก็แสดงว่า 1 นิ้ว = 25mm.

ดังนั้น ตัวอย่างเช่น หากหน้าตัดของทางเข้าคือ 2 นิ้วตามระบบการวัดของอเมริกา ดังนั้น การแปลค่านี้ลงในระบบการวัดของเราตามกฎข้างต้น เราจะได้ 50 มม. หรือแม่นยำกว่านั้น 51 มม. (ปัดเศษ 50.8 ตามกติกา) ...

มันยังคงที่จะเพิ่มว่าเส้นผ่านศูนย์กลางใน เทคนิคลักษณะถูกทำเครื่องหมายด้วยตัวอักษรละติน DNและมักจะระบุอย่างชัดเจนใน นิ้วและความดันจะแสดงด้วยตัวอักษร PNและมีการระบุบ่อยที่สุดใน บาร์- ในกรณีใด ๆ เราใช้เพียงการทำเครื่องหมายดังกล่าวเป็นมากที่สุด สะดวกสบาย.

และตารางต่อไปนี้ จะช่วยคุณสามารถคำนวณได้ไม่เพียงเท่านั้น แม่นยำจำนวนมิลลิเมตรในหนึ่งนิ้ว (ด้วยความแม่นยำหนึ่งในพันของมิลลิเมตร) แต่ยังช่วยให้คุณทราบจำนวนมิลลิเมตรที่มีอยู่ เช่น ใน 2.5 นิ้ว

เมื่อต้องการทำเช่นนี้ ค้นหาคอลัมน์ 2 "" (2 นิ้ว) และมองหา 1/2 ทางด้านซ้าย รวม 2.5 นิ้ว = 63.501 มม. ซึ่งค่อนข้างเป็นไปได้ที่จะปัดขึ้นเป็น 64 มม. และตัวอย่างเช่น 6.25 นิ้ว (เช่น 6 และ 1/4) = 158.753 มม. หรือ 159 มม.


นิ้ว "" ในหน่วยมิลลิเมตร



หากคุณต้องการป้อนเพียงไม่กี่ อักขระพิเศษหรืออักขระ คุณสามารถใช้ตารางอักขระหรือแป้นพิมพ์ลัด สำหรับรายการอักขระ ASCII โปรดดูตารางด้านล่างหรือการแทรกตัวอักษรประจำชาติโดยใช้แป้นพิมพ์ลัด

หมายเหตุ:

การแทรกอักขระ ASCII

เมื่อต้องการแทรกอักขระ ASCII ให้กดแป้น ALT ค้างไว้ แล้วพิมพ์รหัสอักขระ ตัวอย่างเช่น หากต้องการแทรกเครื่องหมายองศา (º) ให้กดปุ่ม ALT ค้างไว้แล้วพิมพ์ แป้นพิมพ์ตัวเลขรหัส 0176

บันทึก:

การแทรกอักขระ Unicode

สำคัญ:บาง โปรแกรมไมโครซอฟต์ Office เช่น PowerPoint และ InfoPath ไม่สามารถแปลงรหัสอักขระ Unicode หากคุณต้องการอักขระ Unicode และใช้โปรแกรมใดโปรแกรมหนึ่งที่ไม่สนับสนุนอักขระ Unicode ให้ใช้เพื่อป้อนอักขระที่คุณอาจต้องใช้

หมายเหตุ:

    ควรพิมพ์ตัวเลขบนแป้นตัวเลข ไม่ใช่ตัวอักษรและตัวเลข หากจำเป็นต้องกดเพื่อป้อนตัวเลขบนแป้นตัวเลข NUM คีย์ LOCK ตรวจสอบให้แน่ใจว่าเสร็จสิ้น

    หากคุณมีปัญหาในการแปลงรหัส Unicode เป็นอักขระ ให้พิมพ์รหัสบนแป้นพิมพ์ตัวเลข เลือกรหัส จากนั้นกด Alt + X

    วี Microsoft Windows XP และเวอร์ชันที่ใหม่กว่าของ Unicode Universal Font ได้รับการติดตั้งโดยอัตโนมัติ ใน Microsoft Windows 2000 ต้องติดตั้งฟอนต์ Unicode ด้วยตนเอง

    บน Microsoft Windows 2000

    1. ออกจากโปรแกรมทั้งหมด

      ดับเบิลคลิกที่ไอคอน การติดตั้งและการลบโปรแกรมบน แผงควบคุม.

      ทำอย่างใดอย่างหนึ่งต่อไปนี้:

    2. ในกล่องโต้ตอบ การติดตั้ง Microsoft Office 2003เลือกตัวเลือก เพิ่มหรือลบส่วนประกอบแล้วกดปุ่ม ไกลออกไป.

      โปรดเลือก การปรับแต่งเพิ่มเติมแอปพลิเคชั่นและกดปุ่ม ไกลออกไป.

      ขยายรายการ เครื่องมือสำนักงานทั่วไป.

      ขยายรายการ รองรับหลายภาษา.

      คลิกที่ไอคอน แบบอักษรสากลและเลือกตัวเลือกการติดตั้งที่ต้องการ

การใช้ตารางสัญลักษณ์

ตารางสัญลักษณ์เป็น .ในตัวของ Microsoft โปรแกรมวินโดว์ซึ่งช่วยให้คุณสามารถดูอักขระที่มีอยู่ในแบบอักษรที่เลือกได้ คุณสามารถใช้ตารางสัญลักษณ์เพื่อคัดลอกสัญลักษณ์หรือกลุ่มของสัญลักษณ์ไปยังคลิปบอร์ดแล้ววางลงในโปรแกรมที่รองรับ

คลิกที่ปุ่ม เริ่มแล้วเลือก โปรแกรม, มาตรฐาน, บริการและ ตารางสัญลักษณ์.

ในการเลือกสัญลักษณ์ในตารางสัญลักษณ์ ให้คลิกปุ่ม เลือก, คลิก คลิกขวาวางเมาส์ในตำแหน่งของเอกสารที่คุณต้องการเพิ่มสัญลักษณ์แล้วเลือกคำสั่ง แทรก.

รหัสอักขระทั่วไป

สำหรับอักขระอักขระเพิ่มเติม โปรดดูบทความที่ติดตั้งบนคอมพิวเตอร์ของคุณ รหัสอักขระ ASCII หรือไดอะแกรมสคริปต์โค้ดอักขระ Unicode

เข้าสู่ระบบ

เข้าสู่ระบบ

สัญลักษณ์สกุลเงิน

สัญลักษณ์ทางกฎหมาย

สัญลักษณ์ทางคณิตศาสตร์

เศษส่วน

เครื่องหมายวรรคตอนและสัญลักษณ์ภาษาถิ่น

สัญลักษณ์แบบฟอร์ม

รหัสกำกับเสียงทั่วไป

สำหรับรายการร่ายมนตร์และรหัสอักขระที่เกี่ยวข้อง โปรดดูที่

เข้าสู่ระบบ

เข้าสู่ระบบ

เข้าสู่ระบบ

เข้าสู่ระบบ

อักขระควบคุม ASCII ที่ไม่สามารถพิมพ์ได้

ตัวเลข 0–31 ในตาราง ASCII ถูกกำหนดให้กับอักขระควบคุมที่ใช้ควบคุมอุปกรณ์ต่อพ่วงบางอย่าง เช่น เครื่องพิมพ์ ตัวอย่างเช่น ตัวเลข 12 หมายถึงฟังก์ชันการแปลหน้า คำสั่งนี้จะนำเครื่องพิมพ์ไปที่ด้านบนสุดของหน้าถัดไป

ตารางอักขระควบคุม ASCII ที่ไม่สามารถพิมพ์ได้

เลขทศนิยม

เข้าสู่ระบบ

เลขทศนิยม

เข้าสู่ระบบ

ขาดข้อมูล

การเปลี่ยนช่องข้อมูล

จุดเริ่มต้นของหัวเรื่อง

การควบคุมอุปกรณ์ 1

จุดเริ่มต้นของข้อความ

การควบคุมอุปกรณ์2

ท้ายข้อความ

การควบคุมอุปกรณ์3

สิ้นสุดการส่ง

การควบคุมอุปกรณ์4

การยืนยันเชิงลบ

การยืนยัน

สัญญาณเสียง

สิ้นสุดบล็อกการโอน

แท็บแนวนอน

จบสื่อ

ไลน์ฟีด/ไลน์ใหม่

แท็บแนวตั้ง

แปลหน้า / หน้าใหม่

ตัวแยกไฟล์

คืนรถ

ตัวแบ่งกลุ่ม

กะไม่คงที่

ตัวคั่นบันทึก

กะการอนุรักษ์

ตัวแยกส่วน

ข้อมูลเพิ่มเติม

บันทึก: ข้อจำกัดความรับผิดชอบเกี่ยวกับการแปลด้วยเครื่อง... บทความนี้แปลโดยใช้ระบบคอมพิวเตอร์โดยไม่มีการแทรกแซงของมนุษย์ Microsoft เสนอเครื่องแปลภาษาเหล่านี้เพื่อช่วยเหลือผู้ใช้ที่ไม่รู้จัก ของภาษาอังกฤษอ่านเอกสารเกี่ยวกับผลิตภัณฑ์ บริการ และเทคโนโลยีของ Microsoft เนื่องจากบทความได้รับการแปลโดยใช้การแปลด้วยคอมพิวเตอร์ จึงอาจมีข้อผิดพลาดเกี่ยวกับคำศัพท์ ไวยากรณ์ และไวยากรณ์

เฟรมเวิร์ก Bootstrap: เลย์เอาต์ที่ตอบสนองอย่างรวดเร็ว

วิดีโอแนะนำทีละขั้นตอนเกี่ยวกับพื้นฐานของเลย์เอาต์ที่ตอบสนองในเฟรมเวิร์ก Bootstrap

เรียนรู้การเรียงพิมพ์อย่างง่ายดาย รวดเร็ว และมีประสิทธิภาพโดยใช้เครื่องมือที่ทรงพลังและใช้งานได้จริง

รูปแบบการสั่งซื้อและรับเงิน

หลักสูตรฟรี "ไซต์บน WordPress"

ต้องการเชี่ยวชาญ WordPress CMS หรือไม่?

รับบทเรียนเกี่ยวกับการออกแบบและเลย์เอาต์เว็บไซต์ WordPress

เรียนรู้การทำงานกับธีมและแบ่งเค้าโครง

หลักสูตรวิดีโอฟรีเกี่ยวกับการออกแบบไซต์เลย์เอาต์และการติดตั้งบน CMS WordPress!

* เลื่อนเมาส์เพื่อหยุดการเลื่อนชั่วคราว

ย้อนกลับไปข้างหน้า

การเข้ารหัส: ข้อมูลที่เป็นประโยชน์และการย้อนหลังโดยสังเขป

ฉันตัดสินใจเขียนบทความนี้เป็นภาพรวมเล็กๆ น้อยๆ เกี่ยวกับปัญหาการเข้ารหัส

เราจะหาว่าการเข้ารหัสคืออะไรโดยทั่วไปและสัมผัสกับประวัติของลักษณะที่ปรากฏในหลักการ

เราจะพูดถึงคุณสมบัติบางอย่างของพวกเขาและพิจารณาช่วงเวลาที่อนุญาตให้เราทำงานกับการเข้ารหัสอย่างมีสติมากขึ้น และหลีกเลี่ยงการปรากฏบนไซต์ที่เรียกว่า krakozyabrov, เช่น. อักขระที่อ่านไม่ได้

งั้นไปกัน ...

การเข้ารหัสคืออะไร?

พูดง่ายๆ ก็คือ การเข้ารหัสเป็นตารางการแมปอักขระที่เราเห็นบนหน้าจอ ไปจนถึงรหัสตัวเลขบางตัว

เหล่านั้น. อักขระแต่ละตัวที่เราป้อนจากแป้นพิมพ์หรือดูบนหน้าจอมอนิเตอร์ จะถูกเข้ารหัสด้วยลำดับบิต (ศูนย์และหนึ่ง) อย่างที่คุณรู้ 8 บิตมีค่าเท่ากับ 1 ไบต์ของข้อมูล แต่จะเพิ่มเติมในภายหลัง

ลักษณะที่ปรากฏของสัญลักษณ์เองนั้นถูกกำหนดโดยไฟล์ฟอนต์ที่ติดตั้งบนคอมพิวเตอร์ของคุณ ดังนั้น กระบวนการแสดงข้อความบนหน้าจอจึงสามารถอธิบายได้ว่าเป็นการจับคู่แบบคงที่ของลำดับของศูนย์และลำดับกับอักขระเฉพาะบางตัวที่ประกอบเป็นฟอนต์

บรรพบุรุษของการเข้ารหัสที่ทันสมัยทั้งหมดถือได้ว่าเป็น ASCII.

ตัวย่อนี้ย่อมาจาก American Standard Code สำหรับการแลกเปลี่ยนข้อมูล(ตารางการเข้ารหัสอเมริกันสแตนดาร์ดสำหรับอักขระที่พิมพ์ได้และรหัสพิเศษบางอย่าง)

มัน การเข้ารหัสแบบไบต์เดียวซึ่งเริ่มแรกมีเพียง 128 อักขระ: ตัวอักษรละติน ตัวเลขอารบิก ฯลฯ



ต่อมาได้มีการขยาย (ตอนแรกไม่ได้ใช้ทั้งหมด 8 บิต) ดังนั้นจึงเป็นไปได้ที่จะใช้ไม่ใช่ 128 แต่เป็น 256 (2 ยกกำลัง 8) ตัวละครต่างๆที่สามารถเข้ารหัสข้อมูลหนึ่งไบต์ได้

การปรับปรุงนี้ทำให้สามารถเพิ่ม ASCII . ได้ สัญลักษณ์ของภาษาประจำชาตินอกเหนือจากอักษรละตินที่มีอยู่แล้ว

มีตัวเลือกมากมายสำหรับการเข้ารหัส ASCII แบบขยายเนื่องจากมีหลายภาษาในโลก ฉันคิดว่าพวกคุณหลายคนเคยได้ยินเกี่ยวกับการเข้ารหัสเช่น KOI8-R ยังเป็นการเข้ารหัส ASCII แบบขยายอีกด้วยออกแบบมาเพื่อทำงานกับตัวอักษรของภาษารัสเซีย

ขั้นตอนต่อไปในการพัฒนาการเข้ารหัสถือได้ว่าเป็นการเกิดขึ้นของสิ่งที่เรียกว่า การเข้ารหัส ANSI.

อันที่จริงก็เหมือนกัน เวอร์ชัน ASCII แบบขยายอย่างไรก็ตาม องค์ประกอบกราฟิกหลอกต่างๆ ได้ถูกลบออกจากองค์ประกอบเหล่านี้และมีการเพิ่มสัญลักษณ์การพิมพ์ ซึ่งก่อนหน้านี้มี "พื้นที่ว่าง" ไม่เพียงพอ

ตัวอย่างของการเข้ารหัส ANSI นั้นเป็นที่รู้จักกันดี Windows-1251... นอกจากตัวอักษรที่พิมพ์แล้ว การเข้ารหัสนี้ยังรวมถึงตัวอักษรของตัวอักษรของภาษาที่ใกล้เคียงกับรัสเซีย (ยูเครน เบลารุส เซอร์เบีย มาซิโดเนีย และบัลแกเรีย)



การเข้ารหัส ANSI เป็นชื่อรวม... อันที่จริงการเข้ารหัสที่แท้จริงเมื่อใช้ ANSI จะถูกกำหนดโดยสิ่งที่ระบุไว้ในรีจิสทรีของคุณ ระบบปฏิบัติการวินโดว์. ในกรณีของภาษารัสเซียจะเป็น Windows-1251 อย่างไรก็ตามสำหรับภาษาอื่นจะเป็น ANSI ชนิดอื่น

ตามที่คุณเข้าใจการเข้ารหัสจำนวนมากและการขาดมาตรฐานเดียวไม่ได้นำมาซึ่งความโชคดีซึ่งเป็นสาเหตุของการประชุมบ่อยครั้งกับสิ่งที่เรียกว่า krakozyabrami- ชุดอักขระที่ไม่มีความหมายที่อ่านไม่ได้

เหตุผลของการปรากฏตัวของพวกเขานั้นง่าย - มันคือ พยายามแสดงอักขระที่เข้ารหัสด้วยตารางการเข้ารหัสหนึ่งตารางโดยใช้ตารางการเข้ารหัสที่แตกต่างกัน.

ในบริบทของการพัฒนาเว็บ เราอาจพบ krakozyabras เมื่อ ตัวอย่างเช่น ข้อความภาษารัสเซียถูกบันทึกผิดพลาดในการเข้ารหัสที่ไม่ถูกต้องซึ่งใช้บนเซิร์ฟเวอร์.

แน่นอนว่านี่ไม่ใช่กรณีเดียวที่เราจะได้รับข้อความที่อ่านไม่ได้ - มีตัวเลือกมากมายที่นี่ โดยเฉพาะอย่างยิ่งเมื่อคุณพิจารณาว่ายังมีฐานข้อมูลที่ข้อมูลถูกจัดเก็บไว้ในการเข้ารหัสบางอย่างด้วย มีการแมปของ การเชื่อมต่อกับฐานข้อมูล ฯลฯ

การเกิดขึ้นของปัญหาเหล่านี้ล้วนเป็นแรงจูงใจในการสร้างสิ่งใหม่ ต้องเป็นการเข้ารหัสที่สามารถเข้ารหัสภาษาใด ๆ ในโลกได้ (อย่างไรก็ตามด้วยความช่วยเหลือของการเข้ารหัสแบบไบต์เดียวไม่สามารถอธิบายตัวอักษรทั้งหมดพูดภาษาจีนซึ่งมีมากกว่า 256 ตัว) อักขระพิเศษและการพิมพ์เพิ่มเติมใดๆ

สรุปคือต้องสร้าง การเข้ารหัสสากลที่จะแก้ปัญหาของ krakozyabrov ทันทีและสำหรับทั้งหมด.

Unicode - การเข้ารหัสข้อความสากล (UTF-32, UTF-16 และ UTF-8)

มาตรฐานนี้ถูกเสนอในปี 1991 โดยองค์กรไม่แสวงหาผลกำไร Unicode Consortium(Unicode Consortium, Unicode Inc.) และผลงานชิ้นแรกของเขาคือการสร้างการเข้ารหัส UTF-32.

อนึ่ง ตัวย่อเอง UTFหมายถึง รูปแบบการแปลง Unicode(รูปแบบการแปลง Unicode)

ในการเข้ารหัสนี้ การเข้ารหัสอักขระหนึ่งตัว ควรจะใช้เท่า 32 บิต, เช่น. ข้อมูล 4 ไบต์ หากเราเปรียบเทียบตัวเลขนี้กับการเข้ารหัสแบบไบต์เดียว เราก็ได้ข้อสรุปง่ายๆ ว่า ในการเข้ารหัส 1 อักขระในการเข้ารหัสสากลนี้ คุณจะต้อง บิตมากขึ้น 4 เท่าซึ่งทำให้ไฟล์หนักขึ้น 4 เท่า

เป็นที่ชัดเจนว่าจำนวนอักขระที่อาจอธิบายได้โดยใช้การเข้ารหัสนี้เกินขีดจำกัดที่สมเหตุสมผลทั้งหมด และในทางเทคนิคแล้วจำกัดจำนวนเท่ากับ 2 ยกกำลัง 32 เห็นได้ชัดว่านี่เป็นการใช้เกินความจำเป็นและสิ้นเปลืองในแง่ของน้ำหนักของไฟล์ ดังนั้นการเข้ารหัสนี้จึงไม่แพร่หลาย

เธอถูกแทนที่ด้วย การพัฒนาใหม่- UTF-16.

ตามชื่อที่สื่อถึง ในการเข้ารหัสนี้ อักขระหนึ่งตัวจะถูกเข้ารหัส ไม่ใช่ 32 บิตอีกต่อไป แต่เพียง 16(เช่น 2 ไบต์) แน่นอนว่าสิ่งนี้ทำให้อักขระใดๆ ก็ตาม "เบา" กว่า UTF-32 สองเท่า แต่ยัง "หนัก" เป็นสองเท่าของอักขระใดๆ ที่เข้ารหัสโดยใช้การเข้ารหัสแบบไบต์เดียว

จำนวนอักขระที่ใช้ได้สำหรับการเข้ารหัสใน UTF-16 คืออย่างน้อย 2 ถึงยกกำลัง 16 กล่าวคือ 65536 อักขระ ดูเหมือนว่าทุกอย่างจะดี นอกจากค่าสุดท้ายของพื้นที่โค้ดใน UTF-16 ที่ขยายเป็นมากกว่า 1 ล้านอักขระแล้ว

อย่างไรก็ตาม การเข้ารหัสนี้ไม่สามารถตอบสนองความต้องการของนักพัฒนาได้อย่างเต็มที่ ตัวอย่างเช่น หากคุณเขียนโดยใช้อักขระละตินเพียงอย่างเดียว หลังจากเปลี่ยนจากเวอร์ชันขยายของการเข้ารหัส ASCII เป็น UTF-16 น้ำหนักของแต่ละไฟล์จะเพิ่มเป็นสองเท่า

ผลที่ตามมา, มีความพยายามอีกครั้งในการสร้างสิ่งที่เป็นสากลและนั่นคือการเข้ารหัส UTF-8 ที่รู้จักกันดี

UTF-8- นี่คือ การเข้ารหัสแบบหลายไบต์พร้อมความยาวอักขระผันแปร... เมื่อดูจากชื่อ คุณอาจคิดว่าเมื่อเปรียบเทียบกับ UTF-32 และ UTF-16 นั้น 8 บิตถูกใช้เพื่อเข้ารหัสอักขระหนึ่งตัว แต่นี่ไม่ใช่กรณี แม่นยำยิ่งขึ้นไม่มากนัก

ทั้งนี้เนื่องจาก UTF-8 ให้ความเข้ากันได้ดีที่สุดกับระบบรุ่นเก่าที่ใช้อักขระ 8 บิต ในการเข้ารหัสอักขระหนึ่งตัวใน UTF-8 นั้นใช้จริง 1 ถึง 4 ไบต์(ตามสมมุติฐาน เป็นไปได้สูงสุด 6 ไบต์)

ใน UTF-8 อักขระละตินทั้งหมดจะถูกเข้ารหัสใน 8 บิต เช่นเดียวกับในการเข้ารหัส ASCII... กล่าวอีกนัยหนึ่ง ส่วนพื้นฐานของการเข้ารหัส ASCII (128 อักขระ) ได้ย้ายไปที่ UTF-8 ซึ่งทำให้คุณสามารถ "ใช้" ได้เพียง 1 ไบต์ในการแสดงข้อมูล ในขณะที่ยังคงความเป็นสากลของการเข้ารหัสไว้ ซึ่งทุกอย่างได้เริ่มต้นขึ้น

ดังนั้น หากอักขระ 128 ตัวแรกถูกเข้ารหัสด้วย 1 ไบต์ อักขระอื่นๆ ทั้งหมดจะถูกเข้ารหัสด้วย 2 ไบต์ขึ้นไป โดยเฉพาะอย่างยิ่ง อักขระ Cyrillic แต่ละตัวถูกเข้ารหัสด้วย 2 ไบต์พอดี

ดังนั้นเราจึงมีการเข้ารหัสสากลที่ช่วยให้เราสามารถครอบคลุมอักขระที่เป็นไปได้ทั้งหมดที่จำเป็นต้องแสดง โดยไม่ต้อง "ถ่วงน้ำหนัก" ไฟล์โดยไม่จำเป็น

มีหรือไม่มี BOM?

ถ้าคุณทำงานด้วย โปรแกรมแก้ไขข้อความ(ตัวแก้ไขโค้ด) like แผ่นจดบันทึก ++, phpDesigner, php อย่างรวดเร็วฯลฯ คุณอาจให้ความสนใจกับความจริงที่ว่าเมื่อระบุการเข้ารหัสที่จะสร้างหน้า คุณสามารถเลือกได้ 3 ตัวเลือกตามกฎ:

ANSI
- UTF-8
- UTF-8 ที่ไม่มี BOM





ฉันต้องบอกทันทีว่าเป็นตัวเลือกสุดท้ายที่คุ้มค่าที่จะเลือกเสมอ - UTF-8 ที่ไม่มี BOM.

BOM คืออะไรและทำไมเราไม่ต้องการมัน

บอมหมายถึง เครื่องหมายคำสั่งไบต์... นี่เป็นอักขระ Unicode พิเศษที่ใช้เพื่อระบุลำดับไบต์ ไฟล์ข้อความ... ตามข้อกำหนดการใช้งานเป็นทางเลือก แต่ถ้า บอมใช้แล้วต้องตั้งค่าไว้ที่จุดเริ่มต้นของไฟล์ข้อความ

เราจะไม่ลงรายละเอียดของงาน บอม... สำหรับเรา สรุปได้ดังนี้ การใช้อักขระบริการนี้ร่วมกับ UTF-8 จะป้องกันไม่ให้โปรแกรมอ่านการเข้ารหัสตามปกติอันเป็นผลมาจากข้อผิดพลาดที่เกิดขึ้นในการทำงานของสคริปต์

ดังนั้นเมื่อทำงานกับ UTF-8 ให้ใช้ตัวเลือกอย่างแน่นอน "UTF-8 ที่ไม่มี BOM"... นอกจากนี้ยังเป็นการดีกว่าที่จะไม่ใช้ตัวแก้ไขโดยหลักการแล้วคุณไม่สามารถระบุการเข้ารหัสได้ (เช่น สมุดบันทึกจากโปรแกรมมาตรฐานถึง Windows).

การเข้ารหัสของไฟล์ปัจจุบันที่เปิดในโปรแกรมแก้ไขโค้ดมักจะระบุไว้ที่ด้านล่างของหน้าต่าง


โปรดทราบว่ารายการ "ANSI เป็น UTF-8"ในกองบรรณาธิการ แผ่นจดบันทึก ++แปลว่า เหมือนกับ "UTF-8 ที่ไม่มี BOM"... นี่ก็เหมือนกัน



ในโปรแกรม phpDesignerคุณไม่สามารถพูดได้อย่างแน่นอนว่ามันถูกใช้หรือไม่ บอม, หรือไม่. เมื่อต้องการทำสิ่งนี้ ให้คลิกขวาที่คำจารึก "UTF-8"หลังจากนั้นในหน้าต่างป๊อปอัป คุณจะเห็นว่า บอม(ตัวเลือก บันทึกด้วย BOM).



ในกองบรรณาธิการ php อย่างรวดเร็วการเข้ารหัส UTF-8 ที่ไม่มี BOMแสดงเป็น "UTF-8 *".

อย่างที่คุณจินตนาการได้ ในเครื่องมือแก้ไขต่างๆ ทุกอย่างดูแตกต่างออกไปเล็กน้อย แต่คุณเข้าใจแนวคิดหลักแล้ว

หลังจากบันทึกเอกสารใน UTF-8 ที่ไม่มี BOMคุณต้องตรวจสอบให้แน่ใจด้วยว่าได้ระบุการเข้ารหัสที่ถูกต้องในเมตาแท็กพิเศษในส่วน ศีรษะเอกสาร html ของคุณ:

การปฏิบัติตามกฎง่ายๆ เหล่านี้จะช่วยให้คุณหลีกเลี่ยงช่องว่างที่มีการเข้ารหัสได้มากมาย

แค่นั้นเอง ฉันหวังว่าการสำรวจและคำอธิบายสั้นๆ นี้จะช่วยให้คุณเข้าใจได้ดีขึ้นว่าการเข้ารหัสคืออะไร มันคืออะไร และทำงานอย่างไร

หากคุณสนใจหัวข้อนี้จากมุมมองที่นำไปใช้มากขึ้น เราขอแนะนำให้คุณศึกษาวิดีโอแนะนำของฉัน

มิทรี เนาเมนโก

ป.ล.ดูบทช่วยสอนระดับพรีเมียมอย่างละเอียดถี่ถ้วนในแง่มุมต่างๆ ของการสร้างไซต์รวมถึง คอร์สฟรีในการสร้างระบบ CMS ของคุณเองใน PHP ตั้งแต่เริ่มต้น ทั้งหมดนี้จะช่วยให้คุณเชี่ยวชาญเทคโนโลยีการพัฒนาเว็บต่างๆ ได้เร็วและง่ายขึ้น

คุณชอบเนื้อหาและต้องการขอบคุณหรือไม่?
เพียงแบ่งปันกับเพื่อนและเพื่อนร่วมงานของคุณ!


รหัส (ไบนารี)

(ไม่มีเครื่องหมายทศนิยม)

(เครื่องหมายทศนิยม)

A (ละตินตัวใหญ่)

B (ละตินขนาดใหญ่)

a (ละตินตัวเล็ก)

A (รัสเซียตัวใหญ่)

ในการเข้ารหัส ANSI

A (รัสเซียตัวใหญ่)

ในการเข้ารหัส ASCII

โค้ดที่คล้ายกันดังที่แสดงด้านบนจะจับคู่จำนวนเต็มตั้งแต่ 0 ถึง 255 ในรูปแบบที่ไม่ได้ลงนามด้วย ดังนั้น อักขระแต่ละตัวจึงมีจำนวนเต็ม เรียกอีกอย่างว่ารหัสอักขระ คอลเลกชันของรหัสอักขระเรียกว่า ตารางรหัส หรือ การเข้ารหัส .

สำหรับคอมพิวเตอร์ส่วนบุคคล ที่พบบ่อยที่สุด ตารางรหัส ANSI (สถาบันมาตรฐานแห่งชาติอเมริกัน) และ ASCII (รหัสมาตรฐานอเมริกันสำหรับการแลกเปลี่ยนข้อมูล) ตาราง ANSI ใช้ใน Windows และใช้ ASCII ใน DOS อย่างไรก็ตาม ในสองตารางนี้ 128 รหัสแรก (0 ถึง 127) จับคู่ ; พวกเขาแตกต่างกันใน 128 รหัสถัดไปที่ใช้เก็บตัวอักษรและสัญลักษณ์ประจำชาติ (รัสเซีย) ของ "กราฟิกหลอก"

ในตารางที่กำหนด การกำหนด KSหมายถึง "รหัสอักขระ" และ กับ- "เครื่องหมาย".

ส่วนมาตรฐานของตารางอักขระ (ascii-ansi)

สัญลักษณ์ข้างต้นบางส่วนมีความหมายพิเศษ ตัวอย่างเช่น อักขระที่มีรหัส 9 หมายถึงอักขระการจัดตารางแนวนอน อักขระที่มีรหัส 10 - อักขระป้อนบรรทัด อักขระที่มีรหัส 13 - อักขระขึ้นบรรทัดใหม่