ถ้าจะนึกถึงภาษาสากล ที่เป็นที่ยอมรับกันทั่วโลกละก็ แน่นอนครับ ภาษา English นั่นเอง ซึ่งทำให้มาตรฐานการเข้ารหัสภาษา หรือ การ Encoding ที่เหมาะกับภาษาอังกฤษนั้น ไม่สร้างปัญหาแก่ผู้สร้างเว็บไซต์ทั่วไปเพราะใช้ ภาษามาตราฐานของ โลก Cyber ไงละครับ
มาพูดถึงภาษาไทยเราดีกว่า บางครั้งเราต้องการสร้างเว็บไซต์ให้คนไทยอ่าน ดังนั้น เราต้องมาเลือกใช้ การเข้ารหัสภาษาที่เหมาะสมกับตัวอักษรไทยครับ ซึ่งถ้าเริ่มต้นทำเว็บไซต์ เราเลือกการเข้ารหัสภาษา Encoding ของภาษาไทยเราได้อย่างถูกต้องแล้ว จะได้ไม่ต้องมาวุ่นวายแก้ ปัญหากันภายหลังไงล่ะครับ
นี่คือตัวอย่าง Tag การกำหนดภาษาให้กับ หน้าเว็บไซต์ของเรานะครับ
สำหรับการเข้ารหัสภาษา Encoding ที่รองรับตัวอักษรไทยนั้น ได้แก่ utf-8, tis-620 และ windows-874 เลือกใช้ตัวไหนก็ได้ครับสำหรับผม แนะนำการเข้ารหัวตัวอักษรแบบ tis-620 และ windows-874 ครับ เพราะว่าเป็น Encoding ที่ออกแบบมาเพื่อตัวอักษรไทยโดยเฉพาะจริงๆ ส่วน การเข้ารหัสตัวอักษรแบบ utf-8 นั้นเป็น Encoding แบบครอบคลุม หลายภาษา เป็น International Encoding น่ะครับ
สาเหตที่ไม่แนะนำ utf-8 ก็เพราะว่าผมเคยเจอปัญหา ตัวอักษร ก. กไก่ บางครั้งจะกลายเป็น อักขระแปลกประหลาด ซะงั้น เพราะเนื่องจากว่า รหัสตัวอักษร ก. ไก่ ในมาตรฐาน utf-8 นั้น มี รหัสตัวอักษรมากกว่า 1 ชุดที่ ตรงกับตัวอักษร ก.ไก่ ครับ ทำให้เกิดการเข้ารหัสผิดเพี้ยน
วันอังคาร, 04 ตุลาคม, 2554
ปัจจุบันชอบใช้แต่ utf-8 ทั้งในฐานข้อมูล และ หน้าเว็บเลย
เค้าพัฒนาแล้ว อิอิ