ثبت نام لاتاری 2022 آموزش ثبت نام لاتاری گرین کارت آمریکا 2022 لاتاری

charset در HTML بخش شانزدهم

charset در HTML

برای نمایش صحیح یک صفحه HTML مرورگر باید بداند که کاراکترهای استفاده شده در سند HTML چگونه رمزنگاری یا (Encoding) شده است.

رمزگذاری کاراکتر

ASCII استاندارد اولین رمزگذاری کاراکتر (تنظیم کننده کاراکتر ها نیز نامیده می شود) .

ASCII برای تعریف ۱۲۷  کارکتر مختلف الفبایی عددی است .

ASCII بازه ی کارکتری اعداد (۱-۹) انگلیسی، حروف انگلیسی (az) کوچک و حروف انگلیسی بزرگ (AZ) ، و برخی کاراکترهای خاص مانند! $ + – () @ <> پشتیبانی می کند .

ANSI (Windows-1252) یکی از استاندارد های کاراکتری ویندوز است که ۲۵۶ کاراکتر را پشتیبانی می کند .

ISO-8859-1 استاندارد پیشفرض کاراکتری در HTML 4 است که ۲۵۶ کاراکتر را پشتیبانی می کند .

از آنجا که کاراکتر های ANSII و ISO-8859-1 محدود بود پس رمزنگاری کارکتر ها به طور پیشفرض در HTML5 به UTF-8 تغییر یافت .

UTF-8 (یونیکد Unicode) تقریبا همه کاراکترها و اعداد در جهان حتی فارسی را پشتیبانی می کند .

رمزنگاری UTF-8 در HTML4 هم پشتبانی می شود

ویژگی charset در HTML

برای نمایش صحیح یک صفحه HTML ، مرورگر وب باید از مجموعه کاراکترهای مورد استفاده در صفحه پشتیبانی کند .

این ویژگی از تگ <meta> معرفی و نوع کاراکتر های پشتیبانی را معین میکنیم  :

برای HTML4:

<meta http-equiv=”Content-Type” content=”text/html;charset=ISO-8859-1″>

برای HTML5:

<meta charset=”UTF-8″>

پیش فرض رمزنگاری سند از ANSI است که در صورت معین نکردن رمزنگاری خاص سند در حالت پیش فرض از این استاندارد تبعیت می کند .

تفاوت بین مجموعه کاراکتر ها یا charset ها

مجموعه کاراکتر ASCII:

33 کاراکتر آن غیرقابل چاپ می‌باشند که اکثر آن‌ها کاراکترهای کنترلی هستند که روی ظاهر متن تأثیر دارند.

۹۵ کارکتر اسکی قابل چاپ هستند که از 32 تا 126 هستند .

کاراکتر هایی که از 128 تا 255 ارزش کمتر و زیاد قابل استفاده نیستند .

مجموعه کاراکتر ANSI  (Windows-1252)

در ANSI از مقادیر 0 تا 127 با ASCII برابر است.

ANSI دارای مجموعه ای اختصاصی از کاراکتر  128 تا 159 است.

از کاراکتر 160 تا 255 در ANSI و هم  UTF-8 برابرند .

مجموعه کاراکتر ISO-8859-1

در ISO-8859-1  از کد 0 تا 127 با مقادیر ASCII برابر است.

در ISO-8859-1 از کد 128 تا 159 با مقادیر استفاده نمی کند.

در ISO-8859-1 از کد 160 تا 255 بامقادیر  UTF-8 برابر است.

مجموعه کاراکتر UTF-8

در UTF-8 از کد 0 تا 127 با مقادیر ASCII برابر است.

در UTF-8 از کد 160 تا 255 با مقادیر ANSI و ISO-8859-1 برابر است.

در UTF-8 از کد ۲۵۵ تا 10,000 نوع کارکترهای موجود در جهان پشتیبانی می کند.

در UTF-8 از کد ۱۲۸ تا ۱۵۹ استفاده نمی کند.

نظر خودتان را ارسال کنید