Hệ cơ số và bảng mã ASCII


Một sô hệ cơ số thông dụng:
  • Hệ nhị phân (binary) là hệ cơ số hai, được máy tính sử dụng.
  • Hệ thập phân (decimal) là hệ cơ số mười mà con người chúng ta sử dụng hằng ngày.
  • Hệ thập lục phân (hexadecimal) là hệ cơ số mười sáu, được sử dụng để tính toán thay cho hệ nhị phân vì nó ngắn gọn và dễ chuyển đổi hơn. Mỗi một chữ số có thể có giá trị 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E và F trong đó A có giá trị là 10 (thập phân), B có giá trị là 11 và tương tự với C,D,E,F.
Bảng mã ASCII (gốc):
ASCII dùng 7 bit để biểu diễn một ký tự. Bởi vậy chúng ta có 2^7( = 128) kết hợp, điều đó có nghĩa là biểu diễn tối đa được 128 ký tự.
Bảng mã này ánh xạ các giá trị thập phân nhỏ hơn 128( từ 00 tới 7F trong hệ thập lục phân) thành những ký tự thông thường. Bảng mã này được sử dụng phổ biến nên các hệ điều hành hiện đại đều tuân theo chuẩn ASCII.

ASCII mở rộng:
Một số người  bắt đầu dùng bit thứ 8 để encode các ký tự khác trong ngôn ngữ của họ 
10000010 -> é (e with acute accent - 130)
10100000 -> á (a with acute accent - 160)
Unicode
ASCII mở rộng giải quyết vấn đề biểu diễn cho các ngôn ngữ được xây dựng trên bảng chữ cái Latin. Như là Greek, Russian, Chinese và các ngôn ngữ khác.
Bạn không thể lưu text dưới dạng Unicode. Nó là một khái niệm trừu tượng để biểu diễn text, bạn cần encode nó:
Encoding: UTF-8 vs UTF-16 vs UTF-32:
  • UTF-8 vs UTF-16 là độ dài encode của một ký tự
  • UTF-8, một ký tự có độ dài là 8 bit
  • UTF-16, một ký tự bắt đầu với 16 bit
  • UTF-32, dùng  32 bit để biểu diễn một ký tự
See you again!



Comments