티스토리 뷰

자료의 저장과 표현

비트와 바이트

  1. 이진수 체계
    • 이진수 체계는 0과 1 두 개의 숫자만을 사용하여 수를 표현하는 체계이다
    • 컴퓨터 시스템에서는 모든 데이터가 이진수 형태로 표현된다
    • 각 자리의 위치는 2의 거듭제곱으로 증가하며, 오른쪽에서부터 2^0, 2^1, 2^2, ... 순서대로 자리가 배치된다
  2. 비트(Bit)의 개념
    • 비트는 이진수 체계에서의 최소 단위로, 0 또는 1의 값을 가진다
    • 컴퓨터 시스템에서는 모든 데이터는 비트로 표현되며, 정보의 존재 여부를 나타낸다
    • 예를 들어, 하나의 비트는 전구가 켜져 있는지(1) 꺼져 있는지(0)를 나타낼 수 있다
  3. 바이트(Byte)의 개념
    • 바이트는 일반적으로 8개의 비트로 구성된 데이터 단위이다
    • 컴퓨터에서는 바이트가 기본 데이터 크기로 사용되며, 문자, 숫자, 그래픽 등의 정보를 나타낼 때 주로 사용된다
    • 바이트는 256(2^8)가지의 서로 다른 값(0부터 255까지)을 나타낼 수 있다
    • 예를 들어, 하나의 바이트는 알파벳 하나를 나타낼 수 있으며, 컴퓨터 메모리에서는 주소 지정이나 데이터 전송 등에 사용된다

 

자료의 표현 형식

  1. ASCII (American Standard Code for Information Interchange)
    • ASCII는 7비트로 영문 알파벳, 숫자, 특수 문자 등을 표현하는 데 사용되는 문자 인코딩 표준이다
    • 총 128개의 문자를 나타내며 0부터 127까지의 숫자로 표현된다
    • ASCII는 오랜 역사를 가진 표준이며 주로 영어권 국가에서 사용된다
    • 하지만 ASCII는 다른 언어나 문자를 표현하는 데에는 적합하지 않다
  2. 유니코드 (Unicode)
    • 유니코드는 전 세계의 모든 문자를 표현하기 위한 문자 인코딩 표준이다
    • 문자에 고유한 코드 포인트(숫자)를 할당하여 문자를 표현한다
    • 초기 버전의 유니코드는 16비트로 모든 문자를 표현했지만 최근의 버전은 21비트로 확장되었다
    • 유니코드는 다국어 지원과 텍스트 교환을 위해 널리 사용되며 ASCII의 한계를 극복하였다
  3. UTF-8 (Unicode Transformation Format - 8-bit)
    • UTF-8은 가변 길이 문자 인코딩 방식 중 하나로 유니코드를 저장하고 전송하기 위한 방식이다
    • ASCII와 호환되며, ASCII 문자는 1바이트로 표현되고 유니코드 문자는 1~4바이트로 표현된다
    • UTF-8은 전 세계에서 널리 사용되며 웹 및 소프트웨어 개발에서 표준으로 채택되어 있다
  4. ASCII vs 유니코드 vs UTF-8
    • ASCII는 영문 알파벳과 일부 특수 문자를 표현하는 데 사용되는 7비트 문자 인코딩 표준이다
    • 유니코드는 전 세계의 모든 문자를 표현하기 위한 표준이며, ASCII의 한계를 극복하여 다양한 문자를 표현할 수 있다
    • UTF-8은 유니코드를 저장하고 전송하기 위한 가변 길이 문자 인코딩 방식으로, ASCII와 호환되면서 다양한 문자를 효율적으로 표현할 수 있다

'내일배움캠프 개발자과정 > TIL' 카테고리의 다른 글

내일배움캠프 31일차 TIL  (1) 2024.03.27
내일배움캠프 30일차 TIL  (0) 2024.03.26
내일배움캠프 28일차 TIL  (1) 2024.03.22
내일배움캠프 27일차 TIL  (0) 2024.03.21
내일배움캠프 26일차 TIL  (0) 2024.03.20
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함