티스토리 뷰
자료의 저장과 표현
비트와 바이트
- 이진수 체계
- 이진수 체계는 0과 1 두 개의 숫자만을 사용하여 수를 표현하는 체계이다
- 컴퓨터 시스템에서는 모든 데이터가 이진수 형태로 표현된다
- 각 자리의 위치는 2의 거듭제곱으로 증가하며, 오른쪽에서부터 2^0, 2^1, 2^2, ... 순서대로 자리가 배치된다
- 비트(Bit)의 개념
- 비트는 이진수 체계에서의 최소 단위로, 0 또는 1의 값을 가진다
- 컴퓨터 시스템에서는 모든 데이터는 비트로 표현되며, 정보의 존재 여부를 나타낸다
- 예를 들어, 하나의 비트는 전구가 켜져 있는지(1) 꺼져 있는지(0)를 나타낼 수 있다
- 바이트(Byte)의 개념
- 바이트는 일반적으로 8개의 비트로 구성된 데이터 단위이다
- 컴퓨터에서는 바이트가 기본 데이터 크기로 사용되며, 문자, 숫자, 그래픽 등의 정보를 나타낼 때 주로 사용된다
- 바이트는 256(2^8)가지의 서로 다른 값(0부터 255까지)을 나타낼 수 있다
- 예를 들어, 하나의 바이트는 알파벳 하나를 나타낼 수 있으며, 컴퓨터 메모리에서는 주소 지정이나 데이터 전송 등에 사용된다
자료의 표현 형식
- ASCII (American Standard Code for Information Interchange)
- ASCII는 7비트로 영문 알파벳, 숫자, 특수 문자 등을 표현하는 데 사용되는 문자 인코딩 표준이다
- 총 128개의 문자를 나타내며 0부터 127까지의 숫자로 표현된다
- ASCII는 오랜 역사를 가진 표준이며 주로 영어권 국가에서 사용된다
- 하지만 ASCII는 다른 언어나 문자를 표현하는 데에는 적합하지 않다
- 유니코드 (Unicode)
- 유니코드는 전 세계의 모든 문자를 표현하기 위한 문자 인코딩 표준이다
- 각 문자에 고유한 코드 포인트(숫자)를 할당하여 문자를 표현한다
- 초기 버전의 유니코드는 16비트로 모든 문자를 표현했지만 최근의 버전은 21비트로 확장되었다
- 유니코드는 다국어 지원과 텍스트 교환을 위해 널리 사용되며 ASCII의 한계를 극복하였다
- UTF-8 (Unicode Transformation Format - 8-bit)
- UTF-8은 가변 길이 문자 인코딩 방식 중 하나로 유니코드를 저장하고 전송하기 위한 방식이다
- ASCII와 호환되며, ASCII 문자는 1바이트로 표현되고 유니코드 문자는 1~4바이트로 표현된다
- UTF-8은 전 세계에서 널리 사용되며 웹 및 소프트웨어 개발에서 표준으로 채택되어 있다
- ASCII vs 유니코드 vs UTF-8
- ASCII는 영문 알파벳과 일부 특수 문자를 표현하는 데 사용되는 7비트 문자 인코딩 표준이다
- 유니코드는 전 세계의 모든 문자를 표현하기 위한 표준이며, ASCII의 한계를 극복하여 다양한 문자를 표현할 수 있다
- UTF-8은 유니코드를 저장하고 전송하기 위한 가변 길이 문자 인코딩 방식으로, ASCII와 호환되면서 다양한 문자를 효율적으로 표현할 수 있다
'내일배움캠프 개발자과정 > TIL' 카테고리의 다른 글
내일배움캠프 31일차 TIL (1) | 2024.03.27 |
---|---|
내일배움캠프 30일차 TIL (0) | 2024.03.26 |
내일배움캠프 28일차 TIL (1) | 2024.03.22 |
내일배움캠프 27일차 TIL (0) | 2024.03.21 |
내일배움캠프 26일차 TIL (0) | 2024.03.20 |