본문 바로가기

컴퓨터구조

데이터

이진법

 

보수

 

16진법

 

문자 집합 : 컴퓨터가 인식할 수 있는 문자의 모음

인코딩 : 문자 집합을 컴퓨터가 인식할 수 있는 문자 코드로 변환하는 과정

디코딩 : 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정

 

코드 포인트 : 글자에 부여된 코드 값

 

아스키 코드 : 아스키 문자 집합에 0-127까지 할당되어 인코딩된 결과물

 

EUC-KR - 한글 인코딩 방식 ~ 완성형 인코딩 방식, 2바이트 부여

완성형 인코딩 : 글자 하나를 고유한 코드를 부여하여 인코딩하는 방식

조합형 인코딩 : 초성, 중성, 종성을 위한 비트열을 할당하고 그것들을 조합하여 하나의 글자 코드를 완성하는 방식

CP949 : Code Page 949 - EUC-KR보다 다양한 문자 표현 / 전부 표현하지는 못함

 

유니코드 : 대부분의 나라 문자, 특수문자, 이모티콘 등을 코드로 표현할 수 있는 통일된 문자 집합 / 광범위하게 표현할 수 있는 통일된 문자 집합

UTF : Unicode Transfomation Format - 유니코드를 인코딩하는 방법

UTF-8 : 1~4바이트까지의 인코딩 결과를 만듦

 

 

참고

혼자 공부하는 컴퓨터구조+운영체게

'컴퓨터구조' 카테고리의 다른 글

RAM ROM 차이  (0) 2023.03.08
인터럽트  (0) 2023.02.23