카테고리 없음

charset(character set), utf-8 에 대하여.

_뮨 2022. 6. 21. 23:01

생활코딩 이고잉님의 html수업을 처음 들으면서 궁금했던게 

항상 html의 <head>영역에 <meta charset="UTF-8">이라는 태그를 넣는다.

UTF-8은 전세계 문자와 기호를 원활하게 인코딩하는 방식이다.

인코딩(encoding)이란?

컴퓨터는 모든 정보를 0과 1인 바이너리, 즉 숫자로 저장한다.

그런데 우리는 매일 여러가지 언어로 코딩작업을 하고 문서를 만들고 저장하고 있다. 

우리가 입력하는 문자와 기호들은 컴퓨터가 이해하지 못한다.

여기서 우리가 입력한 문자와 기호들을 컴퓨터가 이해할 수 있는 신호로 변환하는 과정을 인코딩이라고 한다.

반대로 0과 1로  구성된 바이너리 데이터를 다시 문자로 복구하는 과정을 디코딩이라고 한다.

문자셋(character set)이란?
문자 셋은 쉽게 말해 인코딩과 디코딩을 위해 미리 정해진 규칙을 말한다.

웹브라우저 혹은 html문서가 어떠한 문자셋으로 저장되었는지 명시해놓은 속성.

인코딩을 어떤 종류의 문자셋으로 해줄지 정하는 과정, 즉 인코딩 방식을 정하는 것이다.

<meta charset="UTF-8">

"해당 문서는 UTF-8의 문자셋으로 인코딩되었다"는 의미다.